循环-URL循环教程:


本文主要介绍如何使用URL循环采集网页信息,以豆瓣电影信息采集为例。

 

示例网址


https://movie.douban.com/subject/26387939/

https://movie.douban.com/subject/6311303/

https://movie.douban.com/subject/1578714/

https://movie.douban.com/subject/26718838/

https://movie.douban.com/subject/25937854/

https://movie.douban.com/subject/26743573/

https://movie.douban.com/subject/20451290/

https://movie.douban.com/subject/26816383/

https://movie.douban.com/subject/26260853/

https://movie.douban.com/subject/25864124/

 

适用情况:在多个同类型的网页中,需要采集的字段相同。

 

下面对示例进行示范:


第一步:在八爪鱼采集器主页中找到‘自定义采集’选项,点击其下方的‘立即使用’,进入‘输入一个或多个同类型的采集网址’界面,输入事先复制好的网址,并点击‘保存网址’。

第一步 


第二步:接下来进入到字段配置的界面,点击你想要采集的字段,完成之后,点击‘采集以下数据’,即可采集操作提示框内显示的所有信息,再点击‘保存并开始采集’,基本的配置即完成。


第二步 

第三步:点击‘启动本地采集’,进入到采集界面,采集完成之后,任务会自动停止,并提示采集完成。


第三步