循环-URL循环(7.0版本)
2017-06-23 15:14:43 阅读量: 26718
循环-URL循环教程:
本文主要介绍如何使用URL循环采集网页信息,以豆瓣电影信息采集为例。
示例网址:
https://movie.douban.com/subject/26387939/ |
https://movie.douban.com/subject/6311303/ |
https://movie.douban.com/subject/1578714/ |
https://movie.douban.com/subject/26718838/ |
https://movie.douban.com/subject/25937854/ |
https://movie.douban.com/subject/26743573/ |
https://movie.douban.com/subject/20451290/ |
https://movie.douban.com/subject/26816383/ |
https://movie.douban.com/subject/26260853/ |
https://movie.douban.com/subject/25864124/ |
适用情况:在多个同类型的网页中,需要采集的字段相同。
下面对示例进行示范:
第一步:在八爪鱼采集器主页中找到‘自定义采集’选项,点击其下方的‘立即使用’,进入‘输入一个或多个同类型的采集网址’界面,输入事先复制好的网址,并点击‘保存网址’。
第二步:接下来进入到字段配置的界面,点击你想要采集的字段,完成之后,点击‘采集以下数据’,即可采集操作提示框内显示的所有信息,再点击‘保存并开始采集’,基本的配置即完成。
第三步:点击‘启动本地采集’,进入到采集界面,采集完成之后,任务会自动停止,并提示采集完成。