八爪鱼,百万用户信赖的网络爬虫工具

某知名汽车网车型价格配置信息采集图文攻略

作者:xinyue 发布时间:5/30/2014 3:51:51 PM 11863 人已阅读

摘要:八爪鱼采集器内的规则市场,对于很多使用八爪鱼的小伙伴们来说已经不陌生了,现成的规则即缩短了学习的过程和时间,又能从关联性较强的规则里面获得启发,接下来,我们将不定期以一些行业典型网站作为案例,推出一系列图文攻略。下一步八爪鱼团队将逐步开放规则市场,相关消息小伙伴们可随时留意官网。

       八爪鱼采集器作为国内通用性强的云采集软件,在不同行业有很多有趣的应用,拿最近车友们很关注的深圳港澳国际车展来说,八爪鱼也能帮到车友们快速有效的了解各个车型的配置及价格等数据,对于价格一抹黑想要买车正在做功课的车友们来说,比起一个个翻页面废掉无数脑细胞对比,八爪鱼真是省心又省力了!如此高大上的做功课方法,是不是很逆天的感觉,下面就让我们一睹为快吧。

 

      本文仅以其中车友们比较熟悉的爱卡汽车网为样例,对于其他网站,如果车友们有兴趣想体验,可以参照本文方式自行摸索。

 

第一步,打开八爪鱼软件,点击快速开始,新建一个任务

 页面截图2-新建任务

第二步,找到汽车品牌的列表页。将本列表页地址复制,

 页面截图3 打开网页

第三步,点击要采集的页面元素,比如说奥迪S7,系统弹出对话框后,选择创建一个元素列表处理一个元素

 页面截图4 创建元素

第四步,将元素添加进去,如要继续添加其他品牌点击继续编辑列表

 页面截图5 继续创建元素

 页面截图6 继续添加

 

第五步,全部品牌显示在列表中后,点击创建列表完成。

 页面截图7 创建完成

点击循环操作,进入到下一流程

 页面截图8 循环

 

第六步,由于爱卡网的品牌列表中有部分未上市的,无法采集到价格,我们可以在此以是否有市场价作为一个判断条件。设置一个条件判断项

 页面截图9 判断条件

第七步,设置好条件判断后,对该页面配置所需要的提取数据

 页面截图10 提取数据

第八步,设置完成后,点击下一步,进入到执行计划流程,设置计划执行的方式,建议推荐云采集,速度快并可以判断数据是否存在重复下载。

 页面截图11 设置执行计划

 

第九步,进入下一步,点击检查任务,弹出以下窗口,点击以下图标即可开始运行并下载

 页面截图12 执行

 

附:汽车车型、指导价、市场价的样本数据

http://pan.baidu.com/s/1dDf7ASD

      八爪鱼团队温馨提示小伙伴们可以登录八爪鱼客户端,在采集规则》规则市场下面可以下载部分规则,下一步即将开放会员自助上传分享规则机制,敬请留意八爪鱼最新消息!

       如果小伙伴们再使用的过程中遇到问题可以加入八爪鱼交流群①61570666(已满,推荐加2群)八爪鱼交流群②302187299与其他小伙伴们共同交流。


欢迎咨询在线客服
加微信群,与更多用户一起交流