八爪鱼采集器智能模式
2017-06-14 19:22:30 阅读量: 25530
新手入门-智能模式
本文用于演示使用智能模式采集列表、表格网站的基本步骤,是学习八爪鱼采集软件的一种方便快捷的模式。
文章内示例网址为:https://sz.zu.anjuke.com/ditie/?from=navigation
定位: 智能模式下,只需要输入网址,点击搜索,八爪鱼便会自动采集网页数据并以表格形式呈现出来,你可以对字段信息进行修改名称、删除、翻页、数据导出等操作。
使用前提:智能模式暂时适用于网页中数据以表格或列表形式呈现的网页,例如电商网站商品列表的商品信息、一些生活服务类的网站等等。示例网站如:大众点评、安居客租房、P2P网贷、搜狗电影排行等。
推荐使用情况:对于表格、列表形式的网页,使用智能模式,可以帮助你节省制作规则的时间,迅速的获得需要的信息,进行简单的修改就可以导出到EXCEL直接使用,堪称即点即用。
如果智能模式不能满足你的需求,请参考向导模式攻略进行自定义采集,自定义采集可以准确的实现你绝大多数采集需求。
智能模式采集步骤:
步骤1: 首先打开八爪鱼采集器→将网址复制到输入框→点击放大镜图标进入智能采集模式:
步骤2:查看搜索框下方结果1—结果3,寻找到能满足自己需求的结果:
采集器会采集多种数据模板以满足你的不同采集需求,寻找适合自己的模板继续进行。
步骤3: 如果当前页信息不能判断是否满足需求,可以点击加载下一页,八爪鱼采集器会自动翻页并采集下一页内容。
检查结果为示例数据,不需要将所有数据在此步骤采集完成,如果当前数据无法判断能否满足需求,加载下一页获得更多数据进行判断。
注意点:先判断是否需要加载下一页再进行下一步修改表头,如果先修改表头再加载会导致修改过的表头变回未修改的状态。
步骤4:对表头进行修改,修改自己需要的字段名并删除不需要的字段:
表格可以进行的操作有:删除、修改列名、拉长缩短列宽。列名修改后进行下一步导出或启动采集时依然有效,不需要再次修改。
步骤5:开始采集或者导出到Excel,如果采集数据量较大建议使用云采集功能。
智能模式导出形式为Excel导出,如果需要其他格式导出请使用自定义采集模式。
本地采集占用当前电脑资源进行采集,如果存在采集时间要求或当前电脑无法长时间进行采集可以使用云采集功能,云采集在网络中进行采集,无需当前电脑支持,电脑可以关机,可以设置多个云节点分摊任务,10个节点相当于10台电脑分配任务帮你采集,时间降低为原来的十分之一;采集到的数据可以在云上保存三个月,可以随时进行导出操作。
此外,智能模式还可以输入关键词搜索数据。比如搜索“天气”,点击查询后,可以跳转到数多多规则市场。在数多多上可以直接查找到相关的数据或规则。用户可以通过下载,获取数据或规则,规则可以放到八爪鱼中运行,以获取想要的数据。