八爪鱼,百万用户信赖的网络爬虫工具

八爪鱼8.1,智能采集初现锋芒

作者:keven 发布时间:2/21/2020 8:02:58 PM 21016 人已阅读

摘要:八爪鱼8.1中加入了智能识别功能,用户输入网址即可获得数据,轻松实现数据采集,在保持原有灵活高效的基础上,让数据采集更加智能。

 
【视频教程】快速自定义配置采集数据

 

远程协作不易,在小伙伴们的共同努力下,「八爪鱼8.1」终于上线!

 

这一次,八爪鱼8.1 对自定义配置任务进行了重大改进,加入了自动识别功能,用户输入网址即可获得数据,轻松实现数据采集,在保持原有灵活高效的基础上,让数据采集更加智能,并优化了界面布局,提升采集配置体验;另外也对任务的管理进行了优化。


欢迎体验八爪鱼8.1 ,有任何意见或建议,请不吝提出,万分感谢!软件还有很多改进空间,我们定当全力以赴!

一、八爪鱼8.1 亮点

 

  • 自动识别网页,智能推荐采集方案
  • 采集数据实时展现,字段操作更加直观
  • 采集任务管理升级,优化组合筛选,提高工作效率
  • 快速定位最近编辑任务,管理更便捷

 

 

二、主要功能介绍

 

1. 自动识别网页,智能推荐采集方案

 

输入网址后,即可智能分析网页,自动识别。

 

 

智能推荐采集字段、翻页和滚动页面加载更多数据等设置。

 



一键勾选,轻松进入下一级页面采集更多数据,无需再点击页面创建流程步骤;多个识别结果,总有一组数据满足需求。

 

 

 

2.采集数据实时展现,字段操作更加直观

 

a. 拖动字段,快速调整位置;


b. 字段操作更便捷;


c. 快速添加字段;

 



d. 鼠标上移,快速浏览步骤信息。

 

e. 选中采集字段后网页同步高亮显示。

 

f. 点击直接进入网址设置界面。

 

 

 

g. 点击快速添加流程步骤。

 

 

 


3. 采集任务管理升级,优化组合筛选,提升工作效率

 

通过【云采集数据量】和【云采集结束时间】,即可从大量任务中快速筛选目标任务,无须逐个排查运行异常任务。

 

 

在任务列表中加入任务组相关操作。

 

 

 

4.快速定位最近编辑任务,管理更便捷


快速管理最近编辑过的任务,收缩状态下也能快速切入。

 

 

 


三、自定义任务创建示例

 

1. 准备好采集的网址,此处示例网址为:https://mall.ebaiyin.com/category_3.shtml

 

2. 输入网址,点击采集,等待软件对网页进行智能识别。



 

 

3. 查看识别结果,按需调整。

 



 

第一步:检查下方数据预览中的字段是否为自己所需要的,多余字段,可自行删除,同时可对字段重命名。

 



如果预览中的数据不是自己所需要的,则点击操作提示中的【切换识别结果】,进行示例数据切换,根据网页情况会有多个识别结果供切换选择,选定所需结果进入第二步。

 

第二步:点击【查看】,定位识别到的翻页按钮在网页中的位置,如果识别不正确,则点击【修改】,重新设置页面中正确的翻页按钮。

 

第三步:点击【生成采集设置】

 

 

 

4. 可以对预览数据中的字段进行重命名,也可以在点击【生成采集设置】之后重命名,当前示例以点击之后重命名为例。



 

 

5. 字段重命名后,点击操作提示中的【保存并开始采集】或软件左上角的【采集】,在弹窗中选择【启动本地采集】。然后等待软件完成数据采集。


 

 

6. 采集完成后,点击【导出数据】,将数据以默认的Excel表格形式导出到本地。


 


部分进阶操作

 

 

1. 如需添加字段,可在第3步的识别结果中,点击数据预览最右侧的 + 号,进行添加字段。

 



或者在第4步【生成采集设置】之后,点击数据预览最右侧的 + 号,进行添加字段。

 



如需添加网页中字段,直接点击网页中字段所在区域即可。默认选择【采集该元素文本】。

 

 

 

2. 如果还需点击页面中链接进入下一级页面采集数据。可在第3步识别结果中,选择要点击的链接字段并勾选。(点击【查看】后,该链接在网页中的位置会出现蓝色的背景色)

 

 

 

3.点击【全部字段】,可查看到当前任务的所有字段,选中某个字段名称,网页相应位置、数据预览中都会高亮显示,可用于检查字段是否有遗漏,命名是否有误,是否对应网页所在区域等等。

 

 

 


欢迎咨询在线客服
加微信群,与更多用户一起交流