八爪鱼8.1,智能采集初现锋芒
远程协作不易,在小伙伴们的共同努力下,「八爪鱼8.1」终于上线!
这一次,八爪鱼8.1 对自定义配置任务进行了重大改进,加入了自动识别功能,用户输入网址即可获得数据,轻松实现数据采集,在保持原有灵活高效的基础上,让数据采集更加智能,并优化了界面布局,提升采集配置体验;另外也对任务的管理进行了优化。
欢迎体验八爪鱼8.1 ,有任何意见或建议,请不吝提出,万分感谢!软件还有很多改进空间,我们定当全力以赴!
一、八爪鱼8.1 亮点
- 自动识别网页,智能推荐采集方案
- 采集数据实时展现,字段操作更加直观
- 采集任务管理升级,优化组合筛选,提高工作效率
- 快速定位最近编辑任务,管理更便捷
二、主要功能介绍
1. 自动识别网页,智能推荐采集方案
输入网址后,即可智能分析网页,自动识别。
智能推荐采集字段、翻页和滚动页面加载更多数据等设置。
一键勾选,轻松进入下一级页面采集更多数据,无需再点击页面创建流程步骤;多个识别结果,总有一组数据满足需求。
2.采集数据实时展现,字段操作更加直观
a. 拖动字段,快速调整位置;
b. 字段操作更便捷;
c. 快速添加字段;
d. 鼠标上移,快速浏览步骤信息。
e. 选中采集字段后网页同步高亮显示。
f. 点击直接进入网址设置界面。
g. 点击快速添加流程步骤。
3. 采集任务管理升级,优化组合筛选,提升工作效率
通过【云采集数据量】和【云采集结束时间】,即可从大量任务中快速筛选目标任务,无须逐个排查运行异常任务。
在任务列表中加入任务组相关操作。
4.快速定位最近编辑任务,管理更便捷
快速管理最近编辑过的任务,收缩状态下也能快速切入。
三、自定义任务创建示例
1. 准备好采集的网址,此处示例网址为:https://mall.ebaiyin.com/category_3.shtml
2. 输入网址,点击采集,等待软件对网页进行智能识别。
3. 查看识别结果,按需调整。
第一步:检查下方数据预览中的字段是否为自己所需要的,多余字段,可自行删除,同时可对字段重命名。
如果预览中的数据不是自己所需要的,则点击操作提示中的【切换识别结果】,进行示例数据切换,根据网页情况会有多个识别结果供切换选择,选定所需结果进入第二步。
第二步:点击【查看】,定位识别到的翻页按钮在网页中的位置,如果识别不正确,则点击【修改】,重新设置页面中正确的翻页按钮。
第三步:点击【生成采集设置】
4. 可以对预览数据中的字段进行重命名,也可以在点击【生成采集设置】之后重命名,当前示例以点击之后重命名为例。
5. 字段重命名后,点击操作提示中的【保存并开始采集】或软件左上角的【采集】,在弹窗中选择【启动本地采集】。然后等待软件完成数据采集。
6. 采集完成后,点击【导出数据】,将数据以默认的Excel表格形式导出到本地。
部分进阶操作
1. 如需添加字段,可在第3步的识别结果中,点击数据预览最右侧的 + 号,进行添加字段。
或者在第4步【生成采集设置】之后,点击数据预览最右侧的 + 号,进行添加字段。
如需添加网页中字段,直接点击网页中字段所在区域即可。默认选择【采集该元素文本】。
2. 如果还需点击页面中链接进入下一级页面采集数据。可在第3步识别结果中,选择要点击的链接字段并勾选。(点击【查看】后,该链接在网页中的位置会出现蓝色的背景色)
3.点击【全部字段】,可查看到当前任务的所有字段,选中某个字段名称,网页相应位置、数据预览中都会高亮显示,可用于检查字段是否有遗漏,命名是否有误,是否对应网页所在区域等等。
服务提示