在新手指引里,我们简单讲了数据采集的3种模式:【模板采集】【智能识别采集】和【自定义配置采集】。
本文将详细讲解【使用模板采集数据】,【智能识别采集】可点击开始学习,【自定义配置采集数据】可点击开始学习 。
使用【使用模板采集数据】
顾名思义,【采集模板】是由八爪鱼官方提供的、做好的采集模板,目前已有300+采集模板,涵盖主流网站的采集场景。模板数还在不断增加。
【使用模板采集数据】时,只需输入几个参数(网址、关键词、页数等),就能在几分钟内快速获取到目标网站数据。(类似PPT模板,只需修改关键信息就能直接使用,无需自己从头配置。)
1、如何找到所需的【采集模板】
① 首页【输入框】
在客户端首页【输入框】中,输入目标网站名称或者目标网站地址,八爪鱼自动寻找相关的采集模板。将鼠标移到需要的模板上并单击,进入模板详情页面。
注意,请确保输入的网站名称正确,否则可能无法查找到相关模板。
② 菜单【模板】
点击左侧菜单栏中的【模板】,进入采集模板展示页面。可通过【模板类型】、【搜索模板】多种方法,寻找目标模板。
③ 没有所需的模板
如果没有找到想要的模板,请进入模板展示页面后,点击右下角【?】,【我想要新模板】。官方会评估需求,排期制作新的模板。如遇模板使用问题,请点击【模板使用反馈】反馈。
2、【采集模板】如何使用
Step1:进入【模板详情】后,仔细阅读【使用方法】、【注意事项】、【采集数据预览】,确认模板的具体使用方法以及此模板采的数据符合需求。
注意:模板中的字段是固定的,无法自行增加字段。如果模板的字段不满足需求,请联系官方客服。
Step2:确定模板符合需求以后,点击【参数输入】,自行【配置参数】。常见的参数有关键词、翻页次数、URL等。
请认真查看【模板介绍】中的使用方法说明和参数说明,输入格式正确的参数,否则将影响模板的使用。
Step3:然后点击【启动采集】,选择启动【本地采集】。八爪鱼自动启动1个采集任务并采集数据。
Step4:模板启动过程中,页面会自动弹出网页内容(如果没有弹出可点击右上方【显示网页】显示),部分模板需要手动登录验证,可点击左上角暂停登录,登录完成后方可继续采集。
声明:登录非八爪鱼要求,为采集网页限制。
Step5:数据采集完成以后,可以需要的格式导出。这里以导出为【Excel】为例,数据示例:
通过【采集模板】创建并保存的任务,会放在【我的任务】中。在【我的任务】界面,可以对任务进行多种操作并查看任务采集到的历史数据。在 客户端界面介绍 中有详细说明。
3、【采集模板】是否收费
【采集模板】收费详情【模板详情】有详细说明,使用前请仔细阅读,如有疑问请咨询客服。
4、已创建的任务
点击【已创建的任务】可以查看当前模板创建过的所有任务,以及启动的云采集相关信息:云采集数据量,最近云采集时间,云采集状态,操作),以及可以设置定时启动时间
5、私人定制模板怎么用
私人定制模板请在筛选内选择个人专属,点击搜索即可出现,如有疑问请咨询客服。
现在,我们已经学会【使用模板采集数据】了。快选择合适的模板采集数据吧!
除了【使用模板采集数据】外,我们还可以通过【自定义配置采集数据】。【自定义配置采集数据】有2种方式:① 【智能识别】,只需输入网址,自动智能识别网页上的数据。自动生成采集流程;② 自己动手配置采集流程,灵活应对各类采集场景,包括翻页、滚动、登录、AJAX网页等。
作者:妙卡