【8.0新手入门】第2课:2种采集模式与界面介绍
2019-10-24 10:23:59 阅读量: 15112
在 第1课:下载安装 中,我们已经下载好了八爪鱼客户端并成功登陆。作为新手,如何从0开始数据采集呢?
本课将讲解用八爪鱼采集数据的两种模式:使用【采集模板】和【自定义配置任务】,并进行整体界面介绍。
一、两种采集模式
1、使用【采集模板】
顾名思义,【采集模板】是由八爪鱼官方提供的、做好的采集模板。用户只需输入几个参数(网址、关键词、页数等),就能在几分钟内快速获取到目标网站数据。(类似PPT模板,只需改改信息就能直接使用。)
1.1 如何找到所需的【采集模板】?
1.1.1 首页【输入框】
在客户端首页【输入框】中,输入目标网站名称,八爪鱼自动寻找相关的采集模板。将鼠标移到需要的模板上并单击,进入模板详情页面。
鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图
下文其他图片同理
特别说明:
a. 输入网站名称后无模板出现?请确保输入的网站名称正确。
1.1.2 首页【热门采集模板】
点击【热门采集模板】中的模板,或者【更多>>】,进入采集模板展示页面。可通过【模板类型】、【搜索模板】多种方法,寻找目标模板。
1.1.3 首页左侧点击【+ 新建】
在首页左侧点击【+ 新建】,选择【模板任务】进入采集模板展示页面。可通过【模板类型】、【搜索模板】多种方法,寻找目标模板,与1.1.2同。
1.1.4 没有所需的模板?
没有找到想要的模板?请进入模板展示页面后,点击右上角【我想要新模板】,提交新模板制作需求。
1.2 【采集模板】如何使用
1.2.1 进入【模板详情页】后,仔细阅读【模板介绍】、【采集字段预览】、【采集参数预览】、【示例数据】,确认此模板采的数据符合需求。
特别说明:
a. 想要增加模板中的字段?请联系客服。
1.2.2 点击【立即使用】,自行【配置参数】。常见的参数有关键词、页数、城市、URL等。请按照截图说明,输入正确的参数。
1.2.3 然后点击【保存并启动】,选择启动【本地采集】。八爪鱼自动启动1个采集任务并采集数据。
1.2.4 数据采集完成以后,可以需要的格式导出。这里以导出为【Excel】为例。
数据示例:
1.3 【采集模板】是否收费
【采集模板】大部分是免费的,少部分是收费的。【采集模板】是否收费在【模板详情页】有详细说明,请仔细阅读。如有疑问请咨询客服。
2、使用【自定义配置】
【自定义配置】,即针对目标网站,自行配置【采集任务】采集数据。需要掌握八爪鱼的基本操作。(类似不用PPT模板,自己动手写一份PPT,需要掌握PPT的基本使用方法,文本框怎么放,动画效果怎么添加等。)
【采集任务】,也叫采集规则,采集流程,是从特定网页上抓取数据的指令。每个网站的页面布局是不同的,因此【采集任务】不能通用。一般情况下,一个网站需要配置一个【采集任务】。举个例子,京东商品采集和淘宝商品采集,需要配置2个不同的采集任务。下图中就是一个配置好的【采集任务】。
新手如何从0开始,用【自定义采集】配置采集任务并抓取到数据?是本新手入门系列课的重点,第3-9课会详细讲解。
二 界面介绍
上文中,我们认识了首页【输入框】和【热门模板采集】怎么用。下面将详细介绍首页左侧边栏。
1 【+ 新建】
新建【模板任务】、【自定义配置任务】、任务组、导入任务的1个快捷入口。
2【我的任务】
通过【模板采集】或【自定义配置】创建并保存的任务,都会放在【我的任务】中。在【我的任务】界面,可以对任务进行多种操作。
2.1 进行任务二次编辑、多次启动、筛选查找、导入导出。
通过导入导出功能(图中为导入状态,仅【自定义任务】可导入导出),我们可与别人分享建好的【自定义任务】。
2.2 任务选中状态下,可进行删除、导出任务、移动到分组等操作。
点击左侧边栏 按钮,可进行任务组管理:添加、修改、删除,设为默认等。
2.3 如果任务启动采集并获取到数据,可查看此任务的历史数据。
2.4 任务可按任务组排序(便于分组管理),也可按最近编辑时间排序(便于查找最近编辑任务)。
3 【云采集】
查看云采集任务运行状态的快捷入口。
4 【数据定制】
八爪鱼提供规则定制、数据定制等多项定制服务。如果不想自己采数据,可联系客服进行专业定制。
5 【人工客服】
使用软件过程中有任何问题,都可通过【人工客服】联系我们。
6 【左侧边栏底部】
从左至右依次为【设置】、【工具箱】、【教程与帮助】、【关于我们】。
6.1 设置:可进行任务组管理。添加、修改、删除、设为默认等。
6.2 工具箱:放置八爪鱼常用小工具。
6.3 教程与帮助:提供详细的教程。
6.4 关于我们:展示软件版本号与说明。
作者:Aisling
编辑:Aisling