本文介绍使用八爪鱼采集赶集网招聘信息(以深圳地区应届毕业生职位为例)的方法

采集网站:

http://sz.ganji.com/zpbiaoqian/t_0/

 

使用功能点:

l  分页列表信息采集

/tutorial/fylb-70.aspx?t=1

 

赶集网: 赶集网成是专业的分类信息网,为用户提供房屋租售、二手物品买卖、招聘求职、车辆买卖、宠物票务、教育培训、同城活动及交友、团购等众多本地生活及商务服务类信息。 网站的主要板块有:赶集招聘、赶集租房、赶集二手房、赶集二手网、赶集二手车、赶集生活服务等。

 

赶集网招聘信息数据采集说明:本文进行了赶集网招聘信息数据的采集,本文仅以“赶集网招聘信息采集”为例,大家在实操过程中,可根据自身需求,更换赶集网的其他内容进行数据采集。

 

赶集网招聘信息采集详细说明:公司招聘职位,公司薪资,公司社保,公司福利,公司地址,公司名称。


步骤1:创建采集任务

1)进入主界面,选择“自定义采集”

 

进入八爪鱼主界面,选择自定义采集

2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址

 

将要采集的网站URL复制粘贴到输入框中,点击保存网址

步骤2:创建翻页循环

将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”

3

步骤3:提取招聘信息

1)用鼠标选中第一条招聘信息,如下图所示红框内的内容底板会变成绿色,其中的适配信息字段会变为红色底色。选择右侧操作提示框的“选中子元素


赶集网招聘信息采集4

 

2)然后系统会自动识别其他相似的链接,然后接着选择“选中全部


赶集网招聘信息采集5

 

3)用鼠标点中字段旁边的编辑标识,可以对提取字段的自定义命名,点中旁边的删除标识可以删除不需要的字段。

 

赶集网招聘信息采集6

 

4)接下来,选择右侧提示框中的“采集以下数据”,将整个页面中的评论信息采集下来

 

赶集网招聘信息采集7

 

5)之后选择“保存并开始采集

 

赶集网招聘信息采集8

 

6)选择“启动本地采集

 

赶集网招聘信息采集9

步骤5:数据采集及导出

1)采集完成后,会跳出提示,选择“导出数据”

2)选择“合适的导出方式”,将采集好的数据导出

3)这里我们选择excel作为导出为格式,数据导出后如下图


赶集网招聘信息采集10