赶集网招聘信息采集
2017-09-19 11:49:43 阅读量: 13760
本文介绍使用八爪鱼采集赶集网招聘信息(以深圳地区应届毕业生职位为例)的方法
采集网站:
http://sz.ganji.com/zpbiaoqian/t_0/
使用功能点:
l 分页列表信息采集
/tutorial/fylb-70.aspx?t=1
赶集网: 赶集网成是专业的分类信息网,为用户提供房屋租售、二手物品买卖、招聘求职、车辆买卖、宠物票务、教育培训、同城活动及交友、团购等众多本地生活及商务服务类信息。 网站的主要板块有:赶集招聘、赶集租房、赶集二手房、赶集二手网、赶集二手车、赶集生活服务等。
赶集网招聘信息数据采集说明:本文进行了赶集网招聘信息数据的采集,本文仅以“赶集网招聘信息采集”为例,大家在实操过程中,可根据自身需求,更换赶集网的其他内容进行数据采集。
赶集网招聘信息采集详细说明:公司招聘职位,公司薪资,公司社保,公司福利,公司地址,公司名称。
步骤1:创建采集任务
1)进入主界面,选择“自定义采集”
、
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”
步骤2:创建翻页循环
将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”
1)用鼠标选中第一条招聘信息,如下图所示红框内的内容底板会变成绿色,其中的适配信息字段会变为红色底色。选择右侧操作提示框中的“选中子元素”
2)然后系统会自动识别其他相似的链接,然后接着选择“选中全部”
3)用鼠标点中字段旁边的编辑标识,可以对提取字段的自定义命名,点中旁边的删除标识可以删除不需要的字段。
4)接下来,选择右侧提示框中的“采集以下数据”,将整个页面中的评论信息采集下来
5)之后选择“保存并开始采集”
6)选择“启动本地采集”
步骤5:数据采集及导出
1)采集完成后,会跳出提示,选择“导出数据”
2)选择“合适的导出方式”,将采集好的数据导出
3)这里我们选择excel作为导出为格式,数据导出后如下图