赶集中介房源采集
2018-01-18 14:19:06 阅读量: 16838
本文介绍使用八爪鱼采集中介房源(以赶集网租房中的经纪人房源为例)的方法
采集网站:
采集的内容包括:经纪人,网址,经纪公司,服务区域,链接,服务小区,综合评分,联系方式。
使用功能点:
l 创建循环翻页
l 分页列表信息采集
l Ajax加载
步骤1:创建采集任务
1)进入主界面,选择“自定义采集
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”
步骤2:Ajax加载
1)因为我们已经确定要采集租房的房源,所以可以在网站中租房,然后选择“点击该链接”。
2)同上操作,鼠标选择“找经纪人”,然后选择”点击该链接
3)此步骤涉及Ajax技术。打开“高级选项”,勾选“Ajax加载数据”,设置时间为“2秒”。完成后,点击“确定”
步骤3:创建翻页循环
将页面下拉到底部,鼠标点击“下一页”按钮。然后在右侧的操作提示框中,选择“循环点击下一页”
步骤4:提取房源列表信息
1)移动鼠标,选中页面里的第一条房源的相关信息。选中后,红框内的底板会变成绿色,其中的适配信息字段会变为红色底色。然后在右侧的操作提示框中,选择“选中子元素”。
2)接着选择“选中全部”
最后选择“采集以下数据”
3)然后打开右上角的流程按钮,可以对提取字段的自定义命名,点中下边的删除标识可以删除不需要的字段。
之后选择“保存并开始采集”并选择启动本地采集。
步骤5:数据采集及导出
最后保存并启动本地采集,
采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出这里我们选择excel作为导出为格式,数据导出后如下图
采集的内容包括:经纪人,网址,经纪公司,服务区域,链接,服务小区,综合评分,联系方式。