本文介绍使用八爪鱼采集中介房源(以赶集网租房中的经纪人房源为例)的方法

 

采集网站:

http://sz.ganji.com/


采集的内容包括:经纪人,网址,经纪公司,服务区域,链接,服务小区,综合评分,联系方式。

使用功能点:

l 创建循环翻页

l 分页列表信息采集

l Ajax加载

 

步骤1:创建采集任务

1)进入主界面,选择自定义采集

 

 

2)要采集网站URL制粘贴到输入框中,点击保存网址

 

 

 

步骤2:Ajax加载

1)因为我们已经确定要采集租房的房源,所以可以在网站中租房,然后选择“点击该链接”。

 

 

2)同上操作,鼠标选择“找经纪人”,然后选择点击该链接

 

 

 

3此步骤涉及Ajax技术。打开高级选项”,勾选“Ajax加载数据”,设置时间为“2秒”。完成后,点击“确定

 

 

步骤3:创建翻页循环

将页面下拉到底部,鼠标点击“下一页”按钮。然后在右侧操作提示框中,选择循环点击下一页


 

步骤4:提取房源列表信息

1)移动鼠标选中页面里的第一条房源的相关信息。选中后,红框内的底板会变成绿色,其中的适配信息字段会变为红色底色然后在右侧的操作提示框中,选择“选中子元素”。

 

 

 

2)接着选择选中全部

 

 

最后选择采集以下数据

 

 

 

3)然后打开右上角的流程按钮,可以对提取字段的自定义命名,点中下边的删除标识可以删除不需要的字段。

 

 

 

 

之后选择“保存并开始采集”并选择启动本地采集。

 

步骤5:数据采集及导出

最后保存并启动本地采集

 

采集完成后,会跳出提示,选择导出数据选择合适的导出方式,将采集好的数据导出这里我们选择excel作为导出为格式,数据导出后如下图

 


采集的内容包括:经纪人,网址,经纪公司,服务区域,链接,服务小区,综合评分,联系方式。