Q房网深圳出租房房源信息采集方法
2017-10-12 15:55:43 阅读量: 13609
本文介绍如何使用八爪鱼采集Q房网房源信息的方法。
采集网站:
http://shenzhen.qfang.com/rent/nanshan/f3-o4
Q房网:Q房网是以尽全力满足用户需求为服务宗旨,为客户提供优质购房体验的房地产综合服务商,是聚合房地产行业云端大数据库,打造支持房地产业发展的服务平台。
Q房网采集数据说明:本文进行了深圳Q房网南山出租房的房源信息采集。本文仅以“Q房网-南山出租房的房源信息采集”为例。大家在实操过程中,可根据自身需求,更换Q房网的其他内容进行数据采集。
Q房网采集字段详细说明:房源标题,房源类型、房源面积、房源装修情况、房源楼层、房源出租方式、房源具体位置、房源标签。
使用功能点:
l 分页列表信息
步骤1:创建采集任务
1)进入主界面,选择“自定义采集”
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”
步骤2:创建翻页循环
1)将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”创建翻页循环。
步骤3:提取房源信息
1)移动鼠标,选中页面里的第一条房源信息内容,选中后,红框内的底板会变成绿色,其他适配信息会变成红色,然后在右侧的提示框中选择“选种子元素”
2)然后鼠标点中字段旁边的编辑标识,可以对提取字段自定义命名,点中旁边的删除标识可以删除不需要的字段。
之后在右侧的操作提示框中选择”选中全部“
接下来,选择右侧提示中的“采集以下数据”,将整个页面房源列表中的信息采集下来。
6)选择“保存并开始采集”
步骤4:数据采集及导出
1)采集完成后,会跳出提示,选择“是”可以把有效的数据都采集下来
2)选择“合适的导出方式”,将采集好的数据导出,这里可以选择excel作为导出为格式
3)数据导出后如下图