马蜂窝美食文章评论采集教程
2017-11-23 11:49:57 阅读量: 23635
本文介绍使用八爪鱼采集马蜂窝美食评论(以三种美食为例)的方法
采集网站:
http://www.mafengwo.cn/poi/4208245.html
http://www.mafengwo.cn/poi/6764789.html
http://www.mafengwo.cn/poi/17777.html
使用功能点:
l URL循环
l 分页列表循环
马蜂窝网站简介:马蜂窝旅行网是中国领先的自由行服务平台。马蜂窝旅行网由陈罡和吕刚创立于2006年,从2010年正式开始公司化运营。马蜂窝的景点、餐饮、酒店等点评信息均来自数千万用户的真实分享,每年帮助过亿的旅行者制定自由行方案。
马蜂窝以“自由行”为核心,蚂蜂窝提供全球60000个旅游目的地的旅游攻略、旅游问答、旅游点评等资讯,以及酒店、交通、当地游等自由行产品及服务。
马蜂窝美食评论采集数据说明:本文进行了马蜂窝-美食评论信息的采集。本文仅以“马蜂窝-美食评论信息采集”为例。大家在实操过程中,可根据自身需求,更换马蜂窝的其他内容进行数据采集。
马蜂窝美食评论采集字段详细说明:评论内容,评论人id,评论时间。
步骤1:创建采集任务
1)进入主界面,选择“自定义采集”
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”。这里我们先到马蜂窝上面复制想要采集的美食网址,然后复制粘贴
步骤2:创建翻页循环
1)网页打开以后,将页面下拉到底部,点击“Next”按钮。在右侧的操作提示框中,选择“循环点击单个链接”
步骤3:创建列表循环及信息提取
1)移动鼠标,选中第一条评论,评价框会变成绿色,其中的字段会变为红色底色。然后选择右侧操作提示框中的“选中子元素”
2)字段信息选择完成以后,选中字段旁边的编辑和删除标识,可以把多余的字段删除,并进行自定义命名
3)然后选择“选中全部”
步骤4:数据采集及导出
1)接下来,选择右侧提示中的“采集以下数据”,将整个页面中的评论信息采集下来
2)然后选择“保存并启动”,开始数据采集
3)这里采集方式选择“启动本地采集”
4)采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出,这里我们选择excel作为导出为格式,数据导出后如下图