饿了么评论采集
2018-01-19 12:17:59 阅读量: 14085
本文介绍使用八爪鱼采集饿了么的方法,学会之后用户可以熟练使用我们的各种步骤来采集你所需要的各类网站数据,成为采集达人。
采集网站:
https://www.ele.me/shop/1919756/rate
本文就以饿了么主页下的某一个店家--点都德,来具体说明怎么去采集类似的店铺评价。
采集的内容包括:评价用户昵称、评论内容、满意程度、评论时间
使用功能点:
步骤1:创建饿了么店铺评论采集任务
1)进入主界面,选择“自定义采集”
2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”
.
步骤2:设置Ajax滚动下拉
1)打开网页之后,进入饿了么店铺详情页面,打开右上角的流程按钮,可以显示你所创建好的步骤,该页面为ajax下拉加载页面,所以需要先滚动到底部再进行采集。查看打开网页“高级选项”,设置“页面加载完成后向下滚动”,滚动次数根据页面而定(这里设置20次),方式设置“直接滚动到底部”
步骤三:提取数据
1)提取评论中所需数据,点击第一条评论空白处,点击“选中子元素”
2)系统识别出与选中元素相似元素,选择“选中全部”
3)然后采集数据,删除不需要的字段,对字段名称进行更改
步骤四:开启采集
1)选择“启动本地采集
2)采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的数据导出, 这里我们选择excel作为导出为格式
数据导出后如下图