淘宝评论数据采集

2017-08-08 14:58:28 阅读量: 102373

本文介绍使用八爪鱼采集淘宝网数据方法。

 

采集网站:

https://s.taobao.com/search?q=%E5%8D%8E%E4%B8%BAp10&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.50862.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170804&app=detailproduct&through=1

 

淘宝网:淘宝网是亚太地区较大的网络零售、商圈,由阿里巴巴集团在2003年5月创立。淘宝网是中国深受欢迎的网购零售平台,拥有上亿的注册用户数和在线商品数。采集并分析商品的评论内容,于商家、于消费者而言,都是一件必要而十分有价值的事情。

 

数据说明:本文进行了淘宝网-搜索“华为P10”此关键词-点击每条搜索“华为P10”关键词后出现的商品结果链接,进入每一个商品详情页面-再点击“评论”按钮,采集每一个买家的评论信息。

 

本文仅以“淘宝网-搜索华为P10后出现的商品链接里的具体评论”为例。大家在实操过程中,可根据自身需求,更换搜索的关键词和具体字段进行数据采集。

 

详细字段说明:买家用户名、具体评论、购买信息、成交时间、是否有用、赞同数

 

使用功能点:

分页列表及详细信息提取

 

步骤1:创建采集任务

1)进入主界面,选择“自定义模式

淘宝评论信息采集方法1

2)商品信息页的网址制粘贴到网站输入框中,点击保存网址

淘宝评论信息采集方法2

 

步骤2:创建翻页循环

1)将页面下拉到底部,点击“下一页”按钮,在右侧操作提示框中,选择循环点击下一页

淘宝评论信息采集方法3

 

步骤3:创列表循环

1)移动鼠标选中页面里的第一个产品链接。选中后,系统会自动识别页面里的其他相似链接。在右侧操作提示框中,选择“选中全部”

淘宝评论信息采集方法4

2)选择“循环点击每个链接”,以创建一个列表循环

淘宝评论信息采集方法5

 

步骤4:提取评论信息

1)在创建列表循环后,系统会自动点击第一个商品链接,进入商品详细信息页。将页面下拉至评论区,点击“累计评论”,选择“点击该元素”

淘宝评论信息采集方法6

2)选中第一条评论,在右侧的操作框中,选择“选中子元素”

淘宝评论信息采集方法7

3)系统会自动识别同类元素。在右侧的操作框中,选择“选中全部”

淘宝评论信息采集方法8

4)选择要采集的字段完成后,点击“采集以下数据”

淘宝评论信息采集方法9

5)选中相应的字段,可以进行字段的自定义命名完成后,点击左上角的“保存并启动”,启动采集任务

淘宝评论信息采集方法10

6)选择启动本地采集

淘宝评论信息采集方法11

 

步骤5:数据采集及导出

1)采集完成后,会跳出提示,选择导出数据”。选择合适的导出方式,将采集好的评论信息数据导出

淘宝评论信息采集方法13

2)这里我们选择excel作为导出为格式,数据导出后如下图

淘宝评论信息采集方法14

 

欢迎咨询在线客服
加微信群,与更多用户一起交流