拼多多商品数据采集
2018-01-19 10:46:36 阅读量: 38826
拼多多一款拼团形式的手机购物APP。用户通过发起和朋友,家人,邻居等的拼团,以更低的价格,拼团购买商品。
本文介绍使用八爪鱼采集拼多多商品(限时秒杀)的方法。本文仅以限时秒杀这个栏目做举例说明,大家在采集的时候也可以采集其他栏目。
采集内容包括:商品标题、商品图片、商品价格,商品原价、商品销量
使用功能点:
l 提取数据
l 修改Xpath
步骤1:创建拼多多商品采集任务
1)进入主界面,选择“自定义采集”
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”
步骤2:提取拼多多数据字段
1)鼠标选中要采集的数据,比如我选的是商品标题、商品图片、商品价格,商品原价、商品销量,商品在右面的提示框中选择“选中全部”
拼多多商品采集-提取数据字段
2)随后点击“采集数据”,接下来点击“保存并开始采集”
3)打开右上角流程按钮,观察发现图片地址是默认扫码的按钮,并不是我们想要的。
4)选中拼多多商品图片这个字段,依次点击自定义数据字段->自定义定位元素方式,按下图进行“自定义定位元素设置图”设置。
元素匹配的xpath:
//body/section[1]/div[4]/div[1]/ul[1]/li[1]/div[1]/DIV[1]/IMG[1]
相对xpath:/DIV[1]/IMG[1]
修改好后点击确定
自定义数据字段
自定义定位元素设置图
步骤3:拼多多商品数据采集及导出
1)修改采集字段名称,点击“保存并开始采集”
启动本地采集
采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出,这里我们选择excel作为导出为格式,一份完好的拼多多商品数据就导出好了,数据导出后如下图