天猫店铺数据的采集方法
2017-08-18 09:19:19 阅读量: 32517
本文介绍使用八爪鱼采集天猫店铺数据(采集天猫男装店铺)的方法
采集网站:
天猫(英文:Tmall,亦称淘宝商城、天猫商城),原名淘宝商城,是一个综合性购物网站。整合数千家品牌商、生产商,为商家和消费者之间提供一站式解决方案。提供100%品质保证的商品,7天无理由退货的售后服务,以及购物积分返现等优质服务。
数据说明:很多商家和消费者,都有采集天猫上某一类的商品的数据需求。本文采集示例URL中的男装商品信息。打开要采集的网址后,没有点击商品链接进入商品详情页,而直接以商品区块建立循环列表。
本文示例网址为某男装的商品展示。大家在实操过程中,可更换任意分类、任意商品的相关链接,以采集需要的数据。
详细字段说明:商品名、价格、所在店铺名、月销量、评价。
使用功能点:
l 分页列表信息采集
步骤1:创建采集任务
1)进入主界面,选择“自定义模式”
2)将商品信息页的网址复制粘贴到网站输入框中,点击“保存网址”
步骤2:创建列表循环并提取字段
1)移动鼠标,在第一个宝贝中选择两个需要提取的字段,这样我们需要提取的字段都出来了,选择“选中全部”
2)然后选择“采集以下数据”
3)打开“流程图”,查看刚才提取的列表字段数据
4)将不相关的字段删除,修改相关字段标题。
步骤3:创建翻页循环
1)将页面下拉到底部,点击“下一页”按钮,在右侧的操作提示框中,选择“循环点击下一页”
2)然后选择“保存并启动”
3)选择“启动本地采集”
步骤4:数据采集及导出
1)采集完成后,会跳出提示,选择“导出数据”
2)选择“合适的导出方式”,将采集好的评论信息数据导出
3)这里我们选择excel作为导出为格式,数据导出后如下图
以上为天猫店铺采集详细教程,按照步骤操作即可,其中部分操作顺序可以适当调整,最终也是可以正常采到数据的,灵活应用即可。同时关于提取字段也可以根据实际情况进行添加和删减,根据自己需求定。