亚马逊商品信息采集
2017-08-25 11:08:30 阅读量: 18865
本文介绍如何使用八爪鱼采集亚马逊商品详细信息(以流行音乐CD为例)
采集网站:
https://www.amazon.cn/b/ref=sa_menu_softwa_l3_b754389051?ie=UTF8&node=754389051
使用功能点:
亚马逊:亚马逊公司是美国最大的一家网络电子商务公司,亚马逊及其它销售商为客户提供数百万种独特的全新、翻新及二手商品,如图书、影视、音乐和游戏、数码下载、电子和电脑、家居园艺用品、玩具、婴幼儿用品、食品、服饰、鞋类和珠宝、健康和个人护理用品、体育及户外用品、玩具、汽车及工业产品等。
亚马逊采集数据说明:本文进行了亚马逊-流行音乐分类的商品信息采集。本文仅以“亚马逊-流行音乐分类的商品信息采集”为例。大家在实操过程中,可根据自身需求,更换亚马逊的其他内容进行数据采集。
亚马逊采集字段详细说明:商品名称,商品作者,商品价格,商品类型,商品评论数量、商品评论星级等。
步骤1:创建采集任务
1)进入主界面,选择“自定义采集”
2)将要采集的网站网址复制粘贴到输入框中,点击“保存网址”
网址保存后,页面会在八爪鱼采集器中打开。
步骤2:创建翻页循环
1)网页打开后,将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”
步骤3:CD信息采集
1)移动鼠标,选中页面里第一张CD的标题,采集内容会变成绿色。
2)移动鼠标选中任意的文本字段以后,绿框中适配的内容会变成红色,在右侧的操作提示框中选择“选中子元素”。
3)然后再选择‘’选中全部‘’
4)然后可以查看选中的字段,将不需要的字段删除。
注意,可以把鼠标放到字段上面就会出现一个删除标识,点击标识就可以删除不需要的字段。之后点击右侧提示框中“采集以下数据”进行数据采集。
5)打开右上角流程按钮,可以修改字段名称
6)修改以后,点击右面“保存并启动”开始采集
步骤4:数据采集及导出
1)点击“启动本地采集”。
2)这里我们选择excel作为导出为格式