淘宝网商品信息采集
2017-08-10 19:24:03 阅读量: 98448
本文介绍使用八爪鱼采集淘宝网商品(以某女装店铺所有商品)的方法
采集网站:
https://tangs.taobao.com/category.htm?spm=a1z10.1-c-s.w5001-15784518815.3.1457e73eKuBzRB&search=y&scene=taobao_shop
使用功能点:
淘宝网:淘宝网是亚太地区较大的网络零售、商圈,由阿里巴巴集团在2003年5月创立。淘宝网是中国深受欢迎的网购零售平台,拥有近5亿的注册用户数,每天有超过6000万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。
淘宝网商品采集数据说明:本文进行了淘宝网商品(以某女装店铺所有商品)采集。本文仅以“淘宝网商品(以某女装店铺所有商品)”为例。大家在实操过程中,可根据自身需求,更换淘宝网的其他内容进行数据采集。
淘宝网采集字段详细说明:商品标题,商品价格,商品评价,商品销量,商品库存,商品人气值。
步骤1:创建采集任务
1)进入主界面,选择“自定义模式”
2)将要采集的网址,复制粘贴到网站输入框中,点击“保存网址”
步骤2:创建翻页循环
1)将页面下拉到底部,点击“下一页”按钮,在右侧的操作提示框中,选择“循环点击下一页”
步骤3:创建列表循环
1)移动鼠标,选中页面里的第一个商品链接。选中后,系统会自动识别页面里的其他相似链接。在右侧操作提示框中,选择“选中全部”
2)选择“循环点击每个链接”,以创建一个列表循环
步骤4:提取商品信息
1)在创建列表循环后,系统会自动点击第一个商品链接,进入商品详细信息页。点击需要的字段,选择“采集该元素的文本”
2)选择要采集的字段完成后,点击“采集以下数据”
3)选中相应的字段,可以进行字段的自定义命名。完成后,点击左上角的“保存并启动”,启动采集任务
4)选择“启动本地采集”
步骤5:数据采集及导出
1)采集完成后,会跳出提示,选择“导出数据”。选择“合适的导出方式”,将采集好的数据导出
2)这里我们选择excel作为导出为格式,数据导出后如下图
推荐阅读:淘宝关键词抓取