媒体阅读
电子商务
本地生活
搜索引擎
其它
京东(列表数据、商品搜索、商品详情、最近评论、评论分类)
2021-02-08 10167
视频说明
京东列表页数据采集(list开头网址)
模版介绍:
此模板用于批量采集京东站点下网址以list开头的列表页信息,循环采集列表页的商品信息。注意:输入的网址前缀格式如下:https://list.jd.com/list.html?cat=,不符合要求的会导致采集不到数据
使用方法:
1.点击【立即使用】进入参数配置界面。
2.获取列表页list开头网址, 打开网页https://list.jd.com/list.html?cat=737,794,798,选中采集的类目品类点击,比如:鼠标移动到 “全部商品分类”,“电脑”类目下,点击右侧的“笔记本”网页跳转后,复制当前页面网址输入:https://list.jd.com/list.html?cat=670,671,672
如您要输入多个网址,请每个网址之间用回车进行换行。支持直接从Excel表格中直接复制黏贴一列网址进来。建议每个任务中的网址不要超过1万个。
3.所有参数设置完毕后,请点击【保存并启动】进行采集。
京东-商品搜索-建议本地采集
模版介绍:
此模板用于采集京东主页,进行商品关键词搜索后的列表页信息。模板因网站防采集等原因,云采集时,使用代理IP会获得更好的采集效果。账号内无代理IP时,云上会采集不到数据。如账户内无代理IP,也可使用本地采集。
此外当网站遇到防采集时,会使用代理IP,请确保您账号内有代理IP余额,如已无余额请先进行充值。否则很可能导致采集中断或无法采集。可在浏览器中打开该链接进行充值:https://www.bazhuayu.com/buy/IPproxy
使用方法:
1.点击【立即使用】进入参数配置界面。
2.输入要检索的关键词,如“耐克”。如您要输入多个关键词,请每个关键词之间用回车进行换行。支持直接从Excel表格中直接复制黏贴一列关键词进来。建议每个任务中的关键词不要超过了1万个。
3.设置要翻页的次数,即点击下一页的次数。请输入数字,如“5”,可实现只采集前5页的内容。如果需要采集全部的,则不填写该参数,留空即可。
4.所有参数设置完毕后,请点击【保存并启动】进行采集。
京东-商品详情采集
模板介绍:
此模板用于采集京东商品详情页的商品详细信息,如商品名称,价格,优惠券,促销,颜色,版本子sku,商品基本参数等等。
使用方法:
1.点击【立即使用】进入参数配置界面。
2.输入商品详情页链接,如:https://item.jd.com/55447367940.html;https://item.jd.com/53224481208.htm,如要输入多个(1万个以内)网址,请每个网址之间用回车换行。支持直接从Excel表格中直接复制黏贴一列网址进来。
3.请点击【保存并启动】进行采集。
京东评论——当前商品最近评论
模版介绍:
此模板用于采集京东商品详情页的当前商品最近评论, 勾选了“只看当前商品评价”和“按时间排序”。由于京东云采集需要登录,因此该模板只能本地采集。
使用方法:
1.点击【立即使用】进入参数配置界面。
2.输入要采集的商品详情页网址 :如 https://item.jd.com/100004239719.html,https://item.jd.com/4438331.html,如要输入多个(1万个以内)网址,请每个网址之间用回车换行。支持直接从Excel表格中直接复制黏贴一列网址进来。
3.请点击【保存并启动】进行采集。
注意:
京东评论的限制最多显示前100页数据
京东商品评论
模版介绍:
此模板用于采集京东商品详情页的商品评价信息。具体采集内容请点击【采集字段预览】和【示例数据】。
使用方法:
1.点击【立即使用】进入参数配置界面。
2.输入要采集的商品网址 :https://item.jd.com/100004239719.html,https://item.jd.com/4438331.html,如您要输入多个网址,请每个网址之间用回车进行换行。支持直接从Excel表格中直接复制黏贴一列网址进来。建议每个任务中的网址不要超过了1万个。
3.设置要翻页的次数,即点击下一页的次数。请输入数字,如“5”,可实现只采集前5页的内容。京东评论的限制最多显示前100页数据。
4.所有参数设置完毕后,请点击【保存并启动】进行采集。