八爪鱼,百万用户信赖的网络爬虫工具

跨境电商必看:亚马逊数据采集规则推荐

作者:xinyue 发布时间:7/31/2014 5:39:22 PM 17808 人已阅读

摘要:做跨境电商的企业或许会很困惑,要如何了解海外用户的喜好和市场机会,合理评估备货产品种类和数量,降低海外仓库备货的风险,大部分企业没有一个很好的方式去收集这些数据源,支持运营分析,下面我们就来给大家介绍八爪鱼采集器针对境外网站可以如何进行数据采集。

       跨境电商最近非常火爆,虽然目前做跨境电商在通关及仓储物流环节还存在着难点,但是随着各地政府相继推出各种促进跨境电商交易的扶持政策,跨境电商的大环境日趋明朗,逐渐呈现火爆的状况。

       对于做跨境电商的企业和个人来说,为了缩短物流时间和环节,会选择在海外建仓提前备货,那么,提前了解市场行情和用户喜好,做出科学合理的产品SKU预测就非常重要了,很多做跨境电商的企业或个人习惯性的会通过从国外像亚马逊、EBAY等主流电商网站去获取较为全面详细的信息,通过人工的方式获取显然效率低下,下面我们就来介绍,使用大数据收集工具——八爪鱼采集器如何去快速准去的抓取国外网站的网页数据,为跨境电商企业运营提供参考数据。

      八妹子接下来以亚马逊为例,采集商品的评价及昵称信息,需要采集其他信息的企业可以修改或借鉴本方式,举一反三。

   首先,从规则市场内搜索亚马逊的评价或昵称信息的规则。

 1 亚马逊规则收集

 

第二步,直接将规则导入到任务中,启动,如果你需要修改示例中的网址,可以如下图操作办法进行修改

 亚马逊修改网址

 

如果你只需要采集亚马逊会员名称或评价信息,则直接运行本规则即可,如果你需要再采集其他内容或想自行配置规则,那么需要重点注意以下两个问题:

 

(1)亚马逊翻页设置:

由于网页上的结构并不相同,如翻页设置,直接设置可能会出现某些页数不断循环重复采集的问题,需要再此处设置一下,如下图所示。

 循环翻页设置3

 

2)亚马逊字段设置:

亚马逊字段提取的时候,也有与翻页同样的问题存在,到了某些页数之后,由于页面结构变化了,所采集出来的字段会完全重复,需要先自定义下字段元素,设置下相对XPATH值,小伙伴们可以使用FIREBUG定位到XPATH,然后在下图位置进行修改。

 提取字段设置4 1

 找到字段自定义设置,点击进去修改

 提取数据设置4

 

    做跨境电商的企业可以使用类似的方式多去尝试,去收集国外各个电商网站信息,分析国外用户的喜好及关注的点,将用户抱怨的声音转化为需求,从而更好的发现商机。

 

八爪鱼大数据免费培训课程每周六晚上20:30在YY频道28555302上与你不见不散哦!学会更多大数据的工作方法,改变你的工作方式和思考习惯!


欢迎咨询在线客服
加微信群,与更多用户一起交流