我们在制作规则的时候,可能会遇到总是重复采集最后一页的数据,或者总是在一二页循环提取数据,而不会转到第三页的情况,这其实是由于Xpath定位不好导致的,我们需要通过修改循环翻页的Xpath来解决这个翻页问题。
这里我们以在总是在一二页循环提取数据,而不会转到第三页的情况为例进行修改循环翻页的xpath。
一、观察翻页确定问题
如下图,配置好循环翻页步骤后,在点击循环的时候可以看到循环的是下一页按钮,我们可以直接在流程里选择点击翻页,这时八爪鱼下面的浏览器会直接跳到第二页
这个时候我们再点击流程图里面的循环,可以看到循环列表已经变成了上一页,这样系统再点击翻页的时候就会直接跳回第一页,提取第一页的数据,如此一直重复循环
二、修改循环翻页xpath
把循环翻页的xpath复制粘贴到采集器里进行修改 //A[contains(text(),'下一页')]
说明:
这里为什么修改为这个xpath可学习教程:采集遇到一二页重复循环的解决办法