请输入
菜单

修改循环翻页xpath

标签:教程

我们在制作规则的时候,可能会遇到总是重复采集最后一页的数据,或者总是在一二页循环提取数据,而不会转到第三页的情况,这其实是由于Xpath定位不好导致的,我们需要通过修改循环翻页的Xpath来解决这个翻页问题。

 

这里我们以在总是在一二页循环提取数据,而不会转到第三页的情况为例进行修改循环翻页的xpath。

示例网址:https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E5%A4%A7%E6%95%B0%E6%8D%AE&fenlei=256&oq=%25E5%2586%25AC%25E5%25A5%25A5%25E4%25BC%259A&rsv_pq=834522bb00017899&rsv_t=46e2I%2F550HGI44YjdOVPdp9vLKx9Fdy9gibwppjeYk%2BdhpRulDesPJQJP3A&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=9&rsv_sug1=6&rsv_sug7=100&rsv_sug2=0&rsv_btype=t&inputT=1227&rsv_sug4=452935

 

 

一、观察翻页确定问题

 

如下图,配置好循环翻页步骤后,在点击循环的时候可以看到循环的是下一页按钮,我们可以直接在流程里选择点击翻页,这时八爪鱼下面的浏览器会直接跳到第二页

这个时候我们再点击流程图里面的循环,可以看到循环列表已经变成了上一页,这样系统再点击翻页的时候就会直接跳回第一页,提取第一页的数据,如此一直重复循环

 

二、修改循环翻页xpath

把循环翻页的xpath复制粘贴到采集器里进行修改 //A[contains(text(),'下一页')]

 

说明:

这里为什么修改为这个xpath可学习教程:采集遇到一二页重复循环的解决办法

最近修改: 2024-03-05