视频说明

本视频介绍循环中的固定元素列表循环和不固定元素列表循环以及网页中的下拉框在八爪中如何通过循环下翻的方式处理。

定元素列表循环:

适用情况:网页上要采集的元素是固定数目的。1)每一页的元素数目固定;2)采集特定数目的元素。

实现方式:通过固定因素列表循环,循环页面内的固定元素。

定位方式:使用xpath定位,一条xpath对应循环列表中的一个元素。

固定元素列表循环在云采集时,可以实现任务的自动拆分,将加快采集速度,减小被防采被封IP的概率。

不固定元素列表循环:

适用情况:网页上要采集的元素不是固定数目。每个页面上元素数目不固定:一页存在同类元素7个,另一页存在同类元素10个......

实现方式:通过不固定因素列表循环,循环页面内的不固定数目的元素。

定位方式:使用xpath定位,一条xpath对应循环列表中的多个元素。

循环下翻适用场景:

网页中存在可以下拉并选择元素的下拉框,需要先循环选择下拉框中的元素,再进行数据采集。

例如网页中的日期选择,经常会采用下拉框切换的形式。

常见需求:

1.循环选择下拉框中所有元素。

2.循环选择下拉框中某些特定元素。