返回上一级

八爪鱼功能点

安装注册

Windows客户端安装方法

Mac客户端安装方法

免费注册账号

客户端界面介绍

本地采集界面介绍

模板采集

使用模板采集数据

自定义入门

01 自定义采集（含智能识别）

02 采集单个数据

03 采集列表数据

04 采集表格数据

05 从列表进入详情页采集

06 翻页以采集多页数据

07 启动采集并导出数据

08 采集原理与流程执行逻辑

循环

文本循环：批量输入关键词

URL循环：批量采集同类网页

循环下拉框

ajax与新标签

ajax网页采集方法

边滚动边采集数据的方法

滚动加载数据采集方法

登录验证

登录后再采集数据

XPath

火狐firebug和firepath插件以及谷歌xpath helper安装方法

XPath系统学习与实例

XPath实例：修改循环列表XPath

XPath实例1：循环列表-过滤多余的项

XPath实例1：循环列表-添加更多的项

相对XPath学习与实例

采集遇到一二页重复循环的解决办法

特殊翻页

点击【加载更多】或【再显示20条】等按钮翻页

无【下一页】按钮，点击数字进行翻页

边点击加载更多边采集数据的方法

提取数据

添加特殊字段

自定义定位元素方式

设置备用位置

自定义抓取方式

字段合并

字段格式化

正则表达式

无此字段时如何处理

系统如何去重数据

数据导出

导出到SqlServer数据库

导出到Oracle数据库

导出到Mysql数据库

导出到数据库常见问题

云采集

云采集日志查看

云采集使用方法（含定时云采集）

云采集原理和规则加速设置

云采集实况与历史运行记录

数据导出API和任务控制API

企业版管理

云采集任务启动优化

其他功能点

网页空白的排错方法

执行前等待

判断条件

触发器功能说明

鼠标移上去出现新数据

网页包含iframe框架处理办法

如何获取浏览器UA（User-Agent简称UA）

XPath实例1：循环列表-过滤多余的项

2022-03-17 5905

我们通过创建【循环列表】去采集多个列表或详情页的数据。创建【循环列表】的方式在新手入门系列课程中有详细讲过。

一般情况下，通过以上方法创建的【循环列表】不会出错，能够精准采集到全部数据。但有时候也会遇到一些问题：比如列表中有的部分不是我们想要的，需要进行丢弃。

这时候，可以手动修改XPath去定位列表丢弃不需要的部分。也可以用分支判断丢弃。

以下通过实例进行说明。

实例网址：https://weibo.com/2803301701?refer_flag=1001030103_

一、用XPath过滤多余的项

Step1：按照常规操作创建流程

这个网页采集列表信息，我们按登录网站后常规的采集列表的方法创建循环列表。

Step2：手动执行规则

配置好后，手动执行规则发现：当页面处于第一页时，所有博文都选中了采集，如果我们只想要带视频的博文内容，就需要把纯文字或带图片的博文丢弃。

这里通过修改【循环列表】XPath筛选只包含视频的博文。

Step3：修改【循环列表】XPath

进入【循环列表】的设置页面，修改xpath为//a[@class="WB_video_h5"]/../../../..

修改点击应用后可以发现之选中了包含视频的博文。

这里为什么要改用这个xpath呢，因为我们要去找包含视频博文特有的xpath，通过观察可以发现视频特有的xpath是//ul[@class="WB_media_a WB_media_a_m1 clearfix"]

然后符号\.. 表示返回父级标签，\..\..表示返回到父级的父级标签，以此类推下去。

这里总结一下：当发现列表定位过多，需要过滤多余的项，就需要修改【循环列表】的定位XPath

如何修改需要一定的XPath知识，请看之前的 XPath系统学习教程。

二、分支判断丢弃不需要的列表数据

Step1：按照常规操作创建流程

同上面所讲述方法一致，我们按登录网站后常规的采集列表的方法创建循环列表。

Step2：添加判断条件

1.如下所示添加判断条件

2.左侧分支条件勾选【当前循环项包含元素】，然后填入xpath://ul[@class="WB_media_a WB_media_a_m1 clearfix"]

3.把提取数据拖入左侧分支条件，从而实现采集视频的博文。右侧分支不设置提取数据。

提示：

关于判断设置，可学习判断条件教程

安装注册

模板采集

自定义入门

循环

ajax与新标签

登录验证

XPath

特殊翻页

提取数据

数据导出

云采集

其他功能点

XPath实例1：循环列表-过滤多余的项

服务提示

咨询顾问

申请试用

选择版本

填写信息

服务提示