返回上一级

八爪鱼功能点

安装注册

Windows客户端安装方法

Mac客户端安装方法

免费注册账号

客户端界面介绍

本地采集界面介绍

模板采集

使用模板采集数据

自定义入门

01 自定义采集（含智能识别）

02 采集单个数据

03 采集列表数据

04 采集表格数据

05 从列表进入详情页采集

06 翻页以采集多页数据

07 启动采集并导出数据

08 采集原理与流程执行逻辑

循环

文本循环：批量输入关键词

URL循环：批量采集同类网页

循环下拉框

ajax与新标签

ajax网页采集方法

边滚动边采集数据的方法

滚动加载数据采集方法

登录验证

登录后再采集数据

XPath

火狐firebug和firepath插件以及谷歌xpath helper安装方法

XPath系统学习与实例

XPath实例：修改循环列表XPath

XPath实例1：循环列表-过滤多余的项

XPath实例1：循环列表-添加更多的项

相对XPath学习与实例

采集遇到一二页重复循环的解决办法

特殊翻页

点击【加载更多】或【再显示20条】等按钮翻页

无【下一页】按钮，点击数字进行翻页

边点击加载更多边采集数据的方法

提取数据

添加特殊字段

自定义定位元素方式

设置备用位置

自定义抓取方式

字段合并

字段格式化

正则表达式

无此字段时如何处理

系统如何去重数据

数据导出

导出到SqlServer数据库

导出到Oracle数据库

导出到Mysql数据库

导出到数据库常见问题

云采集

云采集日志查看

云采集使用方法（含定时云采集）

云采集原理和规则加速设置

云采集实况与历史运行记录

数据导出API和任务控制API

企业版管理

云采集任务启动优化

其他功能点

网页空白的排错方法

执行前等待

判断条件

触发器功能说明

鼠标移上去出现新数据

网页包含iframe框架处理办法

如何获取浏览器UA（User-Agent简称UA）

XPath实例1：循环列表-添加更多的项

2022-03-18 5606

我们通过创建【循环列表】去采集多个列表或详情页的数据。创建【循环列表】的方式在新手入门系列课程中有详细讲过。

一般情况下，通过以上方法创建的【循环列表】不会出错，能够精准采集到全部数据。

但有时候我们点击了列表页某一项数据之后，点击“选中全部”，但是循环定位到的数据并没有包含咱们要的所有数据项，这个时候可以通过手动修改xpath，让循环定位到咱们所有需要的数据，

这就是我们本节课所要讲的内容。

实例网址：https://www.haodf.com/hospital/list.html

基础操作：输入网址 —— 开始采集 —— 点击‘朝阳区某一个医院’ —— 选中全部 —— 采集以下链接文本+链接

可以看到，这样操作下来后只是定位到了朝阳区的所有医院，并没有定位到我们所要的其他区的医院。

这个时候我们就可以通过自己写一条xpath，来让循环定位到全部的医院。

注意：如何修改需要一定的XPath知识，请看之前的 XPath系统学习教程。

第一步入手我们可以先定位到我们所需的中间包含我们所需要数据的红框这块区域。通过观察属性可以很快写

出//div[@id="el_result_content"]//div[@class="ct"]来定位到这块区域的内容

第二步我们需要再深层定位到每个北京市每个城区的区域块，通过观察可以发现，每个数据块div层级都有一个共同的属性

class="m_ctt_green"，我们继续通过绝对路径的写法‘//’，把//div[@class="m_ctt_green"]与第一步我们的出的大区域xpath连接起来，

也就是//div[@id="el_result_content"]//div[@class="ct"]//div[@class="m_ctt_green"]

可以发现已经定位到了北京市19个城区的医院区块了

但是我们的需求是精准定位到每个医院的名称，所以需要再继续往深层挖掘。

第三步，可以点击“+”号展开“朝阳区”这块的div层级，再点击展开“ul”层级，通过鼠标移动可以发现，每一个“li”层级就是一个医院名称了，

所以此时只要再添加一个层级//li，就可以定位到所有的医院了，得出最终我们所要的

xpath：//div[@id="el_result_content"]//div[@class="ct"]//div[@class="m_ctt_green"]//li，定位到了所有医院，总共是340条。

把第三步所获得的最终xpath复制到八爪鱼内，点击循环列表，覆盖掉原来默认生成的xpath，点击“应用”，再重新点击下列表循环，可以发现正确的定位到了340条数据了。

采集后得到的数据：

安装注册

模板采集

自定义入门

循环

ajax与新标签

登录验证

XPath

特殊翻页

提取数据

数据导出

云采集

其他功能点

XPath实例1：循环列表-添加更多的项

服务提示

咨询顾问

申请试用

选择版本

填写信息

服务提示