视频说明

本视频介绍在八爪鱼中如何查看/自动生成XPath。

XPath简介

XPath是专门针对xml设计的,在复杂结构化数据中查找信息的语言,简单来说,就是利用一条路径表达式,找到我们需要的数据位置

查看/自动生成XPath方法

1、通过火狐浏览器里面的firebug和firepath插件生成/查看XPath
注:火狐浏览器需是55版本以下,过高的版本可能无法使用firebug和firepath插件,安装时和安装后均需禁止浏览器自动更新
54版本火狐浏览器的下载地址:
64位火狐54:http://ftp.mozilla.org/pub/firefox/releases/54.0.1/win64/zh-CN/
32位火狐54:http://ftp.mozilla.org/pub/firefox/releases/54.0.1/win32/zh-CN/
其他版本下载地址:http://ftp.mozilla.org/pub/firefox/releases/

2、通过八爪鱼采集器生成/查看XPath
八爪鱼采集器内部有一套针对html的XPath引擎,直接用XPath就能精准的查找、定位网页里面的数据,从而进行数据提取。在八爪鱼中进行规则配置的时候,会自动生成定位数据的XPath
在八爪鱼规则配置中,除了打开网页步骤没有XPath外,其他步骤都涉及到XPath定位