请输入
菜单

网页包含iframe框架处理办法

有的网页包含iframe框架,在八爪鱼中也需进行相应设置,本教程将详细讲解。

 

1、什么是iframe框架

通俗来说,iframe框架就是在同一个页面中有多个网页,也就是网页中嵌套了其他的网页。

iframe框架可能有一层,也可能有多层。

如何判断网页有几层iframe框架?

借助火狐浏览器的firebug和firepath插件,我们可以很容易地判断出网页有几层iframe框架。

如果没有安装,请查看 火狐firebug和firepath插件以及谷歌xpath helper安装方法  。

安装好后,点击【Top Window】位置,会显示出网页的层级。

如下图所示:第一个网页有一层iframe框架,第二个网页则有四层iframe框架。

 

2、网页具有一层iframe框架的采集方法

八爪鱼支持自动识别一层iframe框架,因此按照正常流程配置流程即可。

示例网址:http://www.weather.com.cn/alarm/alarm_list.shtml

示例网址具有一层iframe框架:【iframe】,即搜索结果列表是一个独立的网页,嵌套在整个大网页中。

 

这个iframe框架里的数据,正是我们需要采集的。

按照正常流程,配置列表数据采集的规则,配置好后点开【循环列表】设置页面,发现八爪鱼自动识别了iframe框架,无需手动修改什么。

 

3、网页具有2层以上Iframe框架的采集方法

网页包含2层或以上Iframe框架时,在八爪鱼进行点击动作时,可能会发生无法产生相应跳转,也就无法正常配置规则。

示例网址:http://ggzyjyzx.yangzhou.gov.cn/qtyy/ggzyjyzx/jyxx_listn.html?shownode=0

示例网址具有三层Iframe框架:【iframe】、【iframe】和【iframe#right_list】,我们要采集的是【iframe#right_list】框架中的列表数据。

① 在火狐浏览器中:

 

如果直接将整个网址放进八爪鱼中配置规则,可能在进行【点击该元素】后,不会产生跳转(正常情况下会自动跳转),无法正常配置规则。

这时候,我们就需要将要采集的这层iframe框架的真实地址提取出来:

① 将鼠标移动到目标iframe框架的范围内

② 点击鼠标右键

③ 鼠标移动到【查看框架的源代码】上

④ 新开的标签页的网址就是此框架的真实地址。

示例中我们要采集的iframe框架的真实地址为:http://ggzyjyzx.yangzhou.gov.cn/qtyy/ggzyjyzx/right_list/right_list_jsgc.jsp?t=1606210782426

 

② 在谷歌浏览器中:

这时候,我们就需要将要采集的这层iframe框架的真实地址提取出来:

① 将鼠标移动到目标iframe框架的范围内

② 点击鼠标右键

③ 鼠标移动到【查看框架的源代码】上

④新开的标签页的网址就是此框架的真实地址。

示例中我们要采集的iframe框架的真实地址为:https://ggzyjyzx.yangzhou.gov.cn/qtyy/ggzyjyzx/right_list/right_list_jsgc.jsp?t=1723694636616

 

 

 

 

将取到的链接复制到八爪鱼

然后将提取出来的iframe框架真实地址输入八爪鱼中,然后再按正常流程配置规则即可。


 

上一个
鼠标移上去出现新数据
下一个
如何获取浏览器UA(User-Agent简称UA)
最近修改: 2024-09-26