采集“加载更多”等网页数据加载按钮的网页时,可以对采集规则进行下面的设置:

1.使用火狐浏览器的Firebug获取到"加载更多"按钮的XPath的值;

2.添加一个循环点击元素的步骤,将点击元素步骤的XPath修改为“加载更多“”按钮的XPath的值;

3.这类“点击加载”的网页一般都使用了Ajax的网页脚本技术,所以还需要在点击元素的高级选项中进行Ajax延时的设置。

这类特殊翻页网站的采集规则配置可以参考这个教程:

/tutorial/zxs.aspx?t=0