采集模板相关
自定义配置相关
云采集相关
如何用XPATH自定义抓取特定网页文字?
2023-06-21 902
问题:
如何用XPATH自定义抓取特定网页文字?
回答:
在一些网页当中,有些列表信息的出现是不固定的,这里我们需要用到XPATH的下列函数来特殊定位抓取的字段信息:
1) contains(@attribute/text(),’文本字段’),contains方法是指某属性或者标签文本包含某一连续固定字段。
2) starts-with(text(),’文本字段’),指开头包含某些固定连续字段。
3) ends-with(text(),’文本字段’),指结尾包含某些固定连续字段。利用网页中某些固定出现的标签,通过sibling和回退找到该字段。
XPATH视频学习课程:https://www.bazhuayu.com/tutorial8/81xpath
XPATH入门图文教程:http://www.bazhuayu.com/tutorial/gnd/xpath