在一些网页当中,有些列表信息的出现是不固定的,这里我们需要用到XPATH的下列函数来特殊定位抓取字段信息:

1) contains(@attribute/text(),’文本字段’),contains方法是指某属性或者标签文本包含某一连续固定字段

2) starts-with(text(),’文本字段’),指开头包含某些固定连续字段

3) ends-with(text(),’文本字段’),指结尾包含某些固定连续字段

4) 利用网页中某些固定出现的标签,通过sibling和回退找到该字段