提取数据一
2018-06-06 11:01:17 阅读量: 21300
视频说明
本视频介绍提取数据中的添加特殊字段,字段的上移下移,抓取模板的导入导出,以及数据找不到时如何处理。
添加特殊字段:
可添加当前时间,固定字段,当前时间,当前页面标题,当前页面网址,当前页面描述/关键词
字段的上移下移: 调整字段的位置
抓取模板的导入导出:
可将整个提取数据的字段信息(字段名,所含的xpath,数据格式化等等配置信息)都进行导入导出。
在同类型的网页中可以非常方便的复用之前做的抓取模版。如果是不同类型的网页,但要采的字段都相同,
也可复用之前的模版,不过必须修改每个字段的xpath。字段名和格式化等一般不需更改,可减少部分操作,节约时间。
找不到数据时的三种处理办法
使用默认值:在找不到数据时,默认填写一个字段,以补充没有采集到的内容
该字段留空:在找不到数据时,该字段留空,可以在结果中明显的看到哪里有数据没采集到
该步骤所有字段留空:一个字段找不到数据时,该步骤所有字段留空,相当于跳过此条数据不采集