视频说明

本视频介绍提取数据中的添加特殊字段,字段的上移下移,抓取模板的导入导出,以及数据找不到时如何处理。

添加特殊字段:

可添加当前时间,固定字段,当前时间,当前页面标题,当前页面网址,当前页面描述/关键词

字段的上移下移: 调整字段的位置

抓取模板的导入导出:

可将整个提取数据的字段信息(字段名,所含的xpath,数据格式化等等配置信息)都进行导入导出。

在同类型的网页中可以非常方便的复用之前做的抓取模版。如果是不同类型的网页,但要采的字段都相同,

也可复用之前的模版,不过必须修改每个字段的xpath。字段名和格式化等一般不需更改,可减少部分操作,节约时间。

 

找不到数据时的三种处理办法

使用默认值:
在找不到数据时,默认填写一个字段,以补充没有采集到的内容

该字段留空:
在找不到数据时,该字段留空,可以在结果中明显的看到哪里有数据没采集到

该步骤所有字段留空:
一个字段找不到数据时,该步骤所有字段留空,相当于跳过此条数据不采集