八爪鱼提取字段时,有找不到时如何处理的选项。如下图:


1

 

下面介绍如何设置找不到字段时的操作:


 步骤一:点击需要设置的字段名称→自定义数据字段→自定义定位元素方式


找不到数据1


进入自定义定位元素方式后,我们可以看到下图中红框内,有找不到时如何处理的三个选项,分为:使用默认值、该字段留空以及该步骤所有字段留空。


2 

这里为了方便演示,我们修改一下元素匹配的Xpath,这样八爪鱼就抓取不到原来的字段了。


找不到数据2 

由于我们在标题处选择的是找不到时该字段留空,所以修改Xpath后,标题处提取到的数据为空。


3

 

我们同样修改类型和评分处的Xpath看一下其余两项效果。

评分处的使用默认值设置提取不到内容容时出现默认值,默认值设置如下:


4

 

步骤二:保存并启动

 找不到数据3


可以看到弹出了采集错误报告,当前网页三条数据均未采集到信息


5 

此处是因为类型中,找不到字段时该步骤所有字段留空,导致标题、类型、评分、上映年份以及时间均为空值,当八爪鱼一条信息采集不到任何一个字段时便会弹出错误提醒,我们可以查看采集错误报告看到错误类型来进行修改。


6 


如上图,我们设置类型采集不到数据时该字段留空,保存并运行后,可以看到:


7 

标题与类型因为我们设置的该字段留空,所以未显示有任何内容;八爪鱼因为我们没有设置该步骤所有字段留空,所以也没有弹出错误报告;评分处因为我们设置使用默认值,默认值为找不到数据*——*,所以弹出如图所示的内容。


这就是找不到数据时的三种办法,其中该字段留空可以使我们在结果中明显的看到哪里有数据没采集到;该步骤所有字段留空则会使一个字段找不到数据时,便忽略该信息所有字段,相当于跳过该条信息的采集;使用默认值可以让你在找不到数据时默认填写一个字段,来补充没有采集到的内容。