本文给大家演示登陆界面有验证码或者其他验证(如滑块验证)的网站通过八爪鱼控件识别进行数据采集的方式。
所讲示例采集数据网址为/login.aspx


小贴士:通过八爪鱼的控件进行识别,这种方式如果需要自动识别,就需要购买验证码套餐,如果不购买也只能进行单机采集然后手动输入,注意这种方法只能是输入验证码的框才可以用这种方式。


步骤1  登陆八爪鱼7.0采集器→点击新建任务→自定义采集,进入到任务配置页面:然后输入网址→保存网址,系统会进入到流程设计页面并自动打开前面输入的网址。


1


接下来步骤是输入用户名密码了,八爪鱼模拟的是人的操作行为,所以这一步过程也很简单


步骤2 在浏览器中鼠标点击用户名输入框→在右边弹出的提示里面选择“输入文字”→输入自己的用户名→选择“确定” 同样的方式输入密码 这样输入用户名密码的步骤就完成了。


2


这里八爪鱼采集器需要知道

1.验证码图片在哪里

2.输入框验证码的框在哪里


步骤3 点击下方浏览器中验证码图片的位置→按照提示框中的提示选择浏览器中的验证码框→再按照提示框中的提示点击浏览器中的登陆按钮


7


接下来需要配置验证码输入失败和成功的两种场景


步骤4 点击提示框中的确认按钮,系统会自动提交一个错误的验证码→然后点击浏览器中的“验证码不正确”提示→再点击提示框中的确认按钮→选择提示框中的“开始配置识别成功场景”→在提示框中输入显示出来的验证码→选择提示框中的“应用到网页并完成配置”选项


8


上述操作中验证码识别就完成了,接下来需要手动执行这个流程,任务会自动进去到登陆界面


步骤5 点击“流程”按钮→进入到流程界面→手动点击流程步骤(可以看到浏览器中会按照会执行这些步骤)→点到识别验证码步骤时→在辅助模式选项中输入浏览器中当前显示的验证码→选择应用到网页并提交

这样操作之后,可以看到任务就正常登陆进去了。


9


步骤6 这里我随意提取一个数据仅供演示登陆功能,具体的操作可以参考新手入门的教程。


10


步骤7 接下来选择保存并启动按钮,系统将会在本地启动一个采集流程,当执行到输入验证码操作时,如果是购买过验证码套餐的,直接勾选“自动识别验证码”即可。如果没有购买的这里手动输入点确定也是可以的,但是这里这个规则就不能用云采集。


11