八爪鱼采集规则基本步骤介绍:切换下拉选项
2016-08-25 14:38:24 阅读量: 0
切换下拉选项
本步骤用于切换下拉列表
切换下拉选项步骤注意事项:
1) 从option顺序/到option顺序
默认为空,代表从下拉列表第一个顺序切换,直到最后一个,但有时需要跳过第一个选项,从第二个或者中间某个位置开始切换下拉列表, 使用这两个选项可以控制切换的起始和结束顺序,例如,假设下拉选项有5个,需要从第2个顺序切换到第4个,则“从option顺序”设置为2,“到option顺序”设置为4。
1) 跳过值/到值
默认为空,表示按照设定,顺序切换下拉列表,但如果切换中需要跳过某个下拉项,则使用此设置,可以控制跳过的范围, 例如,假设下拉列表有5个选项,值分别是10、11、12、13、14,如果需要跳过12,则设置“跳过值”为12,如果需要跳过12、13,则设置“跳过值”为12,“到值”设置为“13”。
2) 使用当前循环项
配合循环步骤来使用,用以重复的循环中的指定的下拉列表切换到下一个选项。
3) 异步加载数据
异步加载也叫Ajax,是一种无需重新加载网页就能刷新局部数据的技术,因此流程不能检测到网页加载完成,就不能决定何时该执行下一个步骤, 使用此选项,流程会在等待设定的超时时间后默认数据已经加载完成,从而继续执行后续流程步骤。本选项需要配合异步加载超时使用
4) 异步加载超时
等待异步加载完成的时间,在点击元素之后,流程会开始计时,超时时间到达后,执行下一个流程步骤。本选项需要配合异步加载使用。
5) 激活重试
如果网页没有按照成功打开预期页面,例如显示服务器错误(500),访问频率太快等,或者跳转到其他正常执行不应该出现的页面,可以使用本选项进行重试,但必须配合以下几个重试参数执行,请注意以下几种判断的情况任意一种出现都会导致重试。
6) 结果页面网址包含
如果出现的页面网址中总是出现某个特殊的字符串,例如网页找不到时一般会出现500.htm等,则使用此选项可以判断没有打开预期页面,需要重试
7) 结果页面文本包含
如果出现的页面文字中中总是出现某个特殊的字符串,例如"访问频率太快",则使用此选项可以判断没有打开预期页面,需要重试
8) 结果页面文本不包含
如果正常打开网页一定会出现某个特殊的字符串,但没有正常打开的时候一定不会出现该字符串,则可以据此判断判断没有打开预期页面,需要重试
9) 最大重试次数
为了避免无限制重复尝试,请示用本选项限制最大重复尝试的次数,如果重试到达最大允许的次数,任然没有成功,则流程将停止重试,继续执行下一步骤
10) 重试间隔
在两次重试之间等待的时间,一般情况下,当打开网页出错时,立即重试很有可能是同样的错误,适当等待则可能成功打开预期网页,但应该尽量避免设置过长的等待时间,因为这会影响采集速度