【8.0】批量输入关键词查询,采集查询结果
2019-11-13 15:31:34 阅读量: 21375
有很多网站,需要输入关键词查询,然后采集查询后得到的结果数据。
例如:在京东首页搜索框中输入商品名称搜索,采集搜索后得到的商品信息;在新闻网站的搜索框中,输入热门关键词,采集搜索后得到的最新资讯。
在八爪鱼中该如何操作呢?来看一下具体的操作步骤。
一、输入1个关键词查询
示例网址:https://www.jd.com
采集需求:在京东首页,输入关键词【手机】,采集出现的手机商品数据。
Step1. 输入网址打开网页,打开右上角【流程】按钮。选中网页中的文本输入框,在提示框中选择【输入文字】,输入关键词【手机】,按【确定】保存。可以看到,左侧流程区出现了【输入文字】步骤。接下来是点击搜索。选中页面上的【搜索】按钮,在提示框选择【点击该按钮】。
鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图
下文其他图片同理
Step2. 接下来按需提取数据即可。具体请看 新手入门教程3-7课 。
二、批量输入多个关键词
示例网址:https://www.toutiao.com/search/?keyword=
采集需求:在头条搜索页,依次输入 关键词1、关键词2、关键词3、关键词4 (用户可将其更换成自己想要的关键词,单次最多支持输入2W个)并搜索,然后采集每个关键词的搜索结果数据。
Step1. 输入网址打开网页,打开右上角【流程】按钮。鼠标选中 图标不放,将其拖至流程中【打开网页】步骤的后面,打开【高级选项】, 勾选循环方式为【文本列表】,然后点击 按钮,准备输入关键词。
Step2. 点击【文本列表】的编辑框,输入多个关键词,1个关键词一行。点击【确定】保存。
检查一下,选中【循环框】,可以看到我们刚刚输入的多个关键词。
特别说明:
a. 可先准备一个含有多个关键词的excel文档,支持复制粘贴
Step3. 选中网页上的输入框, 在提示框中选择【输入文字】。
八爪鱼会弹出一个文本输入框,但无需输入文字,直接点击【确定】。因为在前面的步骤中,我们已经准备好了关键词,在这里只是为了生成一个【输入文字】的步骤,所以无需再输入文字。
Step4. 可以看到,左侧流程区出现了【输入文字】步骤,但是它在【循环框】的下面。手动将【输入文字】拖入【循环框】内, 并在右侧高级选项区勾选【使用循环】,点击【确定】保存。(该操作是为了实现【循环输入文字】的效果)
Step5. 【输入关键词】的步骤已经完成,接下来是点击搜索。手动执行一遍规则,输入一个关键词到网页中。然后选中页面上的【搜索】按钮,在提示框选择【点击该按钮】。
Step6. 接下来请按需提取数据。在这里,我们选择提取输入框中的关键词和第1个文章标题。选中网页的输入框,在提示框选择【采集该文本框的值】。选中第1个文章标题,在提示框选择【采集该元素的文本】。
Step7. 点击【开始采集】,选择【本地采集】。采集的数据如图展示:
特别说明:
a. 有的网页,在输入第1个关键词并点击搜索以后,文本输入框的位置(本质上)是网页源码会有变化,第1个关键词的数据采集完成以后,没办法输入第2个关键词。此时,需将【打开网页】步骤,拖至【循环】内,如下图所示:
作者:西瓜
编辑:Aisling