有很多网站,需要输入关键词查询,然后采集查询后得到的结果数据。

 

例如:在京东首页搜索框中输入商品名称搜索,采集搜索后得到的商品信息;在新闻网站的搜索框中,输入热门关键词,采集搜索后得到的最新资讯。

 

在八爪鱼中该如何操作呢?来看一下具体的操作步骤。

 

一、输入1个关键词查询

 

示例网址:https://www.jd.com

采集需求:在京东首页,输入关键词【手机】,采集出现的手机商品数据。

 

Step1. 输入网址打开网页,打开右上角【流程】按钮。选中网页中的文本输入框,在提示框中选择【输入文字】,输入关键词【手机】,按【确定】保存。可以看到,左侧流程区出现了【输入文字】步骤。接下来是点击搜索。选中页面上的【搜索】按钮,在提示框选择【点击该按钮】。

 

 

 

鼠标放到图片上,右键,选择【在新标签页中打开图片】可查看高清大图

下文其他图片同理

 

Step2. 接下来按需提取数据即可。具体请看 新手入门教程3-7课 。

 

 

二、批量输入多个关键词

 

示例网址:https://www.toutiao.com/search/?keyword=

采集需求:在头条搜索页,依次输入 关键词1、关键词2、关键词3、关键词4 (用户可将其更换成自己想要的关键词,单次最多支持输入2W个)并搜索,然后采集每个关键词的搜索结果数据。

 

Step1.  输入网址打开网页,打开右上角【流程】按钮。鼠标选中  图标不放,将其拖至流程中【打开网页】步骤的后面,打开【高级选项】, 勾选循环方式为【文本列表】,然后点击  按钮,准备输入关键词。

 

 

 

Step2.  点击【文本列表】的编辑框,输入多个关键词,1个关键词一行。点击【确定】保存。

 

 

 

检查一下,选中【循环框】,可以看到我们刚刚输入的多个关键词。

 

 

特别说明:

a. 可先准备一个含有多个关键词的excel文档,支持复制粘贴

 

Step3. 选中网页上的输入框, 在提示框中选择【输入文字】。

 

 

八爪鱼会弹出一个文本输入框,但无需输入文字,直接点击【确定】。因为在前面的步骤中,我们已经准备好了关键词,在这里只是为了生成一个【输入文字】的步骤,所以无需再输入文字。

 

 

Step4. 可以看到,左侧流程区出现了【输入文字】步骤,但是它在【循环框】的下面。手动将【输入文字】拖入【循环框】内, 并在右侧高级选项区勾选【使用循环】,点击【确定】保存。(该操作是为了实现【循环输入文字】的效果)

 

 

Step5. 【输入关键词】的步骤已经完成,接下来是点击搜索。手动执行一遍规则,输入一个关键词到网页中。然后选中页面上的【搜索】按钮,在提示框选择【点击该按钮】。

 

 

Step6. 接下来请按需提取数据。在这里,我们选择提取输入框中的关键词和第1个文章标题。选中网页的输入框,在提示框选择【采集该文本框的值】。选中第1个文章标题,在提示框选择【采集该元素的文本】。

 

 

 

Step7. 点击【开始采集】,选择【本地采集】。采集的数据如图展示:

 

 

 

特别说明:

a. 有的网页,在输入第1个关键词并点击搜索以后,文本输入框的位置(本质上)是网页源码会有变化,第1个关键词的数据采集完成以后,没办法输入第2个关键词。此时,需将【打开网页】步骤,拖至【循环】内,如下图所示:

 

 

作者:西瓜

编辑:Aisling