八爪鱼,百万用户信赖的网络爬虫工具

手把手教你微信公众号文章采集

作者:keven 发布时间:10/24/2017 12:04:47 PM 37735 人已阅读

摘要:相信每一个运营微信公众号的人,都在考虑这个问题,今天八爪鱼就和大家分享一个实用采集技能,采集公众号。实时监测公众号的内容。

如何才能提高微信文章的打开率?

爆款文章都有哪些特点?

别人家的微信文章都在写什么?

 

相信每一个运营微信公众号的人,都在考虑这个问题,今天八爪鱼就和大家分享一个实用采集技能,采集公众号。实时监测公众号的内容。

 

比如我们来采集深圳本地宝的这个号的文章

在这里要说明一下,八爪鱼目前只能采集互联网公开数据,微信公众号的采集需要从网页采集入手。搜索搜狗微信,通过它采集微信号文章,首先到搜狗微信中复制需要采集的网址。

 

步骤1:创建采集任务

进入主界面,选择“自定义模式”

 

手把手教你微信公众号文章采集图1

 

将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址

 

步骤2:创建翻页循环

 

QQ图片20171019145224

 

打开右上角的“流程”。点击页面中的文章搜索框,在右侧的操作提示框中,选择“输入文字”

 

手把手教你微信公众号文章采集图3

 

输入要搜索的文章信息,这里以搜索“”为例,输入完成后,点击“确定”按钮

 

	/media/86133/手把手教你微信公众号文章采集图4.png

 

“深圳本地宝”会自动填充到搜索框,点击“搜文章”按钮,在操作提示框中,选择“点击该按钮”

 

QQ图片20171019163327

 

页面中出现了“深圳本地宝”的文章搜索结果。将结果页面下拉到底部,点击“下一页”按钮,在右侧的操作提示框中,选择“循环点击下一页”

 

手把手教你微信公众号文章采集图6

 

步骤3:创建列表循环

移动鼠标,选中页面里第一篇文章的区块。系统会识别此区块中的子元素,在操作提示框中,选择“选中子元素”

 

QQ图片20171019163806

 

继续选中页面中第二篇文章的区块,系统会自动选中第二篇文章中的子元素,并识别出页面中的其他10组同类元素,在操作提示框中,选择“选中全部”

 

QQ图片20171019164644

 

我们可以看到,页面中文章区块里的所有元素均被选中,变为绿色。右侧操作提示框中,出现字段预览表,将鼠标移到表头,点击垃圾桶图标,可删除不需要的字段。字段选择完成后,选择“采集以下数据”

 

QQ图片20171019164751

 

由于我们还想要采集每篇文章的URL,因而还需要提取一个字段。点击第一篇文章的链接,再点击第二篇文章的链接,系统会自动选中页面中的一组文章链接。在右侧操作提示框中,选择“采集以下链接地址”

 

QQ图片20171019165130

 

字段选择完成后,选中相应的字段,可以进行字段的自定义命名。完成后,点击左上角的保存并启动,启动采集任务,选择启动本地采集

 

QQ图片20171019165407

 

步骤4:数据采集及导出

 

采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的搜狗微信文章的数据导出.这里我们选择excel作为导出为格式。

 

福利来了

 

但如果实在不想自己制作采集规则,给你一个省心的选择。

 

可以到数多多进行规则定制。

 

QQ图片20171020182426

 

想了解更多的采集干货,别忘了扫下面二维码啊

 

                    


欢迎咨询在线客服
加微信群,与更多用户一起交流