为了让更多的用户实现采集需求,满足对网页图片、文档等文件下载等场景的期待,在八爪鱼最新版本上线了【文件下载】功能。大家不仅可以使用八爪鱼采集所需数据,还可以在采集的过程中下载网页上的文件,包括图片、音频、视频、文档等多种格式。
采集过程中,当用户需要采集网页中的图片、文档等各类文件时,八爪鱼可智能识别文件类型并提供下载选项,帮助用户一次性获取所需数据及文件。
【文件下载】功能支持图片、音频、视频、文档等多种格式的文件下载,例如:
但需要注意目前八爪鱼【文件下载】功能仅支持本地采集模式,云采集文件下载功能正在研发中,请大家耐心等待。
常见的应用场景
文件下载功能只有个人版及以上版本支持
网页包含视频
采集示例:https://new.qq.com/rain/a/20231204A06CDK00
采集视频链接并下载
1.采集页面的标题、网页源码
采集字段文字标题和网页源码outerhtml,因为视频链接没办法直接采集获取到,所以采集源码是为了格式化获取到视频链接。
2.格式化源码获取视频链接
对源码进行格式化处理获取视频链接
特别说明:格式化原理详情请学习教程:正则表达式
3.设置视频下载
点击视频链接字段右上角【...】,然后选择【下载文件】。
设置下载路径,文件命名方式。
启动采集并下载文件。
最后查看下载文件保存的路径,可以看到视频已经下载下来了。