网易云音乐评论采集教程
2017-11-23 15:02:46 阅读量: 27631
网易云音乐是一款由网易开发的音乐产品,依托专业音乐人、DJ、好友推荐及社交功能,在线音乐服务主打歌单、社交、大牌推荐和音乐指纹,以歌单、DJ节目、社交、地理位置为核心要素,主打发现和分享。
网易云音乐中的评论区是一个很有意思的地方——各种味道的故事,引起了网友们的强烈共鸣。甚至产生了一个歌单——网易云评论最多的前100首歌。在这个歌单中,周杰伦的晴天评论数居于第一(截止本文上传时间)。
本文将介绍使用八爪鱼采集网易云音乐评论(以周杰伦的晴天下的评论为例)的方法。采集字段主要有评论内容、用户ID、用户主页链接和点赞数。本文仅为一个示例,大家在采集过程中,可更换歌曲URL,采集歌曲下的评论。还可先采集一批歌曲URL,再使用URL列表循环,采集大量歌曲评论。
采集网站:
http://music.163.com/#/song?id=186016
使用功能点:
l 分页列表循环
l Ajax点击和翻页
步骤1:创建采集任务
1)进入主界面,选择“自定义采集”
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”。这里我们先到网易云音乐上面复制想要采集的美食网址。然后复制粘贴
步骤2:创建翻页循环
1)网页打开以后,将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”
步骤3:创建列表循环及信息提取
1)移动鼠标,选中第一条评论,评论框会变成绿色,其中的字段会变为红色底色。然后选择右侧操作提示框中的“选中子元素”
2)接着在右边的提示框中选择“选中全部”
3)然后选择“采集数据”
4)打开右上角的流程按钮,可以删除不需要的字段并编辑字段名称
5)因为网页涉及到Ajax技术,所以需要设置Ajax,如下图,鼠标点击“点击翻页”步骤,打开高级选项,在Ajax加载项勾选Ajax加载数据,设置超时2秒
步骤4:采集并导出数据
1)点击左上角的“开始采集”,选择“启动本地采集”
2)采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出,这里我们选择excel作为导出为格式,数据导出后如下图