欢乐书客小说采集
2018-01-08 15:18:10 阅读量: 47312
本文介绍使用八爪鱼采集欢乐书客(以次元学院小说为例)的方法。
采集网站:https://www.hbooker.com/book/100040870
上述仅以次元学院小说举例,大家在采集欢乐书客小说的时候,可以更换小说书籍进行采集。
采集的内容包括:小说章节,小说内容
使用功能点:
l 分页列表及详细信息提取
步骤1:创建欢乐书客小说采集任务
1)进入主界面,选择“自定义模式”
欢乐书客小说采集步骤1
2)将要采集的欢乐书客小说网址复制粘贴到网站输入框中,点击“保存网址”
欢乐书客小说采集步骤2
步骤2:创建列表循环
1)在页面右上角,打开“流程”,以展现出“流程设计器”和“定制当前操作”两个板块。若章节被隐藏,点击查看全部章节并选择点击该链接。
欢乐书客小说采集步骤3
2)选中页面里的第一条链接,系统会自动识别页面内的同类链接,选择“选中全部”
欢乐书客小说采集步骤4
3)选择“循环点击每个链接”
欢乐书客小说采集步骤5
步骤3:采集欢乐书客小说内容
1)选中页面内要采集的小说内容(被选中的内容会变成绿色),选择“采集该元素的文本”
欢乐书客小说采集步骤6
2)修改字段名称
欢乐书客小说采集步骤7
3)选择“启动本地采集”
欢乐书客小说采集步骤8
步骤4:数据采集及导出
1)采集完成后,会跳出提示,选择“导出数据。选择“合适的导出方式”,将采集好的评论信息数据导出
欢乐书客小说采集步骤9
2)这里我们选择excel作为导出为格式,数据导出后如下图
欢乐书客小说采集步骤10