本文介绍使用八爪鱼采集欢乐书客(以次元学院小说为例)的方法

 

采集网站:https://www.hbooker.com/book/100040870

 

上述仅以次元学院小说举例,大家在采集欢乐书客小说的时候,可以更换小说书籍进行采集。

 

采集的内容包括:小说章节,小说内容

 

使用功能点:

l 分页列表及详细信息提取

/tutorial/fylbxq7.aspx?t=1

 

步骤1:创建欢乐书客小说采集任务

1)进入主界面,选择“自定义模式

 

欢乐书客小说采集步骤1

 

2)将要采集的欢乐书客小说网址复制粘贴到网站输入框中,点击保存网址

 

欢乐书客小说采集步骤2

 

步骤2:创建列表循环

1)在页面右上角,打开“流程”,以展现出“流程设计器”“定制当前操作”两个板块。若章节被隐藏,点击查看全部章节并选择点击该链接

 

欢乐书客小说采集步骤3

 

2)选中页面里的第一条链接,系统会自动识别页面内的同类链接,选择“选中全部”

 

欢乐书客小说采集步骤4

 

3选择循环点击每个链接

 

欢乐书客小说采集步骤5

 

 

 

步骤3:采集欢乐书客小说内容

1)选中页面内要采集的小说内容(被选中的内容会变成绿色),选择“采集该元素的文本”

 

欢乐书客小说采集步骤6

 

2)修改字段名称

 

欢乐书客小说采集步骤7

 

3)选择“启动本地采集

 

欢乐书客小说采集步骤8

 

 

步骤4:数据采集及导出

1)采集完成后,会跳出提示,选择“导出数据。选择“合适的导出方式”,将采集好的评论信息数据导出

 

欢乐书客小说采集步骤9

 

2)这里我们选择excel作为导出为格式,数据导出后如下图

 

欢乐书客小说采集步骤10