八爪鱼,百万用户信赖的网络爬虫工具

技术小白教你如何使用大数据之利器——八爪鱼 | 法纳技术贴

作者:keven 发布时间:9/15/2017 6:24:04 PM 10367 人已阅读

摘要:本文改编于法纳刑辩公众号发表的《技术小白教你如何使用大数据之利器——八爪鱼 | 法纳技术贴》并以八爪鱼最新版7.1制作实现

  技术小白教你如何使用大数据之利器——八爪鱼|法纳技术贴

  本文改编于法纳刑辩公众号发表的《技术小白教你如何使用大数据之利器——八爪鱼|法纳技术贴》并以八爪鱼最新版7.1制作实现

  律师精英们是不是觉得时间不够用,是不是发现每天在浏览网页、检索信息、查找资料上花费了大量时间,而且下次遇到类似的任务还得再进行一次,十分蓝瘦香菇。

  神呀,重复性的工作可不可以让机器来帮忙,我得抽出时间来思考一下人生。

  好吧,我承认,其实我是要想一想中午是去吃热干面,还是去吃重庆抄手,来犒劳犒劳自己傲娇的味蕾。

  如果你在工作中遇到以下场景,那么,你很幸运,这篇文章介绍的“八爪鱼”软件可以帮你节省时间去思考一下人生了。

  场景一:

  Boss:小蔡(一位可怜的律师助理),写文章要有案例充实才有可读性,知道吗?

  小蔡:好的,明白。

  Boss:那你再去检索关于“受贿”的文章,给我把今年以来新闻报道文章都找出来。

  小蔡:好——的,明——白——了,555……

  八爪鱼使用结果:来一张成品图,检索文章共有1623篇,由于截图限制就不发长图了:)

1

  场景二:

  Boss:小蔡,上次我们代理的集团企业的案子胜诉了。

  小蔡:真的,那太棒了。

  Boss:是呀,那家企业要委托我们做常年法律顾问。

  小蔡:那很好呀。

  Boss:是呀,还有,你现在去收集下那家企业旗下的分公司和子公司资料,我们要利用这个机会进行精准营销。

  小蔡:好的,没有问题。

  Boss:喔,对了,忘记告诉你了,这个集团企业旗下好像有200多家子公司、分公司,明天早上给我资料可以吗?

  小蔡:好——的,没,有问题,555……

2

  还是先用结果说话,“八爪鱼”奉上一张结果图~

  场景三:

  Boss:小蔡,那个故意伤害的案子的辩护词写得不错。

  小蔡:谢谢,老板。

  Boss:不过委托人并不满意审判结果,案子要上诉,你去收集整理一下同类案件的二审裁判观点。

  小蔡:法律数据库好像只能导出全文呀。

  Boss:复制—粘贴,你不会呀!

  小蔡:(喃喃自语)老板,我是想告诉你,这二审案件有1135个,唔唔~

3

  时间不够用,技术律师来拯救你~向大家强烈推荐的是一款大数据采集软件——“八爪鱼”。

  “八爪鱼”的口号是——“网络大数据,想抓哪里抓哪里。”律师伙伴们,也许你正好遇到以上的数据采集问题,现在就想知道软件如何操作使用,小编想告诉你,千万别急,心急吃不了热豆腐。

  如果你第一次听说“八爪鱼”软件,我们还是从最简单的安装说起,否则不负责任的炫技术都是耍流氓。

  八爪鱼的软件安装

  1、“八爪鱼”软件只能在windows系统下运行;

  如果此时有律师问:“我的电脑都是苹果的怎么办?”

  我只想说:“土豪,我们交个朋友吧”,当然苹果电脑安装双系统后也是可以运行八爪鱼的。

  2、登陆www.bazhuayu.com/网站

图片1

  3、通过邮箱注册,邮箱注册的好处是后期能收到“教学资料”推送;

图片2

图片2 4、使用注册邮箱进行验证,然后点击网页中“继续”按钮;

图片3

  5、注册成功后会网站会显示注册名称,然后点击“免费下载”;

图片4

  6、下载“八爪鱼”软件,以及运行所需要的系统插件“NET3.5”,并记住在电脑中的保存路径;

图片5

  7、将电脑桌面的重要文件放到D盘或E盘,为接下来的安装NET3.5系统插件做好准备;

图片6

  ps:本软件需要.NET3.5SP1支持,Win7/8/10已经内置支持,无需下载,但XP系统需要安装,软件会在安装时自动检测是否安装了.NET3.5SP1,如果没有安装则会自动从微软官方在线安装,国内在线安装速度很慢,建议先从以下链接下载安装.NET3.5SP1,然后再安装八爪鱼采集器

  8、双击软件后,输入用户名和密码就进入“八爪鱼”运行界面了

登录界面70

  9、安装好之后登录进去是这样子:

QQ图片20170906172937

  好不容易,安装成功,下面我们要一起聊一聊如何进行大数据采集了,我们还是以开篇的三个场景为例,来讲讲具体操作步骤。

  02

  八爪鱼的法律应用场景

  场景一:一键积累文章写作素材

  1):在搜狗微信中检索“受贿”文章,复制浏览器中地址链接;

1

  2):打开“八爪鱼”,粘贴地址链接,然后点击“保存网址”按钮;

2

  3)网页打开后,将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”

3新

  4)然后鼠标选中第一篇文章的右面的内容,选中后,底板颜色会变成绿色,适配的内容变成红色,然后再选择“选中子元素”

4

  然后接着选择“选中全部”

5

  5)对所选字段进行编辑

6

  选择"保存并开始采集”

7

  6)启动本地采集

8

  最后选择“合适的导出方式”,将采集好的数据导出这里我们选择excel作为导出为格式,数据导出后如下图

11

  场景二:对企业的信息进行调查

  1):在相关网站查询企业基本信息,例如在“天眼查”输入“天天快递”公司名称,发现有250多条公司的相关信息,我们将第一页的网络地址进行复制;

1

  2):打开八爪鱼软件,选择自定义采集下拉框中的向导模式开始采集

2

  3):粘贴地址链接,然后点击“下一步”

3

  4)打开网页以后,勾选左边第二栏“网页列表中每个链接页的详细内容”,然后选择“下一步”

4

  之后在列表中选中公司的链接,配置列表里就会有相应的文字显示,然后然后选择“下一步”

5

  然后接着选中第二条,就会自动显示剩下的链接,接着再选择“下一步”

6

  5)这时需要设置一下翻页选项,勾选第二个“需要翻页”,并选中页面底部的翻页按钮

7

  之后选择我们需要的内容,如下图红框所示,分别选中需要提取的信息

8

  6)接着对提取的信息进行字段命名修改并选择“下一步”

9

  7)最后启动本地采集

10

  数据就采集出来了

12

  对于场景三的操作,建议大家首先在网易云课堂中检索“八爪鱼”课程进行相关学习,然后详细阅读技术大咖陈晓峰律师的文章《还在人工采集裁判文书?让法律技术男拯救你iCourt》,文中详细的讲解了如何运用“八爪鱼”对裁判文书进行采集分析。

Wangyi

  最后,我想说的是运用高效工具可以帮助我们节省更多时间,但是不要盲目去追求“术“,而是把节省的时间运用在思索“道“上来,通过提升思维的层次和维度,才能更好的帮助我们研究分析数据信息之间的关系和趋势,才能更好的指导我们分析问题、解决问题、预测问题。

  本文转自公众号法纳刑辩

  


欢迎咨询在线客服
加微信群,与更多用户一起交流