八爪鱼,百万用户信赖的网络爬虫工具

大数据高考押题背后引发的思考

作者:xinyue 发布时间:6/5/2014 3:58:25 PM 9631 人已阅读

摘要:又到一年高考时,与高考相关的很多有趣的数据层出不穷,数据统计显示考生们最喜欢的四道名菜中有红烧肉你知道吗?高考押题历年都不少见,今年百度也顺势推出了大数据预测高考作文题,一夜之间,大数据应用突然感觉接地气起来,与你我的生活息息相关了,无论这次预测的结果准确与否,大数据未来将给我们带来什么样的变化值得深思。跟随八爪鱼一起学会将数据变为一种能力吧!

       2014年高考于6月7日正式开考,据教育部数据,2014年高考报名人数939万人,较13年增加了27万,增幅达到3%。随着高考的日益临近,与高考相关的话题关注度也不断升温,近期,百度还推出了吸引眼球的百度预测,通过大数据去预测今年的高考押题,基于海量作文范文和搜索数据,利用概率主题模型,预测2014年高考作文的命题方向,“时间的馈赠”、“生命的多彩”、“民族的变迁”、“教育的思辨”、“心灵的坚守”和“发展的困惑”6个大类别,每个类别配有对应的关键词,并可通过关键词搜索到相应的范文及素材,百度显示其中“时间的馈赠”的出题概率显示为28.61%,关键词为“记忆”、“不再”、“未来”、“成长”、“依旧”、“忘记”、“岁月”和“无奈”,与“记忆”相关的示例为“时间不应该变成一块橡皮”、“如果记忆不记得?”和“忘记与铭记”。当然随后有名师出来表示这种预测方法不靠谱,认为根据简单的逻辑就能推导出来的数据不太靠谱,建议考生不要太把预测当回事。

      

       诚然,高考作文命题有着自己的一套逻辑和原则,又受到命题组本身或人为或客观等各种综合因素的一些影响,而目前大数据的预测基于的过往数据以及现有即时数据加以分析,通过一定数据分析模型,发现规律和趋势,从而作出预测。由于目前的数据掌握的局限性我们不好说今年的大数据高考押题会有多准,但是这种行为却值得我们深思,大数据预测真的不靠谱吗?

 

       使用数据进行事件预测这个行为其实在现实生活中并不少见,从已知的各种事件中推断出未来将要发生的事情或趋势,运用数据对体育赛事结果预测相信大家都很熟悉了,美国一名预测牛人Silver基于统计模型,自己搞了个软件来通过分析职业棒球的数据去预测各个球员未来的表现。结果他的预测结果超越了所有最有经验的球探。不但如此,他 的政治预测成绩更同样令人瞠目结舌。2008年大选他对各州总统选举结果预测准确率达到98%,50个州Silver预测对了49个, 更为有趣的是,他的预测跟政治专家的预测相差极大——事实证明听专家的远远不如听数据分析的【1】。象国人关注的NBA、世界杯等赛事,我们在各大体育杂志或资讯网站上都能找到球队历年来的数据,个人的各项数据,通过这些海量数据再使用一定的数据模型进行分析,得出来的结论会不会准确呢?数据越全面我相信命中的概念越高。

        八爪鱼采集器中曾经有用户将软件用于足彩分析,通过海量的数据全面的分析让他每次中奖回报率提升了很多,在大数据时代,数据所拥有改变世界的能量值得期待,而处理分析数据的能力也必将成为人才以及企业的一项核心能力。

 

        再回到考试的话题上来,很多考生在考前都会知道找老师圈重点,圈重点这个行为本身其实也是一种预测,老师根据自己的经验以及以往出题的一些情况对于未来考试范围进行的一个预测,这种思考轨迹本身就非常类似于大数据预测,大数据的方式优势之一在于对于海量数据的快速有效的处理上,这点是人力所不能匹及的。再通过合理的数据分析模型,圈出来的重点自然可信度要高很多。

 

        试想下,数据化时代下,作为家长或老师,如果能运用大数据化的思维结合智慧的数据工具及方法为考生提前做好高考预测,高考会不会变得更有趣些?结果如何我们不得而知,我们能看到的是大数据改变我们生活方式的日子已然不远。

 

         未来已来,我们敢大胆的推测未来大数据高考押题靠谱的日子指日可待。最后八爪鱼采集器也祝愿莘莘学子高考顺利!

 

 

 


欢迎咨询在线客服
加微信群,与更多用户一起交流