八爪鱼,百万用户信赖的网络爬虫工具

八爪鱼助力全国大学生数据挖掘竞赛

作者:keven 发布时间:5/7/2015 5:50:12 PM 9228 人已阅读

摘要:八爪鱼助力全国大学生数据挖掘竞赛

为推广广东省及全国高校数据挖掘实践教学,培养学生数据挖掘的应用和创新能力,增加校企交流合作和信息共享,提升我省高校的教学质量和企业的竞争能力,由广东省工业应用数学学会发起的面向全省高校的第三届数据挖掘竞赛如期举行。本届竞赛是由广东省工业与应用数学学会主办,广州泰迪智能科技有限公司承办,华南师范大学数学科学学院协办。

八爪鱼作为领先的大数据收集平台,被大赛选定为推荐数据收集软件。本次大赛目前已有超过100所高校,500支参赛队伍报名,报名请仔细阅读本文后面的报名流程。

大赛介绍原网站链接:http://www.tipdm.org/notice/599.jhtml
试题介绍原网站链接:http://www.tipdm.org/stpj/626.jhtml

本次竞赛共设置三个题目,难度系数高的题目为: 基于电商平台家电设备的消费者需求及产品数据挖掘分析(难度系数:1.0),选手将使用八爪鱼采集器从电商平台收集大量电商评价,销售等数据,并进行挖掘分析,最终提交数据和论文参赛。

 

本题目具体流程如下:

1、 在电商平台进行评论数据抓取(推荐使用八爪鱼采集器进行评论数据收集,点击免费下载);
2、 对评论数据进行预处理(处理掉水军及随意发表的评论数据);
3、 可分品类进行细化分析(热水器:电热热水器、燃气热水器;净水器:净水机、纯水机);
4、 对评论数据进行文本分析(好评、差评、中文分词、词频统计、情感分析、语义网络);
5、 可利用百度指数、淘宝指数等互联网工具对热水器和净水器的消费人群及搜索关注点进行分析;
6、 建议在国内外相关文献的基础上尽量选择新技术手段进行挖掘,比如基于深度学习理论模型完成情感分析,参见文献:《基于深度学习的微博情感分析》、《基于深度学习的文本情感分类研究》等。

 

报名及竞赛详情介绍如下:

一、组织单位

主办单位:广东省工业与应用数学学会

承办单位:广州泰迪智能科技有限公司

协办单位:华南师范大学

 

二、竞赛组织委员会

1.竞赛组织委员会组成名单

广东省工业与应用数学学会组织成立了数据挖掘竞赛组织委员会,竞赛组织委员会名单如下:

中山大学         冯国灿    

华南理工大学         刘深泉(主任)

华南师范大学         丁时进    

暨南大学         张传林    

广东工业大学         金朝永    

华南农业大学         房少梅    

广州大学         曹广福    

深圳大学         徐晨        

汕头大学         杨守志    

佛山科技学院         王向东    

韩山师范学院         肖刚        

华南师范大学         杨坦(副主任)

广州泰迪智能科技有限公司         张良均(副主任)

广州泰迪智能科技有限公司         刘丽君    

广州泰迪智能科技有限公司         张兰(秘书)

2.     竞赛组织委员会联系方式

地址:广东省广州市科学城科珠路232号(邮编:510663 )

电话:(020)82039399

联系人:张兰:18922381327,woxiyi_zl@163.com

张良均:13560356095,13560356095@qq.com

杨坦:18903011449,fling_yang@163.com

 

三、竞赛说明

        1.    竞赛设赛题三个,学生任选其中一个参赛即可。

        2.    学生以个人名义登记参赛,也可以组队参加,但每队人数不超过3人(必须属于同一所学校)。组织方对参赛选手的年级和专业不做具体限制,各年级、各专业均可报名参加。竞赛主要针对本科生,大专生和研究生参加时,在评奖时会酌情区别对待。

        3.    参赛选手必须同意竞赛组织委员会设立的竞赛相关规则。报名申请时填写真实的姓名、团队名称、指导老师、院系、手机、通信地址及其他注册页面所要求的资料,以便于核对身份并颁发奖品。竞赛组委会保证所收集到的学生个人信息资料仅用于竞赛有关工作,不会公开和泄露。竞赛论文在未征得作者同意的情况下不会公开。

        4.    指导老师可以是本校老师,也可由学生自行指定。

        5.    参赛者请加入QQ群(泰迪杯数据挖掘竞赛,295026770),加群时附加信息说明“数据挖掘竞赛”,加群后请按“学校简称_姓名”修改群名片,如“华师大_李建波”,有问题可咨询群内指导老师。

        6.    本次比赛不收取任何费用。

四、竞赛报名

竞赛报名步骤如下:

 1.    在全国大学生数据竞赛网站(http://www.tipdm.org)注册成为会员;

        2.    登陆全国大学生数据竞赛网站;

        3.    进入会员中心;

        4.    点击左侧“竞赛列表”;

        5.    在“第三届泰迪杯全国大学生数据挖掘竞赛”一行的操作列,报名参赛。

详见步骤见:http://www.tipdm.org/notice/614.jhtml。

 

五、竞赛时间安排

经数据挖掘竞赛组织委员会决研究定,竞赛时间安排如下:

 1.    报名时间:2015年4月1日----2015年5月13日

        2.    开题时间:2015年4月1日

        3.    竞赛时间:2015年5月14日------2015年5月24日

        4.    评阅时间:2015年5月25日------2015年5月28日

        5.    颁奖时间:待定,包括赛题评讲

 

六、技术支持

泰迪科技将为本次数据挖掘竞赛提供技术支持。数据挖掘需要使用专业的软件平台来实现,如IBM公司的SPSS Modeler(前身为SPSS的Clementine)、SAS公司的Entelprise Miner,以及由新西兰怀卡托大学开发的开源软件Weka,也可采用由泰迪科技提供的TipDM数据挖掘平台。

 

七、作品提交

1. 竞赛需要提交论文及相关数据,具体请仔细阅读各竞赛试题的试题要求及说明

2. 作品提交统一通过竞赛平台提交。提交步骤:登录>会员中心->竞赛列表->竞赛列表操作栏(第三届泰迪杯全国大学生数据挖掘竞赛的最右侧)->提交作品。

 

八、论文评审

论文评阅要点:数据预处理的完整性、对相关领域背景问题的理解程度、对挖掘模型评价的客观性、模型应用的创新性、结果的正确性和文字表述的清晰程度。 

 

九、获奖奖励

本次“泰迪杯全国大学生数据挖掘竞赛”获奖奖励办法如下:

1.    凡完成合格论文报告要求者可获得成功参赛证书。

2.    优秀论文奖:奖励泰迪杯优秀论文奖荣誉证书一本。

3.    特等奖1名,采用论文答辩的形式,从一、二等奖里面评取。奖励泰迪杯数据挖掘竞赛特等奖荣誉证书一本,并提供3000元奖学金。(1组)

4.    一等奖:约3%,奖励泰迪杯数据挖掘竞赛荣誉证书一本,并提供1000元奖学金。

5.    二等奖:约5%,奖励泰迪杯数据挖掘竞赛荣誉证书一本,并提供500元奖学金。

6.     三等奖:约10%,奖励泰迪杯数据挖掘竞赛荣誉证书一本,并提供价值200元的纪念品一份。

7.     特等奖、一、二、三等奖获得者可优先得到泰迪科技实习及推荐工作机会。实习优秀者将获优先签约权。

 

十、获奖名单公布

获奖名单将在竞赛网站、广东省工业与应用数学学会、华南师范大学数学科学学院网站及泰迪科技官网上发布。

 

查看全部竞赛试题:http://www.tipdm.org/stpj/626.jhtml


欢迎咨询在线客服
加微信群,与更多用户一起交流