八爪鱼,百万用户信赖的网络爬虫工具

采集锤子手机京东评价后,发现原来是这样的锤子!后悔啊

作者:keven 发布时间:8/11/2017 5:52:33 PM 10251 人已阅读

摘要:本文将以锤子M1L(SM919)评论数据作为分析对象,做一个获取用户反馈的数据分析case。采用文本分析+数值分析方法,定性定量综合分析,获取用户对产品功能的直接反馈。 针对该款手机,主要包括电池、系统、网络、外观问题反馈。通过微图文本分析工具,分析用户对具体功能评论观点,尤其是能够反映产品问题的负面观点。同时,运用spss统计工具,分析负面问题反馈数量,进行异常值预警。

大家都了解,如果产品部想获得用户对产品功能的真实评价,常用方法有抽样用户访谈和调查问卷。

抽样用户访谈对样本要求十分高。调查问卷不仅需要考虑题目内容设计、投放渠道、问卷回收成本等问题,还要进行数据信度和效度处理,排除用户随机填写问题的情况。

 

那么,如何聆听用户的真实声音?

 

本文将以锤子M1L(SM919)评论数据作为分析对象,做一个获取用户反馈的数据分析case。采用文本分析+数值分析方法,定性定量综合分析,获取用户对产品功能的直接反馈。

针对该款手机,主要包括电池、系统、网络、外观问题反馈。通过微图文本分析工具,分析用户对具体功能评论观点,尤其是能够反映产品问题的负面观点。同时,运用spss统计工具,分析负面问题反馈数量,进行异常值预警。

 

通过八爪鱼采集器,采集锤子M1L(SM919)型号手机,京东评论30232条数据。总结手机锤子M1L功能主要分类如下图:

图片1

以下将从用户对产品总体反馈、功能反馈、功能负面评论数量异常值预警三个方面进行分析。

 

一、用户整体反馈

 

1、用户整体情况占比

图片2

 图表来源:微图

正面评论占比83.17%,负面评价14.61%,中性评价2.23%,可见用户对产品的总体反馈不错。

 

图片3

图表来源:微图

上图反映用户对产品总体打分情况。5分评价占比88.73%,4分占比5.11%,3分2.4%,2分0.89%,1分2.86%。

 

2、产品功能关注度

图片4

图表来源:微图

由上图可知,用户对锤子M1L关注的热点话题主要集中在系统、外观、电池,分别占比 48.59%、21.58%、24.13%。系统问题讨论最多,外观和电池占比相差不多,居于次位。本文将列举电池功能例子,分析用户主要观点和情感状况。

 

 

二、产品功能反馈

 

本文将电池功能按时间和功能指标两个维度进行划分。时间维度指用户使用产品时间长短,即用户在不同使用时间范围内,对电池功能的整体反馈情况。电池功能指标为能够反映电池性能的指标。主要包括充电、发热、续航三个指标。

 

1、按用户使用时长分类

 

通过八爪鱼采集器,采集用户在不同时间范围内的追评数据。假设用户初次评论时开始使用产品,对其进行分组分析。1-30天内进行追评的用户,设定为使用产品1个月后对电池功能评价。30-60天内、60-90天内进行追评的用户,其设定依次类推。

 

1-30天内,用户对电池的评论内容主要集中在充电时长,充电器寿命,充电接口发热,充电时手机严重发热四个方面。

图片5

图表来源:微图 

 

30-60天内,用户对电池评论内容主要集中在电池续航能力、充电器寿命等问题。

图片6

图表来源:微图

 

60-90天内,用户对电池评论内容主要集中在发热问题。

图片7

图表来源:微图

 

2、按电池功能指标

 

1)充电

 

用户情感分析

图片8

图表来源:微图 

 

用户主要观点分析

图片9

图表来源:微图 

可以看出用户对锤子M1L手机充电功能整体满意,正面评论比例为77.11%,负面评价占比22.89%。负面问题主要反映充电器寿命短、有噪音、充电口松动等具体问题,需要测试用户反馈问题是否属实,评估技术可行性,决定是否采取措施。

 

充电问题整体反馈数量

图片10

 图表来源:微图 

红色代表电池充电负面评论数量趋势,黄色代表正面评论数量趋势,由上图可见,正负面数量都维持在5-10之间,5月3日左右出现波动,正面数量为50,负面数量为30,但是否属于异常值范围,本文会在第三部分介绍常见的异常值检验方法,及时反应问题重要性。

 

2)发热

 

用户情感分析

图片11

图表来源:微图 

由上图可知,对于发热问题,负面评论占比50.38%,比例很高。根据上图具体评论内容可知,用户对电池发热反应较强烈。研发、测试人员需引起重视。

 

用户主要观点分析

图片12

 图表来源:微图 

对于电池发热,用户主要问题集中在玩游戏发热严重、背面上半部发热明显等方面,进一步缩小发热问题范围。

 

发热问题整体反馈数量

图片13

 图表来源:微图 

由上图可知,负面评论数量普遍维持在0-6之间,在4月20日出现第一波峰值,正面评论数量为12,负面数量为5。而5月8日左右出现第二波峰值,正面数量为18,负面数量为13。存在多个波峰情况,如何判别波动值是否在正常波动范围内,还是存在异常波动,需要引起注意,本文会在最后部分进行示例阐述。

 

3)续航

 

用户情感分析

图片14

图表来源:微图

 

用户情感分析

图片15

 图表来源:微图

可以看出用户对锤子M1L手机电池续航能力十分满意,呈现正面评价占比91.18%,负面评价占比8.82%。负面问题主要包括使用时间短、4000毫安电池可信度、勉强坚持一天,需研发人员依据负面占比和用户具体负面问题综合分析。

 

续航问题整体反馈数量

 

图片16

 图表来源:微图

以上为电池功能的分析思路,像系统死机和重启指标,以及外观划痕和手感等产品人员关注的功能指标,都可按上述方法进行分析。不在此一一赘述。

通过文本分析可以反映用户对产品功能意见反馈。下文将介绍三种常用数值分析方法,对具体功能负面问题反馈数量进行及时监控和预警。

 

 

三、负面问题反馈数量异常分析

 

产品研发人员更加关注每个产品功能是否满足用户的需求,对于用户具体吐槽的内容是什么,才能有针对性的改进。同时,在众多用户反馈中,哪些问题迫切需要改进,哪些问题有待观察,优先级显得尤为重要。

 

1、同比率、环比率

 

这是一种简单直观的数值预警方法。主要依赖以往对数据观测经验,进行判断。

环比率=(本期某个指标值-上期这个指标值)/上期这个指标值

同比率=(现年某个指标值-上年同期这个指标值)/上年同期这个指标值。

 

本文截取3月21日-3月27日电池发热负面评论数量数据,相对上周电池发热负面评论数量,分析哪些是异常波动,哪些是正常范围内的波动。

 

电池发热(按周)环比率情况:

图片17

  图表来源:微图

 

2、箱体图

 

箱体图最大特点是对实际数据进行分析。为我们提供了数据百分位数的概念,例如四分位数(25%和75%)是将该变量分成约4个部分,分别提供了数据不同分位点附件的离散性,而且同时提供描述数据集中性的中位数,这样在中间50%的数据上提供的信息将异常丰富。

 

本文截取4月13日-5月10日时间段内,电池发热负面评论数量数据,运用spss21.0软件,绘制箱体图。

图片18

 图表来源:SPSS

上图离开箱体的22和21列值分别代表5月9日负面评论数量为19个,5月12日负面评论数量13个,考虑为异常数据。应考虑内、外部影响因素,分析异常原因,评估是否需要及时针对电池发热问题进行改进,并及时与市场公关部门沟通,排除潜在产品问题引发公众事件的安全隐患。

 

3、测控图

 

如果是时序数据,控制图是不错的选择。前提条件是样本均值服从正态分布。

 

如何检验一组数据是否是正态分布呢?本文通过spss对4月8日-4月20用户电池发热问题反馈数量进行异常值排查,绘制Q_Q图,若散点呈一条直线,则数据符合正态分布。

图片19

 图表来源:SPSS

证明了数据总体x是服从正态分布。控制图中异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值。与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。控制图主要包括中心线(CL)、上控制限(UCL)和下控制限(LCL)。

 

根据上述数据绘制控制图如下:

图片20

  图表来源:SPSS

通过上图可知,超出虚线部分数值为第13行数据,即电池发热问题反馈数量为13个,可重点分析该异常值,其余数据均在正常波动范围内。

 

当发现异常数据,需结合产品与业务情况进行综合分析。但换种角度,如果我们已知产品的某些负面评论数量本该异常,但是数据没有异常!这也算是数据异常。同样需要查找原因。

 

获得真实产品功能反馈,达到改进产品目的。关键点在于对产品功能指标的细分,通过大数据的方法提取用户评论有效信息,真正达到“聆听用户诉求”目的。让大数据分析深入产品的每个环节,提升产品研发和迭代的效率,精准设计符合用户需求产品。


欢迎咨询在线客服
加微信群,与更多用户一起交流