首页 >> 大全

数据化运营09 抓住问题关键:用相关性分析拆解多个影响因素

2023-06-24 大全 48 作者:考证青年

前一讲,和你探讨了多维分析的方法,通过多维分析来寻找指标变化的原因。当我们找到问题的原因时,自然会进一步思考一个问题:指标变化的原因这么多,决定问题的关键因素又是哪个呢?

需要专栏原数据进行实操的同学,可到“拉勾教育”公众号回复“数据化”,即可在百度云盘中获取本专栏的 21 组数据源。

比如,我们在工作场景中时不时会经常讨论这些问题:

还有很多类似的场景不一一列举。这些业务场景明显复杂很多,除了要能告知原因外,还需要明确出不同原因的重要性。确实,我们知道影响活跃的因素有很多,可资源有限,不可能全面铺开逐一去解决,只能集中优势资源解决核心问题。

那么如何从一大堆原因中找出最核心的原因呢?接下来,我将与你分享一个定量判断指标原因重要性和优先级的方法:相关性分析

什么是相关性分析?

相关性分析,指对两个或多个指标进行分析,评估它们两两之间联系或相互影响的程度。相关性分析不仅可以分析出多个指标间的联系程度,还能给出联系程度紧密的量化值。

例如,相关性分析能够分析出营销活动的投入成本和活动转化率的相关程度,不仅能够告诉我们投入成本越高,转化率越高的数据关系,还能告诉我们高到什么程度。

图片1.png

相关性分析,使用“相关系数”这个指标定量给出几个指标间联系和影响的程度,通常用 p 来表示,我们用 p 值判断指标的相关性时遵循以下两个步骤。

相关系数 p 是一个介于 -1~1 的小数。

1.判断指标间是正相关、负相关,还是不相关

2.其次判断相关的程度

相关性分析的理论不复杂,我们看看在一些产品运营场景中是如何应用的。

相关性应用场景有哪些?

事实上,相关性分析的应用场景非常多,基本上只要提到“它俩有什么关系?”“哪个指标的作用/贡献/价值更大?”“我们应该重点解决哪个问题?”时,都可以用相关性分析给出定量和准确的回答,非常便于产品运营找到解决问题的核心抓手。

我将各类业务场景及其指标总结为下表,可供你需要时参考使用。

图片2.png

接下来,我们通过三个案例进行“相关性分析”实战。

产品运营场景实战案例 1.如何分析哪个客群的留存对整体留存贡献更大?

留存的运营中我们最常看的就是新客的留存和活跃客群的留存,用来评估哪个客群的留存与整体的留存联系更紧密,以便制定后续运营的策略。

图片3.png

对于这样的报表,我们需要找出到底是哪个客群的留存对于整体留存的影响最大。如果能找出来这个关系,那么后续要提升留存,就有非常清晰的方向。

用相关性分析可以很好地回答这个问题,在 Excel 中点击“数据”选项卡,进入“数据分析”,找到“相关系数”,选择数据区域,点击确定即可,分析结果如下图所示。

在Excel中的具体操作过程,会在本课时的最后讲解。

图片4.png

上表就是相关性分析输出的相关系数表,其中显示了指标两两间的相关系数。

可以看出,活跃访客的留存率与整体留存率的相关系数是 0.61,大于 0.5,故是强相关;而新增访客的留存率与整体留存率的相关系数只有 0.15,小于 0.5,故是弱相关。

所以如果要提升整体留存率,我们的产品运营资源应当更多地投放给活跃用户,以提升整体的留存率;而新增访客,虽然不会拿到很多运营资源,但是我们也要去深入分析为什么新增访客的留存的贡献比较小,适时做一些提升这部分客群与整体留存的策略。

2.如何找出对购买转化率贡献最高的渠道?

基本上电商运营会同时部署多个渠道,包括线上电商平台以及线下的门店。由于现有某产品从各个渠道获客的用户在产品上的购买转化率,需要评估哪些渠道的用户对整体购买转化率贡献最大,后续将重点营销此渠道。

图片5.png

图片6.png

可以看出各个渠道对整体购买转化率的相关性为:

可以看出,渠道 B 的购买转化率对整体购买转化率为正向贡献,故若要提升整体购买转化率,应当投入资源在渠道 B 的运营;同时,渠道 A 和渠道 D 对整体购买转化率为负向贡献,应当仔细分析排查原因。

3.如何分析哪些因素对 DAU 的影响更大?

我们分析 DAU 时常会将它拆解为各种维度来分析,这里我们分析与 DAU 联系最紧密的维度到底是哪些,以帮助我们制定针对性的运营策略,如下图所示。

图片7.png

由于数据源过多,该数据图并非完整数据,仅为部分截图。

对于这样的报表,我们需要找出到底是哪几个城市、哪个操作系统,以及哪个年龄段的用户对于 DAU 的影响最大。如果能找出来这个关系,那么后续要提升 DAU,就有非常清晰的方向。

用相关性分析可以很好地回答这个问题,在 Excel 中点击“数据”选项卡,进入“数据分析”,找到“相关系数”,选择数据区域,点击确定即可,分析结果如下图所示。

图片8.png

考察这三个城市与 DAU 的相关系数,按照相关系数的大小排序依次是:上海 > 深圳 > 广州。

也就是说,从城市维度来看,上海、深圳与 DAU 的相关系数最高,超过 0.5,属于强相关;广州与 DAU 的相关系数小于 0.5,属于弱相关。

所以,如果要提升 DAU,那么促活的资源应当更多地投放在上海和深圳这两个城市的用户上。

图片9.png

考察 、iOS 与 DAU 的相关系数,按照相关系数的大小排序依次是:iOS < ,并且 的相关系数高达 0.83,属于强相关。

也就是说,从操作系统维度来看, 设备的用户活跃对整体 DAU 贡献最大。所以,如果要提升 DAU,那么促活的资源应当更多地投放在 的用户上。

图片10.png

考察这三个年龄段与 DAU 的相关系数,按照相关系数的大小排序依次是:大于 30 岁 > 20~30 岁 > 小于 20 岁。

也就是说,从年龄段维度来看,大于 30 岁的客群与 DAU 的相关系数最高,达到 0.94,属于强相关;20~30 岁的客群与 DAU 的相关系数为 0.12,小于 0.5,属于弱相关。

图片11.png

所以,如果要提升 DAU,那么促活的资源应当更多地投放在年龄大于 30 岁的用户上。特别地,我们还发现小于 20 岁的客群与整体 DAU 呈现弱的负相关。

一般而言,出现了负相关情况我们要更加留意,并且进行深入的专题分析。例如,分析这部分客群的行为和路径特征、留存等情况,来判断是产品功能或服务无法满足,还是用户体验不好,或是运营活动出现偏差导致了出现负相关。如果这个客群仍是我们的目标客群,那我们仍需要在做上述分析后努力将负相关转为正相关。

用“相关性分析”找出违背业务常识的真实情况

相关性分析除了能帮我们找出关键的影响因素,还能帮助我们论证业务逻辑的有效性,甚至能纠正我们的思维误区。

有时候,我们想当然的业务常识,可能就是与真实情况相悖的。接下来,向你介绍一个案例。

我有一个朋友是做快消品的,负责公司牙膏产品的渠道推广。他在快手、抖音等短视频平台根据产品的功能特性投放了大量的广告,希望可以引流短视频用户到淘宝去付费下单。

可他用“相关性分析法”追踪短视频平台商品链接的点击情况与淘宝付费下单情况时,非常意外地发现产品视频的点击量和淘宝的付费用户数毫无相关关系。

然后据此追踪用户行为,经过仔细排查后发现,用户的行为模式并不如预期所想。

于是厂商果断大幅调整营销方向,不再在短视频平台投放“产品功能特性关键字”,而是投放“品牌”;在淘宝搜索栏也不再购买“产品功能特性关键字”,而是购买“品牌类关键字”。如此之后营销效果立竿见影。

如果没有相关性分析,谁能想到在各大短视频平台投放产品营销资源,与引流到电商完成付费转化这两者几乎无关联呢?

【注意:相关性分析前,别忘剔除指标中的异常值】

异常的指标,不管是极大值,还是极小值,都会显著影响相关性的计算,严重影响相关性结果。所以一般情况下,需要先通过描述性统计找出异常值,将异常值剔除后再进行相关性分析。

关于异常值,你可回顾《07 | 分析突破口:如何通过指标抓取数据的主要特征?》

操作:在 Excel 中进行“相关性分析”

在 Excel 中为我们提供了相关性分析的算法包,操作步骤如下。

第一步:点击“数据”选项卡,找到“数据分析”。

图片12.png

第二步:选择数据区域。

图片13.png

第三步:点击确定完成。

图片14.png

小结

“相关性分析”最大的作用,就是将两个事情/事物之间的关系做出了量化考核:

当 p 的值在 [0.5,1] 之间,认为指标间是强相关;

当 p 的值在 [0.1,0.5) 之间,认为指标间是弱相关;

当 p 的值在 [0,0.1) 之间,认为指标间是无相关

并能通过量化值对致因因素进行排序,让我们对业务的影响因素有了更清晰的认知,也就是能让我们看清事情的主要矛盾,能抓住“问题关键”制定出更合适的运营策略。

讲到这里,第一大类分析:描述分析的三种常用分析方法就讲完了,下图是这三个方法的核心知识点,希望你能够结合自己的工作场景去理解和使用。

图片15.png

接下来我们就要进入第二大类分析:推断分析的内容,看看推断分析能够为我们的产品运营解决哪些更加复杂的场景和问题。

我是磊叔,下次课见~~~

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了