“数据驱动决策”的13种思维

2023-05-31 0 1,107

责任编辑是译者筹划2个月的经典作品,

撷取了13种观念形式的应用领域,

概要共5103字 | 提议写作天数10两分钟

“数据驱动决策”的13种思维

“统计数据驱动力重大决策”,为的是不许这句话正式成为空谈,请先武器装备下列13种价值观枪械,坚信今后你很大会用上!

第三、信度与信度观念

该些或许是概要最难认知的部份,但我真的也最关键。没那个观念,重大制定者很有可能在统计数据中沉沦。

“数据驱动决策”的13种思维

**简而言之信度,是指两个统计数据或分项另一方面的可信某种程度,主要包括准确度和灵活性**取数形式论与否恰当?是不是不可信性?这归属于准确度;每天排序的演算法与否平衡?舰炮与否完全一致?以完全相同的形式排序相同的第三类时,准确度与否有市场波动?这是灵活性。做到了以上两个方面,就是两个好的统计数据或分项了?其实还不够,还有两个更关键的因素,就是信度!**

**简而言之信度,是指两个统计数据或分项的生成,需贴合它所要衡量的事物,即分项的变化能够代表该事物的变化。**

只有在信度和信度上都达标,才是两个有价值的统计数据分项。

举个例子:要衡量我身体的肥胖情况,我选择了穿衣的号码作为分项,一方面,完全相同的衣服尺码对应的实际衣服大小是相同的,会有美版韩版等因素,使得准确度很差;同时,一会儿穿那个牌子的衣服,一会儿穿那个牌子的衣服,使得该衡量形式形成的结果很不平衡;所以,衣服尺码那个分项的信度不够。另一方面,衡量身体肥胖情况用衣服的尺码大小?你很大真的荒唐,尺码大小并不能反映肥胖情况,是吧?因此信度也不足。体脂率,才是信度和信度都比较达标的肥胖衡量分项。

在我们的现实工作中,许多人会想当然地拿了分项就用,这是非常值得警惕的。你要切骨头却拿了把手术刀,是不是很可悲?信度和信度的本质,其实就是**统计数据质量**的问题,这是一切分析的基石,再怎么重视都不过分!

第二、平衡观念

“数据驱动决策”的13种思维

说到天平大家都不陌生,平衡的观念坚信各位也都能很快认知。简单来说,在统计数据分析的过程中,我们需要经常去寻找事情间的平衡关系,且平衡关系往往是关乎企业运转的大问题,如市场的供需关系,薪资与效率关系,工作时长与错误率的关系等等。

**平衡观念的关键点,在于寻找能展示出平衡状态的分项!**

也就是如图中红框,我们要去寻找那个准确的量化分项,来观察天平的倾斜某种程度。怎么找那个分项呢?以我的经验,一般先找双向型的问题,即高也不是低也不是的问题,然后量化为分项,最后排序成某个比率,长期跟踪后,观察它的信度和信度。

第三分类思维

“数据驱动决策”的13种思维

客户分群、产品归类、市场分级、绩效评价…许多事情都需要有分类的观念。主管拍脑袋也可以分类,通过机器学习演算法也可以分类,那么许多人就模糊了,到底分类观念怎么应用领域呢?

**关键点在于,分类后的事物,需要在核心分项上能拉开距离!**

举个例子:假设该图反映了某个消费者分群的结果,横轴代表购买频率,纵轴代表客单价,那么绿色的这群人,就是明显的“人傻钱多”的“剁手金牌客户”。

第四矩阵化观念

“数据驱动决策”的13种思维

矩阵观念是分类观念的发展,它不再局限于用量化分项来进行分类。许多时候,我们没统计数据做为支持,只能通过经验做主管的推断时,是可以把某些关键因素组合成矩阵,大致定义出好坏的方向,然后进行分析。大家可以百度经典的管理分析形式“波士顿矩阵”模型。

第五管道/漏斗观念

“数据驱动决策”的13种思维

这种观念形式已经普及:注册转化、购买流程、销售管道、浏览路径等,太多的分析场景中,能找到这种观念的影子。

但我要说,看上去越是普世越是容易认知的模型,它的应用领域越得谨慎和小心。在漏斗观念当中,我们尤其要注意**漏斗的长度**

漏斗从哪里开始到哪里结束?以我的经验,漏斗的环节不该超过5个,且漏斗中各环节的百分比数值,量级不要超过100倍(漏斗第三环节100%开始,到最后两个环节的转化率数值不要低于1%)。若超过了我说的这两个数值标准,提议分为多个漏斗进行观察。当然,这两个是经验数值,仅仅给各位做个参考~

理由是什么呢?超过5个环节,往往会出现多个重点环节,那么在两个漏斗模型中分析多个重要问题容易产生混乱。数值量级差距过大,数值间市场波动相互关系很难被察觉,容易遗漏信息。比如,漏斗前面环节从60%变到50%,让你感觉是天大的事情,而漏斗最后环节0.1%的变动不能引起你的注意,可往往是漏斗最后这0.1%的变动非常致命。

第六相关观念

“数据驱动决策”的13种思维

我们观察分项,不仅要看单个分项的变化,还需要观察分项间的相互关系!

有正相关关系(图中红色实线)和负相关关系(蓝色虚线)。最好能时常排序分项间的相关系数,定期观察变化。

相关观念的应用领域太广了,我提往往是被大家忽略的一点。现在的很多企业管理层,面对的问题并不是没统计数据,而是统计数据太多,却不知道怎么用。相关观念的其中两个应用领域,**就是能够帮助我们找到最关键的统计数据,排除掉过多杂乱统计数据的干扰!**

如何执行呢?你可以排序能收集到的多个分项间的相互关系,挑出与其他分项相关系数都相对较高的统计数据分项,分析它的产生形式论,对应的问题,并评估信度和信度,若都满足标准,那个分项就能定位为核心分项!

提议大家养成两个习惯,经常排序分项间的相关系数,仔细思考相关系数背后的形式论,有的是显而易见的常识,比如订单数和购买人数,有的或许就能给你带来惊喜!另外,“没相关关系”,这往往也会成

第七、远近度观念

“数据驱动决策”的13种思维

现在与许多处在管理层的朋友交流后,发现他们往往手握众多统计数据和报表,注意力却是非常的跳跃和分散

。如何避免呢?一是上文说的通过相关观念,找到最核心的问题和分项;二就是该些要说的,建立远进度的观念形式。

确定好核心问题后,分析其他业务问题与该核心问题的远近某种程度,由近及远,把自己的精力有计划地分配上去。比如:近期你地核心任务就是提高客服人员的服务质量,那么客服人员的话术、客

第八、形式论树观念

“数据驱动决策”的13种思维

如图的树状形式论坚信大家已经见过许多回了。一般说明形式论树的分叉时,都会提到“分解”和“汇总”的概念。我这里把它变一变,使其更贴近统计数据分析,称为“下钻”和“上卷”。当然,这两个词不是我发明的,早已有之。

简而言之下钻,就是在分析分项的变化时,按很大的维度不断的分解。比如,按地区维度,从大区到省份,从省份到城市,从省市到区。简而言之上卷就是反过来。随着维度的下钻和上卷,统计数据会不断细分和汇总,在那个过程中,我们往往能找到问题的根源。

下钻和上卷并不是局限于两个维度的,往往是多维组合的节点,进行分叉。形式论树引申到演算法领域就是重大决策树。有个关键便是何时做出重大决策(判断)。当进行分叉时,我们往往会选择差别最大的两个维度进行拆分,若差别不够大,则那个枝桠就不在细分。能够产生显著差别的节点会被保留,并继续细分,直到分不出差别为止。经过那个过程,我们就能找出影响分项变化的因素。

举个简单的例子:我们发现全国客户数量下降了,我们从地区和客户年龄层级两个维度先进行观察,发现各个年龄段的客户都下降,而地区间有的下降有的升高,那我们就按地区来拆分第三个形式论树节点,拆分到大区后,发现各省间的差别是显著的,那就继续拆分到城市,最终发现是浙江省杭州市大量客户且涵盖各个年龄段,被竞争对手的一波推广活动转化走了。就此通过三个层级的形式论树找到了原因。

第九、天数序列观念

“数据驱动决策”的13种思维

很多问题,我们找不到横向对比的形式和第三类,那么,和历史上的状况比,就将变得非常关键。其实很多时候,我更愿意用天数维度的对比来分析问题,毕竟发展地看问题,也是“红色形式论”中的关键一环。这种形式容易排除掉一些外在的干扰,尤其适合创新型的分析第三类,比如两个新行业的公司,或者一款全新的产品。

天数序列的观念有三个关键点:

**一是距今越近的天数点,越要重视**(图中的深浅度,越近期发生的事,越有可能再次发生);

**二是要做同比**(图中的尖头指示,分项往往存在某些周期性,需要在周期中的同一阶段进行对比,才有意义);

**三是异常值出现时,需要重视**(比如出现了历史最低值或历史最高值,提议在天数序列作图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。

时间序列观念有两个子概念不得不提一下,就是“生命周期和运营的节奏更明确。

第十队列分析观念

“数据驱动决策”的13种思维

随着统计数据运算能力的提高,队列分析的形式逐渐展露头脚。英文名称为cohort analysis,说实话我不知道怎么表述那个概念,我的认知就是**按很大的规则,在天数颗粒度上将观察第三类切片,组成两个观察样本,然后观察那个样本的某些分项随着天数的演进而产生的变化

**。目前使用得最多的场景就是留存分析。

举个经常用的例子:假设5.17我们举办了一次促销活动,那么将这一天来的新用户作为两个观察样本,观察他们在5.18、5.19…之后每天的活跃情况。

队列分析中,分项其实就是天数序列,相同的是衡量样本。队列分析中的衡量样本是在天数颗粒上变化的,而天数序列的样本则相对固定。

第十一循环/闭环观念

“数据驱动决策”的13种思维

循环/闭环的概念可以引申到很多场景中,比如业务流程的闭环、用户生命周期闭环、产品功能使用闭环、市场推广策略闭环等等。许多时候你会真的这是两个不落地的概念,因为提的人很多,干出事情来的例子很少。

但我真的这种思考形式是非常必要的。业务流程的闭环是管理者比较容易定义出来的,列出公司所有业务环节,梳理出业务流程,然后定义各个环节之间相互影响的分项,跟踪这些分项的变化,能从全局上把握公司的运行状况。

比如,一家软件公司的典型业务流:推广行为(市场部)➡流量进入主站(市场+产研)➡注册流程(产研)➡试用体验(产研+销售)➡进入采购流程(销售部)➡交易并部署(售后+产研)➡使用、续约前文所述,**千万不要用两个漏斗来衡量两个循环**。

有了循环观念,你能比较快的建立有形式论关系的分项体系。

第十二、测试/对比观念

“数据驱动决策”的13种思维

AB test大家肯定不陌生了。那么怎么细化一下那个概念?

一是在条件允许的情况下,重大决策前尽量做对比测试;

二是测试时,很大要注意参照组的选择,提议任何实验中,都要留有不进行任何变化的一组样本,作为最基本的参照。

,多去发现规律。

第十三指数化观念

“数据驱动决策”的13种思维

指数化观念,是指将衡量两个问题的多个因素分别量化后,组合成两个综合指数(降维),来持续追踪的形式。把那个放在最后讨论,目的就是强调它的关键性。前文已经说过,许多管理者面临的问题是“统计数据太多,可用的太少”,这就需要“降维”了,即要把多个分项压缩为单个分项。

指数化的好处非常明显,**一是减少了分项,使得管理者精力更为集中;二是指数化的分项往往都提高了统计数据的信度和信度**;三是指数能长期使用且便于认知。

指数的设计是门大学问,这里简单提三个关键点:一是要遵循**独立和穷尽**的原则;二是要注意各分项的单位,尽量做**标准化**来消除单位的影响;三是权重和需要等于1

独立穷尽原则,即你所定位的问题,在搜集衡量该问题的多个分项时,各个分项间尽量相互独立,同时能衡量该问题的分项尽量穷尽(收集全)。举个例子:当初设计某公司销售部门的分项体系时,目的是衡量销售部的绩效,确定了核心分项是销售额后,我们将绩效拆分为订单数、客单价、线索转化率、成单周期、续约率5个相互独立的分项,且这5个分项涵盖了销售绩效的各个方面(穷尽)。我们设计的销售绩效综合指数=0.4*订单数+0.2*客单价+0.2*线索转化率+0.1*成单周期+0.1*续约率,各分项都采用max-min形式进行标准化。

通过那个例子,坚信各位就能认知指数化观念了。

小结

本篇内容在我脑中筹划了2月有余了,但当起笔成文时,依然真的自己的思考还不够全面,经验也不够丰富。各种观念形式的应用领域,似乎没孰好孰坏,与否启用看似也比较随机。希望随着我经历的不断丰富,能够总结出一套行之有效的观念技巧,但目前还不行。

总的来说,统计数据质量依然是我真的最大的前提。关键事情说三遍,

动手前,很大要保证好统计数据质量!

动手前,很大要保证好统计数据质量!

动手前,很大要保证好统计数据质量!

End.

译者:胡晨川(中国统计网特邀认证译者)

本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明译者及出处,并保留责任编辑链接。

“数据驱动决策”的13种思维

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务