你会用哪些数据分析方法?

2023-06-01 0 922

原副标题:你会用甚么样统计数据挖掘方式?

责任编辑的主要内容是为大家科学普及统计数据挖掘的基本概念和方式,译者用明晰的“是甚么,为甚么,怎么做”路子,为听众提供了两个又两个的方式论,为统计数据挖掘阿宝们带来了紧凑型的一流科学知识。

你会用哪些数据分析方法?

有老师问:张老师,每天被复试都被问“你采用过甚么样统计数据挖掘的方式”。结果都觉得答不上去。究竟统计数据挖掘有甚么方式?咋我在做统计数据挖掘,却觉得没甚么方式?今天系统答疑一下。

首先,并不是英文名字带“预估”俩字的,就是统计数据挖掘方式。有很多XX预估,是语言学、软件工程、微积分的专精辅助工具,并不直接对准销售业务难题的国际标准答案。当现代人在问:”有甚么预估方式”的时候,更多期许听见两个能得出推论的方式。

所以想提问好这个难题,要返回:统计数据预估究竟化解甚么样销售业务难题上去。

从销售业务商业用途上看,统计数据挖掘能化解5大类难题

是啥(统计数据叙述情况) 是甚么(践行统计数据国际标准) 为甚么(积极探索难题原因) 会什么样(预估销售业务市场走势) 又如何(综合性推论情况)

紧紧围绕每一难题情景,有某一的方式女团(如下表所示图)

你会用哪些数据分析方法?

一、化解“是啥”的方式

用统计数据叙述情况,须要创建健全的统计数据分项体系。创建统计数据分项体系,则须要剖析确切统计数据分项之间的认识论。统计数据分项间有两种基本上的认识论:以太网认识论和博戈达认识论,因此派生出三种基本上的预估方式:棒状预估法&分项回收法。

你会用哪些数据分析方法?

回收的销售业务多了,现代人发现,这类统计数据分项能一般来说的女团采用,比如说:

使用者营运情景:AARRR分项、RFM分项 零售业店面情景:人、货、场分项 商品管理情景:进、销、存分项

这些也习惯性被称为:预估模型。但注意,这些都只是在展示统计数据。统计数据+推论国际标准,才有预估推论。有关推论国际标准的预估,是:是甚么类难题。

二、化解“是甚么”难题的方式

推论国际标准能很简单,比如说领导的指令、KPI要求、过往同期统计数据,都能作为国际标准。这些统称为:简单国际标准。但很多时候,分项市场走势是否正常,并无明确的KPI约束,甚至KPI达标,但是市场走势奇特,领导们还是会觉得有难题。这时候就须要找其他参照物。因此派生出一系列预估方式。

比如说:

与销售业务自身规律比较,推论好坏:生命周期法、自然周期法 与同类型,同期发展的销售业务比较:同期群预估法 与其他销售业务个体进行比较:分层预估法

这样对比,即使只有1个统计数据分项,也能得出好坏推论。如果销售业务发展违背过往规律,明显比其他个体更差,则能判定为:不好。

你会用哪些数据分析方法?

当然,也能采用2个分项,比如说经典的矩阵预估法,通过两分项交叉+两分项平均值,分出四类销售业务,从而得出好坏推论。

你会用哪些数据分析方法?

如果用更多分项也行,比如说常用的Kmean聚类,能先利用多个分项对销售业务个体聚类,之后再看各类型之间表现优劣。

以上这些方式,都能将销售业务的好/坏区分出来,从而在一定程度上辅助推论。

三、化解“为甚么”难题的方式

“预估下这个难题是甚么原因导致的……”是常见的要求,这是“为甚么”难题。化解为甚么难题,有两大基本上路子:

1. 结果推断

常见的,比如说:

结构预估法:通过结构预估,找到难题发生点 标签预估法:通过打标签,做个体对比,找到难题原因 相关预估法:通过计算分项相关关系,找到相关分项,再形成假设 MECE法:讲多个销售业务假设,按MECE原则合并成微积分认识论,一一验证

结果推断,意为难题发生后,用各种统计数据寻找差异,创建假设。能把销售业务口中“我觉得这是XX原因”,抽象成两个统计数据可验证的假设,因此适用范围非常广。但结果推断只是单方面从结果做归纳,有可能有偏颇,还须要实验验证。

你会用哪些数据分析方法?

2. 实验推断

这些方式更接近传统语言学的实验,大部分都要求:

开展统计数据实验,验证假设 设参照组/实验组,且参照组/实验组特征相似 区分控制变量、环境变量,重点测控制变量的影响 先有假设,然后通过实验/分组对比,验证假设。常见的方式,包括ABtest、DID、PSM、RDD、Uplift等方式。

实验推断有语言学依据,计算过程复杂,看起来更量化一些。但是对实验条件要求太高,比如说大促销类ALL in的销售业务,比如说商品、店铺这些无法控制环境的销售业务情景,比如说销售业务员行为、内容传播等难采集统计数据的领域,都很难用。

理想的状态,肯定是两者结合,事实-假设-验证,不断循环,接近真相。但现实中有很多条件制约。导致我们只能从两个角度切入,慢慢靠近真相。

四、化解“会什么样”难题的方式

预估类难题,是所有人都感兴趣的话题,也是语言学/算法最有可能发挥作用的地方。唯一限制方式采用的,是:究竟有啥统计数据&销售业务人员要不要参与。

如果销售业务人员坚持参与预估过程,就只能用销售业务假设法或者滚动预估法,这些方式把影响结果的参数都列出来,方便销售业务人员拍脑袋,也能帮他们明晰:我要做啥。

你会用哪些数据分析方法?

如果销售业务人员不参与,则视统计数据量的啥。统计数据少,则采用时间序列预估,统计数据多,且有影响结果的原因统计数据,则能用诸如回归模型一类算法预估。

你会用哪些数据分析方法?

五、化解“又如何”难题的方式

综合性评估与分配难题,统称“又如何”难题。这是决策的最后一步,决定是否对销售业务做动作,做多大动作。有些简单的评估是很容易的,比如说销售签了生死状,达不成业绩目标就炒鱿鱼。

但大部分情况,评估很复杂,要考虑方方面面。这里最大的区别,在于要不要考虑领导的主观意见。如果要,果断采用主观评分法!满足领导的打分欲是第一位的。如果不要,再考虑采用有监督的机器学习算法,或者因子预估法,DEA法(求的是相对效率)等客观方式。

至于:做啥,谁来做。就是更复杂的难题了。想做好分配,得先把前边几步预估做完,对每一销售业务线基础能力有充分认识,才好下推论。这里,线性规划的方式,能用来做支持。

你会用哪些数据分析方法?

六、为甚么觉得没用上方式?

综上可见,统计数据挖掘的方式是非常多的。但为甚么很多老师觉得自己没用上方式呢?因为每种方式是和销售业务情景、领导风格、统计数据质量、息息相关的。

比如说因果推断算法大多基于分组测试展开,而实际销售业务中,很多因果预估是事后再查原因,也不给二次实验的机会。

比如说很多公司的分配方案,根本是领导拍脑袋,一言堂,根本没机会让预估师用算法。

比如说预估难题,很多公司根本没有足够统计数据积累,只有一条销售统计数据,那撑死了也只能用时间序列法。

这种理想与现实的差距,让很多老师很痛苦。一方面不确切究竟这些方式该如何用,另一方面不了解,自己该如何应对销售业务需求。复试和工作都很吃力。

专栏作家

金融,快消,零售业,耐用,美容等15个行业有丰富统计数据相关经验。

题图来自Unsplash,基于CC0协议。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务