当他们看了不少增长事例后,再看看手头上的组织工作和业绩最终目标,是不是还觉得不知道怎么同时实现?那是因为许多事例并没有如是说得出的预测操作过程,而只是叙述了难题的背景和最终目标,以及强化后的效果。真正的预测操作过程,往往被“发现”两个字推而广之。
总之有人会说,数据挖掘操作过程是两个要说的操作过程,根本不可能按照两个统一的业务流程完成全部预测,的的网络领域的告诉变化之中。那么数据挖掘的操作过程,究竟是两个多于零碎基本功而无条理变易的操作过程,还是两个有明确的关键步骤并能严格依执行的操作过程?我认为是后者。
他们这就来如是说两个通用型的数据挖掘认识论:数据挖掘五套路。
那个架构具备一下几方面特点:
不与具体销售业务存取(部分关键步骤中的技术细节须要与销售业务紧密结合),是从重大决策须要的信息视角起程的;具备发展性,可带入个人经验和纳米技术;可紧密结合大数据技术,须建育苗各个环节,同时实现智能化;方法论明晰,容易学习。一、预测五套路
那个简单的数据挖掘五套路,基本上能够应付日常生活组织工作中至少80%的常用数据挖掘难题。而剩下的20%的情景,能在那个基本上的预测认识论上扩充出来,他们会在后面的内容中深入探讨。
1.1 四个基本上关键步骤
首先,他们来一次传授着5个基本上关键步骤,分别是:
汇整行业龙头赞扬卡日丹决策1.1.1 汇整
最终目标当然是大部份分项中最重要的。但多于最终目标还不如,他们还须要其他的远距分项。就比如ROI,是投入和工业生产三项求出了ROI;而GMV,也能用使用者数量除以平均每使用者的GMV排序出来。这样,他们就把两个最终目标的排序,拆分为了更多有关分项的女团。并且,那些分项更基础,他们能通过一些营运手段影响那些分项的动态变化。
该些没有什么理解的技术难度。或者说,他们要找寻分项之间的排序关系,由此逐渐找到大部份他们须要重视的分项。在现在的网络产品营运之中,从不会缺乏须要看的分项,已经多到了叹为观止的地步。但多于那些跟最终目标有关的分项,他们才须要重视。
1.1.2 行业龙头
这一步相当于给分项增加了两个或者若干个维度。最简单的维度应当算是时间了,比如:他们按天看UV的动态变化;或者他们看不同页面带来的GMV是多少、看不同使用者分群中的GMV分别是多少等等。如果他们理解前面的分项这是个数字的话,增加了维度后,它就变成了一列数据;增加了两个维度后,它就变成了一张表格,以此类推。
维度进行排列女团,就能产生出一大批庞杂的拆分维度,多到根本看不过来。
因此,重要的就在于区分维度的重要程度。
如何区分呢?
他们要按照是否可操作,来区分那些拆分维度的轻重缓急。比如:前面提到了看APP中的不同页面带来的GMV。但是,如果他们没有必要的技术手段或者营运工具,来为那些GMV更高的页面分配更多流量,也不能降低那些GMV较低的页面的流量,那么按照页面拆分的这种方法对于他们没有任何操作空间,更不要说操作后的强化空间了。
另两个例子是使用者分群,特别是当他们希望从外部的投放引流获得更多高质量的新增使用者,以此来拉动增长的时候。在这种时候,他们总是希望首先对现有的高质量使用者进行使用者画像,并确定一些能够标识高质量使用者的特征,再通过那些特征在投放的时候吸引更高质量的使用者。
那个道理是讲得通的,但遗憾的是,外投渠道不能提供十分精准的人群定位,只能提供人口统计学和行业偏好等粗粒度的划分。这其中还包括,他们暂时认为投放渠道对于使用者的标记是十分精准的。
因此能看出,在拉新这件事上,他们对使用者分群的操作是受限的,并不是完全不能,但十分受限。而使用者分群更大的利用空间在于促进活跃,也就是在他们自己的使用者群体中进行切分。
比如:在增长事例中常用的,在相同页面的相同位置放置不同的文案或者图片素材进行版本间的A/B Test,那么展示的版本就是两个能自由操作的维度,因为一旦发现哪个版本更好,他们能很快采取行动。因此展示版本那个维度很适合用来切分分项。
如果说分项的部分只是个监控的话,在【行业龙头】的关键步骤中,就已经体现出一些预测的感觉了。在那个关键步骤中,他们须要找到那些真实可操作的拆分维度,以便他们的预测结论能尽快落地。但该些还留下两个难题,就是如果存在多个可操作的拆分难题,那么它们之间还是有区别的。
比如:他们能简单的替换图表和文案,但他们也能煞费苦心地迭代两个大版本。如何在预测的操作过程中体现并衡量这种操作的复杂度呢?那个就要说到赞扬的难题。
1.1.3 赞扬
在赞扬的部分,他们要用到【汇整】关键步骤中的那个作为最终目标的分项,以它作为赞扬的唯一标准。如果他们的最终目标就是简单的GMV,甚至更简单的PV和UV,那么到了【行业龙头】的关键步骤后,他们就基本上能开始下结论了。
但是在实战中并非如此,他们的最终目标可能是两个复合的最终目标——在拉动GMV的同时,还要控制成本;在拉动PV的同时,还须要带来GMV;或者直接是两个ROI这样的复合分项。
成本。为了进一步简化难题,他们把成本具体为促进老使用者产生GMV的成本,和获得新使用者产生GMV的成本。因为通常在营运中,拉新与促活的手段是不同的,这与【行业龙头】部分的原则对应,即操作空间的大小。
后,他们就能分别按照拉新和促活的不同纬度,对产生的GMV和投入的成本这两个分项进行行业龙头了。例如:在拉新方面,他们有投百度关键字、有投广告联盟、还有与其他APP的合作换量;而在促活方面,他们在APP上的ABCD四个Banner上设置的A/B Test。
那么对于新使用者部分,他们就能分别赞扬百度关键词、广告联盟和合作APP这三种方式,每投入一块钱的成本分别能得到多少新增的GMV。从而在不同的拉新方式中,选择更优的方式,并在已有的方式中调整更优的成本投入。而对于老使用者的部分,他们同样能赞扬ABCD四个Banner各自的A/B Test中,针对不同的版本每投入一块钱能产生多少GMV。
简而言之,在【赞扬】那个关键步骤中,他们须要把【汇整】部分的分项分为两类——即最终的最终目标,与同时实现最终目标的手段。比如在前面的例子中,投入的成本就是同时实现GMV提高的手段。因此,每一块钱的成本投入,他们都须要以产生的GMV来赞扬它。这时,要同时实现GMV的最终目标可选择的手段就比较多了,比如针对老使用者促活:
保持成本投入不变,更换更容易带来转化的图片和文案,来提高投入的每一块钱带来的GMV;保持每一块钱带来的GMV不变,(在限制范围内)追加成本投入;这还是在暂时忽略GMV可能带来的价值的前提下,如果他们将该些价值考虑进来,它就能抵消掉一部分投入的成本,那么备选方案还会更多。
在前面那个例子中,由于他们的拆分维度本身比较简单,只考虑了APP中的Banner和外部拉新的方式,因此比较容易通过数据中的一些标记进行行业龙头。但是在实战中,还有些情况使他们无法拆分的。比如在使用者交互中,产生两个GMV的路径须要经过几个各个环节,或者就像前面那个例子中的ABCD四个Banner,如果使用者点击了其中的两个甚至三个Banner。
那么他们如何拆解呢?那个难题就是下两个关键步骤【卡日丹】了。
1.1.4 卡日丹
那个关键步骤其实就是得出并进行重大决策的”最后一公里“了,也就是他们常说的剖析“为什么”的操作过程。
在前面的关键步骤中,通过事例能清楚地看到他们已经得到了一些能直接对比的量化分项了。在这种情况下,其实他们不须要在【卡日丹】的关键步骤中做什么特殊的操作,能通过数值的比较直接下结论。但是如果他们遇到了多个各个环节或者方法之间,无法进行明确地行业龙头时,应当怎么办呢?在日常生活的数据挖掘中有几种常用的卡日丹思路。
比如,他们以前两个例子中,使用者依次点击了ABCD四个位置才产生了GMV为例——
首次互动卡日丹模型:也就是使用者第一次做某件事,在数据中通常表现为时间最早、顺序号最小等等,那么在他们给A记100%,B、C和D记0%。最终互动卡日丹模型:也就是使用者最后一次做某件事,对应的在数据中就表现为时间最近、顺序号最大等等。那么他们给D记100%,A、B和C记0%线性卡日丹模型:也就是平均分,那么他们给ABCD分别记25%。加权卡日丹模型:也就是给多个促成因素分配一定的权重,例如A和B各记30%,C和D各记20%。正因为多出来两个权重的维度,须要一定的设计,并且也能作为一种预测的操作过程。关于权重也有几种常用的设置办法,比如首末三项最重要其他向中间递减,或者按照时间递减等等。总之,在选择卡日丹方式的时候,也会紧密结合具体销售业务的特征,来考虑行为的先后顺序、停留时间长短等情况对于预测最终目标的影响。
1.1.5 重大决策
最后就能重大决策了,但经过前面几个关键步骤逐渐消除不确定性,重大决策反而是最简单的一步了——就是找出那个表现最好的版本、表现最好的位置、表现最好的拉新手段而已。
而当他们有一些新的idea时,同样能作为A/B Test中的两个版本,加入到这套赞扬体系中,进行综合赞扬。
1.2 应用事例
这套认识论不仅针对日常生活组织工作中的专项预测,在一些已经固化成型的认识论中,也能找到这套基础认识论的影子。
他们来看几个已经成型认识论事例:
1.2.1 A/B Test实验
首先他们要看的事例就是A/B Test。在A/B Test的操作过程中,首先他们要确定实验的目的,也就是他们要通过实验提高和强化的是哪个分项。后,他们以实验中的不同版本作为行业龙头维度,以分项是否同时实现来作为赞扬标准进行赞扬。如果在实验的操作过程中确实遇到了需要卡日丹的难题,则还须要考虑如何进行卡日丹。
总之,随着销售业务的复杂度不断发展,A/B Test的难点已经不在比较和得出的操作过程,而在于如何设计实验才能在更短的时间内、耗费更少的使用者流量、进行更多的实验并得到有效的结论。这也是大部份这方面的平台的起点——Google的著名论文《Overlapping Experiment Infrastructure》论述的核心内容。
1.2.2 使用者分群
使用者分群是两个常用的营运手段,但如何确定分群的准确度以及如何在后续持续的维持准确度,确是两个数据挖掘难题。在基于特征的使用者分群操作过程中,他们首先要确认他们希望获得具备怎样特征的使用者群体。
当他们已经进行了分群,并想要研究这个群体具备怎样的特征时,就能以TGI(Target Group Index,最终目标群体指数)作为最终目标,以TGI的大小来衡量分群对各种特征的倾向性。
反过来说,如果他们想找到喜欢搞笑短视频的使用者,并且以点赞行为作为“喜欢”的定义,同样能使用TGI来衡量分群的准确程度。这样他们就能通过各种手段来对使用者进行分群了,不同的分群方式就对应了不同的TGI值,他们须要的就是那个TGI值最大的分群方式。
1.2.3 经典管理模型:BCG矩阵
为了对那个最终目标进行深入研究,在BCG矩阵中,按照两个维度对那个分项进行了拆分。在通常的画法中,横轴代表相对市场占有率,纵轴代表市场增长率。市场占有率和市场增长率,就是创造利益的手段了,而利益自然是最终最终目标。因此,由于手段带来的利益是不同的,在拆分出的四个象限中,不同的销售业务就有了自己的“宿命”。
二、认识论的强化
根据全面对于认识论的整体叙述,有三个点是能对认识论进行强化的。
(1)汇整
汇整部分的强化,在于发现更新、更合适的远距分项,来排序出最终的最终目标分项。就比如在财务领域,相比于按照收入和支出的排序方式,杜邦预测法(DuPont Analysis)给出了基于销售利率、资金运作和负债程度三个方面的拆解方式,更容易理解并采取行动。
(2)行业龙头
在前面传授行业龙头的时候,侧重的主要是一些客观维度,而随着预测经验的积累和算法能力的提升,逐渐会加入一些偏主观的行业龙头维度。比如根据偏好制作的使用者标签,那些维度提供了新的视角,但同时也有自己的“玩法”。
(3)卡日丹
卡日丹部分是对于那些不能客观确定的拆分方法论,给出了人为定义的拆分方法论。因为有了人为操作的加入,并且客观情况在不断的变化中,这其中就逐渐产生了强化空间,须要对拆分的方式不断调优,以便适应销售业务的发展和环境的变化。
本文由 @御豪同学 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。