数据可视化:你想知道的经典图表全在这

2023-05-27 0 1,054

tracykanc

文|亲路

责任编辑是怎样五周正式成为统计数据策略师的Kozhikode讲义,假如想介绍诗歌创作本意,能由亚姆写作五周手册。温情提示信息:假如您早已熟识统计数据建模,切不可再看这首诗,或只挑选出部份。

Excel的专业课程就此结束,那时早已开始第三周的文本,统计数据建模期。

统计数据建模是两个炙手可热的基本概念,是策略师手里的杰出辅助工具。好的建模是会鬼故事的,它向他们阐明了统计数据另一面的规律性。

我们对建模的

数据可视化:你想知道的经典图表全在这

为方便快捷模拟,该文大多数快照为ECharts.js的实例。

介绍建模前,先知晓此基础基本概念。

层次

统计数据挖掘中时常会提到层次。层次是检视统计数据的视角和对统计数据的叙述。他们能说沿海地区是一类层次,那个层次包涵北京北京那些卫星城。也能指出营业额是两个层次,里头有各种类型产品销售统计数据。

层次能用时间、数值表示,也能用文本,文本常作为类别。统计数据挖掘的本质是各种层次的组合,我想介绍和分析全国各地的营业额,就需要将沿海地区层次和产品销售层次结合,假如想晓得各个年份的变化,那么再加入时间层次。

说的再透彻点,Excel首行各字段就能理解成层次。

数据可视化:你想知道的经典图表全在这

互联网行业的PV、UV、活跃数也能算作层次。

图象的绘制依赖多个层次的组合。

层次类型和转换

层次主要是三大类的统计数据结构:文本、时间、数值。沿海地区的北京、北京就是文本维度(也能称为类别层次),营业额度就是数值层次,时间更好理解了。不同图象有层次使用限制。

数值层次能通过其他层次加工计算得出,例如按沿海地区层次,count出有多少是北京的,有多少是北京的。

层次能互相转换。比如年龄原本是数值型的层次,但是能通过对年龄的划分,将其分类为小孩、青年、老年三个年龄段,此时就转换为文本层次。具体按照分析场景使用。

接下来介绍主要的建模图象。

散点图

散点图在报表中不常用到,但是在统计数据挖掘中能算出镜率最高的。散点图通过坐标轴,表示两个变量之间的关系。绘制它依赖大量统计数据点的分布。

散点图的优势是阐明统计数据间的关系,发觉变量与变量之间的关联。

散点图需要两个数值层次表示X轴、Y轴,下图实例就是身高和体重两个层次。

数据可视化:你想知道的经典图表全在这

为了进行分析,该图又引入性别层次,通过颜色来区分。

当他们想晓得两个指标互相之间有没有关系,散点图是最好的辅助工具之一。因为它直观。尤其是大统计数据量,散点图会有更精准的结果。

后续的学习中,他们也会多次借用到散点图,比如统计中的回归分析,比如统计数据挖掘中的聚类。

折线图

折线图是检视统计数据的趋势,它和时间是好基友,当他们想介绍某一层次在时间上的规律性或者趋势时,就用折线图吧。

数据可视化:你想知道的经典图表全在这

折线图一般使用时间层次作为X轴,数值层次作为Y轴。

柱形图

柱形图是策略师最常用到的图象之一,常用于多个层次的比较和变化。

文本层次/时间层次通常作为X轴。数值型层次作为Y轴。柱形图至少需要两个数值型层次。

下图就是柱形图的对比分析,通过颜色区分类别。当需要对比的层次过多,柱形图是力不从心的。

数据可视化:你想知道的经典图表全在这

柱形图和折线图在时间层次的分析中是能互换的。但推荐使用折线图,因为它对趋势的变化表达更清晰。

柱形图还有许多丰富的应用。例如堆积柱形图,瀑布图,横向条形图,横轴正负图等。

数据可视化:你想知道的经典图表全在这

直方图是柱形图的特殊形式。它的数值坐标轴是连续的,专用于统计,表达的是统计数据分布情况。在统计学的文本会专门讲解。

地理图

一切和空间属性有关的分析都能用到地理图。比如各沿海地区销量,或者某商业区域店铺密集度等。

地理图一定需要用到坐标层次。能是经纬度、也能是地域名称(北京市、北京市)。坐标粒度即能细到具体某条街道,也能宽到世界各国范围。

数据可视化:你想知道的经典图表全在这

除了经纬度,地理图的绘制离不开地图统计数据,POI是很重要的要素。POI是“Point of Information”的缩写,能翻译成信息点,每个POI包涵四方面信息,名称、类别、经度纬度、附近的酒店饭店商铺等信息。借助POI,才能按地理层次展现统计数据。

饼图

饼图时常表示一组统计数据的占比。能用扇面、圆环、或者多圆环嵌套。商务类的汇报中应用较多。

为了表示占比,拼图需要数值层次。

数据可视化:你想知道的经典图表全在这

饼图是有缺陷的,它擅长表达某一占比较大的类别。但是不擅长对比。30%和35%在饼图上凭肉眼是难以分辨出区别的。当类别过多,也不适宜在饼图上表达。

对统计数据策略师来说,除了做报告,饼图没啥用。

雷达图

也叫蛛网图。可能男同胞们在游戏中看到它比较多。它在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。常见于经营状况,财务健康程度。

比如我对企业财务进行分析,划分出六大类:产品销售、市场、研发、客服、技术、管理。通过雷达图绘制出预算和实际开销的层次对比,会很清晰。如下图:

数据可视化:你想知道的经典图表全在这

箱线图

箱线图一般人介绍的不多,它能准确地反映统计数据层次的离散(最大数、最小数、中位数、四分数)情况。凡是离散的统计数据都适用箱线图。

下图就是箱线图的典型应用。线的上下两端表示某组统计数据的最大值和最小值。箱的上下两端表示这组统计数据中排在前25%位置和75%位置的数值。箱中间的横线表示中位数。

数据可视化:你想知道的经典图表全在这

假如你是一位互联网电商策略师,你想晓得某商品每天的卖出情况:该商品被用户最多购买了几个,大部份用户购买了几个,用户最少购买了几个。箱线图就能很清晰的表示出上面的几个指标以及变化。

绘制箱线图,新人需要介绍统计的此基础基本概念:最大值,最小值,中位数,四分位数。那个会在后续讲解。

热力图

以高亮形式展现统计数据。

最常见的例子就是用热力图象现道路交通状况。老司机一眼就晓得怎么开车了。

数据可视化:你想知道的经典图表全在这

互联网产品中,热力图能用于网站/APP的用户行为分析,将浏览、点击、访问页面的操作以高亮的建模形式表现。下图就是用户在Google搜索结果的点击行为。

数据可视化:你想知道的经典图表全在这

热力图需要位置信息,比如经纬度坐标,或者屏幕位置坐标。

关系图

展现事物相关性和关联性的图象,比如社交关系链、品牌传播、或者某种信息的流动。

数据可视化:你想知道的经典图表全在这

有一条微博,现在想研究它的传播链:它是经由哪几个大V分享扩散开来,大V前又有谁分享过等,以此为此基础能绘制出一幅发散的网状图,分析病毒营销的过程。

数据可视化:你想知道的经典图表全在这

关系图依赖大量的统计数据,它本身没有层次的基本概念。

矩形树图

上文说过,柱形图不适合表达过多类目(比如上百)的统计数据,那应该怎么办?矩形树图出现了。它直观地以面积表示数值,以颜色表示类目。

下图中各颜色系代表各个类目层次,类目层次下又有多个二级类目。假如用柱形图象达,简直是灾难。用矩形树图则轻轻松松。

数据可视化:你想知道的经典图表全在这

电子商务、产品产品销售等涉及大量品类的分析,都能用到矩形树图。

桑基图

比较冷门的图象,它常表示信息的变化和流动状态。

数据可视化:你想知道的经典图表全在这

在我曾经写过的一首诗读懂活跃统计数据中,用桑基图绘制了用户活跃状态的变化,这是用户分层的建模应用。

其实统计数据策略师时常接触到桑基图,只是不晓得它的正式名字,它就是Google网站分析中的用户行为和流量分析。用户从哪里来,去了哪个页面,在哪个页面离开,最后停留在哪个页面等。下图就是桑基图非常直观的解释。

数据可视化:你想知道的经典图表全在这

这一块文本,会在第六周结合用户行为讲解。

漏斗图

大名鼎鼎的转化率建模,它适用在固定流程的转化分析,你也能指出它是桑基图的简化版。说实话,随着个性化推荐和精准运营越来越多,漏斗转化有它的局限性。

转化率也能用几组数字表示,不一定做成漏斗图。

数据可视化:你想知道的经典图表全在这

除了上述建模图象,还有其他很多经典之作,例如词云图、气泡图、K线图等。也欢迎我们留言提供更好的图象。他们使用图象,不只是为了好看,虽然好看的报告面向老板和合作方很有优势。更多的是围绕业务进行分析,得到他们想的结果。

没有最好的建模图象,只有更好的分析方法。

有些统计数据建模,Excel就能完成,有些则必须借助第三方辅助工具或者编程。下一首诗我会挑选出部份图象教我们怎样Excel绘制。

推荐写作:

怎样五周正式成为统计数据策略师

统计数据挖掘:常见的Excel函数全部涵盖在这里了

统计数据挖掘:Excel技巧大揭秘

统计数据挖掘:手把手教你Excel实战

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务