一篇文章带你掌握数据可视化方法

2023-05-27 0 224

产品目录:

01、统计数据建模是甚么

02、统计数据建模的通常业务流程

03、常见的统计数据类型

04、透过建模你想抒发甚么重要信息

05、优先选择具体内容的建模形式

06、图象结构设计准则

07、常见的建模辅助工具

01| 统计数据建模是甚么

统计数据

02| 统计数据建模的通常业务流程

具体来说他们须要对他们原有的统计数据展开预测,得出结论自己的推论,明晰要抒发的重要信息和主轴(即你透过图象要表明甚么难题)。接着依照那个目地在原有的或你晓得的图象重要信息系统中优先选择能满足用户你最终目标的图象。最终已经开始亲自动手制做图象,并对图象展开亮化、检查和,直到最终图象顺利完成。

03| 常见的统计数据类型

为的是更快的展开建模,他们将统计数据分成展开分类统计数据、排程统计数据、空间统计数据、多元化表达式统计数据五大类。

1、展开分类统计数据

展开分类统计数据是操作符充分反映表达形式类型的统计数据。如:使用者的电子设备能分成Iphone使用者和andorid使用者三种;缴付形式能分成PayPal、QQ、现金交易四种等。譬如的展开分类所获得的统计数据被称作展开分类统计数据。

2、排程统计数据

排程统计数据也称天数字符串统计数据,是指同一个标准化分项按天数次序历史记录的统计数据列。如:每一月的追加使用者数量、某公司近十年每年的GMV等。譬如按天数次序来历史记录的分项对应的统计数据成为排程统计数据。

3、空间统计数据

空间统计数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面重要信息的统计数据,它能用来描述来自现实世界的最终目标,它具有定位、定性、天数和空间关系等特性。空间统计数据是一种用点、线、面以及实体等基本空间统计数据结构来表示人们赖以生存的自然世界的统计数据。

4、多表达式统计数据

统计数据通常以表格形式的出现,表格中有多个列,每一列代表一个表达式,将这份统计数据就称作多表达式统计数据,多表达式常见来研究表达式之间的相关性。即用来找出影响某一分项的因素有哪些。

04| 透过建模你想抒发甚么重要信息

抒发某个甚么推论(平台上的使用者中哪个地区的使用者较多、统计数据预测领域最具有权威的人物是谁、2016年的GMV环比去年是增加类还是降低了)。

阐述某种现象(学生成绩好坏可能与家庭背景是否具有一定的相关性、应届生收入和毕业院校是否有一定的相关性)。

05| 优先选择具体的建模形式

明晰了他们要借助图象传递甚么重要信息以后他们就能着手优先选择合适的图象了,这里他们借助于《统计数据之美》作者提出的观点,不是列举甚么柱状图、折线图等具体内容的图象,而是介绍一些组成这些图象的零部件。比如说柱状图就是有长度和直角坐标系组成的。他们只须要优先选择所需的零部件展开组合即可。接下来具体内容看一下这些零部件。

基于统计数据的零部件有:视觉暗示、坐标系、标尺、背景重要信息以及前面四种形式的任意组合。

1、视觉暗示

是指透过查看图象就能与潜意识中的意识展开联系从而得出结论图象抒发的意识。常见的视觉暗示主要有:位置(位置高低)、长度(长短)、角度(大小)、方向(方向上升还是下降)、形状(不同形状代表不同展开分类)、面积(面积大小)、体积(体积大小)、饱和度(色调的强度,就是颜色的深浅)、色调(不同颜色)。

一篇文章带你掌握数据可视化方法

2、坐标系

这里的坐标系和他们之前数学中学到的坐标系是相同的,只不过坐标轴的意义可能稍有不同。常见的坐标系类型有:直角坐标系、极坐标系和地理坐标系。

一篇文章带你掌握数据可视化方法

大家对直角坐标系、极坐标系比较熟悉,这里说一下地理坐标系。

地理坐标系是使用三维球面来定义地球表面位置,以实现透过经纬度对地球表面点位引用的坐标系。但是他们在展开统计数据可视化的时候通常见投影的形式把其从三维统计数据转化成二维的平面图形。

一篇文章带你掌握数据可视化方法

3、标尺

前面说到的四种坐标系只是定义了展示统计数据的维度和方向,而标尺的作用是用来衡量不同方向和维度上的大小,其实和他们熟悉的刻度挺像。

4、背景重要信息

此处的背景和他们在语文中学习到的背景是一个概念,是为的是表明统计数据的相关重要信息(who、what、when、where、why),使统计数据更加清晰,便于读者更快的理解。

5、组合组件

组合组件就是依照最终目标用途将上面四种重要信息展开组合,就是他们最终要呈现的图象样式,具体内容如何组合视你的最终目标而定。

一篇文章带你掌握数据可视化方法
一篇文章带你掌握数据可视化方法
一篇文章带你掌握数据可视化方法

06| 图象结构设计准则

图象结构设计准则其实也能看作是图象亮化的一部分,因为他们之所以遵循结构设计准则就是为的是让图象更快看一点。关于图象的结构设计他们能分成三部分,分别为整体的排版布局、色彩搭配和字体。

1、排版布局

排版布局里面他们又能分成两个。

(1)最大化统计数据墨水比

是指在墨水数量一定的情况下最大化统计数据墨水所占的比例。先来了解一下甚么是统计数据墨水,甚么是非统计数据墨水比。

统计数据墨水是指为的是呈现统计数据所用的墨水,在图象中主要是指柱状图的那些柱子,折线图的那根线之类的。而非统计数据墨水就是除了这些统计数据以外的元素所用的墨水,在图象中主要指网格线、坐标轴、填充 背景等元素。

那个准则就是告诉他们在结构设计的时候尽可能多的重点突出统计数据元素而淡化非统计数据元素。

(2)CRAP准则

是指对比(Contrast)、重复(Repetition)、对齐(Alignment)、亲密性(Proximity)这五大基本准则。

对比(Contrast)

对比的基本思想是, 要避免页面上的元素太过相似。 如果元素(字体、 颜色、大小、 线宽、 形状、 空间等) 不相同, 那就干脆让它们截然不同。 要让页面引人注目, 对比通常是最重要的一个因素, 正是它能使读者具体来说看那个页面。

重复(Repetition)

让结构设计中的视觉要素在整个作品中重复出现。 能重复颜色、 形状、 材质、空间关系、 线宽、 字体、 大小和图片, 等等。 这样一来, 既能增加条理性, 还能加强标准化性。

对齐(Alignment)

任何东西都不能在页面上随意安放。 每一元素都应当与页面上的另一个元素有某种视觉联系。 这样能建立一种清晰、 精巧而且清爽的外观。

亲密性(Proximity)

彼此相关的项应当靠近, 归组在一起。 如果多个项相互之间存在很近的亲密性, 它们就会成为一个视觉单元, 而不是多个孤立的元素。 这有助于组织重要信息, 减少混乱, 为读者提供清晰的结构。

2、配色

在配色里面也主要有三种方案。

(1)第一种就是模仿,去找一些看起来比较专业好看的图象配色,接着把该配色方案拷贝过来供他们所用。这里https://jingyan.baidu.com/article/cbcede0728258002f40b4d27.html

或者是现在有一些专业的色彩搭配网站,不过这种的前提是你得事先确定了其中一种色调,接着依据这一种去匹配其他的颜色。(我现在就是用的这种)

(2)第二种相比第一种就比较难点,须要他们去学一些基础的色彩理论。那个对于非专业的可能有点难度。

3、字体

字体分成有衬线和无衬线三种。

一篇文章带你掌握数据可视化方法

中文常见的衬线和非衬线的三种字体分别是宋体和黑体,而英文对应的是Times New Roman和Arial。

一篇文章带你掌握数据可视化方法

在图象中他们通常使用无衬线字体,而为的是方便他们通常默认使用Arial字体,8-10磅大小。

07| 常见的建模辅助工具

1、Microsoft Excel

对于那个软件大家应该并不陌生,对于通常的建模那个软件完全足矣,但是对于一些统计数据量较大的统计数据则不太适合。

2、Google Spreadsheets

Google Spreadsheets是基于Web的应用程序,它允许使用者创建、更新和修改表格并在线实时分享统计数据。基于Ajax的程序和微软的Excel和CSV(逗号分隔值)文件是兼容的。表格也能以超文本链接标记语言(HTML)的格式保存。

3、Tableau Software

Tableau Software现在比较受大家的欢迎,既能超越Excel做一些稍微复杂的统计数据预测,又不用像R、Python那种编程语言展开建模那么复杂。好多人都有推荐这款软件。

4、Smartbi Insight

Smartbi Insight提供丰富的ECharts图形建模优先选择。透过电子表格作图时可使用Excel顺利完成更为复杂的图形结构设计。支持Excel静态图形,支持Echarts动态图形。

5、一些须要编程性语言的辅助工具

R语言、JavaScript、HTML、SVG、CSS、Processing、Python。这里主要是列举一下有哪些编程语言能实现建模,具体内容如何实现须要读者自行学习。

以下是利用Smartbi Insight制做的一些炫酷好看的图形,供参考喔!

一篇文章带你掌握数据可视化方法
一篇文章带你掌握数据可视化方法
一篇文章带你掌握数据可视化方法

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务