9种常用数据分析方法,你还没get吗?

2023-06-01 0 805

9种常用数据分析方法,你还没get吗?

统计数据数据预测方式,chan上有弥漫着多首诗。而在我对个人从业人员的实战经验中,辨认出在网路上这首诗对预测方式的叙述是较为全面性的,因此特地节录。先期会特别针对每一方式,逐渐展开讲诉。

01

形式化统计数据

形式化统计数据是两类统计数据方式的汇总,阐明了统计数据曲线拟合优点。它主要就主要就包括统计数据数据的蟹蛛科花预测、统计数据数据的分散态势预测、统计数据数据对数某种程度预测、统计数据数据的原产和许多基本上的统计数据绘图。

1. 缺位值充填:常见方式有除去法、平均值法、计算机程序法。

2. 正态性检测:许多统计方式都明确要求值顺从或近似于顺从概率密度函数,因此在做统计数据数据预测以后须要展开正态性检测。常见方式:非参数检测的K-量检测、P-P图、Q-Q图、W检测、动差法。

02

重回预测

重回预测是应用领域极为广为的统计数据数据预测方式之一。它如前所述探测统计数据数据创建表达式间适度的倚赖亲密关系,以预测统计数据数据外在规律性。

1. 十元非线性预测

多于两个自表达式X与自表达式Y相关,X与Y都要是naturally表达式,自表达式Y或其状态参数要顺从概率密度函数。

2. 多元化非线性重回预测

采用前提:预测数个自表达式X与自表达式Y的亲密关系,X与Y都要是naturally表达式,自表达式Y或其状态参数要顺从概率密度函数。

3. Logistic重回预测

非线性重回模型明确要求自表达式是连续的概率密度函数表达式,且自表达式和自表达式呈非线性亲密关系,而Logistic重回模型对自表达式的原产没有明确要求,一般用于自表达式是对数时的情况。

4. 其他重回方式:非非线性重回、有序重回、Probit重回、加权重回等。

03

方差预测

采用前提:各样本须是相互独立的随机样本;各样本来自概率密度函数总体;各总体方差相等。

1. 单因素方差预测:一项试验多于两个影响因素,或者存在数个影响因素时,只预测两个因素与响应表达式的亲密关系。

2. 多因素有交互方差预测:一顼实验有数个影响因素,预测数个影响因素与响应表达式的亲密关系,同时考虑数个影响因素之间的亲密关系

3. 多因素无交互方差预测:预测数个影响因素与响应表达式的亲密关系,但是影响因素之间没有影响亲密关系或忽略影响亲密关系

4. 协方差分祈:传统的方差分析存在明显的弊端,无法控制预测中存在的某些随机因素,降低了预测结果的准确度。协方差预测主要就是在排除了协表达式的影响后再对修正后的主效应展开方差预测,是将非线性重回与方差预测结合起来的一种预测方式。

04

假设检测

1. 参数检测

参数检测是在已知总体原产的前提下(一股明确要求总体顺从概率密度函数)对许多主要就的参数(如平均值、百分数、方差、相亲密关系数等)展开的检测 。

2. 非参数检测

非参数检测则不考虑总体原产是否已知,常常也不是特别针对总体参数,而是特别针对总体的某些一般性假设(如总体原产的位罝是否相同,总体原产是否正态)展开检测。

适用情况:顺序类型的统计数据数据资料,这类统计数据数据的原产形态一般是未知的。

1)虽然是连续统计数据数据,但总体原产形态未知或者非正态;

2)总体原产虽然正态,统计数据数据也是连续类型,但样本容量极小,如10以下;

主要就方式主要就包括:卡方检测、秩和检测、二项检测、游程检测、K-量检测等。

05

相关预测

相关预测是一种非确定性的亲密关系,研究现象之间是否存在某种依存亲密关系,并对具体有依存亲密关系的现象探讨其相关方向和相关某种程度。

1. 单相关:两个因素之间的相关亲密关系叫单相关,即研究时只涉及两个自表达式和两个自表达式;

2. 复相关:三个或三个以上因素的相关亲密关系叫复相关,即研究时涉及两个或两个以上的自表达式和自表达式相关;

3. 偏相关:在某一现象与多种现象相关的场合,当假定其他表达式不变时,其中两个表达式之间的相关亲密关系称为偏相关。

06

聚类预测

聚类是将统计数据数据分类到不同的类或者簇这样的两个过程,因此同两个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类预测是一种探索性的预测,在分类的过程中,人们不必事先给出两个分类的标准,聚类预测能够从样本统计数据数据出发,自动展开分类。

1)系统聚类法:适用于小样本的样本聚类或指标聚类,一般用系统聚类法来聚类指标,又称分层聚类。

2)逐渐聚类法 :适用于大样本的样本聚类。

3)其他聚类法 :两步聚类、K平均值聚类等。

07

判别预测

判别预测,是一种统计数据判别和分组技术,就一定数量样本的两个分组表达式和相应的其他多元化表达式的已知信息,确定分组与其他多元化表达式信息所属的样本展开判别分组。

判别预测与聚类预测的区别

1. 聚类预测可以对样本逬行分类,也可以对指标展开分类;而判别预测只能对样本展开分类;

2. 聚类预测事先不知道事物的类别,也不知道分为几类;而判别预测要事先知道事物的类别,并且知道分几类;

3. 聚类预测不须要分类的历史资料,而直接对样本展开分类;而判别预测须要分类历史资料去创建判别函数,然后才能对样本展开分类。

08

因子预测

因子预测是指研究从表达式群中提取共性因子的统计数据技术,从大量的统计数据数据中寻找外在的联系,减少决策的困难。因子预测的方式约有10多种,如重心法、影像预测法、最大似然法、最小平方式、阿尔发抽因法、拉奥典型抽因法等等。

这些方式本质上大都属近似于方式,以相亲密关系数矩阵为基础。在社会学研究中,因子预测常采用以主成分预测为基础的反复法。

09

主成分预测

通过正交变换将一组可能存在相关性的表达式转换为一组非线性不相关的表达式,转换后的这组表达式叫主成分。其主要就思想是降维,将n维特征映射到k维上(k<n),k维是全新的正交特征。这个k维特征称为主元,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。

与因子预测较为:

相同:都能够起到预测数个原始表达式外在结构亲密关系的作用;

不同:主成分预测重在综合原始变适的信息.而因子预测重在解释原始表达式间的亲密关系。

荐:

【中国风动漫】除了《哪吒》,这些良心国产动画也应该被更多人知道!

声明

载请注明,如涉及作品版权问题,请联系我们删除或做相关处理!

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务