5个【统计学】常用的数据分析方法

2023-06-01 0 952

5个【统计学】常用的数据分析方法5个【统计学】常用的数据分析方法

5个【统计学】常用的数据分析方法

5个【统计学】常用的数据分析方法有关预测科学研究现像间与否存有这种科东俄,对具体内容有科东俄的现像深入探讨有关路径及有关某种程度。单有关四个不利因素间的有关亲密关系叫单有关,即科学研究时只牵涉两个常量和两个常量复有关 :四个或四个以内不利因素的有关亲密关系叫复有关,即科学研究时牵涉四个或四个以内的常量和常量有关偏有关在某一现像与多种不同现像有关的公开场合,当假设其它表达式维持不变时,当中四个表达式间的有关亲密关系称作偏有关

5个【统计学】常用的数据分析方法

主成分预测

主成分预测(Principal Component Analysis,PCA), 是一种统计方式。通过正交变换

将一组可能存有有关性的表达式转换为一组线性不有关的表达式,转换后的这组表达式叫主成分。

主成分预测首先是由K.皮尔森(Karl Pearson)对非随机表达式引入的,尔后H.霍特林将此方式推广到随机向量的情形。信息的大小通常见离差平方和或方差来衡量。1. 原理在用统计预测方式科学研究多表达式的课题时,表达式个数太多就会增加课题的复杂性。人们自然希望表达式个数较少而得到的信息较多。在很多情形,表达式间是有一定的有关亲密关系的,当四个表达式间有一定有关亲密关系时,可以解释为这四个表达式反映此课题的信息有一定的重叠。主成分预测是对于原先提出的所有表达式,将重复的表达式(亲密关系紧密的表达式)删去多余,建立尽可能少的新表达式,使得这些新表达式是两两不有关的,而且这些新表达式在反映课题的信息方面尽可能保持原有的信息。设法将原来表达式重新组合成一组新的互相无关的几个综合表达式,同时根据实际需要从中可以取出几个较少的综合表达式尽可能多地反映原来表达式的信息的统计方式叫做主成分预测或称主分量预测,也是数学上用来降维的一种方式。2. 缺点在主成分预测中,我们首先应保证所提取的前几个主成分的累计贡献率达到两个较高的水平(即表达式降维后的信息量须保持在两个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。主成分的解释其含义一般多少带有点模糊性,不像原始表达式的含义那么清楚、确切,这是表达式降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始表达式个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始表达式清楚的“弊”。5个【统计学】常用的数据分析方法因子预测一种旨在寻找隐藏在多表达式数据中、无法直接观察到却影响或支配可测表达式的潜在因子、并估计潜在因子对可测表达式的影响某种程度以及潜在因子间的有关性的一种多元统计预测方式。1. 与主成分预测比较相同:都能够起到治理多个原始表达式内在结构亲密关系的作用不同:主成分预测重在综合原始变适的信息;而因子预测重在解释原始表达式间的亲密关系,是比主成分预测更深入的一种多元统计方式2. 用途减少预测表达式个数通过对表达式间有关亲密关系探测,将原始表达式进行分类

5个【统计学】常用的数据分析方法

信度预测

信度(Reliability)即可靠性,它是指采用同样的方式对同一对象重复测量时所得结果的一致性某种程度。信度指标多以有亲密关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度预测的方式主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。1. 方式重测信度法编辑这一方式是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的有亲密关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方式也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 复本信度法编辑 让同一组被调查者一次填答两份问卷复本,计算四个复本的有亲密关系数。复本信度属于等值系数复本信度法要求四个复本除表述方式不同外,在内容、格式、难度和对应题项的提问路径等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方式者较少。 折半信度法编辑 折半信度法是将调查项目分为两半,计算两半得分的有亲密关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方式一般不适用于事实式问卷(如年龄与性别无法相比),常见于态度、意见式问卷的信度预测。在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表(李克特量表(Likert scale)是属评分加总式量表最常见的一种,属同一构念的这些项目是用加总方式来计分,单独或个别项目是无意义的。它是由美国社会心理学家李克特于1932年在原有的总加量表基础上改进而成的。该量表由一组陈述组成,每一陈述有”非常同意”、”同意”、”不一定”、”不同意”、”非常不同意”五种回答,分别记为5、4、3、2、1,每个被调查者的态度总分就是他对各道题的回答所得分数的加总,这一总分可说明他的态度强弱或他在这一量表上的不同状态。)。进行折半信度预测时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分路径的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的有亲密关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式:求出整个量表的信度系数(ru) α信度系数法 α信度系数是目前最常见的信度系数,其公式为:α=(k/(k-1))*(1-(∑Si^2)/ST^2)当中,K为量表中题项的总数, Si^2为第i题得分的题内方差, ST^2为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方式适用于态度、意见式问卷(量表)的信度预测。总量表的信度系数最好在0.8以内,0.7-0.8间可以接受;分量表的信度系数最好在0.7以内,0.6-0.7还可以接受。Cronbach s alpha系数如果在0.6以下就要考虑重新编问卷。用于检査测量的可信度,例如调查问卷的真实性。2. 分类外在信度不同时间测量时量表的一致性某种程度,常见方式重测信度内在信度每个量表与否测量到单一的概念,同时组成两表的内在体项一致性如何,常见方式分半信度

5个【统计学】常用的数据分析方法

列联表预测

列联表是观测数据按四个或更多属性(定性表达式)分类时所列出的频数表。1. 简介若总体中的个体可按四个属性A、B分类,A有r个等级A1,A2,…,Ar,B有c个等级B1,B2,…,Bc,从总体中抽取大小为n的样本,设当中有nij个个体的属性属于等级Ai和Bj,nij称作频数,将r×c个nij排列为两个r行c列的二维列联表,简称r×c表。若所考虑的属性多于四个,也可按类似的方式作出列联表,称作多维列联表。列联表又称交互分类表,所谓交互分类,是指同时依据四个表达式的值,将所科学研究的个案分类。交互分类的目的是将两表达式分组,然后比较各组的分布状况,以寻找表达式间的亲密关系。用于预测离散表达式或定型表达式间与否存有有关。列联表预测的基本问题是,判明所考察的各属性间有无关联,即与否独立如在前例中,问题是:两个人与否色盲与其性别与否有关?在r×с表中,若以pi、pj和pij分别表示总体中的个体属于等级Ai,属于等级Bj和同时属于Ai、Bj的概率(pi,pj称边缘概率,pij称格概率),“A、B两属性无关联”的假设可以表述为H0:pij=pi·pj,(i=1,2,…,r;j=1,2,…,с),未知参数pij、pi、pj的最大似然估计(见点估计)分别为行和及列和(统称边缘和)为样本大小。根据K.皮尔森(1904)的拟合优度检验或似然比检验(见假设检验),当h0成立,且一切pi>0和pj>0时,统计量的渐近分布是自由度为(r-1)(с-1) 的Ⅹ分布,式中Eij=(ni·nj)/n称作期望频数。当n足够大,且表中各格的Eij都不太小时,可以据此对h0作检验:若Ⅹ值足够大,就拒绝假设h0,即认为A与B有关联。在前面的色觉问题中,曾按此检验,判定出性别与色觉间存有这种关联。2. 需要注意若样本大小n不很大,则上述基于渐近分布的方式就不适用。对此,在四格表情形,R.A.费希尔(1935)提出了一种适用于所有n的精确检验法。其思想是在固定各边缘和的条件下,根据超几何分布(见概率分布),可以计算观测频数出现任意一种特定排列的条件概率。把实际出现的观测频数排列,以及比它呈现更多关联迹象的所有可能排列的条件概率都算出来并相加,若所得结果小于给定的显著性水平,则判定所考虑的四个属性存有关联,从而拒绝h0。对于二维表,可进行卡方检验;对于三维表,可作Mentel-Hanszel分层预测列联表预测还包括配对计数资料的卡方检验、行列均为顺序表达式的有关检验。

-END-

5个【统计学】常用的数据分析方法

爱数据福利大放送

5个【统计学】常用的数据分析方法

今天,小编为大家准备了语言学精选学习礼包,包含17张语言学高清思维导图以及2023年精选语言学资料大全

【1216】领取吧

5个【统计学】常用的数据分析方法

5个【统计学】常用的数据分析方法导图概览5个【统计学】常用的数据分析方法5个【统计学】常用的数据分析方法5个【统计学】常用的数据分析方法点这里 0基础入职数据挖掘5个【统计学】常用的数据分析方法

5个【统计学】常用的数据分析方法

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务