因子分析的一般原理概述.docx
因子分析的一般原理概述因子分析是处理多变量数据的一种统计方法,它可以揭示多变量之间的关系,其主要目的是从众多的可观测得变量中概括和综合出少数几个因子,用较少的因子变量来最大程度地概括和解释原有的观测信息,从而建立起简洁的概念系统,揭示出事物之间本质的联系。一、因子分析的种类(一)、R型因子分析与Q型因子分析这是最常用的两种因子分析类型。R型因子分析,是针对变量所做的因子分析,其基本思想是通过对变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量去描述多个随机变量之间的相关关系。然后再根据相关性的大小把变量分组,使同组内的变量之间的相关性较高,不同组变量之间的相关性较低。Q型因子分析,是针对样品所做的因子分析。它的思路与R因子分析相同,只是出发点不同而已。它在计算中是从样品的相似系数矩阵出发,而R型因子分析在计算中是从样品的相关系数矩阵出发的。(二)、探索性因子分析与验证性因子分析探索性因子分析(EFA),主要适用于在没有任何前提预设假定下,研究者用它来对观察变量因子结构的寻找、对因子的内容以及变量的分类。通过共变关系的分解,进而找出最低限度的主要成分,让你后进一步探讨这些主成分或共同因子与个别变量之间的关系,找出观察变量与其对应因子之间的强度,即所谓的因子负荷值,以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。验证性因子分析(CFA),要求研究者对研究对象潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观测变量的组成模式,进行因子分析的目的是为了检验这一先前提出的因子结构的适合性。这种方法也可以应用于理论框架的检验,它在结构方程模型中占据相当重要的地位,有着重要的应用价值,也是近年来心理测量中相当重要的内容。二、因子分析基本思想、模型与条件(一)、因子与共变结构因子分析的基本假设是那些不可观测的“因子”隐含在许多现实可观察的事物背后,虽然难以直接测量,但是可以从复杂的外在现象中计算、估计或抽取得到。它的数学原理是共变抽取。也就是说,受到同一个因子影响的测量分数,共同相关的部分就是因子所在的部分,这可以用“因子”的共变相关部分来表示。(二)、因子分析的条件第一、因子分析以变量之间的共变关系作为分析的依据,凡影响共变的因子都要先行确认无误。首先,因子分析的变量都必须是连续变量,符合线性关系的假设。其他顺序与类别型的数据不能用因子分析简化结构。第二、抽样过程必须随机,并具有一定规模。一般样本量不得低于100,原则上是越大越好。此外,一般还要求样本量与变量数之间的比例不得低于5:1。第三、变量之间要具有一定程度的相关,对于一群相关太高或太低的变量,不太适合进行因子分析。相关程度太高了,多重共线性明显,区分效度不够,获得的因子结构价值也不太高,可以通过巴特莱(Bartetfs)球形检验、KMO检验以及检查共同性指数(共同度系数)来确定这一问题。1、巴特莱球形检验可以用来检验样本内各变量之间的相关系数是否不同且大于0。若球形检验结果显着,表示相关系数可以用于因子分析抽取因子。2、使用偏相关矩阵来判断。在因子分析中,可以得到一个反映像矩阵,呈现出偏相关的大小,在该矩阵中,若有多数系数偏高,则应放弃使用因子分析。对角线的系数除外,该系数称为取样适切性量数(KMO),代表与该变量有关的所有相关系数与净相关系数的比例,该系数越大,表示相关情形越良好。一般:大于0.9最佳,0.8至09较好,0.7至0.8尚可,0.6至0.7较差,0.6以下放弃。3、检查共同性指数。指某一变量与其他所有变量的复相关系数的平方,这个数值表示该变量的变异量被共同因子解释的比例。其计算方式为在一变量上各因子负荷量平方值的总和,变量的共同性越高,因子分析的结果就越理想。(二)、因子抽取的方法因子抽取的目的在于决定测量变量当中存在着多少个潜在的成分或因子数。当然,除了人为可以设定因子个数外,决定因子个数的具体方法还有:1、主成分法(principalcomponentanalysis)。主成分法以线性方程式将所有变量加以合并,计算所有变量共同解释的变异量,该线性组合成为主成分。第一次线性组合建立后,计算出的第一个主成分估计值,可以解释全体变异量的一大部分,其解释的变异量即属于第一个主成分所有。然后再将剩余的变异量,经过第二次方程式线性合并,抽取出第二个主成分,其涵盖的变异量即属于第二个主成分所有。以此类推,直到无法再抽取为止,最后保留解释量比较大的那几个变量。主成分法分析一般适用于单纯为简化大量变量为少数的成分时,以及作为因子分析的预备工作。2、主因子法。主因子法是分析变量间的共同变异量而非全体变异量。它的计算方法与主成分法有差异,主因子法用共同性取代了相关矩阵中的对角线1.00,目的在于抽出一系列互相独立的因子。第一个因子解释最多的原来变量间共同变异量;第二个因子解释除去第一个因子解释后剩余共同变异量的最大变异,其余因子依次解释剩下的变异量中最大部分,直到所有的共同变异被分割完毕为止。此法符合因子分析模式的假设,亦即分析变量间共同变异,而非分析变量间的总变异,因子的内容较易了解。除此之外还有两种比较常见的因子抽取方法,即最小平方法和最大似然法。(三)因子数目因子数目的决定主要是依据特征值,一般都是提取特征值大于1的因子,此外还可以直接定义,就是直接向计算机输入你所需要的因子个数。(四)、因子旋转因子旋转的目的,就是在于理清因子与原始变量间的关系,以确立因子间最简单的结构,达到简化的目的,使心因子具有更鲜明的实际意义,更好地解释因子分析结果。所谓简单结构,就是使每一个变量仅在一个公共因子上有较大的载荷,而在其他公共因子上的载荷比较小。因子旋转可分为正交旋转和斜交旋转。所谓正交旋转就是指旋转过程中因子之间的轴线夹角为90度,即因子之间的相关设定为0,如最大变异法(varimax)、四方最大发(quartimax)、均等变异法(equimaxrotation)0另一种旋转法叫着斜交旋转,这种方法允许因子与因子之间具有一定相关性,在旋转过程中同时对于因子的关联情形进行估计,例如最小斜交法(Obliminrotation)、最大斜交法(ObIimaXrotation)s四方最小法(quartimin)等。正交旋转是基于各因子间是相互独立的前提,它能够最大限度地对各因子进行区分,但也容易扭曲潜在特质在现实生活中的真实关系,容易造成偏差。因此,一般进行研究时,除非研究者具有特定的理论作为支持,或有强有力的实证证据,否则,为了精确地估计变量与因子关系,使用斜交旋转是较为贴近真实的一种做法。