SPSS在主成分分析报告中地应用.doc
《SPSS在主成分分析报告中地应用.doc》由会员分享,可在线阅读,更多相关《SPSS在主成分分析报告中地应用.doc(17页珍藏版)》请在课桌文档上搜索。
1、wordSPSS在主成分分析中的应用摘要 主成成分分析是一种对数据进展分析的技术,最重要的应用是对原有数据进展简化。本文首先对主成成分分析方法的原理进展了简单的阐述。介绍了进展主成成分分析的工具SPSS,并以分析全国31个省市的8项经济目标为例,给出了详尽的分析。实验结果明确,主成成分分析能有效的将原有的复杂数据降维,同时包含原数据的大局部信息。关键词 SPSS 主成分分析 经济开展指标1 主成分分析的原理。 主成分分析是设法将原来众多具有一定相关性比如P个指标,重新组合成一组新的互相无关的综合指标来代替原来的指标。 通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法
2、就是用F1 选取的第一个线性组合,即第一个综合指标的方差来表达,即Var(F1)越大,表示F1 包含的信息越多。因此在所有的线性组合中选取的 F1 应该是方差最打的,故称 F1为第一主成分。如果第一主成分不足以代表原来 P 个指标的信息,再考虑选取F2 即选第二个线性组合,为了有效地反映原来信息,F1 已有的信息就不需要再出现再 F2 中,用数学语言表达就是要求 Cov(F1, F2)=0,如此称 F2 为第二主成分,依此类推可以构造出第三、第四,第P个主成分。 主成分模型: 满足以下条件:1. 每个主成分系数平方和为1即:2. 主成分之前互不相关 即:3. 主成分方差依次递减,即二利用SPS
3、S进展主成成分分析实例以全国31个省市的8项经济指标为例,进展主成分分析。第一步:录入或调入数据图1。图1 原始数据未经标准化第二步:打开“因子分析对话框。沿着主菜单的“AnalyzeData ReductionFactor的路径图2打开因子分析选项框图3。图2 打开因子分析对话框的路径图3 因子分析选项框第三步:选项设置。首先,在源变量框中选中需要进展分析的变量,点击右边的箭头符号,将需要的变量调入变量Variables栏中图3。在本例中,全部8个变量都要用上,故全部调入图4。因无特殊需要,故不必理会“Value栏。下面逐项设置。图4 将变量移到变量栏以后 设置Descriptives选项。
4、单击Descriptives按钮图4,弹出Descriptives对话框图5。 图5 描述选项框在Statistics栏中选中Univariate descriptives复选项,如此输出结果中将会给出原始数据的抽样均值、方差和样本数目这一栏结果可供检验参考;选中Initial solution复选项,如此会给出主成分载荷的公因子方差这一栏数据分析时有用。在Correlation Matrix栏中,选中Coefficients复选项,如此会给出原始变量的相关系数矩阵分析时可参考;选中Determinant复选项,如此会给出相关系数矩阵的行列式,如果希望在Excel中对某些计算过程进展了解,可选
5、此项,否如此用途不大。其它复选项一般不用,但在特殊情况下可以用到本例不选。设置完成以后,单击Continue按钮完成设置图5。 设置Extraction选项。打开Extraction对话框图6。因子提取方法主要有7种,在Method栏中可以看到,系统默认的提取方法是主成分.因此对此栏不作变动,就是认可了主成分分析方法。在Analyze栏中,选中Correlation matirx复选项,如此因子分析基于数据的相关系数矩阵进展分析;如果选中Covariance matrix复选项,如此因子分析基于数据的协方差矩阵进展分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可
6、。在Display栏中,选中Unrotated factor solution非旋转因子解复选项,如此在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便比照。选中Scree Plot“山麓图,如此在分析结果中给出特征根按大小分布的折线图形如山麓截面,故得名,以便我们直观地判定因子的提取数量是否准确。在Extract栏中,有两种方法可以决定提取主成分因子的数目。一是根据特征根Eigenvalues的数值,系统默认的是。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认,如此所有方差大
7、于等于1的主成分将被保存,其余舍弃。如果觉得最后选取的主成分数量不足,可以将值降低,例如取;如果认为最后的提取的主成分数量偏多,如此可以提高值,例如取。主成分数目是否适宜,要在进展一轮分析以后才能肯定。因此,特征根数值的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临界值如取 ,这样提取的主成分将会偏多,根据初次分析的结果,在第二轮分析过程中可以调整特征根的大小。第二种方法是直接指定主成分的数目即因子数目,这要选中Number of factors复选项。主成分的数目选多少适宜?开始我们并不十分清楚。因此,首次不妨将数值设大一些,但不能超过变量数目。本例有8个变量,因
8、此,最大的主成分提取数目为8,不得超过此数。在我们第一轮分析中,采用系统默认的方法提取主成分。图6 提取对话框 需要注意的是:主成分计算是利用迭代Iterations方法,系统默认的迭代次数是25次。但是,当数据量较大时,25次迭代是不够的,需要改为50次、100次乃至更多。对于本例而言,变量较少,25次迭代足够,故无需改动。设置完成以后,单击Continue按钮完成设置图6。 设置Scores设置。 选中Save as variables栏,如此分析结果中给出标准化的主成分得分在数据表的后面。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的“回归Regression法即可。
9、图7 因子得分对话框选中Display factor score coefficient matrix,如此在分析结果中给出因子得分系数矩阵与其相关矩阵。 设置完成以后,单击Continue按钮完成设置图7。 其它。对于主成分分析而言,旋转项Rotation可以不必设置;对于数据没有缺失的情况下,Option项可以不必理会。 全部设置完成以后,点击OK确定,SPSS很快给出计算结果图8。图8 主成分分析的结果第四步,结果解读。在因子分析结果Output中,首先给出的Descriptive Statistics,第一列Mean对应的变量的算术平均值,计算公式为第二列Std. Deviation对
10、应的是样本标准差,计算公式为第三列Analysis N对应是样本数目。这一组数据在分析过程中可作参考。接下来是Correlation Matrix(相关系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从计算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关矩阵的行列式值,根据关系式可知,det(I)=det(R),从而Determinant=1.133E-0.4=1*2*3*4*5*6*7*8。这一点在后面将
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 成分 分析 报告 应用
链接地址:https://www.desk33.com/p-6466.html