01-SPSS软件聚类分析过程的图文解释及结果的全面分析.docx
-
资源ID:1442041
资源大小:217.73KB
全文页数:13页
- 资源格式: DOCX
下载积分:5金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
01-SPSS软件聚类分析过程的图文解释及结果的全面分析.docx
SPSS聚类分析过程聚类的主要过程一般可分为如卜.四个步骤:1 .数据预处理(标准化)2 .构造关系矩阵(亲疏关系的描述)3 .聚类(依据不同方法进行分类)4 .确定最佳分类(类别数)SPSS软件聚类步骤1 .数据预处理(标准化)>Analyze(分析)-QaSSify(分类,归类)>HierachicalClUSterAnaIySiS(层序聚类分析)÷Method(方法,条理,)然后从对话框中进行如下选择从TranSformVaIUeS框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:ZscoresNoneZscoresRange-1to1Range0to1Maximummagnitudeof1Meanof1StdndarddeviationOf1标准化方法说明:None:不进行标准化,这是系统默认值;ZScores(Z-Scores,英文名又叫StandardizedPopulationData,是以标准差单位来表现的一组视察值):标准化变换;Range-1to1:极差标准化变换(作用:变换后的数据均值为0,极差为1,且M<l,消去了量纲的影响;在以后的分析计算中可以削减误差的产生。);Range0to1(极差正规化变换/规格化变换):2 .构造关系矩阵在SPSS中如何选择测度(相像性统计量):-÷Analyze-÷ClassifyTHieraChiCalClusterAnalysis->Method然后从对话框中进行如下选择常用测度(选项说明):Euclideandistance:欧氏距离(二阶MinkOWSki距离),用途:聚类分析中用得最广泛的距离;SquaredEucideandistance:平方欧氏距离;Cosine:夹角余弦(相像性测度;Pearsoncorrelation:皮尔逊相关系数;3 .选择聚类方法SPSS中如何选择系统聚类法常用系统聚类方法a) Between-groupslinkage组间平均距离连接法方法简述:合并两类的结果使全部的两两项对之间的平均距离最小。(项对的两成员分属不同类)特点:非最大距离,也非最小距离b) Within-groupslinkage组内平均连接法方法简述:两类合并为一类后,合并后的类中全部项之间的平均距离最小C)Nearestneighbor最近邻法(最短距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法d) Furthestneighbor最远邻法(最长距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法e) Centroidclustering重心聚类法方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值特点:该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪,且符号变更频繁,计算较烦。f) Medianclustering中位数法方法简述:两类间的距离既不采纳两类间的最近距离,也不采纳最远距离,而采纳介于两者间的距离特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采纳。g) WarcrSmethod离差平方和法方法简述:基于方差分析思想,假如分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大特点:实际应用中分类效果较好,应用较广;要求样品间的距离必需是欧氏距离。谱系分类的确定经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应依据探讨的目的来确定适当的分类方法,并提出了一些依据谱系图来分类的准则:A.任何类都必需在接近各类中是突出的,即各类重心间距离必需极大B.确定的类中,各类所包含的元素都不要过分地多C.分类的数目必需符合好用目的D.若采纳几种不同的聚类方法处理,则在各自的聚类图中应发觉相同的类实例分析AnalyzeQraphsUtilitiesHindowHelpRortsDg,scriptiveStatisticsCompareMeansGeneral1.inearModelCorrelateRegressionK-MeansCluster.Discriminant.HierarchicalCluster.ClassifyDataReductionScaleHonparametricTestsMultipleResponse生成树形图生成冰柱图<=JPlCts-I凝聚状态表,显示聚类过程各项间的距离矩阵类成员栏Statistics.I结果分析:(方法选择如下)CkjsterMethod:Measure行Intervai:rCounts:rBinary:arsmethodIEucIideandistancef,over2IRoot:?ChkS<u<ife11waureISquaredEucMdean<flstar力CSCn1.lb¼<TraDSformVQSStandardize:Zscores3GByyarlablerBycaseTransformMedSUr,rAbSoMegIeS1.CbangesignrRqscaIoto0111U<紫光南南A4京海木宇让津东苏UX牝«*南1.T内河河M甘*Jt上广辽*AX.*M三刷i*I475363456l99672solt7t2JS22221I11112111SPSS19.O分析软件聚类分析4.2聚类分析一一系统聚类法在数据编辑窗口的主菜单中选择“分析(八)J”分类(F)J”系统聚类(三)”(如图-4所示),分类降维Sfi(三)非参数检验(N)预则)盟两步聚类Q1.解K-均值聚类(K)品系统聚类S)自树®M判别弹出“系统聚类分析"对话框,将“地区"变量选入"标注个案(C)”中,将其他变量选入“变量框”中,如图-5所示。在“分群单选框中选中“个案”,表示进行的是Q型聚类。在“输出”复选框中选中“统计量”和"图",表示要输出的结果包含以上两项。啕茎统聚类分析变里:,企Ii夕非农企业夕事也,机关夕札林一牧Jt业标注个案(2):确EIa(P)lS(R)1取消帮助Ik-1JJ.一一-J一-J-单击“统计量(三)”按钮,在“系统聚类分析:统计量”对话框中选择“合并进程表”、“相像性矩阵”,如图-6所示,表示输出结果将包括这两项内容。单击“绘制(T)”按钮,在“系统聚类分析:图”对话框中选择“树状图”、“冰柱”,如图7所示,表示输出的结果将包括谱系聚类图(树状)以及冰柱图(垂直)。曲系统聚类分析:图¾Bl福丽冰柱一斫有聚类©)。聚类的指定全距)开始聚类:匚停止聚类电):排序标准(旦):匚无(三)方向一垂直包)。水平但)单击“方法(M)”按钮,弹出“系统聚类分析:方法”对话框,如下图8所示。g系统聚类分析:方法聚类方法(W:组间联接-转换值标准化:feoji按照变里(Y)按个案:-转换度里绝对值(1.)3更改符号(三)重新标度到0-1全距但)继续J取消群助|“聚类方法(M)选项条中可选项包括如图-9所示的几种方法,本例中选择“组间联接J田系统聚类分析:方法聚类方法(M):篦赢度里标准©区间(三)计数(I):组间联接组内联接最近邻元素最远邻元素质心果类法中位数聚类法Ward法“度量标准-区间(N)”选项条中可选项包括如图-Io所示的几种度量方法,本例中选择“平方Euclidean距离”:乖方Euclidean柜离Eudidean距离平方Euclidean距离余弦Pearson相关性Chebychev距离块Minkowski距离设定距离度里标准区间®):计数H):。二分类但):转换值“转换值-标准化"选项条中可选项包括如图-11所示的几种将原始数据标准化的方法,本例中选择“全局从。到r:11三标准化:O1-J不Z得分全距从-1到1全距从O到1IJl的最大里1均值为1I)标准差为1f冰柱图说明聚类分析冰柱图形态类似于屋檐上垂下的冰柱,因此而得名。横轴:案例(Case)表示被聚类的对象或变量;纵轴:群集数(NUmberofdUSterS)表示被聚成几类;视察冰柱图应从最终一行起先。举例如下:当聚成6类时X4和X8和X6聚成一类,其他个案自成一类,用白板将6类一下挡上可以看出如图;当聚成5类时X4和X8和X6和X2聚成一类,其他个案自成一类。冰柱图的优点是不仅可以显示出不同类数时个案所属的分类结果,还能表现出聚类的过程步骤,生动形象;缺点是不能表现出聚类过程中距离的大小。若生成的树状图如下,看不清晰。可点击右键导出文件,生成Word文件,然后可以看出聚类过程。RescaledDistanceClusterCombineCASE05101520251.abelBujiB2-+C3-+H卜A1IE51FIF61.ID4-+DendrogiaJiUSiWAverage1.inkage(BetweenGroups)Resca1.edDistanceClusterCoabine25B2-4-+辆(DC3-+Htt(C)A11湍砧账P)E51>2啜/腿自咖蟠A)FG1导肌.宙皆内沓>FRAFFTlF三,C:11caycAT)11111AnnT)ata1nrj11Tnc113u2fifWnu"hytn'导出的word文档中聚类过程如下:RescaledDistanceClusterCombineCASE05101520251.abel如叭+-+B2-+C3-+A1+E5+-+IF6+ID4+可看出聚类过程为如下表所示:分类过程统计表连结依次连结元素IBC2ABC3EF4EFABC5DABCEF