多元统计分析报告我国主要城市地聚类分析报告课程设计.doc
《多元统计分析报告我国主要城市地聚类分析报告课程设计.doc》由会员分享,可在线阅读,更多相关《多元统计分析报告我国主要城市地聚类分析报告课程设计.doc(18页珍藏版)》请在课桌文档上搜索。
1、摘 要以我国31个主要城市为研究样本,选取平均气温、平均相对湿度、降水量、日照时数、4个反映生态气候情况的主要指标,对我国主要城市气候进展聚类分析。使用spss将全国主要城市的平均气温、平均相对湿度、降水量、日照时数,利用K均值聚类分析法和系统聚类分析法进展分类,并且讨论K均值聚类分析法和系统聚类分析法的异同与哪种方法更好。关键词:平均气温;平均相对湿度;降水量;日照时数;系统聚类;聚类分析;spss目录1. 设计目的42. 聚类分析的根本思想53. 实际问题分析54. 系统聚类分析64.1 实际操作64.2 结果分析65. K均值聚类分析115.1. 根本思想115.2. 操作步骤115.3
2、. 结果分析126两种方法的结果比拟167. 总结18参考文献19我国主要城市气候的聚类分析1.设计目的了解系统聚类分析法,学会应用spss软件进展系统聚类分析。同时更好的了解应用多元统计分析的知识,熟练掌握应用多元统计分析在实际问题上的应用,并将所学的知识结合spss对数据的处理解决实际问题。本设计是利用spss软件我国31个城市的气候进展聚类分析。我国主要城市的气候利用K均值聚类分析法和系统聚类分析法进展分类,并且讨论K均值聚类分析法和系统聚类分析法的异同与哪种方法更好。2.聚类分析的根本思想找出能够度量样品或指标之间相似程度的统计量以此作为划分类型的依据,把一些相似程度较大的聚合为一类另
3、一些相似程度较大的聚合为一类,直到所有都聚合完毕形成一个由小到大的分类系统 3.实际问题分析下表是某年我国31个主要城市平均气温、平均相对湿度、降水量、日照时数的数据,试使用系统聚类法对这些地区进展聚类分析。城市平均气温平均相对湿度降水量日照时数54.0 某某60.8 某某58.8 某某55.2 呼和浩特46.9 某某67.7 某某57.6 某某58.1 某某68.8 某某70.3 某某71.3 某某78.3 某某68.3 某某67.7 某某61.3 某某59.2 某某66.8 1269某某69.6 某某70.8 某某75.5 某某80.0 某某81.1 某某76.7 某某75.1 某某71.
4、8 某某某某33.8 某某53.3 某某57.1 某某52.3 乌鲁木齐56.0 4. 系统聚类分析4.1 实际操作1在spss将数据导入数据视图;2点击spss选择 分析、分类、系统聚类;选中系统聚类分析主页面,将城市选入标注个案,将变量平均气温至日照时数移入变量框中。单击定义组因为本案例是对样本进展聚类,所以在分群中勾选个案,在输出选项组中勾选统计量复选框和图复选框。3点击绘制按钮,选中树状图和冰柱栏中的无,点击继续按钮;4 点击保存按钮,在聚类成员框中选中方案X围按钮,最小聚类数设为2,最大聚类书设为5,继续;5统计量和方法都选择系统默认值;6点击确认按,运行系统聚类过程。4.2结果分析
5、(1) 案例处理汇总表案例处理汇总a,b案例有效缺失总计N百分比N百分比N百分比310.031a. 平方 Euclidean 距离 已使用 b. 平均联结组之间案例处理汇总表中汇总了有效数据数量31个,占百分比百分之百,缺失数据0个,占百分之零。总计数量31个,占百分比百分之百。(2) 聚类过程的结果聚类表阶群集组合首次出现阶群集群集 1群集 2系数群集 1群集 2下一阶11700232102500243272800842426001251113001061421001872931001982730301494800191011205020112150015122224041713917002
6、1145270822152611025163160025172223120291814196026194299722201118100262191213024224519142323141222824910212272523151628此表是对每一阶段聚类结果的反映,第四列表示聚合系数,第二列第三列表示聚合的类,例如,第一个阶段是把相似程度较大的第一个样品和第七个样品聚为一类,此时有30类,第二个阶段是把相似程度较大的第十个样品和第二十五个样品聚为一类,此时有29类,以此类推。此图为根据聚类表所制出的折线图3聚类成员表群集成员案例 5群集4群集3群集2群集1: 11112:某某22113:某某
7、22114:某某11115:呼和浩特11116:某某22117:某某11118:某某11119:某某332210:某某332211:某某432212:某某332213:某某432214:某某432215:某某221116:某某221117:某某332218:某某432219:某某432220:某某432221:某某4322该表每个案例分别在分为五类、四类、三类、二类时所在的类别数,由表可知因为最小聚类数为2,最大聚类数为5 ,类别数分别为2, 3,4,5时样本的类别归属情况。可以结合后面的树状图、冰柱图与研究目的,确定具体的较为合理的类别数与成员归属。4冰柱图冰柱图也是反映样品聚类情况的图,比
8、如我们希望分为3类,那么最左边的类数应选4,每个样品右边都有一列冰柱,如果某个样品右边的列冰柱长度小于三,那么他和前面冰柱长度大于三的样品聚为一类,如此下去直到找到全部三类为止,例如,案例二十二右边的列冰柱长度为2,那么它就与案例二十三和案例二十八为一类了,第九个案例右边的列冰柱长度为1,那么从案例十九到九为一类,其余为一类。由此,将此题分为了三类5树状聚类图* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * *
9、 * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster bine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 1 -+-+ 某某 7 -+ | 某某 27 -+ +-+ 某某 28 -+ | | 某某 30 -+ | | 呼和浩特 5 -+-+ | 某某 29 -+ | 乌鲁木齐 31 -+ +-+ 某某 4 -+ | | 某某 8 -+ | | 某某 2 -+ | | 某某 15 -+-+ | | 某某 6 -+ +-+ | 某
10、某 3 -+-+ | 某某 16 -+ | 某某 24 -+ | 某某 26 -+ | 某某 22 -+-+ | 某某 23 -+ | | 某某 10 -+-+ | | 某某 25 -+ +-+ +-+ 某某 9 -+ | | |由上表可以由分类个数得到分类情况,如果我们选择分类数为5,就从距离大概为4的地方往下切,把地区分为5类,得到分类结果如下:第一类:、某某、呼和浩特、某某、某某、某某、某某、某某、某某、乌鲁木齐第二类:某某、某某、某某、某某、某某第三类:某某、某某、某某、某某、某某第四类:某某、某某、某某、某某、某某、某某、某某、某某第五类:某某、某某、某某、某某如果我们选择分类数为4
11、,就从距离大概为5的地方往下切,把地区分为4类,得到分类结果如下:第一类:、某某、呼和浩特、某某、某某、某某、某某、某某、某某、乌鲁木齐第二类:某某、某某、某某、某某、某某第三类:某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、第四类:某某、某某、某某、某某如果我们选择分类数为3,就从距离大概为6的地方往下切,把地区分为3类,得到分类结果如下:第一类:某某、某某、某某、某某、乌鲁木齐、某某、呼和浩特、某某、某某、某某、某某、某某、某某、某某第二类:某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某、某某第三类:某某、某某、某某、某某如果我们选择分类数为2,就从距
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 报告 我国 主要 城市 聚类分析 课程设计

链接地址:https://www.desk33.com/p-16200.html