应用回归分析spss软件的应用论文.doc
《应用回归分析spss软件的应用论文.doc》由会员分享,可在线阅读,更多相关《应用回归分析spss软件的应用论文.doc(25页珍藏版)》请在课桌文档上搜索。
1、题目:影响成品钢材需求量的回归分析摘要:随着社会经济的不断开展,科学技术的不断进步,统计方法越来越成为人们必不可收的工具盒手段。应用回归分析是其中的一个重要分支,本着国家经济水平的不断提高,我们采用回归分析的方法对我国成品钢材的需求量进展分析应用。为了使分析的模型具有社会实际意义,我们引用了19801998年的成品钢材、原油、生铁、原煤、发电量、铁路货运量、固定资产投资额、居民消费、政府消费9个不同的量来进展回归分析。通过建立回归模型充分说明成品钢材需求量与其他8个变量的关系,以及我国社会经济的实际开展情况和意义。关键字:线性回归 回归分析 社会经济 回归模型 成品钢材 投资 多元回归 国家经
2、济 社会开展 目 录第1章 题目表达1第2章 问题假设1第3章 问题分析2第4章 数据的预处理34.1 曲线统计图34.2 散点统计图44.3 样本的相关系数4第5章 回归模型的建立5第6章 回归模型的检验66.1 F检验66.2 T检验及模型的T检验分析76.2.1 T检验76.2.2 T检验分析76.3 偏相关性10第7章 违背模型根本假设的情况117.1 异方差性的检验117.1.1 残差图检验117.1.2 怀特White检验127.2 自相关性的检验127.3 多元加权最小二乘估计127.3.1 权函数自变量的选取137.3.2 Weight Estimate估计幂指数m137.3.
3、3 加权最小二乘估计拟合14第8章 自变量选择与逐步回归158.1 前进逐步回归158.2 后退逐步回归17第9章 多重共线性的情形及处理189.1 多重共线性的诊断189.2 多重共线性的消除20第10章 回归模型总结24参考文献25第1章 题目表达 理论上认为影响成品钢材的需求量的因素主要有经济开展水平、收入水平、产业开展、人民生活水平提高、能源转换技术等因素。为此,收集了我国成品钢材的需求量,选择与其相关的八个因素:原油产量、生铁产量、原煤产量、发电量、铁路货运量、固定资产投资额、居民消费、政府消费作为影响变量,19801998年的有关数据如下表。此题旨在通过建立这些经济变量的线性模型来
4、说明影响成品钢材需求量的原因。 数据来源:易丹辉.数据分析与EViews应用.中国人民大学.2008教材第85页 原始数据中国统计年鉴:年份成品钢材万吨原油万吨生铁万吨原煤亿吨发电量亿千瓦时铁路货运量万吨固定资产投资额亿元居民消费亿元19802716.2105953802.46.23006.2111279910.92317.119812670.1101223416.66.23092.71076739612604.1198229021021235516.6632771134951230.42867.9198330721060737387.1535141187841430.13182.519843
5、37211461.340017.8937701240741832.93674.51985369312489.543848.7241071307092543.245891986405813068.850648.9444951356353120.65175198743561341455039.2849731406533791.75961.21988468913704.657049.854521449484753.87633.11989485913764.1582010.5458481514894410.48523.51990515313830.6623810.8621215068145179113
6、.21991563814009.2676510.8767751528935594.510315.91992669714209.7758911.1675391576278080.112459.81993771614523.7873911.51839516266313072.315682.41994848214608.2974112.4928116309317042.120809.819958979.815004.9410529.2713.6110070.316588520019.326944.519969338.0215733.3910722.513.9710813.11688032297432
7、152.319979978.9316074.1411511.4113.7311355.5316973422913.534854.6第2章 问题假设 为了问题的简洁明了,现对题目中的变量给出以下假设:中国成品钢材的需求量为万吨、原油产量万吨、生铁产量万吨、原煤产量亿吨、发电量亿千瓦时、铁路货运量万吨、固定资产投资额亿元、居民消费亿元、政府消费亿元作为影响变量,而且此题收集的数据均为定量变量,其符号和经济意义如下表:变量符号代表意义中国成品钢材的需求量为万吨成品钢材需求总量原油产量万吨原油工业开展水平生铁产量万吨生铁工业开展水平原煤产量亿吨原煤工业开展水平发电量亿千瓦时发电技术水平铁路货运量万吨运
8、输产业水平固定资产投资额亿元固定资产支出水平居民消费亿元居民支出水平政府消费亿元政府支出水平第3章 问题分析 在上述问题中,中国成品钢材的需求量万吨的影响因素不只是原油产量万吨,还有生铁产量万吨、原煤产量亿吨、发电量亿千瓦时、铁路货运量万吨、固定资产投资额亿元、居民消费亿元、政府消费亿元等,这样因变量就与多个自变量有关。因此,我们就可以采用多元线性回归进展问题的分析。 多元线性回归模型的根本形式:设随机变量与一般变量的理论线性回归模型为:其中,是个未知参数,称为回归常数,称为回归系数。称为被解释变量因变量,而是个可以准确测量并可控制的一般变量,称为解释变量自变量。是随机误差,与一元线性回归一样
9、,对随机误差项我们常假定称为理论回归方程。第4章 数据的预处理4.1 曲线统计图 分析:从曲线统计图上我们可以大致的来看,变量和因变量在1980年到1986年的增长速度都相对平稳没有明显的增势;从1986年到1993年,个变量开场缓慢增长;从1993年到1998年,增长的幅度开场加大了。的曲线近似为一条水平的直线,这两个变量分别表示原油和原煤的量,可能受到资源和政策的限制,因而增长的速度非常缓慢。从图中可以明显看到随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。分析:从散点统计图上我们可以细致的来看,变量铁路运货量的变化最为明显,还可以清楚的看到1981年,1991年,1998年,因为
10、一些特殊事件而导致的铁路运输量降低。与在1980年到1986年的增长速度都相对平稳没有明显的增势,从1986年到1993年,个变量开场缓慢增长;从1993年到1998年,增长的幅度开场加大了。但是原油与原煤的产量却始终保持相对平稳的增长趋势,而却增长速度非常的缓慢,这可能是受到了资源的限制和国家政策的影响。从散点图中可以很明显的看到各年的真是数据,还可以看出随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。4.3 样本的相关系数 分析:从样本的相关系数表来看,各变量的相关系数都在0.9以上,说明自变量与因变量有高度的线性相关性,适合做与8个自变量的多元线性回归。说明:本表格是由EView
11、s软件计算得出,但由于不能导出,所以通过保存成图片后经WPS截图工具截得。第5章 回归模型的建立 将原始数据导入到spss19.0简体中文版的数据框中,然后用spss19.0软件回归线性分析得到以下表:模型汇总模型RR 方调整 R 方标准 估计的误差11.000a.999.998113.19930a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。 分析:从模型汇总表中可以看出,复相关系数,决定系数,由决定系数看回归方程高度显著。Anovab模型平方和df均方FSig.1回归1.291E8816139672.5601259.526.000a残差12814
12、0.8061012814.081总计1.292E818a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。b. 因变量: y 分析:从方差分析表,P值=0.000,说明回归方程高度显著,说明整体上对有高度显著的线性影响。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-381.485912.146-.418.685x1.122.107.0881.134.283x2.125.187.135.668.519x3-149.154121.354-.141-1.229.247x4.653.277.7232.359.040x5.003.023.0
13、24.131.898x6.081.042.2601.932.082x7-.120.047-.522-2.570.028x8.394.239.4341.646.131a. 因变量: y 分析:从系数表中可以得到对8个自变量的线性回归方程为 从回归方程中可以看到,对成品钢材需求量起正影响,对成品钢材需求量起负影响。从实际社会生活来看,原煤生产水平和居民的消费水平提高,都会促进成品钢材的需求量,应该和成品钢材的需求量成正相关,这与定性分析的结果不一致。为此,我们对它进展更深层次的分析。第6章 回归模型的检验6.1 F检验Anovab模型平方和df均方FSig.1回归1.291E8816139672.
14、5601259.526.000a残差128140.8061012814.081总计1.292E818a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。b. 因变量: y 分析:从表中输出结果可以看出,Sig即显著性P值,由,P值=0.000,可知此回归方程高度显著,即做出8个自变量整体对因变量y产生显著线性影响的判断所犯错误的概率仅为0.000。6.2 T检验及模型的T检验分析6.2.1 T检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-381.485912.146-.418.685-241
15、3.8741650.904x1.122.107.0881.134.283-.118.361x2.125.187.135.668.519-.292.542x3-149.154121.354-.141-1.229.247-419.547121.239x4.653.277.7232.359.040.0361.270x5.003.023.024.131.898-.049.055x6.081.042.2601.932.082-.012.175x7-.120.047-.522-2.570.028-.224-.016x8.394.239.4341.646.131-.139.927a. 因变量: y 分析:通
16、过看上面的T检验表可以发现,在显著性水平时,只有的Sig收尾概率小于0.05,通过了显著性检验。回归方程B的95.0%置信区间上下限给定如表中所示。6.2.2 T检验分析 为了尽可能的保存合理变量,我们就针对逐个变量给以T检验分析,逐步剔除不合理的变量,使回归模型更完善。因此我们首先剔除Sig最大的变量,再做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-274.526387.581-.708.493x1.133.066.0962.014.069x2.121.176.130.686.507x3-137.53479.000-.130-1.741.110
17、x4.678.197.7503.443.005x6.082.040.2632.082.061x7-.124.037-.537-3.348.007x8.388.224.4271.731.111a. 因变量: y分析:剔除后,在显著性水平时,有的Sig收尾概率小于0.05,通过了显著性检验。此时我们发现,剔除了后,通过T检验的变量增多了,这是一个很好的结果。因此我们再剔除Sig最大的变量,再用其他通过了T检验的变量做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-279.142378.881-.737.475x1.154.057.1122.714.019
18、x3-151.03474.804-.143-2.019.066x4.772.137.8555.625.000x6.100.030.3183.320.006x7-.135.032-.585-4.143.001x8.403.218.4441.849.089a. 因变量: y 分析:剔除后,在显著性水平时,有的Sig收尾概率小于0.05,通过了显著性检验。此时我们发现,剔除了后,通过T检验的变量又增多了一个。因此我们再剔除Sig最大的变量,再做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-108.818400.265-.272.790x1.150.062
19、.1082.423.031x3-248.80057.640-.235-4.316.001x4.978.0881.08211.120.000x6.127.028.4054.462.001x7-.084.019-.365-4.391.001a. 因变量: y 分析:剔除后,在显著性水平时,剩余变量的Sig收尾概率都小于0.05,全部通过了显著性T检验。模型汇总模型RR 方调整 R 方标准 估计的误差1.999a.999.998115.02599a. 预测变量: (常量), x7, x1, x3, x6, x4。分析:以做回归分析的输出表来看,决定系数,由决定系数看回归模型仍然具有高度的显著性。An
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 spss 软件 论文

链接地址:https://www.desk33.com/p-23461.html