【《我国GDP增长的相关分析和回归分析》5000字(论文)】.docx
我国GDP增长的相关分析和回归分析目录我国GDP增长的相关分析和回归分析11引言12对我国GDP的相关分析和回归分析21.1 1数据收集21.2 数据处理31.3 分析步骤41.4 结果分析41、方差分析表53全国各省市GDP聚类分析63.1 数据收集63.2 数据处理83.3 分析步骤81、统计量描述82、系统聚类法83、快速聚类法83.4 结果分析8DescriptiveStatistics82、结果总结93.5 4.3快速聚类法10下表表示的是初始聚类中心,也就是种子点10InitialClusterCenters103. 4.4结论114讨论和建议124. 1人口过剩之制约国民经济发展的关键因素之一125. 2各地经济发展不够平衡123、加大对落后省事的政策扶持力度,全面协调发展。13结论13参考文献131引言自1978年改革开放以来,我国经济飞速发展,国内生产总值日趋上升,经济总体处于供大于求的状态,虽然经历了1997金融风暴和2007金融危机,但我国经济发展前景一片大好。国内生产总值(简称GDP,是指在一定时期内(一个季度或一年)一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标)。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可以观察到。一般而言,GDP公布的形式不外乎两种,以总额和百分比率为计算单位。当GDP的增长数字处于正数时,即显示该地区经济处于扩张阶段;反之,如果处于负数,即表示该地区的经济进入衰退时期。近来由于世界金融危机和我国经济转型的影响,以及我国自身的一些发展条件限制,我国经济发展速度逐渐放缓,因而对我国GDP水平的研究就显得尤为必要。因此,本文首先通过网络工具对我国1980-2014年GDP、人口数、固定资产投资、进出口总额、国家财政支出数据;我国各省(直辖市)2011年GDP数据进行数据收集。而后根据要求对数据进行适当的处理,根据所需要的分析结果,我们分别选择了excel和SPSS两种工具进行辅助分析。这其中既有关于GDP与人口数、固定资产投资、进出口总额、国家财政支出的相关性分析,也有各省GDP方差分析,还有各省GDP聚类分析。根据分析的结果对我国GDP水平进行适当的探讨以及给出一些经济发展规划的建议。2对我国GDP的相关分析和回归分析2.1数据收集1980-2014年全国经济相关数据年份GDP现价(亿元)人口数(万人)固定资产投资(亿元)进出口总额(亿元)国家财政支出(亿元)19804545.62498705910.9570.01228.8319814891.5611100072961.0735.31138.4119825323.3511016541230.4771.31229.9819835962.65161030081430.1860.11409.5219847208.05171043571832.91201.01701.0219859016.03661058512543.22066.72004.25198610275.17921075073120.62580.42204.91198712058.61511093003791.73084.22262.18198815042.8231110264753.83821.82491.21198916992.31911127044410.44156.02823.78199018667.82241143334517.05560.13083.59199121781.49941158235594.57225.83386.62199226923.47651171718080.19119.63742.2199335333.924711851713072.311271.04642.3199448197.856411985017042.120381.95792.62199560793.729212112120019.323499.96823.72199671176.591712238922913.524133.87937.55199778973.03512362624941.126967.29233.56199884402.279812476128406.226849.710798.18199989677.054812578629854.729896.213187.67200099214.554312674332917.739273.215886.52001109655.170612762737213.542183.618902.582002120332.689312845343499.951378.2220533.152003135822.756112922755566.670483.524649.952004159878.337912998870477.4395539.128486.892005184937.36913075688773.6129116921.833930.282006216314.4259131448109998.1624140974.040422.732007265810.3058132129137323.9381166863.749781.352008314045.4258132802172828.3998179921.470262592.662009340902.8126133450224598.7679150648.063576299.932010401512.7952134091278121.8549201722.14789874.162011473104.00134735311485.1254236401.992109247.792012519322.10135404374675.7255077.749112234.112013588019.25136072436528.5258267.45127504.422014636463.00136782512761.4246408.331134156.202.2数据处理这里我们录入全国1980年到2014年的GDP、人口数、固定资产投资,进出口总额、国家财政支出数据。在相关性分析中,我们以GDP为参考,利用SPSS软件研究其他四种因素与GDP的相关性,由于做单个比较需要进行四次操作,因而我们在这里直接利用SPSS的相关功能直接给出五个量的两两相关系数,这之中自然包括我们所需要的GDP其他四类因素的相关系数。在回归分析中,我们令GDP为因变量,将人口数,固定资产投资,进出口总额、国家财政支出四个数据作为自变量XI、X2、X3、X4,然后利用excel的数据分析工具做回归分析。2.3分析步骤录入数据到SPSS于画出关于GDP的散点图做大致分析一做相关性分析。录入数据到excel选择分析工具f定好自变量和因变量f做回归分析。2.4结果分析2.1.4相关性分析下表是通过SPSS所做相互的两两相关系数表格:项目GDP人口数固定资产投资额进出口总额国家财政支出GDPPearsonCorrelation1.798.956*.984*.992*Sig.(2-tailed).000.000.000.000N3232323232人口数PearsonCorrelation.798*1.633*.781*.729*Sig.(2-tailed).000.000.000.000N3232323232固定资产投资额PearsonCorrelation.956*.633*1.933*.974*Sig.(2-tailed).000.000.000.000N3232323232进出口总额PearsonCorrelation.984*.781*.933*1.969*Sig.(2-tailed).000.000.000.000N3232323232国家财政支出PearsonCorrelation.992*.729*.974*.969*1Sig.(2-tailed).000.000.000.000N3232323232从表中我们可以知道:1、GDP与人口数之间的相关系数是0.798,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,有超过99%的把握认为,两者之间存在着比较强的正相关性。2、GDP与固定资产投资之间的相关系数是0.956,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,有超过99%的把握认为,两者之间存在着非常强的正相关性。3、GDP与进出口总额之间的相关系数是0.984,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,有超过99%的把握认为,两者之间存在着比较强的正相关性。4、GDP与国家财政支出数据之间的相关系数是0.992,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,有超过99%的把握认为,两者之间存在着非常强的正相关性。对于回归分析,可以利用excel中自带的会给分析予以分析。2.4.2回归分析下表是通过excel软件做出的回归分析结果:1、方差分析表方差分析dfSSMSFSignificanceF回归分析44.96E+111.24E+113400.954.65521E-36残差279.83E+0836423935总计314.96E+112、参数确定表COeffiCien标准误差tStatP-VaIUe1.wer95%Uppcx95%限95,仍卜米95.0%Intercept-14951018613.98-8.032141.25E-08-187702.8061-111317I-187703-111317XVariable11.44950.1672688.6657372.79E-091.1062944731.7927051.1062941.792705_XVariable20.1899640.1848611.0276020.031325-0.1893402760.569268-0.189340.569268XVariable30.4275310.0726855.8819332.89E-060.2783924810.5766690.2783920.576669XVariable42.4613430.6141274.0078750.0004331.2012589013.7214271.20125.93.721427由输出结果可以知道,线性回归方程为:l>Y=-149510+l.4495*X1+O.189964*X2+0.427531*X3+2.461343*X402根据输出结果中的方差分析可知,SignificanceF=4.65521E-36<=0.05,说明回归方程是显著的。3>而由结果中的回归系数的tStat检测可知:a:P-Value=I.25E-08<=0.05,bl:P-Value=2.79E-09<a=0.05,b2:P-Value=O.031325<=0.05,b3:P-Value-2.89E-06<=0.05»b4:P-Value-O.000433<=0.05。综上所述,因此回归方程是有效可靠的。3全国各省市GDP聚类分析3.1数据收集全国各省市2011年GDP数据(现价/单位:亿元)地区地区生产总值农业工业建筑业交通运输、产出和邮政业批发和零售业住宿和餐饮业金融业房地产业其他北京16251.93136.273048.79703.69808.952139.65348.422215.411074.935775.82天津11307.28159.725430.84497.48632.11463.89194.52756.5411.461760.77河北24515.762905.7311770.381356.482046.221780.63338.91746.01918.022653.38Ih西11237.55641.425959.96675.3756.29846.65261.33519.32224.911352.37内蒙古14359.881306.37101.6936.091040.031216.6381.64447.46384.761545.41辽宁22226.71915.5710696.541455.611143.171960.33436.13755.57876.122987.66口林10568.831277.444917.95693.53420.98860.47205.69207.65238.611746.51黑125821701.55602.76727.77543.811060.26275.8350.82465.611853.67龙江上海19195.69124.947208.59719.3868.313040.99279.342277.41019.683657.14江苏49110.273064.7722280.612922.672127.935341.39919.132600.112747.897105.77浙江32318.851583.0414683.031872.551206.953288.53620.252730.291677.134657.08安徽15300.652015.3170621247.38589.821050.61252.62503.85634.921944.15福建17560.181612.247675.091394.11963.851511.29300.35862.41911.162329.68江西11702.821391.075411.86978.69507.44831.97270.29357.44402.511551.55山东45361.853973.8521275.892741.222328.385400.19881.581640.411838.145282.2河南26931.033512.2413949.321477.76961.51586.09797.99868.29872790.94湖北19632.262569.38538.041277.9869.481512.89446.52674.57634.673108.89湖南19669.562768.038122.751239.24948.821662.34406.87501.09518.03502.38广东53210.282665.224649.61797.782090.365681.171192.282916.133321.318896.45广西11720.872047.234851.37823.95588.2803.48307.844537465.681387.72海南2522.66659.23475.04239.46119.74258.0689.75105.24208.71367.43重庆10011.37844.524690.46852.58456.25747.3166.31704.66396.281153.01四川21026.682983.519491.051538.08638.761186.58562.63868.15620.623137.3贵州5701.84726.221829.2365.13590.91448.77224.4297.27160.31059.64云南8893.121411.012994.3786.02217.22932.21278.2456.23222311595.62西藏605.8374.4748.18160.6123.9534.2517.7531.717.44197.48陕西1251231220.95857.921077.67552.54103635266.92432.11398.031669.86甘肃5020.37678.751923.95453.88280.33351.97123.61145.05134.25928.57青海1670.44155.08811.73163.4567.5393.718.9362.5629.05268.41宁夏2102.21184.14816.79239.36174.1109.9937.15134.1879.01327.49新疆6610.051139.032700.2525.7256.72371.977.87288.77176.221073.643.2数据处理根据要求,我们需要对全国GDP做聚类分析,简而言之,就是做一个分类处理。这个分类,我们可以根据全国各省市的GDP构成来对其进行一个简单地划分。通过对全国各省市的GDP构成的了解,以及通过比较各省市之间的各行GDP进行分类。在这里我们利用了SPSS软件中的系统聚类法和快速聚类法。并且在聚类分析之前通过对统计量进行描述,对数据做初步分析。3.3分析步骤1、统计量描述录入数据到SPSS选用合适的分析工具一做数据分析。2、系统聚类法选择合适的分析工具一选择变量一选择系统聚类方法f做系统聚类一选择下一种系统聚类法分析具体操作过程,用七种系统聚类法所得的树状聚类图。3、快速聚类法选择合理的分析工具一选择变量一预先数据分为三类一做快速聚类。3.4结果分析3.4.1数据描述DescriptiveStatisticsNMinimumMaximumMeanStd.Deviation农业3174.473973.8511.5306E31099.29507工业3148.1824649.607.4799E36296.67453建筑业31160.612922.671.0303E3673.06563交通运输仓储3123.952328.388.0067E2613.84875和邮政业批发零售业3134.255681.171.5681E31509.48430住宿和餐饮业3117.751192.283.5423E2277.56833金融业3131.702916.138.3555E2833.73651其他31197.488896.452.5054E32036.35437ValidN(Iistwise)31从表中数据可知:平均GDP较高的三个行业是工业、交通运输仓储和邮政业、金融业。从GDP的极大值和极小值方面分析,我们可以知道GDP的极小值是住宿和餐饮业的17.7亿元。极大值是工业的24649.6亿元。3.4.2系统聚类法(注:取用间距SqUaredEuclideanDistance)SqIIareaEi7千«*ft4illM4AlTqBtT。上KiTKunii2<rg1,J153车IK41比.990WZ1m“。73949W»HO>w>HT999>ua1.7天,OOO1mOflOrSOOI4IM4B44M1M8.3101阮134It1391OBBMQ71W231Q34700120621111OCM.63335m1seo1dB7600)011000OM394066OT443311616IM2280G83W515RFS919197W07400016412407?14,iW1mKK0970732班9Bir=r.78950B231384164OOO426279657225S701.164.055»71708FU伙9116006124G6OOO02t9。6<551.117加m3EB三I881195*O”Q78”9028OM82S411552.0S2158019叱冷.110651*6311<65790662tOOO2W侬Ml5”8”即1.1O133.0034355219143313SU2254414010J.r5DaeMT3.4三r2.7844.103XOIi«HJ"1.54(»1M416161m701I315公6筑WOOO1.2F9.84019211»U®114329UJ19BIM104Iir28413Hr1mOOO.073.052ITOft.3e.31022。”06626T“622MO.on.000.ISI2247*dno108mOOD07325023Oia4131.0S2ISI(KK)JxZ“11J7.m304tt1MM9685,11701“2)2t1)M11«J-W1.20I1K«f.52213ia1061«4729498871114173Ml88SM“679013*6VJRft8996”m«03IBOOT330r2WWOBI.1007)0IWS16«ft“9635冷,«59215的0加露3汕27SJM140X2i4H“车3.2174834-2919S.02942712902531T473,J08132112954.3143.S404Us2.20S.9792跄M119。第23OOOir9283r娱.043.181OM3IM201.2972491MT2ir4491028«492M1269Jl72713.45.701m53»122,R.”8.07®«2.011139430OMorM944031.001.IM.217XMin71.23BJllI01962544T623SM1645153"1o?2554乂01”.221.37324M州.3Iltt1rO0O1M602069I3S“4.r2IAOJ(M.424.tie441«1.25n1921851Ml1121T2<620280448n4SM1W.124.274OH3BO2M方.1.“6W,M>20"13432I4«017)>.rtHO41CO13.”床fiSll1477<503r061239036031T41313414S305).121Oofi3257、下表是利用“组间联结”聚类法计算所得的近似矩阵表,其实质是一个不相似矩阵,其中的数值表示各个样本之间的相似系数,数值越小,表示两样本的差距越小。(由于表格数据很大,故截取一部分作说明)2、结果总结纵观七种聚类方法,比较其聚类结果(分为三类)可总结出如下表:第一类第二类第三类组间联结聚类法广东、山东、江苏浙江、上海、北京其他组内联结聚类法广东山东、江苏其他最近邻元素聚类法广东、山东、江苏浙江其他最远邻元素聚类法广东、山东、江苏浙江、上海、北京其他质心聚类法广东、山东、江苏浙江、上海、北京其他中位数聚类法广东、山东、江苏浙江、上海、北京其他Ward聚类法广东、山东、江苏浙江、上海、北京其他3.4.3快速聚类法1、下表表示的是初始聚类中心,也就是种子点InitialClusterCentersCluster123农业74.472665.203512.24工业48.182.46E41.39E4建筑业160.611797.781477.76交通运输仓储和邮政业23.952090.36961.50批发零售业34.255681.171586.09住宿和餐饮业17.751192.28797.99金融业31.702916.13868.20房地产业17.443321.31987.00其他197.488896.452790.942、下表表示的是每个个案的类别情况:第三列的“Cluster”表示的是该案属于哪一个类别。第四列的“distance”表示的该案例与所属类别中心之间的距离。ClusterMembershipCaseNumber地区ClusterDistance1北京15.056E32天津12.352E33河北32.505E34山西12.625E35内蒙古33.191E36辽宁31.114E37吉林11.662E38黑龙江12.464E39上海33.752E310江苏2714.67011浙江35.887E312安徽32.977E313福建32.173E314江西12.159E315山东22.694E316河南34.537E317湖北31.330E318湖南31.876E319广东22.924E320广西11.937E321海南13.178E322重:庆11.397E323四川31.215E324贵州11.653E325云南1791.06926西藏13.774E327陕西12.596E328甘肃11.633E329青海13.052E330宁夏12.983E331新疆1928.110分析上表可知,若采用K-均值聚类法分三类,第一类包括广东、山东、江苏,第二类包括河北、内蒙古、辽宁、上海、浙江、安徽、福建、河南、湖北、湖南、四川,第三类为其他。3.4.4结论结论1:不同地业的平均GDP比较平均GDP较高的三个行业是:工业、交通运输仓储和邮政业、金融。结论2:不同地区平均GDP比较:比较系统聚类法和K-均值聚类法输出的结果,其我们可以清楚的看到第一类基本都为广东、山东、江苏,但是第二类却有很大出入,用系统聚类法的几种不同方法所做的分析结果基本相同,故而我们这里认为第二类包括北京,上海,浙江,第三类包括其他省市。4讨论和建议4.1人口过剩之制约国民经济发展的关键因素之一根据回归方程:Y=149510+1.4495*X1+0,189964*X2+0.427531*X3+2.461343*X4可知,人口和政府财政支出较进出口和固定资产对GDP水平的影响大的多,但人口过剩也是制约国民经济发展的一个非常关键的因素。为促进国民经济又好又快的发展,政府的作用显得非常重要,同时我们也看到进出口总额对国民经济的影响也是不容小视的。同时,加大固定资产的投资也可以促进经济发展,政府的固定资产投资包括基础设施建设、水利工程改造等。针对以上问题,本文给出以下建议:1、政府要加大财政支出,位经济发展提供驱动力。2、加大全球经济交融力度,扩大外贸,融入全球经济中。3、继续实施“计划生育”基本国策。4、要加大基础设施建设力度。5、深化国家经济产业转型,加大经济改革力4.2各地经济发展不够平衡通过对问题的分析可知,如果对我国各省市进行聚类分析,可以把北京、上海、浙江归为一类,把广东、山东、江苏归为一类。本文聚类的根据是各省市的产业结构,所以被归集为一类的省市在产业结构上具有一定的相似性。以前两组为例,广东、山东、江苏三省的各产业GDP水平均在各省市的前列;北京、上海、浙江三省市的各产业水平与非常高,但在农业、但由于地域等因素的限制,普遍对比广东、山东、江苏三省稍低,但总体水平也相当可观。针对以上现象,本文给出以下建议:1、经济发展要因地制宜,不要求面面俱到,做到集中力量发展优势产业;2、经济发展要全国整体规划,做到各省市要有自己的强势产业,全国各省市的强势产业加一起要构成一个整体无缺的市场格局。3、加大对落后省事的政策扶持力度,全面协调发展。结论做国家GDP研究是一个非常系统庞大的过程,本文仅仅只是GDP分析中的一个微小部分。从分析的过程中不难知道,做好数据分析的关键就是要有非常精确的数据,而后才是分析的方法。虽然在这次统计调查的过程中笔人花费了很多时间,但却在这次统计调查分析中学到了很多知识。通过分析调查,笔人对GDP有了初步的了解,对国民经济的构成也有了一定的了解。同时,由于这次分析调查的局限性,我对问题的研究和探讨有一定的局限性,所以给出的建议也有一定的问题。参考文献1罗建章.关于我国国内生产总值局限性的思考J1.云南财贸学院学报(社会科学版),2004,03:81-83.2朱姗.我国国内生产总值的模型建立与分析J.现代经济信息,2009,10:64-65.3王静.我国GDP统计数据质量的量化分析J.中国统计,2009,10:45-46.4徐剑明.我国GDP增长过程中的代价分析J.现代经济探讨,2007,12:10-14.5张卜元,刘冰冰,张东旭.我国国内生产总值影响因素实证分析U1.合作经济与科技,2016,02:10-11.6吴金香.影响GDP增长的经济因素因子分析J.商场现代化,2015,28:216-217.