时间序列分析+基于ARIMA模型的城镇居民人均收入的预测.docx
基于ARIMA模型的城镇居民人均收入的预测摘要:城镇居民可支配收入一向较为是反映人民生活水平和国内经济开展状况的重要指标,故对于城镇居民可支配收入的情况了解几何就显得尤为重要。在此对19802015年我国城镇居民人均可支配收入的数据进行训练集和检验集的划分处理后,运用SAS9.3统计软件建立了ARlMA(1,1,0)城镇居民人均可支配收入的拟合模型:(1一A)X=1£。并预测2016年城镇居民人均的可支配收入为29284.77元,为政府部门提供了制定相关惠民政策的参考有着极为重要的作用。一、引言城镇居民可支配收入是指反映居民家庭全部收入在能用于安排家庭日常生活支出的局部收入。随着经济的开展,国家财政在民生政策和民生福利上的不断加大投入,在此城镇居民的可支配收入就成为了一个非常重要的参考指标,可以用来衡量城镇居民的生活水平,从而是政府制定相关政策的重要依据。就目前而言国内针对城镇居民可支配收入的预测研究的文献主要采用两种预测方法平稳时间序列预测法和灰色预测法。一种是由著名学者邓聚龙教授提出的灰色预测系统理论,目前已经广泛应用到了经济、科教、工农业、气象、军事等领域,并取得了较好的预测效果。其中游中胜以重庆城镇居民家庭为例构造了GM(U)的家庭人均可支配收入模型,并分别预测了20132015年的人均可支配收入。另一种那么是通过建立ARIMA模型进行预测,通过对数据的处理分析最终得到较好的预测结果。文献有蒋琴莉利用ARIMA模型预测了我国城镇居民家庭人均可支配收入并提出建设性的政策意见。本文运用软件SAS9.3对中国统计年鉴2016M9802015年我国城镇居民人均可支配收入的数据进行分析,此外,为了更好地检验数据的拟合效果,我们将数据分为训练集和检验集,并运用ARIMA模型对城镇居民可支配收入进行了预测。二、ARlMA模型原理ARIMA模型全称为自回1归移动平均模型(AUtOregreSSiVeIntegratedMovingAverageModel,简记ARIMA),具有如下结构:中(BwXt=。(为与E(G=0,gNj)=成,=0,s1Exst=0,VSV-式中,=(I-(B)=-B,为平稳可逆ARMAP,q)模型的自回归系数多项式;须B)=_0B_一仇炉,为平稳可逆ARMA(p,q)模型的移动平滑系数多项式。求和自回归移动模型这个名字的由来是因为d阶差分后序列可以表示为:寸Xt=(-l),yCid=/出、"。式中,!(4-D!,即差分后序列等于原序列的假设干序列值的加权和,而对它又可以拟合自回归移动平均模型,所以称它为求和自回归移动平均模型。式(5.1)可以简记为:NtiXt(ig)(团又(2)式中,J为零均值白噪声序列。由式2容易看出,ARIMA模型的实质就是差分运算与ARMA模型的组合。这一关系意义重大。这说明任何非平稳序列如果能通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行ARMA模型拟合了。而ARMA模型的分析方法非常成熟,这意味着对差分序列的分析也将是非常简单、非常可靠的。特别的,当d=0时,ARIMA(p,d,q)模型实际就是ARMA(p,q)模型。当P=O时,ARIMAS,d,q)模型可以简记IMA(d,q)模型。当d=l,p=q=O时,ARIMA(0,1,0)模型为:Xt=Xf+GE(G=0,Var(t)=2iE(ts)=0istExsf=0,5<t,)该模型又称为随机游走模型。三、数据的介绍以及描述本文选取中国统计年鉴201619802015年我国城镇居民人均可支配收入作为研究数据。通过利用SAS9.3软件对城镇居民人均可支配收入绘制时序图(如图1),可以清晰的了解到城镇居民人均可支配收入序列蕴含着曲线递增的长期趋势,是非平稳时间序列。20000 19000 18000 170001OOO 1SOOO 14000 13000 12000 11000 IOOOO9000 80007000 6000 5000400030002000 IOOO8000900010000 IIOOO120001300014000150006000图119802015年城镇居民人均可支配收入的时序图3.1数据预处理为了更好地检验数据的拟合效果,我们将数据分为训练集和检验巢。19802012年的数据作为训练集用于建模,余下3年数据作为检验集作为检验模型预测能力好坏的标准。由于初步了解数据发现该序列呈现明显的上升趋势,为非平稳序列。且通过观察图形我们可以看出时序图呈指数函数上升的趋势,于是我们对该序列做对数变换,变换后的时序图(如图2)所示。图2 19802012年城镇居民人均可支配收入对数变换时序图图2显示,取对数后的时序图仍然蕴含着线性递增的趋势,还需要对该城镇居民人均可支配收入进行1阶差分运算来实现趋势平稳。结果如图3所示。图31980-2012年城镇居民人均可支配收入的1阶差分时序图1阶差分后的序列不再呈现明显的趋势性,可以直观的初步确认该序列已经平稳。四、ARIMA模型的建立4.1序列的平稳性检验与白噪声检验时序图显示该序列的信息根本被差分运算充分提取,为了进一步验证其平稳性,我们考察差分后序列的自相关图(如图4)。图419802012年城镇居民人均可支配收入的1阶差分后自相关图自相关图显示,延迟1阶之后,自相关系数具有明显的短期相关性,可以认为该差分后序列平稳。表1白噪声检验AutocorrelationCheckforWhiteNoiseToLagChi-SquareDFPr>ChiSqAutocorrelations611.6060.0714049302590.1290.2390.1850063而对于白噪声的检验,我们由表1显示,在各阶延迟下LB检验统计量的P值在(a=0.1)的水平下,拒绝序列纯随机的原假设,我们可以断定城镇居民人均可支配收入的1阶差分后的序列属于非白噪声序列。结合前面平稳性的检验结果,可以说明该序列为平稳非白噪声序列。4.2模型的定阶与拟合为了确定模型的阶数,我们还需要考虑偏自相关图(图5)。1.0W0.01bQ.-0.5-1.0IIIIIII01234561.ag图5偏自相关图偏自相关图显示,除了延迟1阶的偏西相关系数显著大于2倍标准差之外,其他阶数的偏自相关系数都比拟小。根据自相关图和偏相关图的特点,我们来进行模型的定阶。由于偏相关图中只有延迟1阶的偏相关系数显著大于2倍标准差,所以拟合定阶模型AR(I),并剔除了常数项,(见表2)。表2未知参数估计表ConditionalLeastSquaresEstimationParameterEstimateStandardErrortValueApproxPr>tLagAR1,10.757050.140845.38<00011由上表可知,t统计量的P值小于非常小(<0.001),所以AR(1)非常显著。综合考虑前面的差分运算,实际上对该数列拟合的模型ARlMA(1,1,0)o由此结合表3可知,表3拟合模型的具体形式AutoregressiveFactorsFactor1:1-0.75705B*(1)由此结合表3可知,我们得到城镇居民人均可支配收入的拟合模型:(1-bx1=4.3模型的检验表4残差白噪声检验AutocorrelationCheckofResidualsToLagChi-SquareDFPr>ChiSqAutocorrelations64.2450.5156-0.0700.087-0.2580.2000.1300.085124.60110.9491-0.034-0.0340.0170.0060.0260.066186.23170.99150.0440.0590.0190.0050.0760.079残差检验结果表示,在显著性检验a=005的水平下,检验统计量P均大于0.05.这说明残差序列可以视为白噪声序列。该ARlMA(1,1,0)模型对该序列建模成功。4.5模型的预测于是我们运用SAS程序利用上述ARlMA模型预测了城镇居民人均未来4年的可支配收入(如表5)所示。并将其中20132015的预测数据与检验集这三年的实际数据相比拟,(如表6)所示。表52013-2015年城镇居民人均可支配收入预测值ForecastsforvariableIxObsForecastStdError95%ConfidenceLimits259.93870.15409636810240626999990.311493896106103271004620.47529.114910977628100813063808830811.3318表6经过转换后2013-2015年的预测值:251497720964.96261497823118.93271497925825.84281498029284.77表7预测结果与实际结果比拟表:通过表7我们发现真实值与预测值十分接近,这说明我们所建模型有较好的效果,可以用来预测。于是我们得到了2016年城镇居民人均的可支配收入为29284.77元。五、结论预测城镇居民的人均可支配收入,不仅能够清楚掌握我国经济开展情况而且还有助于了解居民的生活水平和质量,据此为政府部门提供制定相关惠民政策的参考。本文通过对19802015年我国城镇居民人均可支配收入的数据进行分析,采用ARlMA(1,1,0)模型对城镇居民可支配收入进行了预测。通过对检验数据的拟合,ARIMA(1,1,0)模型能够提供较好预测,并最终预测2016年城镇居民人均的可支配收入为29284.77元。此外,我们发现城镇居民的人均可支配收入呈现稳健的递增趋势,这说明国内经济开展良好,居民生活质量高,国家出台的相关促进经济增长的政策得到了一定成果。参考文献蒋琴莉.我国城镇居民家庭人均可支配收入的分析及预测一基于ARlMA模型J.2游中胜,张苑.基于GM(1,1模型的城镇居民人均可支配收入预测一以重庆市城镇居民家庭为例J.重庆师范大学学报.王振雯,杨堰琨,张峰ARlMA模型在城镇居民家庭收入的应用J内蒙古农业大学学报.王燕.应用时间序列M.北京:中国人民大学出版社.附录dataa;inputx;date=intnx(,year','1janl980'd,_n_-l);formatdateyear;cards;343.4477.6739.11510.21700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.67702.88472.29421.610493.011759.513785.815780.817174.719109.49procgplotdata=a;symbollV=Starc=redi=join;plotx*date=l;run;datab;seta;Ix=Iog(x);difl=dif(Ix);run;procgplotdata=b;symbol2v=starc=redi=join;plotlx*date=2dif;run;procgplotdata=b;symbol3v=starc=redi=join;plotdifl*date=3;run;procarimadata=b;identifyvar=lxnlag=6;run;identifyvar=lx(1)nlag=6;run;estimatep=5noint;run;forecastlead=4id=dateout=c;datac;setc;y=exp(Ix);195=exp(195);u95=exp(u95);forecast=ex(forecast+std*std2);run;procprintdata=c;vardateforecast;wheredate>='1janl980'd;run;