第15章时间序列回归.ppt
《第15章时间序列回归.ppt》由会员分享,可在线阅读,更多相关《第15章时间序列回归.ppt(64页珍藏版)》请在课桌文档上搜索。
1、1,第十五章 时间序列回归,本章我们讨论分析时间序列数据(检验序列相关性,估计ARMA模型,使用分布滞后,非平稳时间序列的单位根检验)的单方程回归方法。,2,15.1 序列相关理论,时间序列回归中的一个普遍现象是:残差和它自己的滞后值相关。这种序列相关性违背了回归理论的标准假设:不同时点的扰动项互不相关。与序列相关相联系的主要问题有:在线性估计中OLS不再是有效的;使用OLS公式计算出的标准差不正确;如果在方程右边有滞后因变量,OLS估计是有偏的且不一致。EViews提供了检测序列相关和估计方法的工具。但首先必须排除虚假序列相关。虚假序列相关是指模型的序列相关是由于省略了显著的解释变量而引起的
2、。例如,在生产函数模型中,如果省略了资本这个重要的解释变量,资本对产出的影响就被归入随机误差项。由于资本在时间上的连续性,以及对产出影响的连续性,必然导致随机误差项的序列相关。所以在这种情况下,要把显著的变量引入到解释变量中。,3,平稳性定义:如果随机过程 的均值和方差、自协方差都不取决于 t,则称 Y t 是协方差平稳的或弱平稳的:,对所有的 t,对所有的 t,对所有的 t 和 s,注意,如果一个随机过程是弱平稳的,则Y t与Y t-s之间的协方差仅取决于s,即仅与观测值之间的间隔长度s有关,而与时期t 无关。一般所说的“平稳性”含义就是上述的弱平稳定义。给定一个样本值为T 的时间序列可以看
3、作是随机过程 Y t 的一个实现,仍记为。,4,一般地,我们考虑如下形式:,是在t时刻的解释变量向量;是前期已知变量向量;是参数向量;是残差;是残差的扰动项;可能包含 的滞后值或 的滞后值。是无条件残差,它是基于结构成分 的残差,但它不使用 中包含的信息。是一步预测误差,它是因变量真实值和以解释变量以及以前预测误差为基础的预测值之差。,5,一、一阶自回归模型,最简单且最常用的序列相关模型是一阶自回归AR(1)模型。定义如下:,参数 是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。,二、高阶自回归模型,更为一般,带有p阶自回归的模型,AR(p)误差由下式
4、给出:,AR(p)的自相关将渐渐衰减至零,同时高于p阶的偏自相关也是零。,6,15.2 检验序列相关,在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),EViews提供了几种方法来检验当前序列相关。,15.2.1 Dubin-Waston统计量,EViews将D-W统计量视为标准回归输出的一部分。D-W统计量用于检验一阶序列相关,还可估算回归模型邻近残差的线性联系。D-W统计量是在下面定义中检验原假设:,如果序列不相关,D-W值在2附近。如果存在正序列相关,D-W值将小于2(最小为0),如果存在负序列相关,D-W值将在2-4之间。正序列相关最为普遍,根据经验
5、,对于有大于50个数据和较少的解释变量,D-W值小于1.5的情况,说明存在强正一阶序列相关。参考Johnston and DiNardo(1997版6.6.1章)关于D-W检验和统计量显著性的论述。,7,Dubin-Waston统计量检验序列相关有三个主要不足:1D-W统计量的扰动项在原假设下依赖于数据矩阵X。2回归方程右边如果存在滞后因变量,D-W检验不再有效。3仅仅检验原假设(无序列相关)与备选假设(一阶序列相关)。其他两种检验序列相关方法:Q-统计量和Breush-Godfrey LM检验克服了上述不足,应用于大多数场合。例子:工作文件15_1eq_cs,8,15.2.2 相关图和Q-统
6、计量,在方程工具栏选择View/Residual Tests/correlogram-Q-statistics。EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的Ljung-Box Q统计量。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q-统计量不显著,并且有大的P值。k 阶滞后的Q-统计量是原假设为序列没有k 阶自相关的统计量。计算式如下,是 j 阶自相关系数,T是观测值的个数。,9,例子:,下面是这些检验程序应用的例子,考虑用普通最小二乘估计的简单消费函数的结果:,10,浏览这些结果:系数在统计上是很显著的,并且拟合得很好。但是,如果误差项是序
7、列相关的,那么估计OLS标准误差将是无效的,并且估计系数由于在方程右端有滞后因变量会发生偏倚和不一致。在这种情况下D-W统计量作为序列相关的检验是不合适的,因为在方程右端存在着一个滞后因变量。选择View/Residual test/Correlogram-Q-statistice会产生如下情况,11,15.2.3 序列相关LM检验,选择View/Residual Tests/Serial correlation LM Test,一般地对高阶的,含有ARMA误差项的情况执行Breush-Godfrey LM(Lagrange multiplier,拉格朗日乘数检验)。在滞后定义对话框,输入要检
8、验序列的最高阶数。检验的原假设是:至给定阶数,残差不具有序列相关。EViews将给出两个统计量:F统计量和NR2(观测值个数乘以R2),NR2在原假设下服从 分布。F统计量分布未知,但常用来对原假设进行非正规检验。,12,上一例子中相关图在滞后值3时出现峰值。Q统计量在各阶滞后值中都具有显著性,它显示的是残差中的显著序列相关。进行序列相关的LM检验,选择View/Residual Tests/Serial Correlation LM Test,输入滞后2产生如下结果:,此检验拒绝直至2阶的无序列相关的假设。Q-统计和LM检验都表明:残差是序列相关的,并且方程在被用于假设检验和预测之前应该重新
9、定义。,13,15.3 估计AR模型,在使用本章描述的工具之前,可以首先检验模型其他方面的错误。误差存在序列相关是模型定义存在的严重问题。特别地,应注意使用OLS得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。,15.3.1 一阶序列相关,在EViews中估计一个AR(1)模型,选择Quick/Estimate Equation打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数,应定义方程为:cs c gdp cs(-1)ar(1)。例子:工作文件15_1eq_cs_ar1,cst=-22.35+0.092
10、4*GDPt+0.874*cst-1 ut=0.2789*ut-1,14,15.3.2 高阶序列相关,估计高阶AR模型稍稍复杂些,为估计AR(k),应输入模型的定义和所包括的各阶AR值。如果想估计一个有1-5阶自回归的模型,应输入:cs c gdp cs(-1)ar(1)ar(2)ar(3)ar(4)ar(5)例子:工作文件15_1eq_cs_ar5 可以输入在模型中想包括的各个自回归,EViews在消除序列相关时给予很大灵活性。例如,如果有季度数据而且想用一个单项来说明季节自回归,可以输入:cs c gdp cs(-1)ar(4)。,15,15.3.3 存在序列相关的非线性模型,EViews
11、可以估计带有AR误差项的非线性回归模型。例如:估计如下的带有附加AR(2)误差的非线性方程,使用EViews表达式定义模型,在后面的方括号内描述AR修正项,对每一阶AR滞后项都应包括一个系数,每项之间用逗号隔开。cs=c(1)+gdpc(2)+ar(1)=c(3),ar(2)=c(4)EViews通过差分来转换这种非线性模型且使用Gauss-Newton迭代法来估计转换后的非线性模型。,16,15.3.4 存在序列相关的二阶段回归模型,通过把二阶段最小二乘法或二阶段非线性最小二乘法和AR项结合起来,对于在回归因子和扰动项存在相关性的情况和残差存在序列相关一样估计模型。如果原始回归模型是线性的,
12、EViews使用marquardt算法来估计变形后模型的参数。如果原始回归模型是非线性的,EViews使用Gauss-Newton算法来估计AR修正后的模型。对于存在序列相关的情况,可以通过向方程添加AR项来调整TSLS。EViews会自动将模型转化为非线性最小二乘问题,并用工具变量估计模型。估计对话框中的Options 钮用来改变非线性工具变量过程的迭代次数限制和收敛标准。,17,例子:15_1eq_cs_tsls_ar 假设用二阶段最小二乘估计消费函数,考虑存在一阶序列相关。二阶段最小二乘变量列表为:cs c gdp ar(1)工具变量列表为:c gov log(m1)cs(-1)gdp(
13、-1)注意因变量的滞后(cs(-1))和内生变量的滞后(gdp(-1))都包括在工具变量表中。类似地,考虑消费函数,cs c cs(-1)gdp ar(1)有效的工具变量表为:c gov log(m1)cs(-1)cs(-2)gdp(-1),18,15.3.5 含有AR项模型的估计输出,当估计某个含有AR项的模型时,在解释结果时一定要小心。在用通常的方法解释估计系数,系数标准误差和t-统计量时,涉及残差的结果会不同于OLS的估计结果。要理解这些差别,记住一个含有AR项的模型有两种残差:第一种是无条件残差,通过原始变量以及估计参数 算出。在用同期信息对y t值进行预测时,这些残差是可以观测出的误
14、差,但要忽略滞后残差中包含的信息。,19,第二种残差是估计的一期向前预测误差。如名所示,这种残差代表预测误差。如果使用前期数据残差和当前信息作预测,实际上,通过利用滞后残差的预测能力,改善了无条件预测和残差。对于含有AR项的模型,基于残差的回归统计量,如R2(回归标准误差)和D-W值都是以一期向前预测误差为基础的。含有AR项的模型独有的统计量是估计的AR系数。对于简单AR(1)模型,是无条件残差的序列相关系数。对于平稳AR(1)模型,在-1(极端负序列相关)和+1(极端正序列相关)之间。一般AR(p)平稳条件是:滞后算子多项式的根的倒数在单位圆内。EViews在回归输出的底部给出这些根:Inv
15、erted AR Roots。如果存在虚根,根的模应该小于1。,20,15.3.6 EViews如何估计AR模型,课本上经常描述估计AR模型的技术。探讨最多的方法,如Cochrane-Orcutt(科克兰内-奥克特)、Prais-Winsten、Hatanaka以及Hildreth-Lu程序都是使用标准线性回归进行估计的多步方法。当使用滞后因变量作为回归自变量或使用高阶AR项定义模型时所有这些方法都有严重的缺点。见Davidson&MacKinnon(1994,pp.329-341),Greene(1997,p.600-607)。EViews估计AR模型采用非线性回归方法。这种方法的优点在于:
16、易被理解,应用广泛,易被扩展为非线性定义的模型。注意:非线性最小二乘估计渐进等于极大似然估计且渐进有效。,21,为估计AR(1)模型,EViews通过将线性模型,转换成非线性模型。将第二个方程代入第一个方程,整理,参数通过应用Marquarat非线性最小二乘法估计。对于非线性定义,EViews将非线性模型,转换成:,使用Gauss-Newton算法来估计参数。,22,高阶AR定义情况也类似。例如,在方程中运用非线性最小二乘估计的非线性AR(3)如下:,23,15.4.1 非平稳时间序列,ARMA估计理论都是基于平稳时间序列。如果一个序列的均值和自协方差不依赖于时间,就说它是平稳的。非平稳序列的
17、典型例子是随机游动:,是平稳随机扰动项。序列y的方差随时间增长,若设,则 的方差是。但是随机游动是差分平稳序列,因为y一阶差分后平稳:,差分平稳序列称为单整,记为I(d),d为单整阶数。单整阶数是使序列平稳而差分的阶数。对于上面的随机游动,有一个单位根,所以是I(1),同样,平稳序列是I(0)。检查序列平稳性的标准方法是单位根检验。,15.4 ARIMA理论,24,ARIMA(Autoregressive Integrated Moving average,自回归单整动平均)模型是简单的AR模型的一般化,使用三种工具来为扰动项的序列相关建模。自回归AR 上述的AR(1)模型只运用了一阶AR项,
18、一般地,可以使用高阶AR项。每一个AR项对应于在无条件残差预测方法中的滞后值。P 阶的自回归模型AR(p)有下面的形式:,单整 I 每一单整阶数对应于对序列进行差分。一阶单整意味着对原始序列进行一次差分,二阶单整对应于进行两次差分,依此类推。,15.4.2 ARIMA模型,25,动平均MA 动平均预测模型使用预测误差的滞后值来改善当前预测。一阶动平均利用前期预测误差,二阶动平均利用前两期预测误差,以此类推。MA(q)有如下形式:,请注意,一些教科书和软件包的系数使用的是与常规相反的符号,因此MA系数也可能是相反的。自回归和动平均可以结合在一起形成ARMA(p,q)定义为:,尽管计量经济学家常应
19、用ARMA模型于回归模型残差分析,它也可直接应用于序列。后种方法提供了一种单变量模型,将条件序列均值设定为一个常数,将残差估计成均值的序列差分。,26,15.4.3 ARIMA模型建模原则(Box-Jenkins 1976),在ARIMA预测中,用上述的三种程序块的结合来建立一个完整的预测模型。建立残差序列ARIMA模型的第一步是看其自相关性,可以使用相关图来达到这一目的。ARIMA模型建模过程被称为识别(勿与有关联立方程的著作中使用的同一词混淆)。残差当前值与过去值之间的相关性为选择ARIMA形式提供了导向。自相关很容易解释每一值是序列当前值和滞后一定区间的值的相关系数。偏自相关有些复杂,它
20、们是考虑了序列所有值滞后后的预测能力后,计算当前和滞后序列的相关性。例如滞后6阶偏自相关是计算当 已在预测模型中时,的预测能力。实际上,偏自相关是当前期滞后已应用于 的预测后 的回归系数。如果怀疑左侧的因变量和其他的预测值之间存在一个分布滞后关系,那么可以在执行估计前看它们的交叉相关。,27,第二步是决定使用何种ARIMA模型。如果自相关函数以几何速率衰减,偏自相关函数一阶滞后后为零,即为一阶自回归模型。同样,如果自相关一阶滞后后为零,而偏自相关以几何速率衰减,即为一阶动平均。如果自相关有季节特征,这说明存在季节ARMA结构。例如:选择EViews example filesdataHSHS序
21、列工作栏中View/Correlogram便可以检验基本住房序列相关图。,28,上图中存在季节频度的波动循环,建议用季节ARMA模型拟合HS序列。ARIMA分析的目的是控制残差过程的一种过度节约的表示法。也可仅用AR或MA来拟和残差的特性。使用AIC 准则和Schwarz准则来选择滞后阶数。建立合适的ARIMA模型后,应当确认模型没有残差自相关。检查扰动项的自相关和偏自相关,还要考虑是否有重要的预测能力被忽略。EViews提供了估计之后的诊断检查方案。,29,15.5 估计ARIMA模型,EViews估计的是考虑到具有右侧解释变量的ARIMA(p,d,q)设定形式,尽管这样的模型有时叫做ARI
22、MAX模型:ARIMA模型是ARIMAX模型的特例,但是我们把这一类的模型都叫做ARIMA模型。为建立ARIMA模型,首先需要做以下两点:1确定单整阶数,差分因变量序列;2描述结构回归模型(因变量和解释变量),用前面介绍的方式加入AR或MA项。,30,15.5.1 差分因变量序列,一、差分 D算子被用来定义序列差分。定义一阶差分,仅把序列名写入D后的括号。例如,D(GDP)定义GDP的一阶差分,或GDP-GDP(-1)。更复杂的差分形式可以使用两个参数 n,s。D(x,n)定义序列x的n 阶差分,L是滞后算子。例如:D(GDP,2)定义了GDP的2阶差分:D(GDP,2)=GDP-2*GDP(
23、-1)+GDP(-2)D(x,n,s)定义序列x的n阶普通差分,带有滞后s阶的季节差分:,例如:D(GDP,0,4)定义带有滞后4阶季节差分的零阶普通差分,即GDP-GDP(-4)。如果需要对数形式,可以使用Dlog算子,它以对数值返回差分。例如:Dlog(GDP)定义log(GDP)的一阶差分,即 log(GDP)-log(GDP(-1)。,31,二、在EViews中估计单整模型,可以直接在估计定义式中包含差分算子D。例如:GDPI(1),即GDP是一阶单整序列。对GDP估计ARIMA(1,1,1)模型,可以输入列表(15_1EQ_DY):D(GDP)c ar(1)ma(1)使用因变量差分因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 15 时间 序列 回归
链接地址:https://www.desk33.com/p-726665.html