第15章时间序列回归.ppt
1,第十五章 时间序列回归,本章我们讨论分析时间序列数据(检验序列相关性,估计ARMA模型,使用分布滞后,非平稳时间序列的单位根检验)的单方程回归方法。,2,15.1 序列相关理论,时间序列回归中的一个普遍现象是:残差和它自己的滞后值相关。这种序列相关性违背了回归理论的标准假设:不同时点的扰动项互不相关。与序列相关相联系的主要问题有:在线性估计中OLS不再是有效的;使用OLS公式计算出的标准差不正确;如果在方程右边有滞后因变量,OLS估计是有偏的且不一致。EViews提供了检测序列相关和估计方法的工具。但首先必须排除虚假序列相关。虚假序列相关是指模型的序列相关是由于省略了显著的解释变量而引起的。例如,在生产函数模型中,如果省略了资本这个重要的解释变量,资本对产出的影响就被归入随机误差项。由于资本在时间上的连续性,以及对产出影响的连续性,必然导致随机误差项的序列相关。所以在这种情况下,要把显著的变量引入到解释变量中。,3,平稳性定义:如果随机过程 的均值和方差、自协方差都不取决于 t,则称 Y t 是协方差平稳的或弱平稳的:,对所有的 t,对所有的 t,对所有的 t 和 s,注意,如果一个随机过程是弱平稳的,则Y t与Y t-s之间的协方差仅取决于s,即仅与观测值之间的间隔长度s有关,而与时期t 无关。一般所说的“平稳性”含义就是上述的弱平稳定义。给定一个样本值为T 的时间序列可以看作是随机过程 Y t 的一个实现,仍记为。,4,一般地,我们考虑如下形式:,是在t时刻的解释变量向量;是前期已知变量向量;是参数向量;是残差;是残差的扰动项;可能包含 的滞后值或 的滞后值。是无条件残差,它是基于结构成分 的残差,但它不使用 中包含的信息。是一步预测误差,它是因变量真实值和以解释变量以及以前预测误差为基础的预测值之差。,5,一、一阶自回归模型,最简单且最常用的序列相关模型是一阶自回归AR(1)模型。定义如下:,参数 是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。,二、高阶自回归模型,更为一般,带有p阶自回归的模型,AR(p)误差由下式给出:,AR(p)的自相关将渐渐衰减至零,同时高于p阶的偏自相关也是零。,6,15.2 检验序列相关,在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),EViews提供了几种方法来检验当前序列相关。,15.2.1 Dubin-Waston统计量,EViews将D-W统计量视为标准回归输出的一部分。D-W统计量用于检验一阶序列相关,还可估算回归模型邻近残差的线性联系。D-W统计量是在下面定义中检验原假设:,如果序列不相关,D-W值在2附近。如果存在正序列相关,D-W值将小于2(最小为0),如果存在负序列相关,D-W值将在2-4之间。正序列相关最为普遍,根据经验,对于有大于50个数据和较少的解释变量,D-W值小于1.5的情况,说明存在强正一阶序列相关。参考Johnston and DiNardo(1997版6.6.1章)关于D-W检验和统计量显著性的论述。,7,Dubin-Waston统计量检验序列相关有三个主要不足:1D-W统计量的扰动项在原假设下依赖于数据矩阵X。2回归方程右边如果存在滞后因变量,D-W检验不再有效。3仅仅检验原假设(无序列相关)与备选假设(一阶序列相关)。其他两种检验序列相关方法:Q-统计量和Breush-Godfrey LM检验克服了上述不足,应用于大多数场合。例子:工作文件15_1eq_cs,8,15.2.2 相关图和Q-统计量,在方程工具栏选择View/Residual Tests/correlogram-Q-statistics。EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的Ljung-Box Q统计量。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q-统计量不显著,并且有大的P值。k 阶滞后的Q-统计量是原假设为序列没有k 阶自相关的统计量。计算式如下,是 j 阶自相关系数,T是观测值的个数。,9,例子:,下面是这些检验程序应用的例子,考虑用普通最小二乘估计的简单消费函数的结果:,10,浏览这些结果:系数在统计上是很显著的,并且拟合得很好。但是,如果误差项是序列相关的,那么估计OLS标准误差将是无效的,并且估计系数由于在方程右端有滞后因变量会发生偏倚和不一致。在这种情况下D-W统计量作为序列相关的检验是不合适的,因为在方程右端存在着一个滞后因变量。选择View/Residual test/Correlogram-Q-statistice会产生如下情况,11,15.2.3 序列相关LM检验,选择View/Residual Tests/Serial correlation LM Test,一般地对高阶的,含有ARMA误差项的情况执行Breush-Godfrey LM(Lagrange multiplier,拉格朗日乘数检验)。在滞后定义对话框,输入要检验序列的最高阶数。检验的原假设是:至给定阶数,残差不具有序列相关。EViews将给出两个统计量:F统计量和NR2(观测值个数乘以R2),NR2在原假设下服从 分布。F统计量分布未知,但常用来对原假设进行非正规检验。,12,上一例子中相关图在滞后值3时出现峰值。Q统计量在各阶滞后值中都具有显著性,它显示的是残差中的显著序列相关。进行序列相关的LM检验,选择View/Residual Tests/Serial Correlation LM Test,输入滞后2产生如下结果:,此检验拒绝直至2阶的无序列相关的假设。Q-统计和LM检验都表明:残差是序列相关的,并且方程在被用于假设检验和预测之前应该重新定义。,13,15.3 估计AR模型,在使用本章描述的工具之前,可以首先检验模型其他方面的错误。误差存在序列相关是模型定义存在的严重问题。特别地,应注意使用OLS得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。,15.3.1 一阶序列相关,在EViews中估计一个AR(1)模型,选择Quick/Estimate Equation打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数,应定义方程为:cs c gdp cs(-1)ar(1)。例子:工作文件15_1eq_cs_ar1,cst=-22.35+0.0924*GDPt+0.874*cst-1 ut=0.2789*ut-1,14,15.3.2 高阶序列相关,估计高阶AR模型稍稍复杂些,为估计AR(k),应输入模型的定义和所包括的各阶AR值。如果想估计一个有1-5阶自回归的模型,应输入:cs c gdp cs(-1)ar(1)ar(2)ar(3)ar(4)ar(5)例子:工作文件15_1eq_cs_ar5 可以输入在模型中想包括的各个自回归,EViews在消除序列相关时给予很大灵活性。例如,如果有季度数据而且想用一个单项来说明季节自回归,可以输入:cs c gdp cs(-1)ar(4)。,15,15.3.3 存在序列相关的非线性模型,EViews可以估计带有AR误差项的非线性回归模型。例如:估计如下的带有附加AR(2)误差的非线性方程,使用EViews表达式定义模型,在后面的方括号内描述AR修正项,对每一阶AR滞后项都应包括一个系数,每项之间用逗号隔开。cs=c(1)+gdpc(2)+ar(1)=c(3),ar(2)=c(4)EViews通过差分来转换这种非线性模型且使用Gauss-Newton迭代法来估计转换后的非线性模型。,16,15.3.4 存在序列相关的二阶段回归模型,通过把二阶段最小二乘法或二阶段非线性最小二乘法和AR项结合起来,对于在回归因子和扰动项存在相关性的情况和残差存在序列相关一样估计模型。如果原始回归模型是线性的,EViews使用marquardt算法来估计变形后模型的参数。如果原始回归模型是非线性的,EViews使用Gauss-Newton算法来估计AR修正后的模型。对于存在序列相关的情况,可以通过向方程添加AR项来调整TSLS。EViews会自动将模型转化为非线性最小二乘问题,并用工具变量估计模型。估计对话框中的Options 钮用来改变非线性工具变量过程的迭代次数限制和收敛标准。,17,例子:15_1eq_cs_tsls_ar 假设用二阶段最小二乘估计消费函数,考虑存在一阶序列相关。二阶段最小二乘变量列表为:cs c gdp ar(1)工具变量列表为:c gov log(m1)cs(-1)gdp(-1)注意因变量的滞后(cs(-1))和内生变量的滞后(gdp(-1))都包括在工具变量表中。类似地,考虑消费函数,cs c cs(-1)gdp ar(1)有效的工具变量表为:c gov log(m1)cs(-1)cs(-2)gdp(-1),18,15.3.5 含有AR项模型的估计输出,当估计某个含有AR项的模型时,在解释结果时一定要小心。在用通常的方法解释估计系数,系数标准误差和t-统计量时,涉及残差的结果会不同于OLS的估计结果。要理解这些差别,记住一个含有AR项的模型有两种残差:第一种是无条件残差,通过原始变量以及估计参数 算出。在用同期信息对y t值进行预测时,这些残差是可以观测出的误差,但要忽略滞后残差中包含的信息。,19,第二种残差是估计的一期向前预测误差。如名所示,这种残差代表预测误差。如果使用前期数据残差和当前信息作预测,实际上,通过利用滞后残差的预测能力,改善了无条件预测和残差。对于含有AR项的模型,基于残差的回归统计量,如R2(回归标准误差)和D-W值都是以一期向前预测误差为基础的。含有AR项的模型独有的统计量是估计的AR系数。对于简单AR(1)模型,是无条件残差的序列相关系数。对于平稳AR(1)模型,在-1(极端负序列相关)和+1(极端正序列相关)之间。一般AR(p)平稳条件是:滞后算子多项式的根的倒数在单位圆内。EViews在回归输出的底部给出这些根:Inverted AR Roots。如果存在虚根,根的模应该小于1。,20,15.3.6 EViews如何估计AR模型,课本上经常描述估计AR模型的技术。探讨最多的方法,如Cochrane-Orcutt(科克兰内-奥克特)、Prais-Winsten、Hatanaka以及Hildreth-Lu程序都是使用标准线性回归进行估计的多步方法。当使用滞后因变量作为回归自变量或使用高阶AR项定义模型时所有这些方法都有严重的缺点。见Davidson&MacKinnon(1994,pp.329-341),Greene(1997,p.600-607)。EViews估计AR模型采用非线性回归方法。这种方法的优点在于:易被理解,应用广泛,易被扩展为非线性定义的模型。注意:非线性最小二乘估计渐进等于极大似然估计且渐进有效。,21,为估计AR(1)模型,EViews通过将线性模型,转换成非线性模型。将第二个方程代入第一个方程,整理,参数通过应用Marquarat非线性最小二乘法估计。对于非线性定义,EViews将非线性模型,转换成:,使用Gauss-Newton算法来估计参数。,22,高阶AR定义情况也类似。例如,在方程中运用非线性最小二乘估计的非线性AR(3)如下:,23,15.4.1 非平稳时间序列,ARMA估计理论都是基于平稳时间序列。如果一个序列的均值和自协方差不依赖于时间,就说它是平稳的。非平稳序列的典型例子是随机游动:,是平稳随机扰动项。序列y的方差随时间增长,若设,则 的方差是。但是随机游动是差分平稳序列,因为y一阶差分后平稳:,差分平稳序列称为单整,记为I(d),d为单整阶数。单整阶数是使序列平稳而差分的阶数。对于上面的随机游动,有一个单位根,所以是I(1),同样,平稳序列是I(0)。检查序列平稳性的标准方法是单位根检验。,15.4 ARIMA理论,24,ARIMA(Autoregressive Integrated Moving average,自回归单整动平均)模型是简单的AR模型的一般化,使用三种工具来为扰动项的序列相关建模。自回归AR 上述的AR(1)模型只运用了一阶AR项,一般地,可以使用高阶AR项。每一个AR项对应于在无条件残差预测方法中的滞后值。P 阶的自回归模型AR(p)有下面的形式:,单整 I 每一单整阶数对应于对序列进行差分。一阶单整意味着对原始序列进行一次差分,二阶单整对应于进行两次差分,依此类推。,15.4.2 ARIMA模型,25,动平均MA 动平均预测模型使用预测误差的滞后值来改善当前预测。一阶动平均利用前期预测误差,二阶动平均利用前两期预测误差,以此类推。MA(q)有如下形式:,请注意,一些教科书和软件包的系数使用的是与常规相反的符号,因此MA系数也可能是相反的。自回归和动平均可以结合在一起形成ARMA(p,q)定义为:,尽管计量经济学家常应用ARMA模型于回归模型残差分析,它也可直接应用于序列。后种方法提供了一种单变量模型,将条件序列均值设定为一个常数,将残差估计成均值的序列差分。,26,15.4.3 ARIMA模型建模原则(Box-Jenkins 1976),在ARIMA预测中,用上述的三种程序块的结合来建立一个完整的预测模型。建立残差序列ARIMA模型的第一步是看其自相关性,可以使用相关图来达到这一目的。ARIMA模型建模过程被称为识别(勿与有关联立方程的著作中使用的同一词混淆)。残差当前值与过去值之间的相关性为选择ARIMA形式提供了导向。自相关很容易解释每一值是序列当前值和滞后一定区间的值的相关系数。偏自相关有些复杂,它们是考虑了序列所有值滞后后的预测能力后,计算当前和滞后序列的相关性。例如滞后6阶偏自相关是计算当 已在预测模型中时,的预测能力。实际上,偏自相关是当前期滞后已应用于 的预测后 的回归系数。如果怀疑左侧的因变量和其他的预测值之间存在一个分布滞后关系,那么可以在执行估计前看它们的交叉相关。,27,第二步是决定使用何种ARIMA模型。如果自相关函数以几何速率衰减,偏自相关函数一阶滞后后为零,即为一阶自回归模型。同样,如果自相关一阶滞后后为零,而偏自相关以几何速率衰减,即为一阶动平均。如果自相关有季节特征,这说明存在季节ARMA结构。例如:选择EViews example filesdataHSHS序列工作栏中View/Correlogram便可以检验基本住房序列相关图。,28,上图中存在季节频度的波动循环,建议用季节ARMA模型拟合HS序列。ARIMA分析的目的是控制残差过程的一种过度节约的表示法。也可仅用AR或MA来拟和残差的特性。使用AIC 准则和Schwarz准则来选择滞后阶数。建立合适的ARIMA模型后,应当确认模型没有残差自相关。检查扰动项的自相关和偏自相关,还要考虑是否有重要的预测能力被忽略。EViews提供了估计之后的诊断检查方案。,29,15.5 估计ARIMA模型,EViews估计的是考虑到具有右侧解释变量的ARIMA(p,d,q)设定形式,尽管这样的模型有时叫做ARIMAX模型:ARIMA模型是ARIMAX模型的特例,但是我们把这一类的模型都叫做ARIMA模型。为建立ARIMA模型,首先需要做以下两点:1确定单整阶数,差分因变量序列;2描述结构回归模型(因变量和解释变量),用前面介绍的方式加入AR或MA项。,30,15.5.1 差分因变量序列,一、差分 D算子被用来定义序列差分。定义一阶差分,仅把序列名写入D后的括号。例如,D(GDP)定义GDP的一阶差分,或GDP-GDP(-1)。更复杂的差分形式可以使用两个参数 n,s。D(x,n)定义序列x的n 阶差分,L是滞后算子。例如:D(GDP,2)定义了GDP的2阶差分:D(GDP,2)=GDP-2*GDP(-1)+GDP(-2)D(x,n,s)定义序列x的n阶普通差分,带有滞后s阶的季节差分:,例如:D(GDP,0,4)定义带有滞后4阶季节差分的零阶普通差分,即GDP-GDP(-4)。如果需要对数形式,可以使用Dlog算子,它以对数值返回差分。例如:Dlog(GDP)定义log(GDP)的一阶差分,即 log(GDP)-log(GDP(-1)。,31,二、在EViews中估计单整模型,可以直接在估计定义式中包含差分算子D。例如:GDPI(1),即GDP是一阶单整序列。对GDP估计ARIMA(1,1,1)模型,可以输入列表(15_1EQ_DY):D(GDP)c ar(1)ma(1)使用因变量差分因子D(GDP)定义模型,EViews将提供水平变量GDP的预测值。,15.5.2 确定ARMA形式,一、ARMA项,模型中AR和MA部分应使用关键词ar和ma定义。在上面AR定义中,我们已见过这种方法的例子。这对MA也同样适用。,32,例如,估计一个2阶自回归和1阶动平均过程ARMA(2,1),应将AR(1),MA(1),AR(2)和其它解释变量一起包含在回归因子列表中:y c gov ar(1)ar(2)ma(1)不必连续使用AR和MA项。例如想用4阶季节自回归模型来拟合季节变化,可以仅使用AR(4):y c gov ar(4)也可仅用MA项来定义纯动平均模型。如可以表示出残差的MA(2)模型。y c gov ma(1)ma(2)传统的Box-Jenkins模型或ARIMA模型除了常数外不具有任何解释变量。在这种情况下,解释变量将仅包含一个c加上AR,MA项,例如:y c ar(1)ar(2)ma(1)ma(2)这是标准的Box-Jenkins ARMA(2,2)模型。,33,二、季节ARMA项,对于带有季节因素的季度数据,Box and Jenkins(1976)建议使用季节自回归SAR和季节动平均SMA。SAR(p)定义为带有p阶滞后的季节自回归项。估计中使用的滞后多项式是AR项和SAR项定义的结合。与此类似,SMA(q)定义为带有q阶滞后的季节动平均。估计中使用的滞后多项式是MA项和SMA项定义的结合。存在SAR项则允许建立一个滞后多项式。例如:没有季节项的2阶AR过程,用滞后算子,则上式可表示为:,可以通过回归自变量的ar(1),ar(2)项来估计这个过程。,34,对于季度数据,可以加入sar(4)来表示季节因素,定义方程:y c x ar(1)ar(2)sar(4)估计误差结构为:,等价于,参数 和季节因素相联系。注意:这是对系数有非线性约束的AR(6)模型。在另一个例子中,无季节性的二阶MA过程如下,可以通过包含ma(1)和ma(2)来估计二阶MA过程。,35,对季度数据,可以添加sma(4)考虑季节性。例如定义方程:y c x ma(1)ma(2)sma(4)估计模型为:,等价于:,参数 和季节因素相联系。这是对系数有非线性约束的MA(6)模型。还可以在方程说明中同时包括SAR,SMA项。,36,15.5.3 ARIMA估计的输出,含有AR或MA项的模型的估计输出和OLS模型一样,只是在底部增加了一个AR,MA多项式的根的倒数。如果我们利用滞后多项式 和 写一般的ARMA模型:,输出表中报告的结果相当于下列多项式,和,如果 有绝对值大于1的实根或一对复根的逆在单位圆外(即模大于1),这意味着自回归过程是发散的。如果 的根的倒数在单位圆外,说明MA过程是不可逆的,应使用不同的初值重新估计模型,直到得到满足可逆性的动平均。如果估计的MA模型的根的模接近于1,有可能是对数据差分过多,这就很难估计和预测。如果可能的话,应减少差分阶数重新估计。,的根。这些根(可能是虚根)的模应小于1,如果不满足这个条件,输出表中将显示警告信息。,37,38,这个ARMA估计输出例子的结果对应于如下定义:,或等同于:,注意:MA项的符号和教科书中的符号可能相反。倒根的模接近于1,这对于许多宏观经济序列是很典型的。,39,15.5.4 ARMA估计选择,如前所述,带有AR或MA的模型用非线性最小二乘法估计。非线性估计方法对所有系数估计都要求初值。EViews自行确定初值。有时当迭代最大值达到时,方程终止迭代,尽管还未达到收敛。从前一步初值重新开始方程,使方程从中止处开始而不是从开始处开始。也可以试试不同的初值来保证估计是全部而不是局部平方误差最小,可以通过提供初值加速估计过程。为控制ARMA估计初值,在方程定义对话框单击options。在EViews提供的选项中,有几项设置初值的选择。EViews缺省方法是OLS/TSLS,这种方法先进行没有ARMA项的预备估计,再从这些值开始非线性估计。另一选择是使用OLS或TSLS系数的一部分作为初值。可以选择0.3,0.5,0.8或者可以将所有初值设为零。用户确定初值选项是User Supplied。在这个选项下,EViews使用C系数向量中的值。为设置初值,双击图标,为C系数向量开一窗口,进行编辑。,40,为适当地设置初值,需对EViews如何为ARMA设置系数多些了解。EViews使用C系数向量。它按下列规则为变量安排系数:1.变量系数,以输入为序。2.定义的AR项,以输入为序。3SAR,MA,SMA系数(以输入为序)这样,下面两种定义将有同样规格的系数 Y c X ma(2)ma(1)sma(4)ar(1)Y sma(4)c ar(1)ma(2)X ma(1)也可使用程序指令安排C向量值 param c(1)50 c(2)0.8 c(3)0.2 c(4)0.6 c(5)0.1 c(6)0.5 初值:常数是50,X系数的初值是0.8,ar(1)、ma(2)、ma(1)、sma(4)系数的初值分别是0.2,0.6,0.1,0.5。估计后,可在方程表达式Representation选项见到系数安排。也可以从估计方程中填写C向量,选择pros/update/coefs from equations。,41,15.5.5 处理估计问题,对于ARMA模型估计,要考虑一些问题。首先,MA模型很难估计。特别的,应避免高阶MA,除非模型非常需要,因为它们可能引起估计困难。例如,相关图上滞后57有一个大波峰并不要求必须在模型中包括MA(57),除非知道每57期都有特别事情发生。相关图中的突起很可能是序列中的一个或多个奇异值的结果。模型中含有许多MA项,将会丧失自由度,并且可能牺牲估计的稳定性和可靠性。如果MA过程的根的模接近于1,可能会遇到估计困难。Eviews会报告在迭代到最大次数时,不能收敛或不能提高平方和,这说明可能对数据差分过多,应检查序列相关图来看是否可以减少差分阶数来重新估计。,42,1、带有ARMA误差的TSLS 对ARIMA进行二阶段最小二乘法或工具变量法没有什么特殊困难。2、带有ARMA误差的非线性模型 EViews将估计带有自回归项的非线性最小二乘模型。EViews目前不估计有MA误差的非线性模型。然而,可以运用状态空间方法来定义估计这些模型。3、带有ARMA误差的加权模型 EViews不会自动估计带有ARMA误差项的加权模型如果对一加权模型加入AR项,加权序列会被忽略。,43,15.6 诊断检验,如果ARMA模型定义正确,模型残差将为白噪声。这意味着残差中应不存在序列相关。D-W统计量是当方程右边没有滞后变量时对一阶序列相关的检验。如上所述,对残差中序列相关更多的检验可以如:View/Residual Tests/Corre-logram-Q-Statistic和View/Residual Tests/Serial correlation LM Test。,44,15.7 多项分布滞后(PDLS),在经济分析中人们发现,一些经济变量,它们的数值是由自身的滞后量或者其他变量的滞后量所决定的,表现在计量经济模型中,解释变量中经常包含某些滞后变量。以投资函数为例,分析中国的投资问题发现,当年的投资额除了取决于当年的收入(即国内生产总值)外,由于投资的连续性,它还受到前1 个、2个、3个时期投资额的影响。已经开工的项目总是要继续下去的,而每个时期的投资额又取决于每个时期的收入,所以可以建立如下关于投资的计量经济方程,其中I 表示投资额,Y 表示国内生产总值。,45,对于有限滞后长度的情形,分布滞后模型的一般形式如下,系数 描述x对y作用的滞后。在模型中解释变量与随机误差项不相关的情况下,可以直接使用OLS估计参数。但是,一个显然的问题是解释变量之间,即x的当前和滞后值之间具有高度共线性,而共线性问题的一个直接后果是参数估计量失去意义,不能揭示x的各个滞后量对因变量的影响,所以必须寻求另外的估计方法。可以使用多项式分布滞后(Polynomial Distributed Lags,PDLs)来减少要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对低阶的多项式。p 阶PDLs模型限制 系数服从如下形式的p阶多项式,j=0,1,2,k(15.2),(15.1),一、多项式分布滞后模型的估计方法,46,是事先定义常数:,PDLs有时被称为Almon分布滞后模型。常数 仅用来避免共线性引起的数值问题,不影响 的估计。这种定义允许仅使用参数 p 来估计一个x 的 k 阶滞后的模型(如果 p k,将显示“近似奇异“错误信息)。定义一个PDL模型,EViews用(15.2)式代入到(15.1)式,将产生如下形式方程,其中,(15.3),47,一旦从(15.3)式估计出,利用(15.2)式就可得到 的各系数。这一过程很明了,因为是 的 线性变换。定义一个PDLs要有三个元素:滞后长度k,多项式阶数(多项式最高次幂数)p和附加的约束条件。一个近端约束限制x对y一期超前作用为零:,一个远端约束限制x对y的作用在大于定义滞后的数目衰减:,如果限制滞后算子的近端或远端,参数个数将减少一个来解释这种约束。如果对近端和远端都约束,参数个数将减少二个。EViews缺省不加任何约束。,48,二、如何估计包含PDLs的模型,通过PDL项定义一个多项式分布滞后,信息在随后的括号内,按下列规则用逗号隔开:1、序列名 2、滞后长度(序列滞后数)3、多项式阶数 4、一个数字限制码来约束滞后多项式:1=限制滞后近端为零 2=限制远端 3=两者都限制 如果不限制滞后多项式,可以省略限制码。方程中可以包含多个PDL项。例如:sales c pdl(y,8,3)是用常数,解释变量y的当前和8阶分布滞后来拟合因变量sales,这里解释变量y的滞后系数服从没有约束的3阶多项式。,49,类似地,y c pdl(x,12,4,2)用常数,解释变量x的当前和12阶分布滞后拟合因变量y,这里解释变量x的系数服从带有远端约束的4阶多项式。PDL也可用于二阶段最小二乘法TSLS。如果PDL序列是外生变量,应当在工具表中也包括序列的PDL项。为此目的,可以定义PDL(*)作为一个工具变量,则所有的PDL变量都将被作为工具变量使用。例如:如果定义TSLS方程为 sales c inc pdl(y(-1),12,4)使用工具变量 z z(-1)pdl(*)则y的分布滞后和z,z(-1)都被用作工具变量。PDLs不能用于非线性定义。,50,三、例子 投资INV关于关于GDP的 分布滞后模型的结果如下,51,逐个观察,INV滞后的系数统计上都不显著。但总体上讲回归具有一个合理的R2,(尽管DW统计量很低)。这是回归自变量中多重共线的典型现象,建议拟合一个多项式分布滞后模型。估计一个无限制的5阶多项式滞后模型,输入变量列表:log(INV)c PDL(log(GDP),12,5),窗口中显示的多项式估计系数,PDL01,PDL02,PDL03,分别对应方程(15.3)中Z1,Z 2,的系数。,52,方程(15.1)中的系数 在表格底部显示。,表格底部的滞后值是分布滞后的估计系数值,并且在平稳的假设下有GDP对INV的长期影响的解释。,53,15.8 单位根检验,EViews提供两种单位根检验:Dickey-Fuller(DF)、增广DF(Augmented DF)检验和Phillips-Perron(PP)检验。本节提供这两种检验的一些理论背景。,一、ADF检验,为说明ADF检验的使用,先考虑一个AR(1)过程,是参数,假设为白噪声。如果-1 1,y是平稳序列。如果=1,y是非平稳序列(带漂移的随机游动)。如果这一过程在某一点开始,y的方差随时间增长趋于无穷。如果 的绝对值大于1,序列发散。因此,一个序列是否平稳,可以检验 是否严格小于1。DF和PP都用单位根作为原假设,。因为发散序列没有经济学含义,所以备选假设为单边假设。,(15.4),54,从方程两边同时减去,其中,所以原假设和备选假设可改为,(15.5),单位根检验可以看作对 进行t 检验。对于(15.5)可使用常规的OLS方法得到 的估计量和t统计量(即系数的估计量除以其标准偏差),但是这时t统计量不再渐近正态,甚至不对称。Dickey和Fuller(1979)通过蒙特卡洛方法研究发现,检验 的统计量的临界值依赖于回归的形式(是否引进了常数项和趋势项),并且和样本长度n有关,一般临界值随着n的增大而减小。t 统计量在原假设下不具有一般 t 分布。Dickey和Fuller对选择的样本序列模拟了临界值,近年来Mackinnon又进行了更大规模的模拟,允许D-F计算的临界值适用于任何样本和任何数目的右边变量。EViews为单位根检验提供了这些临界值。,(15.6),55,上面描述的简单单位根检验称为DF检验,该检验只有当序列为AR(1)时才有效。如果序列存在高阶滞后相关,这就违背了扰动项是白噪声的假设。ADF和PP检验使用不同的方法来控制高阶序列相关。ADF方法通过在回归方程右边加入因变量y的滞后差分项来控制高阶相关,扩展定义将检验,EViews将DF,ADF检验都看成为ADF检验。ADF检验考虑如下三种回归形式:,56,通过在模型中增加的滞后项来消除残差的序列相关性。EViews在检验回归时,询问是否包含有其它外生变量,即上面三种形式:包含截距,即常数项,包含截距和线性趋势项,或两者都不包含。如果序列含有趋势(确定的或随机的),序列回归中应既有常数又有趋势。如果序列没有表现任何趋势且有非零均值,回归中应仅有常数。如果序列在零均值波动,检验回归中应既不含有常数又不含有趋势。,二、Phillips-Perron(PP)检验,Phillips和Perron(1988)提出一种非参数方法来控制序列中高阶序列相关。对AR(1)的PP检验为:,57,ADF检验通过在方程右边添加滞后差分项来修正高阶序列相关。PP检验参数的t 统计量来修正AR(1)的序列相关。这种修正方法是非参数的,因为我们使用在零频率的谱估计。零频率对未知形式的异方差性和自相关性较稳健。EViews使用Newey-West异方差自相关一致估计,q是截断滞后值。PP统计量由下式计算:,是t 统计量;是 的标准差;s是检验回归标准差。,58,PP统计量渐进分布同ADF的t统计量一样。EViews显示Mackinnon临界值。对PP检验,必须为Newey-West 纠正定义截断滞后因子q,即要包括的序列相关期数。对话框开始包括N-W自动截断滞后选择(f loor函数返回的是不超过括号中数的最大整数),这仅基于检验回归中使用的观测值数,也可定义为任何整数。,59,三、EViews进行单位根检验,双击序列名打开序列窗口,选择View/unit Root Test,60,进行单位根检验必须定义四项:1、选择检验类型,ADF检验或PP检验;2、定义序列在水平值、一阶差分、二阶差分的情况下进行单位根检验。可以使用这个选项决定序列中单整的阶数。如果检验在水平值未拒绝检验而在一阶差分拒绝检验,序列中含有一个单位根,是一阶单整I(1)。3、定义在检验回归中是否含有常数,常数和趋势,或二者都不包含。这一选择很重要,因为检验统计量在原假设下的分布随上3种情况不同而变化。4、定义序列相关阶数。对于ADF检验,定义加入检验回归的滞后一阶差分个数。对PP检验,定义计算Newey-West异方差和自相关(HAC)一致谱(在零频率)估计的滞后截断。定义上述选项后,单击OK进行检验。,61,EViews显示检验统计量和估计检验回归。对ADF检验,检验统计量是检验回归滞后因变量的t 统计量,注意关于 的统计检验是单边检验,当计算得到的t统计量的值小于临界值时拒绝原假设(即否定存在单位根)。对PP检验,检验统计量是调整t统计量。如果t统计量小于临界值,拒绝原假设。单位根检验后,应检查EViews显示的估计检验回归,尤其是如果对滞后算子结构或序列确定性不肯定的话,可以选择有常数项、有常数项和趋势或两者都没有三种不同的回归形式,或滞后阶数来重新检验。下面的例子(工作文件BASICIP)是对序列IP的水平值进行ADF单位根检验的结果。序列IP的t统计量是-0.223277,大于所有的临界值,因此接受原假设,即存在单位根,IP可能是I(1)的。,62,63,下面是对序列IP的一阶差分进行ADF单位根检验的结果。序列D(IP(-1)的系数的 t 统计量-7.479534小于所有的临界值,因此拒绝原假设,即IP的一阶差分序列不存在单位根,即D(IP)是平稳的I(0)序列,并由此确定IP是I(1)序列。,64,15.10 命 令,命令equation eq_gdp.ls gdp c ar(1)ar(2)ma(1)ma(2)用来用一个ARMA(2,2)模型拟合序列GDP并把结果储存在方程 EQ_GDP中。命令 eq1.auto(4)用来检验方程EQ1残差序列直到四阶的相关系数。命令eq1.correlogram(12)用来显示方程直到12阶的残差相关图。命令equation eq2.ls gdp c pdl(m1,12,3)使用一个三次多项式拟合m1直到12阶的值。命令gdp.ruoot(4,c)用来运行一个带常数和四阶滞后的ADF检验。命令gdp.uroot(4,t,h)用来运行一个带常数和线性趋势的PP检验,