第8章异方差性.ppt
计量经济学导论第四版伍德里奇,一、异方差-基本概念,定义:不可观测因素的方差随总体的不同部分(由不同解释变量值所决定)而变化,即:,异方差对OLS影响:通常的t、F检验以及置信区间不确当OLS不是BLUE,也不再是渐进有效的不导致估计系数出现偏误或产生不一致拟合优度指标的解释也不受影响,二、OLS估计后的异方差-稳健推断,适用情况:异方差形式未知1.出现异方差时的标准误和t统计量,例8.1P253用stata求异方差-稳健的t统计量:WAGE,gen single=(married)gen male=(female)gen marrmale=male*married gen marrfem=female*married gen singfem=single*female reg lwage marrmale marrfem singfem educ exper expersq tenure tenursq,robust,异方差-稳健t估计,OLS估计:reg lwage marrmale marrfem singfem educ exper expersq tenure tenursq,异方差-稳健的t统计量推断的适用性:,异方差-稳健t检验统计量只有在样本容量越来越大时才能使用。小样本时可能不服从t分布,异方差-稳健的F统计量例8.2 P255 GPA3.DTA,例8.2 P255 GPA3.DTA,1.异方差-稳健回归得R-square=0.4006(注意是春季学期,所以有条件项),2.联合显著性检验约束方程回归求R-squared=0.3983,普通OLS回归,普通OLS回归的约束方程回归,计算F统计量:,异方差-稳健的LM检验,例8.3 P256 CRIME1.DTA,例8.3 P256 CRIME1.DTA,Turning point for avgsen,di _bavgsen/(2*_bavgsensq)-17.276862,1.ROBUST回归,受约束方程robust回归并预测残差rur,受约束变量avgsen对其他没有排除的自变量回归,保留残差r1,注意回归不包含原来的y,受约束变量avgsensq对其他没有排除的自变量回归,保留残差r2,对观测值求rrur,无截距语句与robust不能同时使用,?求F统计量的p值,用1对每个rrur回归,得到LM统计量=n-SSR1,SSR1就是该步骤的残差平方和,异方差-稳健的LM=4.00,查表,在自由度为2的 分布中,10%,X=4.61;5%,X=5.99;1%,X=9.21,不能拒绝H0.,2.同理求普通LMreg narr86 pcnv ptime86 qemp86 inc86 black hispanpredict urr,residreg avgsen pcnv ptime86 qemp86 inc86 black hispanpredict ur11,residreg avgsensq pcnv ptime86 qemp86 inc86 black hispanpredict ur22,residgen urr11=urr*ur11gen urr22=urr*ur22gen io=1reg io urr11 urr22,?,predict ubar1,residquite reg avgsen pcnv ptime86 qemp86 inc86 black hispanpredict r1,rquite reg avgsensq pcnv ptime86 qemp86 inc86 black hispanpredict r2,rquite gen ur1=ubar1*r1quite gen ur2=ubar1*r2gen iota=1reg iota ur1 ur2,noconstantscalar hetlm=e(N)-e(rss)scalar pval=chi2tail(2,hetlm)display _n Robust LM statistic:%6.3f hetlm/*/_n Under H0,distrib Chi2(2),p-value:%5.3f pvalRobust LM statistic:3.997Under H0,distrib Chi2(2),p-value:0.136predict ubar2,residreg ubar2 pcnv avgsen avgsensq ptime86 qemp86 inc86 black hispan scalar lm1=e(N)*e(r2)display _n LM statistic:%6.3f lm1/*通常的LM=3.54异方差稳健LM=4.00仍然不能拒绝H0问题:语句的意思,有没有直接计算LM的命令(robust LM statistic已有,则前面的计算?),三、异方差的检验,原理:,方法1:异方差的BPagan检验,STATA准备:BPagan检验不是标准语句,需要下载,操作如下:输入命令:.findit bpagan.search bpagan,all,得到词条:bpagan from http:/fmwww.bc.edu/RePEc/bocode/b 点击后按install 然后help bpagan,可以看到:BPAGAN:module to perform Breusch-Pagan test for heteroskedasticity/,方法2:异方差的怀特检验,原理:步骤:,异方差的BPagan检验和white检验例8.4,8.5 P259 HPRICE1.DTA,1.普通回归,2.异方差检验,?whitetst,fitted option fitted not allowedP值都不显著,存在异方差,3.因变量采用对数形式回归及检验:消除异方差,问题:两个检验出现矛盾的结论?,注意:进行异方差检验时应该首先检验模型的误设问题,否则异方差检验可能都是显著的,四、加权最小二乘WLS估计,若已知异方差的形式,采用WLS比OLS更有效,且能得到确当的t、F统计量。,情况1:除一个常数倍数外异方差是已知的:,WLS原理,WLS应用:例8.6 P265 401KSUBS.DTA(与答案例子不同),1.OLS回归,得到第一列结果。(注意,只用单身个人数据 if fsize=1),2.WLS回归,得第二列结果WLS语句:aw=1/inc,3.gen agenew=(age-25)2 注意数据集中对age的解释有误。控制新变量的OLS回归,得第三列结果(?系数及t与书上略有差异),4.控制新变量的WLS回归,得第四列结果(?系数及t与书上略有差异),问题:什么时候权数是除以h,什么时候是除以根号h?取决于是否先对变量进行变换。不变换,则无根号,WLS权数的选择,多数情况中,对权数的选择有一定随机性当研究问题没有个人层次数据而只有样本小组的均值数据时,如果个体方程同方差,则可以用小组人数(如企业规模,城市人口数)作为权数,以保证较大的子样本得到较高权数但由于总体样本平均误差的形式不确定,在利用人均数据估计模型时研究倾向于简单使用OLS并计算稳健的标准误和统计量另一种方法是以组规模进行加权,但在WLS估计中报告异方差-稳健统计量。,情况2.异方差形式未知,需估计异方差函数:可行GLS,原理:如果异方差形式未知,则模型化函数h,并利用数据来估计这个模型中的未知参数,在GLS变换中用每个hi的估计值取代hi得到原方程的可行的GLS(FGLS)估计量。因为使用同样的数据进行估计,所以FGLS不是无偏的,但是一致的,且比OLS渐进有效。,模型化函数h的一种特殊方法:,线性模型不能保证预测值都为正,但进行WLS变换要求估计的方差必须为正,估计hi的另一个方法,FGLS应用:例8.7 P270 SMOKE.DTA,1.普通OLS回归,价格、收入都不显著,1.收入对吸烟量的影响 display _blincome*10/100 0.088026822.年龄与吸烟量的二次关系转折点 display _bage/2/_bagesq-42.7081163.怀特检验whitetst Whites general test statistic:52.17226 Chi-sq(25)P-value=.00114.whitetst,fitted Whites special test statistic:26.57258 Chi-sq(2)P-value=1.7e-06 5.Bpagan检验 bpagan cigs lincome lcigpric educ age agesq restaurn Breusch-Pagan LM statistic:1021.143 Chi-sq(7)P-value=3.e-216因此有强证据证明存在异方差,2.计算残差u并将残差平方的对数与自变量回归,注:答案少了一步 predict ub,resid,3.求上述回归的拟合值并用该拟合值取指数后的倒数为权重进行WLS,xb calculate linear prediction收入显著,价格不显著但系数变化大,五、再议线性概率模型,当因变量y是二值变量,除非所有斜率参数都为零,否则就一定包含异方差。方法1:继续使用OLS,同时也要计算检验统计量的稳健标准误例8.8 P275 MROZ.DTA,例8.8 P275 MROZ.DTA,1,普通OLS,2.Robust回归,在本例中差异不大,方法2:用加权最小二乘法估计,例8.9 P277 GPA1.DTA,步骤2的解释:即当hi的拟合值为负,不能作为权数,因此,,例8.9 P277 GPA1.DTA,gen parcoll=(x1 I x2)代表x1与x2至少有一个为1,1.普通OLS回归,2.求稳健标准误,判断异方差存在与否,并无明显差异,异方差证据不强烈,2.求出上述回归的拟合值并构造h进行WLS,