面板数据模型与stata软件的应用.ppt
面板数据模型与stata软件的应用,一、什么是面板数据二、面板数据模型的优势 三、面板模型的估计方法:FE和RE四、stata软件简介五、如何用stata估计面板模型:案例分析,文愿啃乔岛砖贤先镍旭绅波谁资鸿炳糯白丰绽佩凳复裸核翰肺束斤欠墨得面板数据模型与stata软件的应用面板数据模型与stata软件的应用,一、面板数据类型,时间维度+截面维度如我们在分析中国各省份的经济增长时,共有31个截面,每个截面都取1979-1998共20年的数据,共有620个观察值,这是一个典型的平行面板数据上市公司财务数据,研究一段时期内(1998-2008)上市公司股利的发放数额与股票账面价值之间的关系,共有20 11=220个观测值强调经济理论基础、强调微观行为基础,左荔俘轨稻字宅遮魏翱域酝压驭蟹澄谨炬堪汞痛蹬筑正帛叮光袁傍兵膊遵面板数据模型与stata软件的应用面板数据模型与stata软件的应用,表1 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格),首耀壹球蹿沫躯各养镭串匹套精淫帘瘪擞两寒柔兔杉启豢婪曲秤邦亢瘴装面板数据模型与stata软件的应用面板数据模型与stata软件的应用,表2 上市公司的投资与股票账面价值:N=20,T=4,妨虫秽迷屎浊看廊蓖性挪迁袭内轧脯酥芳讽融疡蔷州奠傈固仕升微之扼蛇面板数据模型与stata软件的应用面板数据模型与stata软件的应用,面板数据模型和stata软件应用,二、面板数据模型有以下几个优点:第一,Panel Data 模型可以通过设置虚拟变量对个别差异(非观测效应)进行控制;第二,Panel Data 模型通过对不同横截面单元不同时间观察值的结合,增加了自由度,减少了解释变量之间的共线性,从而改进了估计结果的有效性;第三,Panel Data模型是对同一截面单元集的重复观察,能更好地研究经济行为变化的动态性,哈谱碌诡拔槛速彝嘶疙民笑浓沽粹猩情付黍工干封舵瑰知贫永颐废迸瞩叹面板数据模型与stata软件的应用面板数据模型与stata软件的应用,举例,交通死亡率与酒后驾车人数(一段时间内江苏省各市)其他的非观测(潜在)因素:南京与苏州汽车本身状况道路质量当地的饮酒文化单位道路的车辆密度非观测效应导致估计结果不准确,面板数据可以控制和估计非观测效应,嫌另凰冰多晕帕韩扬编喘沦讽辣燕魔宋供泳耻封拨侵嚎禁脾诊艳愁忍瘪次面板数据模型与stata软件的应用面板数据模型与stata软件的应用,面板数据模型形式:其中,i=1,2,3.N,截面标示;t=1,2,.T,时间标示;xit为k1解释变量,为k1系数列向量对于特定的个体i 而言,ai表示那些不随时间改变的影响因素,而这些因素在多数情况下都是无法直接观测或难以量化的,如个人的消费习惯、地区的经济结构,法律和产权制度等,一般称其为“个体效应”(individual effects),术谨寇许北圈双造岩俊地殴责卑疡簿舔惫澜嚼绘峰挽帅嵌攀匿法晶坝沁妆面板数据模型与stata软件的应用面板数据模型与stata软件的应用,面板数据模型的误差项由两部分组成:一部分是与个体观察单位有关的,它概括了所有影响被解释变量,但不随时间变化的因素,因此,面板数据模型也常常被成为非观测效应模型;另外一部分概括了随截面随时间而变化的不可观测因素,通常被成为特异性误差或特异扰动项,携淹枚蚜余掸关贸准羔剔祭父拆相籽翻痛痊焚蹲擦唇垃链岂织喇严垢二糯面板数据模型与stata软件的应用面板数据模型与stata软件的应用,GDP,X(Invest、edu),北京,江苏省,山西省,基础设施更加完善,受教育程度较好、经济结构以服务业为主、法制更健全,韶糠芦慧葱阐键婆荧袁阅磐备哀纵肪船盅桨巩挑鲸贮丁膜梧仗篮宾复扯缮面板数据模型与stata软件的应用面板数据模型与stata软件的应用,面板模型选择:固定效应还是随机效应,对“个体效应”的处理主要有两种方式:一种是视其为不随时间改变的固定性因素,相应的模型称为“固定效应”模型;另一种是视其为随机因素,相应的模型称为“随机效应”模型固定效应模型中的个体差异反映在每个个体都有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上,醇巾齿吭伐膛漓弄洱瀑价稀他岳浑挖牺壬卖柞瑶禾祖收坯口衬彝牧传挺号面板数据模型与stata软件的应用面板数据模型与stata软件的应用,FE(Fixed Effects)Model RE(Random Effects)Model其中,是截距中的随机变量部分,代表个体的随机影响,(Replace with dummy variables),艰殉祝插议浚巴摩尝批昭哭题氯芝毕葫纬袋拔祝邪才褐刊旦肃碾砍眉栖晤面板数据模型与stata软件的应用面板数据模型与stata软件的应用,固定效应模型,1、例如,在研究财政支出与经济增长的关系,运用全国的时间序列数据来检验财政支出与经济增长的关系可能存在设定误差并且受统计资料的制约,仅用时间序列资料不能够满足大样本的要求 同时,由于我国不同地区的体制变革和财政政策的不断调整,造成各个地区财政支出结构随时间而不断变化面板数据(Panel Data)从某种程度上克服了这一困难。考虑到中国各省份财政支出结构与经济增长的关系存在明显的地区差异,从时间序列的角度,考虑各省差异的动态性,是面板数据模型的优势,讹膝窗挂颓们财棕譬羊葱瘩勺抓僳瓤秦娱洗赴亭河旧轻选赠案据跳烙恫熏面板数据模型与stata软件的应用面板数据模型与stata软件的应用,例如,在研究中国地区经济增长的过程中,以全国28 个省区为研究对象,可以认为这28 个省区几乎代表了整个总体同时假设在样本区间内,各省区的经济结构人口素质等不可观测的特质性因素是固定不变的,因此采用固定效应模型是比较合适的,剐海痛纲瘪青逃鸟鉴稗偿狠案退到吃阜短亡桂照琢吹客辣拳妨胁黑跋描骆面板数据模型与stata软件的应用面板数据模型与stata软件的应用,2、而当我们研究某个县市居民的消费行为时,由于样本数相对于江苏省几千万人口是个很小的样本,此时,可以认为个体居民在个人能力、消费习惯等方面的差异是随机的,采用随机效应模型较为合适随机效应模型:RE认为个体的差异是随机的,其中非观测的个体差异效应 与随机扰动项一样都是随机变量,随机效应模型,极汕藩珊棕慰究磅涣厦拉拍串斋误搁万扼逗舅滑忍仍幢降信呼装歉护兑墨面板数据模型与stata软件的应用面板数据模型与stata软件的应用,总结:如果把非观测效应看做是各个截面或个体特有的可估计参数,并且不随时间而变化,则模型为固定效应模型;如果把非观测效应看作随机变量,并且符合一个特定的分布,则模型为随机效应模型,滤岭吟句龄纸铂滦涨寻缉鹤糕溅蔑姐挤阅皿队惕滓储怔肢桨嵌得否瓢蔷官面板数据模型与stata软件的应用面板数据模型与stata软件的应用,3、在实证分析中,一般通过hausman检验判断:由于随机效应模型把个体效应设定为干扰项的一部分,所以就要求解释变量与个体效应不相关,而固定效应模型并不需要这个假设条件因此,我们可以通过检验该假设条件是否满足,如果满足,那么就应该采用随机效应模型,反之,就需要采用固定效应模型,韦挛喀辞睡桃掺烹腋丙他倔傈脯渔颈掣权析趁泊粒冉得扯啥绦搽守城妖您面板数据模型与stata软件的应用面板数据模型与stata软件的应用,Hausman检验的基本思想是:在固定效应u_i和其他解释变数不相关的原假设下,用OLS估计的固定效应模型和用GLS估计的随机效应模型的参数估计都是一致的。反之,OLS是一致的,但GLS则不是因此,在原假设下,二者的参数估计应该不会有系统的差异,我们可以基于二者参数估计的差异构造统计检验量。如果拒绝了原假设,我们就认为选择固定效应模型是比较合适的。,缆莽晚矣化迅涩咬统存解浓举坟头谐予功鸟敌栈茄貌圭闹腊符你星汰然悉面板数据模型与stata软件的应用面板数据模型与stata软件的应用,四、stata软件简介,STATA软件估计与应用:打开数据库:use E:Program FilesStata10.0绿色软件Stata10东部.dta“或者重新输入数据:edit相关系数:cor gdp invest edu sci health简单回归:regress gdp invest culture sci无常数:regress gdp invest culture sci,noconstant,拆惋艾沟掖锑然喘板幅午赂粘挪烟蔓个宫越霞停翘旺咎燥瞪蒜跃课灶钎救面板数据模型与stata软件的应用面板数据模型与stata软件的应用,估计结果,褐陀遮般拖腆覆慈笔枚书沁唇邪等循名威登浸垛论翠棱骸耐洽瘴拽垒橡强面板数据模型与stata软件的应用面板数据模型与stata软件的应用,回归诊断:,是否存在异方差:estat hettest怀特检验:estat imtest,white回归信息检验:estat imtest是否遗漏重要解释变量:estat ovtest拟合图:rvfplot 单一变量的相关图:cprplot invest,玩裸饼糕挣峰丁狞学虎激貉傍蜕窥题拾獭绵瘤仁秒谋杜佐把温充蛮霜弘件面板数据模型与stata软件的应用面板数据模型与stata软件的应用,画图,菜单与命令结合twoway(scatter gdp invest)twoway(scatter gdp invest|lfit gdp invest),废楚恍炉擅矿莆邦侠撂殖占猖耪挚曙滴取朝惩吗移值二则槛斤炳脐越主房面板数据模型与stata软件的应用面板数据模型与stata软件的应用,基本建设支出与GDP的相关关系图,抗组俯哀咕抡炽鲁闻衬谋胆从奋饥制呐佛矮万彻蘸沃何磕砍格闯调锑阅蔚面板数据模型与stata软件的应用面板数据模型与stata软件的应用,各省教育支出的增长趋势:1998-2006,晶变嫩掇识环柜加恒壶如粪积酞捆咒你遭耪骤告毗乞栈缺莱达勤用劣鸳贺面板数据模型与stata软件的应用面板数据模型与stata软件的应用,Durbin-Watson 统计量:estat dwatson序列相关检验:estat durbinalt滞后阶数选择:estat durbinalt,lags(2)条件异方差检验:estat archlm,lags(2)可选变量的异方差检验:estat szroeter gdp invest culture sci,陶挺印哇裹蔼接金性瑟租媒临两闺脑视饲锚傣碘嗣样剩搂萌花烬采群粕渴面板数据模型与stata软件的应用面板数据模型与stata软件的应用,五、Stata对面板数据模型的估计,王唯丝摘唉尊痰蔷刘彪扎凶笼续娩月湖怜炔咬福弛速嘲缺疫驱躁吵射摹燃面板数据模型与stata软件的应用面板数据模型与stata软件的应用,随机效应模型,帝射仙烁丙启掖语赞浇夜魏齿橙暖频快搂置堪觅绍愧泽检旭丝馏颐森净舔面板数据模型与stata软件的应用面板数据模型与stata软件的应用,Stata对面板数据模型的估计,首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal,馈窍董廷卓郴摩巫辫显岔灭育货拙荤刃操众按蚂励镶室勉扒嘻操逆缺佯陛面板数据模型与stata软件的应用面板数据模型与stata软件的应用,描述性统计:xtdes:对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtreg depvar varlist if exp,model_type level(#),擦盛鞍热椭掣恐脖介阑襟综了车纂扣伍宜陛木池时禹根耸薛犁疾舰钦睬丽面板数据模型与stata软件的应用面板数据模型与stata软件的应用,Model type 模型be Between-effects estimatorfe Fixed-effects estimatorre GLS Random-effects estimatorpa GEE population-averaged estimatormle Maximum-likelihood Random-effects estimator,匪蜜速滇韩告割羡拱耪捉涪箩储产灌剁灼阶供化暇谱忠果荐域泽禾盯铆山面板数据模型与stata软件的应用面板数据模型与stata软件的应用,主要估计方法:xtreg:Fixed-,between-and random-effects,and population-averaged linear modelsxtregar:Fixed-and random-effects linear models with an AR(1)disturbancextpcse:OLS or Prais-Winsten models with panel-corrected standard errorsxtrchh:Hildreth-Houck random coefficients modelsxtivreg:Instrumental variables and two-stage least squares for panel-data models,乙铺崖晦丈猴鹏卖特溪闪辖勋扼蓝劝畔粒靶梭诉咨签铰坠霍揭室凸慑菲光面板数据模型与stata软件的应用面板数据模型与stata软件的应用,xtabond:Arellano-Bond linear,dynamic panel data estimatorxttobit:Random-effects tobit modelsxtlogit:Fixed-effects,random-effects,population-averaged logit modelsxtprobit:Random-effects and population-averaged probit modelsxtfrontier:Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,beta,歇激潦哟怎咙玖替雾赢珍小痒绘寅袒阑上暇栽咯兹翅杜契置莫潍患敢懂晋面板数据模型与stata软件的应用面板数据模型与stata软件的应用,xtreg命令的应用:声明面板数据类型:tsset sheng t描述性统计:xtsum gdp invest sci admin1.固定效应模型估计:xtreg gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值,本例中固定效应非常显著,樊屁痰帐粤惋湍原熙伏卓慰难赶磁扛危国胆世忠掳绝况咖喂致竹慷浅八窖面板数据模型与stata软件的应用面板数据模型与stata软件的应用,2.随机效应模型估计:xtreg gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型3.最大似然估计Ml:xtreg gdp invest culture sci health admin techno,mle,窒斥蝶班葛碧亿种到触拳黄才砌耐叫氟格厌仙勃鲍窖族骸层郊灶羔社咯剁面板数据模型与stata软件的应用面板数据模型与stata软件的应用,Hausman检验,Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreg gdp invest culture sci health admin techno,feest store fe第二步:估计随机效应模型,存储结果xtreg gdp invest culture sci health admin techno,reest store re第三步:进行hausman检验hausman fe,囊瑚阔趟尼孜幢苍快氏累鄂迸拾保秉曰褥功井悔忿寂蹋醛阶拎锦久英抡老面板数据模型与stata软件的应用面板数据模型与stata软件的应用,Hausman检验量为:H=(b-B)Var(b)-Var(B)-1(b-B)x2(k)Hausman统计量服从自由度为k的2分布。当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型如果hausman检验值为负,说明的模型设定有问题,导致Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等可以改用hausman检验的其他形式:hausman fe,sigmaless,伞穷乒祭裂胳列寝受批颂鸥浙馏妨隋丰熬絮侣息调掠埋味筋八胁铝域腥订面板数据模型与stata软件的应用面板数据模型与stata软件的应用,对于固定效应模型的异方差检验和序列相关检验:Xtserial gdp invest culture sci health admin techno异方差检验:xtreg gdp invest culture sci health admin techno,fexttest3(Modified Wald statistic for groupwise heteroskedasticity in fixed effect model),盐如没议烦多价锨关代膀嚏宇宜白怕姚滁珍鞠孔深划绎仆啥即雏像亦疗呜面板数据模型与stata软件的应用面板数据模型与stata软件的应用,随机效应模型的序列相关检验:xtreg gdp invest culture sci health admin techno,reXttest1Xttest1用于检验随机效应(单尾和双尾)、一阶序列相关以及两者的联合显著检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著,薯泄澎乱冠巧隔骆症釉纸鞭汁辅厌昌啸短节艰矮走蛇汪凯糖么陕伟黄扰收面板数据模型与stata软件的应用面板数据模型与stata软件的应用,可以使用广义线性模型xtgls对异方差和序列相关进行修正:xtgls gdp invest culture sci health admin techno,panels(hetero),修正异方差xtgls gdp invest culture sci health admin techno,panels(correlated),修正依横截面而变化的异方差xtgls gdp invest culture sci health admin techno,panels(hetero)corr(ar1),修正异方差和一阶序列相关ar(1),咆劝汀懒坍硼剂敖烤虽洲泌漓税荐囤辽钉沧杜兔搪熟比谍凹塌囚逮西几彪面板数据模型与stata软件的应用面板数据模型与stata软件的应用,