面板数据分析.ppt
,面板数据分析 Panel Data,1.面板数据模型简介,面板数据(panel data)也称作时间序列与截面混合数据(pooled time series and cross section data)。面板数据是截面上个体在不同时点的重复观测数据。,N=30,T=50的面板数据示意图 中国各省级地区消费性支出占可支配收入比例走势图,面板数据分两种特征:(1)个体数少,时间长。(2)个体数多,时间短。面板数据用双下标变量表示。yi t,i=1,2,N;t=1,2,Ti 对应面板数据中不同个体。N表示面板数据中含有N个个体。t 对应面板数据中不同时点。T表示时间序列的最大长度。利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。,yi t,i=1,2,N;t=1,2,T若固定t不变,yi.,(i=1,2,N)是横截面上的N个随机变量;若固定i不变,y.t,(t=1,2,T)是纵剖面上的一个时间序列(个体)。,面板数据是不同个体和不同时期被观察的数据(Longitudinal or Panel Data),横截面数据,时间序列数据,面板数据,2面板数据模型分类,用面板数据建立的模型通常有3种,即混合模型、固定效应模型和随机效应模型。2.1 混合模型(Pooled model)。如果一个面板数据模型定义为,yit=+Xit+it,i=1,2,N;t=1,2,T其中yit为被回归变量(标量),表示截距项,Xit为k 1阶回归变量列向量(包括k个回归量),为k 1阶回归系数列向量,it为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数和都相同。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,it)=0。那么无论是N,还是T,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。,2.2 固定效应模型(fixed effects model)。固定效应模型分为3种类型,即个体固定效应模型、时点固定效应模型和个体时点双固定效应模型。下面分别介绍。2.2.1个体固定效应模型(entity fixed effects model)如果一个面板数据模型定义为,yit=i+Xit+it,i=1,2,N;t=1,2,T 其中i是随机变量,表示对于i个个体有i个不同的截距项,且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包括k个回归量),为k 1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),it为误差项(标量),则称此模型为个体固定效应模型。,3.面板数据模型估计方法,混合最小二乘(Pooled OLS)估计(适用于混合模型)平均数(between)OLS估计(适用于混合模型和个体随机效应模型)离差变换(within)OLS估计(适用于个体固定效应回归模型)一阶差分(first difference)OLS估计(适用于个体固定效应模型)可行GLS(feasible GLS)估计(适用于随机效应模型),示例,采用STATA自带的范例数据grunfeld.dta包含六个变量company和year分别表示样本公司的代码和观察的年份,相当于截面变量和时间变量invest表示公司的投资额;mvalue表示公司的市场价值;kstock表示公司的资本存量目的是看公司的投资额和资本存量如何影响公司的市场价值,过程,第一步,声明截面变量和时间变量第二步,进行样本的描述性统计第三步,面板数据模型回归分析第四步,模型的筛选和检验固定效应显著性的检验固定效应还是随机效应,