第6章双变量回归.ppt
2023/11/7,计量经济学讲义,1,第6章:双变量线性回归,2023/11/7,计量经济学讲义,2,本章主要内容,双变量线性回归模型:回归的含义总体回归函数随机误差项的性质和设定参数估计-普通最小二乘法参数最小二乘估计量的统计性质(小结),2023/11/7,计量经济学讲义,3,复习:,计量经济学“四大过程”,模型设计:理论假说理论模型计量模型,模型估计:数据估计方法,模型检验:经济统计计量,模型应用:预测制定政策,2023/11/7,计量经济学讲义,4,复习:,计量模型“四个要素”,Y=1+2X+u,3、方程式,4、随机扰动项,2023/11/7,计量经济学讲义,5,(2)、回归与相关,相关分析就是用来测度变量之间的线性关联程度的一种分析方法。回归分析并不对变量之间的关系感兴趣,主要是通过自变量的设定值来估计或预测因变量的平均值,同时对经济理论建立的假设进行检验。,2023/11/7,计量经济学讲义,6,2023/11/7,计量经济学讲义,7,回归的几个基本概念,回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。这里:前一个变量被称为被解释变量(Explained Variable)或因变量(Dependent Variable),后一个(些)变量被称为解释变量(Explanatory Variable)或自变量(Independent Variable)。,2023/11/7,计量经济学讲义,8,2、总体回归函数,总体回归函数(PRF:Population Regression Function)E(Y|Xi)=f(Xi)例如 Yi=b0+b1Xi+u 回归直线上的点可表示为:E(YXi)=b0+b1Xi,2023/11/7,计量经济学讲义,9,总体回归曲线,2023/11/7,计量经济学讲义,10,总体回归函数释义,E(YXi)意为:在给定X值的条件下Y值分布的均值,即回归。这就是Y的条件期望(conditional expectation)或条件均值(conditional expected value)。意味着Y依赖于X,一般称之为Y对X的函数。一般称为Y对X的回归。换句话说,总体回归直线经过Y的条件期望值。,2023/11/7,计量经济学讲义,11,回归系数,b0,b1为参数parameters,也称回归系数(regression coefficients)b1为截距(intercept);b0为斜率(slope)ui是随机误差项(stochastic,random error term)或随机干扰项。其值不能先验地知道。通常用概率分布来描述。,2023/11/7,计量经济学讲义,12,条件分布,条件分布:以X取定值为条件的Y的条件分布注:给定收入X,支出Y并不确定,而是取不同的值。问:给定收入X,支出Y取什么值?例:给定X=80,Y取5个不同的值:55、60、65、70、75,2023/11/7,计量经济学讲义,13,条件概率,条件概率:给定X的Y的概率,记为P(Y|X)。已知给定X=80,Y取5个不同的值:55、60、65、70、75。问:Y取每个值的概率有多大?古典概率模型:取每个值的概率相等。因此有:P(Y=55|X=80)=1/5;P(Y=60|X=80)=1/5;P(Y=65|X=80)=1/5;P(Y=70|X=80)=1/5;P(Y=75|X=80)=1/5;,2023/11/7,计量经济学讲义,14,条件期望,问:给定X,Y可以取不同的值,那么,这些值平均起来是多少?条件期望(conditional Expectation):给定X的Y的期望值,记为E(Y|Xi)。例如,E(Y|X=80)=551/5601/5651/5701/5751/565注:条件均值条件期望,称条件期望是为了表示它是总体的平均值。习惯上,看到“期望”一般指的是总体的平均值;看到“均值”一般指的是样本的平均值。应该注意区分二者的含义。,2023/11/7,计量经济学讲义,15,总体回归曲线,思考:给定一个X,就对应一个(唯一的)E(Y|X)。因此,(X,E(Y|X))可以表示成平面上的一个点。总体回归曲线(Popular Regression Curve):Y的条件均值的轨迹。即Y对X的回归。总体回归曲线的几何意义:当解释变量给定值时因变量的条件期望值的轨迹。,2023/11/7,计量经济学讲义,16,条件均值,条件均值,80 140 220 X,E(Y|Xi),Y,14910165,2023/11/7,计量经济学讲义,17,总体回归函数(PRF),因为每个Xi对应唯一的一个E(Y|Xi),所以E(Y|Xi)是Xi的函数。将此函数称为:总体回归函数(PRF:Population Regression Function)E(Y|Xi)=f(Xi)(1)当PRF的函数形式为线性函数,则有,E(Y|Xi)=1+2Xi(2)其中1和2为未知而固定的参数,称为回归系数。1和2也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。,2023/11/7,计量经济学讲义,18,6.4随机误差项的性质及其来源,1、变量的省略。由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量有一定影响的自变量。2、统计误差。数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代表性误差。3、模型的设定误差。如在模型构造时,非线性关系用线性模型描述了;复wwaz杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。4、随机误差。被解释变量还受一些不可控制的众多的、细小的偶然因素的影响,2023/11/7,计量经济学讲义,19,4、总体与样本,总体是我们研究的目的,但是不能知道总体的全部数据用总体中的一部分(样本)来推断总体的性质。,总体,2023/11/7,计量经济学讲义,20,4、样本回归函数(SRF),两个随机样本,对应给定的每个Xi只有一个Y值,问:能从样本数据中估计出PRF吗?样本数据一 样本数据二,2023/11/7,计量经济学讲义,21,样本回归线与总体回归线,比较两条样本回归线SRF1和SRF2(假定PRF是直线),问哪条样本线代表“真实”的总体回归线?,SRF1PRFSRF2,Y,X,2023/11/7,计量经济学讲义,22,2023/11/7,计量经济学讲义,23,2023/11/7,计量经济学讲义,24,样本回归函数,估计量(Estimator):一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计值。,2023/11/7,计量经济学讲义,25,比较PRF和SRF,2023/11/7,计量经济学讲义,26,样本回归线的几何意义,Xi X,i,ui,Y,E(Y|Xi),E(Y|Xi),i,Yi,2023/11/7,计量经济学讲义,27,样本回归线的几何意义,2023/11/7,计量经济学讲义,28,“线性”的含义,“线性”可作为两种解释:对变量的线性和对参数的线性。本课“线性”回归一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。,2023/11/7,计量经济学讲义,29,线性回归的特殊含义:,2023/11/7,计量经济学讲义,30,6.6:“线性”特殊含义:,一解释变量的线性:是被解释变量y与解释变量x之间为线性关系,即解释变量x仅以一次方的形式出现在模型之中。用数学语言表示为:,二是被解释变量x与参数 之间为线性关系,即参数仅以一次方的形式出现在模型之中。用数学语言表示为:,在经济计量学中,我们更关心被解释变量y与参数 之间的线性关系。因为只要被解释变量y与参数 之间,2023/11/7,计量经济学讲义,31,为线性关系,即使被解释变量y与解释变量x之间不为线性关系,我们也可以通过变量替换方便地将其化为线性。例如,模型就属于被解释变量y与解释变量x之间不为线性关系的情形,如果我们令,此时非线性模型 就变成线性模型 了。,三、一元线性回归模型中随机项的假定,在给定样本观测值(样本值),1,2,3,n后,为了估计(2.1.5)式的参数 和,必须对随机项做出某些合理的假定。这些假定通常称为古典假设。,2023/11/7,计量经济学讲义,32,“线性”的含义,Y=1+2X+u 是线性的!lnY=1+2lnX+u 也是线性的!Y=1ln(2X+u)不是线性的!,2023/11/7,计量经济学讲义,33,2023/11/7,计量经济学讲义,34,方程组(*)称为正规方程组(normal equations)。,2023/11/7,计量经济学讲义,35,记,上述参数估计量可以写成:,称为OLS估计量的离差形式(deviation form)。由于参数的估计结果是通过最小二乘法得到的,故称为普通最小二乘估计量(ordinary least squares estimators,2023/11/7,计量经济学讲义,36,由最小二乘法确定的一元线性回归方程 有以下性质:,1、它是由所选取的样本唯一决定的。即对于一个给定的样本,只能估计出一个,但对于不同的样本,估计出的 可能不相等,即它们是服从某种分布的随机变量。,2、残差的均值为零,即,2023/11/7,计量经济学讲义,37,2023/11/7,计量经济学讲义,38,