第5章 多元线性回归模型.ppt
第五章 多元线性回归模型,一元线性回归模型研究的是某一因变量与一个自变量之间的关系问题。但是,客观现象之间的联系是复杂的,许多现象的变动都涉及到多个变量之间的数量关系。研究某一因变量与多个自变量之间的相互关系的理论和方法就是多元线性回归模型。,第一节多元线性回归模型及其假设条件,第二节 模型参数的估计,与一元线性回归模型一样,我们采用最小二乘法求解参数。设第i期的观测值为yi,预测值为,则二者的差值平方和Q为:,(5.2.1),(5.2.2),根据N元2次方程求极值原理,对(5.2.2)式关于各参数求偏导可得:,(5.2.3),求解P+1元一次方程组(5.2.3)可得参数的估计值:,案例应用:P77,第三节 回归系数向量估计值 的统计性质,回归系数向量的估计值 具有线性性质。估计值 是回归系数向量的无偏估计量。,回归系数向量估计值 具有最小方差性。,第四节多元线性回归模型的检验,在建立多元线性回归模型的过程中,为进一步分析回归模型所反映的变量之间的关系是否符合客观实际,引入的影响因素是否有效,同样需要对回归模型进行检验。常用的检验方法有检验法,检验法,t检验法和检验法。,一、检验法(相关系数与复可决系数检验法),检验法是通过复相关系数检验一组自变量 与因变量y之间的线性相关程度的方法,又称复相关系数检验法。,1、复可决系数,(5.4.1),它可以用来衡量因变量 与自变量 之线性相关关系的密切程度。(5.4.2)称为复相关系数。,2、复相关系数,与相关系数检验法一样,复相关系数检验法的步骤为:()计算复相关系数;()根据回归模型的自由度nm-1 和给定的显著性水平 值,查相关系数临界值表;()判别。,3、复相关系数检验步骤,4、回归系数的显著性检验P84,检验是通过统计量检验假设:是否成立的方法。,二、检验,()统计量。(5.4.3),式(5.4.3)中的m是回归变差 的自由度,nm-1是剩余变差 的自由度。(2)对给定的显著性水平,查分布表可得临界值。若,则否定假设:认为一组自变量与因变量y之间的回归效果显著;反之,则不显著。,表5.4.1 检验判别表,第五节 多元回归在经济预测和分析中的应用,一、点估计 在多元线性回归模型中,对于自变量x1,x2,xp 的一组给定值,代入回归模型,就可以求得一个对应的回归预测值,又称为点估计值。,二、区间估计,所谓预测区间就是指在一定的显著性水平上,依据数理统计方法计算出的包含预测对象未来真实值的某一区间范围。,估计区间为:,利用样本方差sy来近似总体方差,则有,,根据大样本统计经验,可以根据需要取值为,2,3,4,。,与概率的对应关系为:68.26%2 95.46%3 99.73%4 99.9937%5 99.999943%6 99.9999998%,第5节含有虚拟变量的回归模型,一、虚拟变量 品质变量不像数量变量那样表现为具体的数值。它只能以品质、属性、种类等形式来表现。要在回归模型中引入此类品质变量,必须首先将具有属性性质的品质变量数量化。通常的做法是令某种属性出现对应于1,不出现对应于0。这种以出现为,未出现为形式表现的品质变量,就称为虚拟变量。二、带虚拟变量的回归模型 常见的带虚拟变量的回归模型有以下三种形式:,式(5.5.2)的趋势变化如图所示,3、含有多个虚拟变量的线性回归模型。含有多个虚拟变量的回归模型建模步骤如下:,第6节自变量的选择,一、逐步回归法 逐步回归法是一种按照变量的边际贡献选择自变量的方法。所谓边际贡献就是某一变量加入到模型中来或从模型中删除对回归平方和或模型解释力(样本决定系数)的影响。如果一个变量加入到模型中或从模型中删除后模型的回归平方和或模型解释力(样本决定系数)变化不大,则可以认为此变量的边际贡献较小,因此这一变量就没有必要加入到模型中来。反之,则认为该变量的边际贡献较大,应当保留或加入到模型中。,第7节 若干问题讨论,一、模型设定误差 我们在5.6中讨论了自变量的选择问题。但无论是哪一种选择自变量的方法,都存在如何确定加入或删除变量的标准问题。标准的设定需要预测工作者的智慧及其对所研究问题的深入了解和认识。因此,难免会发生模型设定误差。回归模型中自变量“过少”,即遗漏了必要的自变量时,将会影响估计量的无偏性和一致性;回归模型中自变量“过多”,即在模型中加入不必要的自变量时,则会破坏估计量的最小方差性。,二、关于样本容量问题 收集高质量的样本数据是建立预测模型的基础性工作。选择适当的样本容量,既能够满足参数估计的需要又能节约时间和经费,就成为一个值得重视的问题。,对于一个含有m个自变量的回归方程,设样本容量为n,则为n行m+1列矩阵,由式(5.7.16)可知,样本容量n必须满足 因此,要得到参数估计量,样本容量n一定不能小于模型中所包含的自变量个数加1。是样本容量的最低限。,