第3章回归分析的性质和基本概念.ppt
《第3章回归分析的性质和基本概念.ppt》由会员分享,可在线阅读,更多相关《第3章回归分析的性质和基本概念.ppt(62页珍藏版)》请在课桌文档上搜索。
1、第三章 回归分析的基本概念,学习目的,理解回归分析的性质和双变量回归分析的一些基本概念。,第三章 回归分析的基本概念,第一节 回归分析释义,第二节 经济变量之间的关系,第三节 符号术语数据,第四节 总体回归函数,第五节 随机干扰项,第六节“线性”一词的含义,第七节 样本回归函数,“回归”的历史溯源:“回归”一词最先由弗朗西斯高尔顿(Francis Galton)提出。高尔顿发现一个趋势:父母高,儿女也高;父母矮,儿女也矮。但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。换言之,尽管父母都异常高或异常矮,但儿女的身高却有走向人口平均身高的趋势。换句话说,尽管父母都异常
2、矮或异常高,但儿女的身高却有走向人口总体平均身高的趋势。普遍回归定律(law of universal regression),一、概述,第一节 回归分析释义,高尔顿的朋友卡尔.皮尔逊(Karl Pearson)证实了他的观点,它收集了1000名成员的身高记录发现,对于一个父亲高的群体,儿辈的平均身高低于父辈的身高;而对于一个父亲矮的群体,儿辈的平均身高则高于其父亲的身高。用高尔顿的话说,这是“回归到中等”(regression to mediocrity)。,回归的定义,回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的变量的依赖关系,其用意在于通过后者(在重复抽样中)的已知
3、或设定值,去估计和(或)预测前者的(总体)均值。,例 高尔顿的普遍回归定律,现代的观点关心的是给定父辈身高的情形下找出儿辈平均身高的变化。即,一旦知道父辈的身高,怎样预测儿辈的平均身高。考虑如下散点图(scatter diagram):,对应于任一给定的父亲身高,都有儿子身高的一个分布范围。父亲身高增加,儿子的平均身高也增加。,回归线,勾画一条通过这些散点图的直线,以表明儿子的平均身高是怎样随父亲的身高增加而增加。这条线叫做回归线(regression line)。如下图是不同年龄处测度的男孩身高的总体分布。身高随着年龄增加而增加,通过给定年龄平均身高画一条线。,例 菲利普斯曲线,下图给出了历
4、史数据所表现的散点图,图中的曲线是把货币工资变化率同失业率联系起来的菲利普斯曲线(Phillips curve)之一例。,该散点图可预测在给定的某个失业率下货币工资的平均变化。,例 通货膨胀率,由货币经济学中得知,其他条件不变,通货膨胀率越高,人们愿意以货币形式保存的收入比例k越低。如下图。可预测在各种通货膨胀率下人们愿意以货币形式保存的收入比例。,经济学家想研究个人消费支出对可支配个人收入的依赖关系。这种分析有助于估计边际消费倾向(MPC),也就是实际收入每元价值的变化所引起的消费支出的平均变化。一位能设定价格或产出的垄断商,想知道产品需求对价格变化的实际反应,通过定价实验能估计出产品需求的
5、价格弹性(price elasticity),即产品需求对价格变化的灵敏程度,从而有助于确定最有利可图的价格。,其 他 例 子,其 他 例 子,公司的销售部主任想知道人们对公司产品的需求与广告费开支的关系。这种研究在很大程度上有助于计算出相对于广告费支出的需求弹性,即广告费预算每变化百分之一时需求变化的百分比。有助于制定“最优”广告费预算。农业经济学家想研究作物(如小麦)收成对气温、降雨量、阳光量和施肥量的依赖关系。这种依赖关系分析能使他对给定的解释变量进行信息预测或预报作物的平均收成。,计量经济研究是对经济变量之间关系的研究,针对某一具体经济问题展开研究时,首先需要考察的就是相关经济变量之间
6、有没有关系、有什么样的关系。,确定的函数关系,不确定的相关关系,经济变量之间的关系,第二节 经济变量之间的关系,函数关系,指某一经济变量可直接表示为其他经济变量的确定的函数,函数表达式中没有未知参数。,1)某一商品的销售收入Y与单价P、销售数量Q之间的关系Y=PQ 2)某一农作物的产量Q与单位面积产量q、种植面积S之间的关系 Q=q S,例如:,相关关系,指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。,居民消费C与可支配收入Y之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一确定,
7、但有一定的取值范围,0 C Y,遵循边际消费倾向递减的规律。居民消费C与可支配收入Y之间的关系可表示为C=+Y,、为待估参数。,例如:,相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。,第三节 符号术语数据,因变量(Dependent variable)解释变量(Explanatory variable),被解释变量(Explained variable)自变量(Independent variable),预测子(Predicted)预测元(Predictor),回归子(Regressand)回归元(Regressor),响应(Response)刺激变量(Stimulus)
8、,内生(Endogenous)外生(Exogenous),结果(outcome)共变(Convariate),被控变量(Controlled variable)控制变量(Control variable),如果我们研究一个变量对一个解释变量的依从关系,如消费支出对实际收入的依赖,则称这种研究为简单(simple)或双变量回归分析(two-variable regression analysis)。如果我们研究一个变量对多个解释变量的依赖性,如农作物收成依赖降雨、气温、阳光和施肥一例,则称它为复回归分析(multiple regression analysis)。换句话说,在双变量回归中只有一个
9、解释变量,在复回归中则有多于一个解释变量。,符号,字母Y一律指因变量,而 一律指解释变量。Xk代表第k个解释变量。Xki 指对变量Xk 的第i次观测值。N或T指总体中的观测值的总个数,n或t指样本中观测值总个数。惯例:将下标i用于横截面数据(cross-sectional data)(即在一个时间点上收集的数据);将小标t用于时间序列数据(time series data)(即在一段时间点上收集的数据)。,数据,1)时间序列数据;,2)横截面数据;,3)面板数据;,1)时间序列数据;,特点:可以在有规则的时间间隔收集Example:每日(股票价格)、每周(联邦储备委员会提供的货币供给数字)、每
10、月(失业率、消费者价格指数CPI)、每季(如GNP)、每年(政府预算)、每5年(制造业普查资料)、每10年(人口普查资料),有些数据每季和每年都有公布,如GDP和消费者支出数据。极短时间的数据也可以搜集,如股票价格数据,可以得到连续数据(实时牌价)。,1)时间序列数据;,一个时间序列是对一个变量在不同时间取值的一组观测结果。,平稳的时间序列数据如果一个时间序列的均值和方差不随时间而系统的变化,那它就是平稳的。,随时间推移,M1货币供给稳定上升。不是平稳的。,1)时间序列数据;,2)横截面数据;,对一个或多个变量在同一时间点上收集的数据。,Example:1990年和1991年美国50个州的劳工
11、会蛋产量和蛋价格,对每一年份50个州的数据构成一个横截面数据样本。下表中有两个横截面数据样本。,3)面板数据;,在面板数据中兼有时间序列和横截面数据的成分。,1973-1985年每个国家的通货膨胀率构成一个时间序列,而对某一年说,7个国家的通货膨胀率又构成一个横截面。,数据来源,互联网,e.g.国家统计局,Bloomberg,Wind咨询,实验数据,e.g.评价肥胖对血压的影响时,研究者要在人们饮食、烟酒习惯都不变的情况下收集数据。,数据的准确性,大部分社会科学数据是非实验性质的,存在观测误差。问卷型调查中,非应答问题十分严重。获取数据的抽样方法可能变化很大,要比较不同样本得来的结果通常很困难
12、。通常获得宏观数据(如GDP,就业,通货膨胀,失业),无法告知个人或微观单位的情况。由于保密性质,某些数据只能加总形式公布。如企业普查,不允许公布任何厂家的生产、人员雇佣、能源消耗、研究与开发费用,要研究厂际差异是困难的。,变量的测量尺度,比率尺度(ratio scale)对于一个变量X,取其两个值X和X,比率X/X和距离(X-X)都是有意义的量。大多数经济变量都属于这一类,问今年的GDP与去年的GDP相差多少是有意义的。区间尺度(interval scale)两个时期之间的距离(如2000-1995)是有意义的,但两个时期的比率(2000/1995)是无意义的。序数尺度(ordinal sc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章回 分析 性质 基本概念

链接地址:https://www.desk33.com/p-740127.html