欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > PPT文档下载  

    财务会计统计学.ppt

    • 资源ID:272876       资源大小:3.09MB        全文页数:183页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    财务会计统计学.ppt

    统计学,第一章 总论第二章 统计数据的描述分析第三章 概率与概率分布第四章、统计量及其抽样分布第五章 参数估计第六章 参数假设检验第七章列联分析和方差分析第八章 一元线性回归第九章 多元线性回归第十章 时间序列分析第十一章 统计指数,第一章 总论,一、统计学的产生和发展二、统计学及其学科性质三、统计学的几个基本概念四、统计调查五、统计整理统计软件介绍,返回,一、统计学的产生和发展(一)政治算术学派(英国:威廉.配第1623-1687)用大量的数字对英国、法国和荷兰三国的经济实力进行比较,用数字、重量、尺度等定量的方法进行分析比较,并配以朴素的图表来表达其思想和观点。马克思评价其为“政治经济学之父”约翰格朗特编制世界上第一张死亡率统计表,返回,(二)国势学派(德国:康令1606-1681)“国势学”课程,并于1749年用“统计学”取代缺乏数字内容,用文字描述与政治算术学派共存200多年,但政治算术学派影响要大(三)数理统计学派(比利时:凯特勒1796-1874)把概率论、大数法则、误差法则、正态分布等概率方法引入统计学,并认为其适合任何观察科学的通用方法。是数理统计学的奠基人和先驱者,被尊称为“统计学之父”,瑞士数学家 J.贝努里(1654-1705)首次在推算法中给出了贝努里定理的大数法则。法国数学家拉普拉斯(17491827)概率论分析:总结了前人的成果,并以大数法则为桥梁,使概率论与政治算术联系起来;德国大数学家高斯(17771855)是另一位将概率论引入统计学的杰出贡献者。利用最大似然法等数学知识将误差理论和概率分布理论结合起来,提出误差分布曲线,使用最小二乘法和高斯分布最终建立了误差理论。,英国统计学大师费希尔(R.Fisher,亦译为费舍或费雪)建立了样本分布、区间估计以及假设检验等综合理论,确立了数理统计学的数学框架。,返回,二、统计学及其学科性质1、统计学(statistics):the science of collecting,analyzing,presenting,and interpreting data.Copyright 1994-2000 Encyclopaedia Britannica,Inc.(不列颠百科全书)统计学是一门收集、处理、分析和解释数据并从数据中得出结论的科学。其目的是探索数据的内在数量规律性,从而为有关决策提供依据.搜集数据整理数据分析数据解释数据2、争论:“方法论学科”“实质性学科”1)、描述统计和推断统计描述统计:注重汇总、图表显示、概括分析推断统计:研究用样本数据推断总体数量特征2)、应用统计学和数理统计学,返回,反映客观现象的数据,描述统计(统计数据的搜集、整理、显示和分析等),返回,三、统计学的几个基本概念(一)总体和样本1、总体是由具有某种共同性质的许多个体组成的整体,构成总体的个体称为总体单位。两层含义:统计学研究的是大量现象的数量特征,总体包含了大量现象;统计单位具有某一共同性质,但其他的性质、特征是不同的,便于在差异中寻找规律。,返回,2、样本,(二)参数和统计量,(三)标志和指标1、标志是说明总体单位特征的名称,分为数量标志和品质标志。2、指标是说明总体综合数量特征的名称 按其反映数量特点的不同,分为数量指标和质量指标。按其反映的时间特征的不同分为时期指标和时点指标。,(四)变量分类变量:分类数据顺序变量:顺序数据数值型变量:数值型数据,(五)存量与流量时期指标时点指标2009年中国国内生产总值为335,353亿元(49,092.81亿美元,同期日本为5.07万亿美元),比上年增长8.7.产业:第一产业增加值35477 亿元,增长 4.2%;第二产业增加值156958亿元,增长9.5%;第三产业增加值142918亿元,增长8.9%。,返回,四、统计调查 统计报表制度:国家统计报表 部门统计报表 地方统计报表 专门调查:普查 典型调查 重点调查 抽样调查,返回,数据的误差抽样误差 80人 10人,无偏估计 非系统性误差非抽样误差:抽样框误差 回答误差 无回答误差 系统性误差 调查员误差 测量误差,返回,五、统计整理 1、统计分组:统计分组是将统计总体按照一定标志区分成若干个组成部分的一种统计分析方法。按分组标志的不同,分为:品质数列 单项数列:一个变量值是一个组 变量数列 组距数列:两个变量值构成的区间是一个组,返回,2、频数分布:统计分组后,每个组分配的总体单位数称为频数或次数 频数/总体单位总数=频率(比率)分布类型1)钟型分布2)J型分布3)U型分布,(a)对称分布,(b)偏态分布,钟形分布,返回,J型U型分布,返回,3、统计表:例、一批钢材,抽样测试其抗张力,随机抽取76个样本观察值如下:(单位:kg/cm2)41.0 37.0 33.0 44.2 30.5 27.0 45.0 28.5 40.6 34.831.2 33.5 38.5 41.5 43.0 45.5 42.5 39.0 36.2 27.538.8 35.5 32.5 29.5 32.6 34.5 37.5 39.5 35.8 29.142.8 45.1 42.8 45.8 39.8 37.2 33.8 31.2 31.5 29.529.0 35.2 37.8 41.2 43.8 48.0 43.6 41.8 44.5 36.536.6 34.8 31.0 32.0 33.5 37.4 40.8 44.7 40.0 41.540.2 41.3 38.8 34.1 31.8 34.6 38.3 41.3 44.2 37.130.0 35.2 37.5 40.5 38.1 37.3,一批钢材抗张力分组表,累计频数分布数列1)各组频数向上、向下累计形成的数列。2)在经济学中的应用。洛伦茨曲线基尼系数=A/(A+B),统计表的格式和注意事项(p77-p78)横行标题:对象(总体(常以年份形式表示)、总体分组、总体各单位)纵栏标题:统计指标交叉部分:指标值注意事项:数据居中,小数点对齐左右不封口;表下面注明资料来源。,表头,列标题,行标题,数字资料,附加,统计表的结构,统计图(直方图和饼图),返回,第二章 统计数据的描述分析,返回,第一节 集中趋势分析第二节 离中趋势分析第三节 偏度和峰度分析,第一节 集中趋势分析集中趋势指一组数据中心点的位置所在,是数据分布的中心,描述集中趋势的指标有平均数、中位数、众数等。代表数据的一般水平。一、众数二、中位数三、平均数三个测度值间的关系,返回,某单位80个工人一周生产的零数 单位:个 65 78 88 65 58 76 69 66 80 64 77 78 60 65 85 74 73 65 66 79 74 85 59 69 60 87 85 86 64 93 76 62 91 49 74 78 75 79 86 68 87 97 92 82 66 94 75 56 85 77 67 89 78 79 88 83 73 69 84 95 55 79 77 58 80 68 77 87 70 78 79 61 47 69 89 96 66 76 81 99Min=47 max=99,众数,一、众数(M0)1、众数是指一组变量值中出现次数最多的变量值,一般用M0表示。可以测度分类数据、顺序数据和数值型数据。一组数据可能没有众数,也可能有两个甚至多个众数。2、众数的确定未分组资料:M0就是出现次数最多的变量值。有时众数不止一个,上例中,78、79各出现5次,都是M0,数据分布是双峰的。,返回,分组资料:在等距分组的情况下,频数最多的组是众数组,在该组内确定众数。,二、中位数及分位数1、中位数把一批数按照从小到大的顺序排列,处于数列中点的变量值就是Me确定方法未分组资料:(n+1)/2中位数的位置。前例Me=77分组资料:根据向上或向下累计频数分布数列,按照 确定中位数所在的组,然后确定值。,返回,返回,2、分位数上四分位数QU=3n/4下四分位数QL=n/4,三、平均数(一)、算术平均数(均值)分为简单算术平均数和加权算术平均数,返回,例、某单位80工人一周生产零件数。1、简单算术平均数2、加权算术平均数,众数,某单位某周生产零件数资料表,3、算术平均数与数学期望对于离散型随机变量X,设它的概率密度函数P(Xi)为,则数学期望为:实际上算术平均数等于期望值简单算术平均数:xi1/n加权算术平均数情况:xini/n,4、算术平均数的缺陷10 15 20 25 70去掉70后,从这个角度讲算术平均数不及众数和中位数,(二)、几何平均数两种应用:年均增长率及银行复利计息平均利率(三)、调和平均数倒数平均数的倒数:,返回,四、综合(平均数、众数、中位数)1、三个测量度与三种类型数据间的对应关系2、三个测度值间的关系,第二节 离中趋势分析,一、离中趋势概念1、离中趋势是数据分布的又一特征,它表明数据的离散程度,反应各变量值与均值间的平均偏离程度。2、意义:首先,可以衡量算术平均数的代表性大小。例:均值都为150的两组数 50,100,150,200,250 100,125,150,175,200其次,进行产品质量管理和决策。3、离中趋势测度经常用到的指标有:异众比率、极差、平均差、方差和标准差、四分位差、离散系数等,它们也被称为变异指标。,返回,二、异众比率(非众数组频数所占比例)一般来说,异众比率越大,数据离散程度越大主要测度分类数据,也可适用其他数据,三、四分位差1、四分位差用数列中第3/4位次与1/4位次的变量值之差除以2来表示。主要用于测度顺序数据,也可适用其他类型数据2、意义:剔除了极端值,说明50%数据分布状况;与中位数配合说明数据分布是否对称。若分布对称,则Q2-Q1=Q3-Q2=(Q3-Q1)/2若不相等,则是非对称的。,四、极差1、极差也称为全距,是一组变量中最大值与最小值的离差,表明变量值变动的范围。用R表示极差,其计算公式是:2、缺点:易受极端值的影响。,五、平均差1、平均差是指变量值与其算术平均数的离差绝对值的算术平均数,用符号A.D表示。计算公式:2、优缺点:,优点:恰当反应了数据与平均数间的平均偏离程度,缺点:表达式中有绝对值,在数学处理上较麻烦,六、方差与标准差1、方差与标准差是测定离中趋势最常用的指标。标准差是方差的平方根。2、计算公式(总体数据):P99 一般表达式与概率表达式 A.D3、标准分数(相对位置的度量)指某个具体数据偏离平均数几个标准差,以其反映该数的出类拔萃(或差)程度:,自由度(degree of freedom),自由度的概念由统计学家R.A Fisher提出是指数据个数与附加给独立的观测值的约束或限制的个数之差从字面涵义来看,自由度是指一组数据中可以自由取值的个数当样本数据的个数为n时,若样本平均数确定后,则附加给n个观测值的约束个数就是1个,因此只有n-1个数据可以自由取值,其中必有一个数据不能自由取值按着这一逻辑,如果对n个观测值附加的约束个数为k个,自由度则为n-k,七、离散系数(标准差系数、变异系数)特别注意:离散系数是比较数据间离散程度的最终指标,返回,第三节 偏度和峰度分析,一、偏态1、分布的偏态就是分布的不对称2、偏态的测量方法主要是两种:一种是Pearson偏态系数,二是三阶中心距。Pearson偏态系数以平均数与众数之差除以标准差来衡量偏斜程度,用SK表示。其计算公式为:当SK=0时,呈对称分布;当SK0时,分布是右偏(正偏)的;当SK0时,分布是左偏(负偏)的。,返回,矩法估计就是利用中心矩来衡量分布的偏度。用公式表示为:,二、峰度1、峰度是变量分布的又一性质,它指的是分布曲线的高峰形态,也是分布曲线的尖峭程度2、衡量指标:峰度是用变量的四阶中心矩除以标准差四次方,并将结果再减3,用公式表示为:当峰度指标K0时,表示频数分布比标准正态分布更集中,分布呈尖峰状态;K0时表示频数分布比标准正态分布更分散,分布呈平峰。,返回,第三章 概率与概率分布,一、随机事件的概率及法则P(A)=该事件的可能数/总的可能数加法法则:P(AUB)=P(A)+P(A)-P(AB),返回,二、贝叶斯公式,P(AB)=P(A)P(B/A)P(AB)=P(B)P(A/B)所以:P(A)P(B/A)=P(B)P(A/B)即:P(A/B)=P(A)P(B/A)/P(B)当然:P(Ai/B)=P(Ai)P(B/Ai)/P(B),三、密度与概率分布,离散型变量的密度即变量概率连续性变量的密度表示出现可能性的高低,但具体某个变量值的概率P(X)=0变量所有可能取值的概率之和等于1(对于连续性变量密度在定义域上的积分为1)期望值就是平均数,四、正态分布,1、正态分布的分析均转化为标准正态分布2、灵活计算标准正态分布的区间概率3、以大概率反过来求大概率区间的临界值4、二项分布的正态近似:二项分布XB(n,p)近似于XN(np,np(1-p))当n很大,p很小时,二项分布近似于泊松分布:,返回,第四章、统计量及其抽样分布,一、统计量与抽样分布的概念二、三大推断分布三、常用统计量分布,返回,统计量样本函数称为统计量。设是来自总体X的一个样本,是 的函数,若 是连续函数且其中不含任何未知参数,则称 是一个统计量。抽样分布统计量的概率分布称为抽样分布,总体的分布已知时,统计量的分布是确定的。,返回,一、统计量与抽样分布概念,二、三大推断分布,(一)分布1、设 是来自总体N(0,1)的一个样本,则称统计量服从自由度为n的 分布,记为。自由度是指包含的独立变量的个数。2、性质:(1)设,且 独立,则 即 分布具有可加性。,返回,(2)分位点(根据查分位点(即临界点)一定要掌握)若对于给定的,0 1,存在使得 则称点 为 分布的上 分位点,如图所示。,(二)t分布1、定义:设XN(0,1),Yx2(n),且X,Y相互独立,则称随机变量即服从自由度为n的t分布,记Tt(n)。t分布又称学生氏(student)分布特别的(P164):,2、性质关于y轴呈对称分布;当 时,近似于N(0,1)分布。分位点对于给定的,0 1,称满足的点 为t分布的分位点。,(三)F分布1、设UX2(n1),VX2(n2),且U、V相互独立,则服从自由度为(n1,n2)的F分布,记为2、性质F分布是非对称的分位点对于给定的,0 1,称满足为F分布的分位点。,返回,三、常用统计量分布,1、样本均值统计量的抽样分布。(1)正态总体,方差已知(2)总体非正态,方差未知,大样本(中心极限定理P166)(3)正态总体,方差未知,小样本2、样本方差s2的抽样分布:,返回,3、两样本均值差的抽样分布(1)已知(2)未知,但两者相等,小样本(P165),4、两总体方差比的分布5、样本成数的抽样分布,返回,第五章 参数估计,第一节 参数估计的理论依据第二节 区间估计第三节 样本容量的确定,返回,第一节 参数估计的理论依据,根据中心极限定理样本平均数与总体平均数的联系 可以求出样本平均数在某区间内的概率进一步可以求出在一定的概率保证下样本平均数在哪一个范围之内通过转换可得出在相应概率保证下总体平均数的估计区间:,返回,同样的逻辑,可以推广到样本平均数的其他分布:,参数估计的无偏性和有效性(p181),点估计时:估计量的期望值等于总体参数表现为无偏性估计量的方差越小,表明估计越有效越一致,返回,第二节 区间估计(p198-p200),一、总体均值(比例)的区间估计(包括两个独立总体均值差的估计)二、方差的区间估计三、匹配样本问题,一、总体均值(比例)的区间估计(包括差值的估计)1、正态总体、方差已知,或非正态总体、大样本(以s代替),返回,2、正态总体、方差未知、小样本(该处抽样成数不讨论)3、非正态总体、方差未知、小样本 不可求,返回,二、方差的区间估计,方法:找出涉及方差的分布如果单个总体方差涉及卡方分布 两个总体方差比涉及F分布单个总体:,返回,两个总体的方差比较:,返回,三、匹配样本问题,两个独立样本:产品两种组装方法所需时间(两种方法各抽取12人)解答方法为两个独立总体均值差的区间估计:见p192,均值差的估计范围为:0.14分钟7.26分钟,返回,产品两种组装方法所需时间(同一组人用两种方法)两种组装方法时间差D的估计区间为:3.03t0.025(11)*2.88/3.46即:3.032.201*0.83,估计范围为:1.2分钟4.9分钟,返回,第三节 样本容量的确定,决定样本容量的因素1、总体方差一定2、给定允许误差E3、给定概率保证程度,返回,在既定的总体方差情况下,要达到给定的允许误差和概率保证,则唯一可以做到是寻求适宜的样本容量来达到这个要求,第六章 假设检验,第一节 假设检验的基本原理和步骤第二节 常见的参数假设检验统计量假设检验的两类错误,返回,第一节 假设检验的基本原理和步骤,一、假设检验的原理假定:在一次抽样中小概率事件不可能发生比较:在总体为真时样本统计量分布的大概率区间vs实际发生样本的统计量值对应的位置取舍:当二者不够一致时,由于样本是客观发生的,不可否认,该否定的只能是总体参数。而当二者没有显著性矛盾时,不能否定假定的总体参数。,返回,二、方法和步骤(原假设以总体均值为例)1、如果问与总体参数是否相同、一致、有无显著性差别等,则为双侧检验,原假设H0:u=0,否定域为临界点两侧,临界点为+Z/2(或T检验+t/2、F检验 卡方检验);2、如果问总体参数是否高于、超过某值等,则为右单侧检验,原假设H0:u0,否定域为右侧小概率区间,临界点为Z(或t、F1-、);3、如果问总体参数是否低于、有显著性降低等,则为左单侧检验,原假设H0:u0,否定域为左侧小概率区间,临界点为-Z(或-t、F1-、)。注:当单侧检验没有否定原假设时,只能说没有足够的理由支持备选假设,而不宜直接表述为接受原假设的内容。1 2 3 4 5 6,返回,第二节 常见的参数假设检验统计量,一、单个总体均值的检验二、两个总体均值差的检验三、单个总体成数的检验四、两个总体成数差的检验p235五、单个正态总体方差的检验六、两个正态总体方差比的检验七、匹配样本的检验,返回,一、单个总体均值的检验,(一)大样本,或虽为小样本但总体方差已知 检验统计量:双侧临界点:+Z/2(p212-216例8.1、例8.4)左单侧临界点:-Z(p219例8.2)右单侧临界点:+Z(p224例8.6),对照,返回,(二)小样本,总体方差未知检验统计量:双侧拒绝域:(p225例8.7)单侧临界点:,对照,二、两个总体均值差的检验,(一)大样本,或小样本但总体方差已知检验统计量:双侧拒绝域:(p231例8.10)单侧临界点:+Z,对照,返回,(二)小样本,两总体方差未知,但相等检验统计量:双侧拒绝域:单侧临界点:,对照,(三)小样本,两总体方差未知且不等检验统计量:(p233例8.11),返回,三、单个总体成数(比例)的检验,只考虑大样本检验统计量:双侧拒绝域:(p227例8.7)单侧临界点:+Z,返回,只考虑大样本检验统计量:两个总体比例相等的假设:p=(p1n1+p2n2)/(n1+n2)参考p191(p235例8.12)两个总体比例不相等的假设:(p236例8.13)双侧拒绝域:单侧临界点:+Z,四、两个总体成数差的检验p235,返回,检验统计量:(p236例8.9)双侧拒绝域:或者左单侧拒绝域:左单侧拒绝域:,五、单个正态总体方差的检验,返回,对照,六、两个正态总体方差比的检验,检验统计量:双侧检验条件下,双侧拒绝域F(p238例8.14)单侧:单侧拒绝域F或者 F,对照,七、匹配样本的检验(p238),在某俱乐部训练前后体重记录 单位:千克能否支持该俱乐部宣称可以使肥胖者减轻8.5千克的声明?,返回,参数检验的两类错误(p213),第一类错误:“弃真”总体参数是正确的,但检验时否定了(统计量落在小概率区间)。有概率犯这种错误的可能性,减小可以减少这类错误的概率。第二类错误:“取假”总体参数是错误的,但检验时没有否定(统计量落在大概率区间)。有概率犯这种错误的可能性,增加可以减少这类错误的概率。,返回,第七章 列联分析与方差分析,第一节 列联分析第二节 方差分析,返回,第一节 列联分析,一、列联分析所要解决的问题一致性问题:各比例是否一致的问题 各比例是否与某参考值一致的问题独立性问题:两个分类变量间是否存在关联问题检验统计量:,返回,二、一致性检验,例1:某公司中各分公司对改革方案的态度统计 单位:人,(37),(30),(40),(34),期望值fe,31,33,45,32,观察值f0,反对改革方案,(73),(60),(80),(66),期望值fe,79,57,75,68,观察值f0,赞成改革方案,四分公司,三分公司,二分公司,一分公司,例2:广告前后市场占有率变化,如调查200人时期望值fe,比例,200,200,100%,合计,16,30,15%,其它,82,80,40%,B,102,90,45%,A,广告后调查200人(观察值f0),广告前,公司,三、独立性检验,例:某原料产地与质量等级抽样资料 单位:件,期望值fe,观察值f0,期望值fe,观察值f0,期望值fe,观察值f0,500,150,150,188,188,162,162,合计,189,56.70,74,71.06,65,61.24,50,丙地区,171,51.30,52,64.30,59,55.40,60,乙地区,140,42.00,24,52.64,64,45.36,52,甲地区,合计,三级,二级,一级,返回,第二节 方差分析,一、概述二、单因素方差分析三、双因素方差分析,返回,一、概述,(一)问题的提出 方差分析:在若干个能够相互比较的资料组中,判别各组资料是否存在差异以及分析差异原因的方法和技术。可表述为判断分类型自变量对数值型因变量是否有显著影响,或表述为判别多个总体均值是否相等的检验。,返回,(二)方差分析的三个假定条件 1、对于各因素的每个水平,其总体服从正态分布;2、各个总体的方差2必须相同 3、各个观测值之间是独立的(三)方差分析的基本思想1、将组间数据差异与组内数据差异进行比较2、因素是否会对结果有影响就转化为各组均值是否相等3、即通过方差的比较来实现对均值的比较。,返回,二、单因素方差分析,(一)单因素方差分析1、三个离差平方和 总离差平方和:组间离差平方和:组内离差平方和:,返回,2、假设检验拒绝域:,返回,三、两因素方差分析,(一)无重复两因素方差分析1、前提假定及四个平方和 与前面单因素方差分析的三个前提假定相同,返回,其中:,2、假设检验拒绝域:,(二)有交互作用的双两因素方差分析1、交互作用2、五个平方和:,3、样本统计量的分布,第八章 相关与回归(一元线性回归),变量间的关系相关关系的描述与测度(相关系数)一元线性回归D.W检验(自相关检验),返回,一、变量间的关系,1、函数关系反映现象(变量)之间存在一一对应的数量关系,可以用数学表达式表达出来。2、无关系3、相关关系反映现象(变量)之间确实存在的依存关系,但是又不是确定(一一对应)的依存关系。,返回,相关关系的图示,二、相关系数,Pearson相关系数:(样本相关系数r)0.8|r|1为高度相关,0.5|r|0.8为中度相关0.3|r|0.5为低度相关,|r|0.3可以认为不相关总体相关系数,记为,返回,相关关系的测度(相关系数取值及其意义),r,三、一元线性回归,回归模型类型:,返回,回归模型与回归方程,当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归对于只涉及一个自变量的简单线性回归模型可表示为:y=b0+b1 x+e(几个假定P322)误差项 是随机变量,反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响,是不能由 x 和 y 之间的线性关系所解释的变异性。是一个服从正态分布的随机变量,且相互独立。即N(0,2)一元回归方程:E(y)=b0+b1 x(P322图形)回归方程是在y与x之间不确定的关系中寻找规律性(确定性),由于是得到的总是样本数据,所以能求的只能是估计的回归方程:,回归方程的解(P324通过偏导数为0求得),离差平方和的分解(图示),离差平方和的分解(三个平方和的关系),2.两端平方后求和可以证明有:,从图上看有,SST=SSR+SSE,样本决定系数(判定系数 R2),1.回归平方和占总离差平方和的比例,可以证明判定系数等于相关系数的平方 即R2r2,估计标准误差,回归方程的显著性检验(检验的步骤),1.提出假设H0:线性关系不显著,2.计算检验统计量F,确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若FF,拒绝H0;若FF,接受H0,回归系数的显著性检验(样本统计量 的分布),回归系数的显著性检验(步骤),提出假设H0:b1=0(没有线性关系)H1:b1 0(有线性关系)计算检验的统计量,确定显著性水平,并进行决策 tt,拒绝H0;tt,接受H0,利用回归方程进行估计和预测(置信区间估计),y 的期望值的置信区间估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的期望值E(y0)的估计区间,这一估计区间称为置信区间 E(y0)在1-置信水平下的置信区间为,式中:Se为估计标准误差,利用回归方程进行估计和预测(预测区间估计),y 的个别值的预测区间估计 利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间 y0在1-置信水平下的预测区间为,置信区间、预测区间、回归方程,xn,y,x,x,预测上限,置信上限,预测下限,置信下限,返回,第九章 多元线性回归,一、概念一个因变量与两个及两个以上自变量之间的线性回归描述因变量 y 如何依赖于自变量 x1,x2,xm 和误差项 的方程称为多元线性回归模型涉及 m 个自变量的多元线性回归模型可表示为,b0,b1,b2,bm是参数 是被称为误差项的随机变量 说明了包含在y里面但不能被m个自变量的线性关系所解释的变异性,是一个服从正态分布的随机变量,即N(0,2),且相互独立,返回,多元线性回归方程,描述 y 的期望值如何依赖于 x1,x1,xm的方程称为多元线性回归方程多元线性回归方程的形式为 E(y)=0+1 x1+2 x2+m xm,b1,b2,bm称为偏回归系数 bi 表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均变动值,多元线性回归方方程的直观解释,二、多元线性回归的估计方程,总体回归参数 是未知的,利用样本数据去估计,用样本统计量 代替回归方程中的 未知参数 即得到估计的回归方程,是 估计值 是 y 的估计值,参数的最小二乘法(要点),根据最小二乘法的要求,可得求解各回归参数 的标准方程如下,使因变量的观察值与估计值之间的离差平方和达到最小来求得。即,三、多重判定系数 R2(多重样本决定系数),1.回归平方和占总离差平方和的比例,等于多重相关系数的平方,即R2=r2,修正的多重判定系数 R2(修正的多重样本决定系数),由于增加自变量将影响到因变量中被估计的回归方程所解释的变异性的数量,为避免高估这一影响,需要用自变量的数目去修正R2的值用n表示观察值的数目,m表示自变量的数目,修正的多元判定系数的计算公式可表示为,四、显著性检验,(一)线性关系的检验检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总体的显著性检验检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用 F 检验来分析二者之间的差别是否显著如果是显著的,因变量与自变量之间存在线性关系如果不显著,因变量与自变量之间不存在线性关系,回归方程的显著性检验(线性关系的检验),提出假设H0:12m=0 线性关系不显著H1:1,2,m至少有一个不等于0,2.计算检验统计量F,3.确定显著性水平和分子自由度m、分母自由度n-m-1找出临界值F 4.作出决策:若FF,拒绝H0;若FF,接受H0,(二)回归系数的显著性检验,如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量 xi 对因变量 y 的影响是否显著对每一个自变量都要单独进行检验应用 t 检验在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验,回归系数的显著性检验(步骤),提出假设H0:bi=0(自变量 xi 与 因变量 y 没有线性关系)H1:bi 0(自变量 xi 与 因变量 y有线性关系)计算检验的统计量 t,确定显著性水平,并进行决策 tt,拒绝H0;tt,接受H0,五、多重共线性,(一)概念当回归模型中两个或两个以上的自变量彼此相关时,回归模型存在多重共线性。由于提供了重叠性信息,使回归模型变量解释产生扭曲。(二)多重共线性的判别依据1、各自变量间显著相关;2、模型的线性关系检验显著,而回归系数的检验不显著;3、某变量回归系数的正负号与实际解释背离。,(三)多重共线性的处理1、将各相关自变量尽量剔除;2、避免对单个变量回归系数的解释;3、用回归模型进行预测时,自变量要在样本数据范围内取值。,六、变量选择与逐步回归,(一)向前选择1、将因变量与所有自变量(K个)分别拟合一元线性回归模型,找出F统计量值最高的自变量作为首选自变量;2、将余下的自变量逐一与首选自变量拟合二元线性回归模型(K-1个),将使F值最大的新加自变量作为第二个选入的自变量;3、按上述方式逐个增加自变量,直到加入新变量后模型不再显著为止。,返回,(二)向后剔除1、将Y与所有自变量(K个)拟合回归模型,判别是否存在多重共线性2、如存在多重共线性,则分别拟合K个含K-1个变量的回归模型,将使SSE增加最少的变量剔除;3、如果仍存在多重共线性,再按上述方式减少自变量;4、直到用剩余自变量所求的回归模型不存在多重共线性为止。,返回,补充:可化为线性回归的 曲线回归,1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.通过检验线性关系的显著性来检验曲线关系的显著性,返回,几种常见的非线性模型,指数函数,3.线性化方法两端取对数得:lny=ln+x令:y=lny,=ln,则有y=+x,基本形式:,2.图像,几种常见的非线性模型,幂函数,3.线性化方法两端取对数得:lg y=lg+lg x令:y=lgy,x=lg x,则y=lg+x,基本形式:,2.图像,几种常见的非线性模型,双曲线函数,3.线性化方法令:y=1/y,x=1/x,则有y=+x,基本形式:,2.图像,几种常见的非线性模型,对数函数,3.线性化方法x=lgx,则有y=+x,基本形式:,2.图像,几种常见的非线性模型,S 型曲线,线性化方法令:y=1/y,x=e-x,则有y=+x,基本形式:,图像,返回,第十章 时间序列分析,第一节 概述第二节 长期趋势第三节 季节变动的测定季节指数分析 返回,第一节 概述,一、什么是时间序列例:16 5 15 16 28 32 一般要求:1、间隔时间相等2、时间序列上指标值含义相同,1984 1988 1992 1996 2000 2004,2008 51,返回,二、时间序列的分解,返回,三、描述性分析,(一)发展水平与平均发展水平时点数列序时平均数的求法(二)发展速度与平均发展速度几何平均法(三)指数平滑法,第二节 长期趋势的测定,最小平方法:y-2 最小散点图:,返回,直线趋势方程的解,抛物线方程,当一组数据二级增长量大致相等,可设趋势方程:yc=a+bt+ct2,指数方程,当一组数据环比发展速度大致相等时,可设趋势方程:yc=abt,三和法:令趋势值的三个局部总和分别等于原序列 观察值的三个局部总和。,修正指数曲线,修正指数曲线趋势方程为:(K0,b00,0b11)修正指数曲线用于描述初期增长迅速,随后增长率逐渐降低,最终以K为增长极限的一类(经济)现象。y-2 最小,但难以求出趋势方程,可令:S1=(K+b0b1)+(K+b0b12)+(K+b0b1m)S2=(K+b0b1m+1)+(K+b0b1m+2)+(K+b0b12m)S3=(K+b0b12m+1)+(K+b0b12m+2)+(K+b0b13m)解得:,龚铂茨曲线,用来描述初期增长缓慢,以后逐渐加快,到一定程度后增长率又逐渐下降,最后接近一条水平线的一类(社会)现象。趋势方程为:两边取对数得:lg=lgK+(lgb0)b1t设:lg=lgK=K lgb0=B0得:=K+B0b1t同理用三和法可求出待定系数,返回,第三节 季节变动的测定,返回,季度 销售量,四期移动平均,四期移动平均的二次移动平均T,五期移动平均,啤酒销售量季节比率计算表,季节比率计算表,啤酒销售量趋势值计算,返回,第十一章 指数,一、概述指数起源:18世纪的欧洲指数概念:广义指数指一切相对数;狭义指数指反应不能直接相加和对比的复杂社会经济现象综合变动程度的相对数。指数种类:质量指标指数 综合指数 平均指标指数 数量指标指数 平均指标对比指数,返回,二、综合指数,指数的计算公式,为了单纯反映价格的变动,上式中分子和分母所用的销售量应该是同一时期的。,同度量因素,三、平均指标指数,四、对总量变动的因素分析,某企业工资统计表,五、平均指标对比指数(对平均水平变动的因素分析),两个平均数:用k表示两个平均数比值:,

    注意事项

    本文(财务会计统计学.ppt)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开