欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > PPT文档下载  

    社会统计学课件.ppt

    • 资源ID:259394       资源大小:3.67MB        全文页数:59页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    社会统计学课件.ppt

    第十二讲 回归与相关,第四节 相关分析,相关关系(correlation),变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个这些变量y的取值按某种规律在一定范围内变化,Social Statistics,社会统计学,第十二章 线性回归与相关,相关关系的种类,正相关和负相关单相关和复相关直线相关和曲线相关 完全相关、完全不相关和不完全相关,两个变量的相关关系称为单相关。三个或三个以上变量的相关关系称为复相关,相关的变量按同一方向变化,为正相关。相关的变量按反方向变化,为负相关。,当一个变量每增减1个单位,另一相关变量按一个大致固定的增(减)量变化时称为线性相关;反之,相关变量不按固定增(减)量变化时,则为非线性相关。,当变量之间的依存关系密切到近乎于函数关系时,称为完全相关;当变量之间不存在依存关系时,就称为不相关或零相关;大多数相关关系介于其间,称为不完全相关。,Social Statistics,社会统计学,第十二章 线性回归与相关,散点图(scatter diagram),Social Statistics,社会统计学,第十二章 线性回归与相关,相关分析及其假定,相关分析要解决的问题变量之间是否存在关系?如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?为解决这些问题,在进行相关分析时,对总体有以下两个主要假定两个变量之间是线性关系两个变量都是随机变量,Social Statistics,社会统计学,第十二章 线性回归与相关,(x1,y1),一、相关系数(一)协方差,Social Statistics,社会统计学,第十二章 线性回归与相关,0,正相关:散布点主要位于一、三象限。,正相关,Social Statistics,社会统计学,第十二章 线性回归与相关,负相关:散布点主要位于二、四象限。,负相关,Social Statistics,社会统计学,第十二章 线性回归与相关,零相关:散布点均匀分布在4个象限,不存在线性相关关系。,零相关,Social Statistics,社会统计学,第十二章 线性回归与相关,协方差公式:协方差表示x与y两变量观测值相对其各自均值所造成的共同平均偏差。协方差的数量可以作为变量线性相关程度的度量。,Social Statistics,社会统计学,第十二章 线性回归与相关,方差公式:,(二)相关系数r计算公式与取值,对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,记为 r,Social Statistics,社会统计学,第十二章 线性回归与相关,1.计算公式相关系数就是标准化了的协方差:,Social Statistics,社会统计学,第十二章 线性回归与相关,2.性质 性质1:r 的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负相关 r=0,不存在线性相关关系-1r0,为负相关0r1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱,Social Statistics,社会统计学,第十二章 线性回归与相关,相关系数的性质(取值及其意义的图解),r,Social Statistics,社会统计学,第十二章 线性回归与相关,相关系数受变量取值范围的影响很大。因此在给出相关系数的同时,还应该给出相关系数的取值范围。,Social Statistics,社会统计学,第十二章 线性回归与相关,性质2:相关系数不因坐标原点的改变或单位的变化而变化性质3:仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系性质4:r具有对称性。即x与y之间的相关系数和y与x之间的相关系数相等,即rxy=ryx性质5:r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系性质6:相关系数具有PRE的性质,Social Statistics,社会统计学,第十二章 线性回归与相关,(判定系数),Social Statistics,社会统计学,第十二章 线性回归与相关,r为相关系数;PRE(r2)系数为判定系数。二者的区别?,Social Statistics,社会统计学,第十二章 线性回归与相关,例1:为了研究受教育年限与职业声望之间的关系。设以下是8名抽样调查结果。求相关系数。,Social Statistics,社会统计学,第十二章 线性回归与相关,Social Statistics,社会统计学,第十二章 线性回归与相关,Social Statistics,社会统计学,第十二章 线性回归与相关,相关系数(r)显示职业声望与受教育年限之间具有很强的正相关,即教育年限越长,职业声望就越高。决定系数r2,则表示用教育年限来预测职业背景时,能够减少90.25%的误差。r系数值越大,就表示线性回归方程的预测能力越强。,接例1,计算教育年限与职业声望的相关系数,例2:某地区历年人均收入与商品销售额资料如下:要求计算人均收入与商品销售额的相关系数,Social Statistics,社会统计学,第十二章 线性回归与相关,解:将计算表中的数值代入效率公式得:,Social Statistics,社会统计学,第十二章 线性回归与相关,(三)相关系数的假设检验H0:0(总体中两个变量不相关);H1:0(总体中两个变量相关)。t 服从自由度为n-2的 t 分布。,Social Statistics,社会统计学,第十二章 线性回归与相关,为使用者方便,上述检验简化为使用相关系数r进行直接检验。具体步骤为:1.列出原假设和研究假设 2.根据r公式计算样本的r值 3.根据显著性水平和k=n-2,按附表8查出相应的临界相关系数r 4.比较r的绝对值与r的大小:如r绝对值r,则x与y之间存在线性相关关系;如r绝对值r,则x与y之间不存在线性相关关系。5.做结论,Social Statistics,社会统计学,第十二章 线性回归与相关,对例题1得出的相关系数进行检验。H0:0(总体中两个变量不相关);H1:0(总体中两个变量相关)。=0.05,k=8-2=6,查附表8得:r=0.070 rr因此可以认为总体中x和y存在线性相关。,Social Statistics,社会统计学,第十二章 线性回归与相关,相关系数r的检验与回归系数的检验的关系:从前一节可见,回归系数的检验是为了确认配置线性回归方程是否有意义,也就是确认总体是否存在线性相关,这和相关系数的检验目的是相同的。即:也就是说,如果通过了r的检验也必然导致(F检验)检验的通过。实际上,F公式与 r 公式有对应关系:,Social Statistics,社会统计学,第十二章 线性回归与相关,接例1,用F检验法判断受教育年限与职业声望是否存在相关性。,查附表得:F0.05(1,n-2)=5.99因为F F0.05(1,n-2)=5.99,所以拒绝总体为r=0(或b=0的假设),即可以认为配置回归方程是有意义的。,查附表得:t0.05(8-2)=1.9432因为t t0.05(6)=1.9432,所以拒绝原假设,即可以认为受教育年限与职业声望是相关的。,仍以例1为例,用t检验法判断受教育年限与职业声望是否存在相关性。,二、线性相关与线性回归的关系1.区别(1)相关表示相互关系,不一定有因果关系;而回归所描述的是一种因果关系。相关关系只是因果关系的必要条件。因此回归分析必须区分自变量和因变量,而相关分析不必区分。(2)回归分析的两个变量一个是自变量,一个是因变量,通过给定自变量的值来推算因变量的可能值;而相关分析的两个变量都是随机变量。,Social Statistics,社会统计学,第十二章 线性回归与相关,(3)回归分析中对于因果关系不甚明确的两个变量,可以建立两个回归方程;而相关分析只能计算出一个相关系数。(4)r 没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有关;回归系数与r相关系数都是描述两个定距变量间的线性关系的指标。,Social Statistics,社会统计学,第十二章 线性回归与相关,(5)相关分析的目的在于了解两个变量关系的有无、大小和方向,本质上说相关分析只是对客观现象的一种描述程序,它不能给出当一个变量x有x的变化发生时,y的变化y具体有多大。回归分析比相关分析进了一步,它不仅分析两个变量关系的有无、大小和方向,而且要了解两个变量具体是以什么方式发生关系的。它是对相关的两个变量间关系的具体形态的一种深入分析。它根据两变量间关系的具体形态,选择一个合适的数学模型,用来近似地表达变量间平均变化关系,这个数学模型就是回归模型。因此,回归分析除了具有描述和说明这种关系的功能外,还具有预测的功能。,Social Statistics,社会统计学,第十二章 线性回归与相关,2.联系 尽管有上述不同,但回归分析与相关分析间有着十分密切的关系,实际上r值所要表示的,就是以回归方程作为预测工具时所能减少的误差比例,r值越大,就表示回归方程的预测能力越强,即散点图中的点越靠近回归直线。因此在社会研究中往往要先计算r的值,然后再决定是否用回归分析。,Social Statistics,社会统计学,第十二章 线性回归与相关,回归分析的区间估计:对于给定的 X 值,求出 Y 的一个个别值的预测区间。,第五节 用回归方程进行预测,如果 相互独立。都服从相同的正态分布,则随机变量y的标准化:服从自由度为n-2的t分布,总体的回归模型,Y 的个别值相对于其估计值的方差,当X=X0时,所估计的Y0 的方差组成,与用 估计 Y平均值相联系的方差,给定一个变量 X=X0,如果要预测Y 的一个个别值 Y0 的置信区间,则其相应的残差为:,即:Y0的方差为:,即:,则 Y 的一个个别值 Y0 的标准差的估计值为:,因此,对于给定的 X0,Y 的一个个别值Y0 的预测区间估计值为:,已知,即,也就是:,若令=0.05,则有 t/2(n-2)=2.31,当 时,得到最小值。当 时,的值随 的减少或增加而逐步增大。,如何才能缩小置信区间?,1.增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n-2)的临界值越小;同时,增大样本容量,在一般情况下可使 减小,因为式中分母的增大是肯定的,分子并不一定增大。2.提高模型的拟合优度,以减小残差平方和。设想一种极端情况,如果模型完全拟合样本观测值,残差平方和为0,则置信区间长度也为0,预测区间就是一点。3.提高样本观测值的分散度。在一般情况下,样本观测值越分散,作为分母的 的值越大,致使区间缩小。置信水平与置信区间是矛盾的。置信水平越高,在其他情况不变时,临界值 越大,置信区间越大。如果要求缩小置信区间,在其他情况不变时,就必须降低对置信水平的要求。,回归方程的估计与预测,估计的前提:回归方程经过检验,证明 X 和 Y 的关系在统计上是显著相关的。,对于给定的 X 值,求出 Y 的一个个别值的预测区间。,区间估计,对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值的预测值。,点估计,点估计,区间估计,对于给定的 x=x0,Y 的1-置信区间为,即:,在大样本条件下,近似有:,练习题1,Social Statistics,社会统计学,第十二章 线性回归与相关,将计算结果代入回归方程得:,Social Statistics,社会统计学,第十二章 线性回归与相关,r2表示知道X与Y的关系之后,预测Y的值,可以减少93%的误差。,检验:H0:0(总体中两个变量存在线性相关);H1:0(总体中两个变量不存在线性相关)。=0.05,k=12-2=10,查附表8得:r=0.576 rr因此可以认为总体中x和y存在线性相关,r具有推论总体意义。,Social Statistics,社会统计学,第十二章 线性回归与相关,2.以下是子代与父代受教育年限的抽样调查:,求:(1)回归方程(2)相关系数、判定系数及是否具有推论意义(=0.05),Social Statistics,社会统计学,第十二章 线性回归与相关,(1)回归直线:,将计算结果代入回归方程得:,(2)相关系数及判定系数:相关系数(r)显示父代与子代之间的受教育年限具有很强的正相关。决定系数r2表示用一方的受教育年限预测另一方的受教育年限时,能够减少83.72%的误差。,(3)检验:H0:0(总体中两个变量存在线性相关);H1:0(总体中两个变量不存在线性相关)。=0.05,k=5-2=3,查附表8得:r=0.878 rr因此可以认为总体中x和y存在线性相关,r具有推论总体意义。,Social Statistics,社会统计学,第十二章 线性回归与相关,回归方程的检验步骤,1.提出假设H0:=0(线性关系不显著),2.计算检验统计量F,确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若FF,拒绝H0;若FF,接受H0,Social Statistics,社会统计学,

    注意事项

    本文(社会统计学课件.ppt)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开