心理与教育统计学07.ppt
《心理与教育统计学07.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学07.ppt(96页珍藏版)》请在课桌文档上搜索。
1、第六章 抽样分布及总体平均数的推断,第一节抽样分布,一、抽样分布的概念要区分以下三种不同性质的分布:总体分布:总体内个体数值的频数分布。样本分布:样本内个体数值的频数分布。抽样分布:某一统计量的概率分布。实验性的抽样分布是为了容易了解,实际上抽样分布是一个理论的概率分布。它是统计推断的理论依据。,二、平均数抽样分布的几个定理,1、从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。2、容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的平方根。3、从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。4、虽然总体不呈正态分布,如果样本容量较大,反映
2、总体平均数和标准差的样本平均数的抽样分布,也接近于正态分布。,值得注意:,1、抽样分布是统计推断的理论依据。2、抽样误差用抽样分布上的标准差来表示。3、某种统计量在抽样分布上的标准差称为该种统计量的标准误。,三、样本平均数与总体平均数离差统计量的形态,(一)正态分布及渐进正态分布1、总体分布为正态,总体方差已知时,无论样本大小,样本平均数的抽样分布为正态 分布。2、总体分布为正态,总体方差未知时,只要样本容量n30,样本平均数的分布为正态分布。3、总体分布为非正态分布,但总体方差已知,若样本容量n30.样本平均数的抽样分布为渐进正态分布。当抽样分布为正态分布或渐进正态分布时,样本平均数与总体平
3、均数离差的统计量用Z值来表示。,(二)t分布若总体呈正态分布,总体方差未知而且n30,样本平均数的抽样分布为t分布。样本平均数与总体平均数的离差的统计量用t值来表示。t分布的特点:T分布是一种左右对称的分布,且分布的形状随样本容量的变化而变化。,t 分布,t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,正态分布与t分布的比较,相同点:1、取值范围相同2、平均数为0,且以平均数处为最高峰向俩侧逐渐下降3、尾部无限延伸,以横轴为渐进线4、单峰对称形,不同点:1、t分布的形态随自由度的变化呈一簇分布
4、形态,2、t分布的峰狭窄尖峭,尾长而翘的高,在基线上分布的范围广。自由度越小,分布范围越广3、当自由度增大时,t分布逐渐接近正态分布。当自由度无限大时,t分布与正态分布重合。,t分布表(教材333页),t分布表是由T分布函数计算得到的,给出了不同自由度时某些概率下的t值。因为t分布曲线以纵轴为对称轴,表中只有t的正值。表的左列为不同的自由度,最上面一行是指t分布曲线两尾部的概率(面积)之和,而表第二行标明的是t分布曲线一侧的尾部概率。当t分布曲线两侧尾部概率相同时,不同的自由度下其相应t值是不同的。,自由度:指总体参数估计量中变量值独立自由变化的个数。用df表示自由度与统计运算和统计推断中样本
5、容量及限制因素的个数有关。自由度的个数等于样本容量n减去限制因子的个数。,第二节总体平均数的估计,总体参数估计假设检验,参数估计在统计方法中的地位,参数估计的方法,统计推断的过程,根据样本统计量对相应总体参数所作的估计叫总体参数估计,1、点估计 用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。点估计的评价标准如下:,无偏性(unbiasedness),无偏性:估计量抽样分布的数学期望等于被估计的总体参数,有效性(efficiency),有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效,一致性(consistency),一致性:随着样本容量的增大,估计量的值越
6、来越接近被估计的总体参数,点估计的特点:,1、用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息,2、区间估计以样本统计量的抽样分布(概率分布)为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。在一定的可靠程度上求出总体参数的置信区间的上下限。,区间估计,在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分
7、数在7585之间,置信水平是95%,区间估计的图示,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为(1-为是总体参数未在区间内的比例常用的置信水平值有 99%,95%,90%相应的 为0.01,0.05,0.10,置信水平,由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间,置信区间,置信区间与置信水平,影响区间宽度的因素,1.总体数据的离散程度,用 来测度2、样本容量,3、置信水平(1-),影响 z 的大小,总体均值的区间估计(正态总体、已知,或非正态总体、大样本),1、
8、总体分布为正态,总体方差已知时,无论样本大小,样本平均数的抽样分布为正态 分布。2、总体分布为正态,总体方差未知时,只要样本容量n30,样本平均数的分布为正态分布。,总体均值的区间估计(大样本),1.假定条件总体服从正态分布,且方差()未知如果不是正态分布,可由正态分布来近似(n 30)2、使用正态分布统计量 z,3、总体均值 在1-置信水平下的置信区间为,总体均值的区间估计(例题分析),【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从
9、正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%,总体均值的区间估计(例题分析),解:已知N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:总体均值在1-置信水平下的置信区间为,该食品平均重量的置信区间为101.44g109.28g,总体均值的区间估计(例题分析),【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间,总体均值的区间估计(例题分析),解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:,总体均值在1-置信水平下的置信区间为,
10、投保人平均年龄的置信区间为37.37岁41.63岁,总体均值的区间估计(正态总体、未知、小样本),总体均值的区间估计(小样本),1.假定条件总体服从正态分布,且方差()未知小样本(n 30)使用 t 分布统计量,总体均值 在1-置信水平下的置信区间为,t 分布,t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,总体均值的区间估计(例题分析),【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间,总体均值的区间估计
11、(例题分析),解:已知N(,2),n=16,1-=95%,t/2=2.131 根据样本数据计算得:,总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,结 束,THANKS,总体比例的区间估计,总体比例的区间估计,1.假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 z,3.总体比例在1-置信水平下的置信区间为,总体比例的区间估计(例题分析),【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:已知 n=100,p65%
12、,1-=95%,z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.35%,总体方差的区间估计,总体方差的区间估计,1.估计一个总体的方差或标准差2.假设总体服从正态分布总体方差 2 的点估计量为S2,且,4.总体方差在1-置信水平下的置信区间为,总体方差的区间估计(图示),总体方差的区间估计(例题分析),【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间,总体方差的区间估计(例题分析),解:已知n25,1-95%,根据样本数据计算得 s
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 教育 统计学 07
链接地址:https://www.desk33.com/p-250445.html