第8章抽样推断.ppt
《第8章抽样推断.ppt》由会员分享,可在线阅读,更多相关《第8章抽样推断.ppt(146页珍藏版)》请在课桌文档上搜索。
1、第八章 抽样推断,第一节 抽样推断的概述第二节 简单随机抽样的参数估计第三节 其它常用的抽样组织方式第四节 假设检验 第五节 单因素方差分析,第一节 抽样推断的概述,一、抽样推断二、抽样推断中的几个基本概念三、重复抽样与不重复抽样四、抽样分布五、抽样平均误差,一、抽样推断 1、抽样推断的定义 抽样推断是指依随机的原则,从总体中抽取一部分单位组成样本,并据样本资料计算样本特征值,再据样本特征值对总体特征值做出具有一定可靠程度的估计,以达到认识总体数量特征的目的。注意如下几点:部分与全部。随机原则。部分特征与全部特征的关系。对总体的认识。,2、抽样推断的作用特点抽样推断是现代统计学的中心内容,抽样
2、调查也是现代社会调查的主要的调查方法之一。抽样推断的作用不仅是解决了无法进行全面调查问题,还可以节省调查成本。抽样推断最明显的特点是对抽样产生的误差可以事先计算并可加以控制。,3、抽样推断的主要内容 抽样推断的目的并不在于了解样本的数量特征,而是要借助样本的数量特征,来估计和检验总体分布的数量特征及某些未知因素。其主要内容:1)随机抽样 随机抽样是指按随机的原则从总体中抽取部分单位,构成样本的过程。2)统计估计 统计估计是根据随机抽取的部分单位的特性来对总体的分布函数、分布参数或数字特征等进行推测估算的过程。3)假设检验 假设检验是指根据经验或不成熟的认识,在的总体的有关分布函数、分布参数或数
3、字特征等信息作出某种假设的前提下,为了确定该假设的正确性,而自总体中随机抽取部分单位,利用部分与总体间的关系来对所提出的假设作出判断,以决定是否接受该假设的过程。,二、有关抽样的基本概念,(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。2.样本个数。样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。,(二)总体参数与样本统计量 1.总体参数。总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。常见的
4、总体参数有:总体的平均数,总体成数(比例),总体分布的方差、标准差。它们都是反映总体分布特征的重要指标。,2.样本统计量。样本统计量是样本的一个函数。它们是随机变量。我们利用统计量来估计和推断总体的有关参数。常见的样本统计量有:样本平均数,样本比例,样本的方差、标准差。,三、重复抽样与不重复抽样,四、抽样分布,抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。(主要求出样本平均数的期望与方差)包括以下内容重复抽样分布样本平均数的分布样本成数的分布不重复抽样分布样本平均数的分布样本成数的分布,重复抽样分布-样本平均数的分布,某班组5个工人的日工资为34、38、42
5、、46、50元。=422=32现用放回抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。,验证了以下两个结论:抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用 表示。,由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布这是一个非常重要的结论,有广泛的应用。(请参见中心极限定理。),总体成数p是指具有某种特征的单位在总体中的比重。现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成数是:P也是一个随机变量,利用样本平均数的分布性质结论,即有:,不重复抽样分布,样本均值的分布性质:样本成数的分布性质,抽样分布总结
6、,第二节 参数估计,一、参数估计概述二、总体均值的估计三、总体比例的估计四、总体方差的估计,一、参数估计概述,(一)参数估计的定义与种类 所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函数)。例如,估计总体均值,估计总体比例和总体方差等等。参数估计有两种基本形式:点估计和区间估计。前者是用一个数值作为未知参数的估计值,后者则是给出具体的上限和下限,把 包括在这个区间内。,(二)点估计 点估计,主要有矩估计法和最大似然估计法。矩估计法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量;最大似然估计法是把待估计的总体参数看作
7、一个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。,(三)估计量的优良标准,2.有效性。又称最小方差性。,(四)区间估计与估计的精度和可靠性,二、总体均值的估计,【例】某企业加工的产品直径X是一随机变量,且服从方差为0.0025的正态分布。从某日生产的大量产品中随机抽取6个,测得平均直径为16厘米,试在0.95的置信度下,求该产品直径的均值置信区间。,解:本例产品数量很多,即总体单位数N很大,故采用放回抽样的有关公式计算。样本平均数 n=16样本平均的标准差=0.
8、0204抽样极限误差=1.960.0204=0.04所求的置信区间为:16-0.0416+0.04 即(15.96,16.04)。,如何得到?,例:某零件的长度服从正态分布,从该批零件中随机抽取9件,测得平均长度为21.5mm,已知总体方差为0.0225.试求该种零件平均长度的95%的置信区间。,解:已知则代入公式得:即:0.95 21.5,0.025,我们用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,如何理解?错误的理解:60-80区间以95%的概率包含全班同学平均成绩的真值;或以95%的概率保证全班同学平均成绩的真值落在60-80分之间。正确的理解:如果做了多次抽样(如1
9、00次),大概有95次找到的区间包含真值,有5次找到的区间不包括真值。如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:该班同学平均成绩的置信区间是60-80分,置信度为95%。,(二)总体方差2未知的情形,2.区间估计,【例】在上例中,若总体方差未知,但通过抽取的6个样本测得的样本方差为0.0025,试在0.95的置信度下,求该产品直径的均值置信区间。,例:在总体 服从正态分布的情况下,从某大学本科生中随机抽取100人,调查他们平均每天参加体育锻炼的时间为30分钟,样本方差为36,试以95%的置信水平估计该校本科生平均每天参加体育锻炼的时间?,解;由题意可知,用T分布求解。=95%
10、,则其区间为:=,例:某种果树产量服从正态分布,随机抽取6 棵测得其产量分别为:111,91,102,104,116,110。以95%的置信水平估计全部果树的平均产量。,解:代入公式计算得:,=(96.45,114.89),三、总体比例的估计,解:本例总体单位数N很大,故采用放回抽样的有关公式计算。n=300,p=0.02,n P=65,可以认为户数n充分大,=0.05,z=1.96。=0.0081*1.96=0.016因此,所求电视机拥有率的置信区间为0.02-0.016P0.02+0.016,即(0.004,0.036)。,例:从一个随机样本n=100中知道,某城镇居民家庭中夫妻不是双职工
11、的比例是20%。试以95%的置信水平估计总体P的置信区间。,解:已知则代入公式得置信区间,例:某灯泡厂从一批10000只灯泡中随机抽取500只,检验其平均耐用时数。规定灯泡耐用时数在850小时以上者为合格品。有关资料如下:,试以95.45%的置信水平对这批灯泡的平均耐用时数和合格品率进行区间估计。,解:样本的平均耐用时数、方差和成数:,平均耐用时数的区间为:,成数的区间为:,问:这批灯泡合格品的数量的区间范围是多少?,总体均值区间估计总结,如果不是正态总体,或分布未知,总体成数估计区间估计总结,总体成数估计区间的上下限只考虑大样本情况(请记住大样本条件),一、问题的提出二、估计总体均值时样本容
12、量的确定三、估计总体比例时样本容量的确定四、使用上述公式应注意的问题,参数估计中的精度要求与可靠性要求常常是一对矛盾!增加样本容量n?样本容量n究竟取多大合适?,(一)、问题的提出,四、样本容量的确定,(二)、样本容量的确定,(三)、使用上述公式应注意的问题,1总体的方差与成数常常是未知的,这时可用有关资料替代:一是用历史资料已有的方差与成数代替;二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;三是比例方差在完全缺乏资料的情况下,就用比例方差的最大可能值0.25代替。,2.上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替
13、。例如计算得到:n=56.03,那么,样本容量取57,而不是56。,3.如果进行一次抽样调查,需要同时估计总体均值与比例,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足两方面的需要。,例:某公司为估计某市拥有其产品的家庭数目,进行了一次抽样调查,据销售部门估计该市拥有其产品的家庭约占10%。(1)若要求以95.45%的把握保证拥有率估计的绝对误差不超过1%,应抽多少户?(2)若其它条件不变,要求其产品拥有估计的相对误差不超过5%,又应抽多少?,解:(1)已知:代入公式得:,(2)已知:代入公式得:,第三节 其它常用的抽样组织形式,一、简单随机抽样二、类型抽样三、整群抽样四、等
14、距抽样,返回,一、简单随机抽样(纯随机抽样),按随机原则直接从总体N个单位中抽取n个单位作为样本,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式,返回,二、类型抽样(分层抽样),将总体全部单位分类按主要标志分类,形成若干个类型组,然后从各类型中按随机原则分别抽取样本单位组成样本。,等额抽取,等比例抽取,最优抽取,能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标。,返回,三、整群抽样(集团抽样),将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本。,例:总体群数R=16 样本群数r=4,样本容量,返回,四
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 推断
![提示](https://www.desk33.com/images/bang_tan.gif)
链接地址:https://www.desk33.com/p-751504.html