统计学抽样与抽样分布.ppt
《统计学抽样与抽样分布.ppt》由会员分享,可在线阅读,更多相关《统计学抽样与抽样分布.ppt(67页珍藏版)》请在课桌文档上搜索。
1、第四章 抽样与抽样分布,4.1 抽样的基础知识4.2 抽样分布 4.3 中心极限定理的应用,1,4.1 抽样的基础知识,一、几个概念二、抽样误差三、常用的抽样方法,2,一、几个概念,(一)全及总体与总体指标全及总体。简称总体(Population),是指所要研究的对象的全体,它是由所研究范围内具有某种共同性质的全部单位所组成的集合体。总体单位总数用N表示。(举例)总体指标(参数)。在抽样估计中,用来反映总体数量特征的指标称为总体指标,也叫总体参数。研究目的一经确定,总体也唯一地确定了,所以总体指标的数值是客观存在的、确定的,但又是未知的,需要用样本资料去估计。,3,总体和参数(续),通常所要估
2、计的总体指标有,一、几个概念,(二)样本总体与样本指标样本总体。简称样本(Sample),它是按照随机原则,从总体中抽取的部分总体单位的集合体。样本容量:样本中所包含的个体的数量,一般用n表示。在实际工作中,人们通常把n30的样本称为大样本,而把n30的样本称为小样本。样本分量:其中每一个Xi是一个随机变量,称为样本分量。样本观察值:一次抽样中所观察到的样本数据x1、x2、x3称为样本观察值。对于某一既定的总体,由于抽样的方式方法不同,样本容量也可大可小,因而,样本是不确定的、而是可变的。,5,一、几个概念,(二)样本总体与样本指标样本指标(统计量)。在抽样估计中,用来反映样本总体数量特征的指
3、标称为样本指标,也称为样本统计量或估计量,是根据样本资料计算的、用以估计或推断相应总体指标的综合指标。,6,样本和统计量,统计量(statistic)。在抽样估计中,用来反映样本总体数量特征的指标称为样本指标,也称为样本统计量或估计量,是根据样本资料计算的、用以估计或推断相应总体指标的综合指标。常见的样本统计量有:样本统计量不含未知参数,它是随样本不同而不同的随机变量。,二、抽样误差,(一)抽样误差的概念抽样误差是统计调查误差的一种形式。统计调查误差,是指调查所得结果与总体真实数值之间的差异。在抽样调查中,误差的来源有两大类:登记性误差。是任何一种统计调查都可能产生.代表性误差 系统性误差 随
4、机误差,8,样本统计量一、统计量 随机抽样每次抽取的结果Xi,可能是总体中任何一个个体。因此可以看成是一个随机变量。n次抽取形成的样本X1,X2,Xn可以看成是一组随机变量。设X1,X2,Xn是来自总体X 的一个样本,g(X1,X2,Xn)是X1,X2,Xn的一个函数。若 g 是连续函数,且 g 中不含任何未知参数,则称 g(X1,X2,Xn)是一个统计量。统计量也是一个随机变量。设x1,x2,xn 是相应于样本X1,X2,Xn的一个样本值,则称 g(x1,x2,xn)是统计量 g(X1,X2,Xn)的一个观测值。统计量作为一个随机变量,它的分布称为抽样分布。,设X1,X2,Xn是来自总体X
5、的一个样本。x1,x2,xn是这个样本的一个样本值。则,(4)样本比例:Ps=k/n,其中k为样本中某属性出现次数,概率抽样(probability sampling),概率抽样也叫随机抽样,是指按随机原则抽取样本。随机原则,就是排除主观意识的干扰,使总体每一个单位都有一定的概率被抽选为样本单位,每个单位能否入选是随机的。特点能有效地避免主观选样带来的倾向性误差(系统偏差),使样本资料能够用于估计和推断总体的数量特征,而且这种估计和推断得以建立在概率论和数理统计的科学理论之上可以计算和控制抽样误差,说明估计的可靠程度。作用:在不可能或不必要进行全面调查时,利用概率抽样来推断总体;利用概率抽样修
6、正或补充全面调查的不足。,概率抽样(probability sampling),统计上所指的抽样一般都是指概率抽样概率抽样最基本的组织形式有:简单随机抽样、分层抽样、等距抽样和整群抽样。,简单随机抽样(simple random sampling),从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率,简单随机样本(
7、simple random sample),由简单随机抽样形成的样本从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为n样本都有相同的机会(概率)被抽中 参数估计和假设检验所依据的主要是简单随机样本,分层抽样(stratified sampling),又称类型抽样或分类抽样。先对总体各单位按主要标志加以分组(层),然后再从各组(层)中按随机原则独立抽选一定单位构成样本。分层抽样通过分类(组),把总体中标志值比较接近的单位归为一组,减少各组内的差异程度,这样再从各组抽取样本单位就更具有代表性,因而抽样误差也就相对缩小。特别是在标志值相差悬殊时,由于划分了类型,一方面缩小了组内方差,另一
8、方面也保证各组都能抽取一定的样本单位,所以,分层抽样较之纯随机抽样可以提高样本的代表性,能获得更为满意的效果,分层抽样(stratified sampling)续,优点:除了可以对总体进行估计外,还可以对各层的子总体进行估计可以按自然区域或行政区域进行分层,使抽样的组织和实施都比较方便分层抽样的样本分布在各个层内,从而使样本在总体中的分布比较均匀如果分层抽样做得好,便可以提高估计的精度,系统抽样(systematic sampling),将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一
9、个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:简便易行。可提高估计的精度缺点:对估计量方差的估计比较困难,它是先将总体所有单位按某一标志顺序排列,然后按相等的距离抽取样本单位。排列的标志可以是无关标志也可以是有关标志。(1)无关标志,指和单位标志值的大小无关或不起主要的影响作用。(2)有关标志,指作为排队顺序的标志和单位标志值的大小有密切的关系。其中,按有关标志顺序排队,并将样本单位加以n等份后,对每一部分抽取一个样本单位有两种方法 半距中点取样 对称等距取样 应该指出的是,等距取样间隔的确定,要避免与想象中的周期性节奏重合,引起系统误差的影响。,19,整群抽样(cluster
10、sampling),将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差,多阶段抽样(multi-stage sampling),先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推广,使抽样的段数增多,就称为多阶段抽样具有整群抽样的优点,保证样本相对集中,节约调查费用需要包含所有低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开
11、在大规模的抽样调查中,经常被采用的方法,概率抽样(小结),非概率抽样,也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额抽样(是按照一定标准或一定条件分配样本单位数量,然后由调查者在规定的数额内主观地抽取样本)、方便抽样(指调查者按其方便任意选取样本。如商场柜台售货员拿着厂家的调查表对顾客的调查)等就属于非随机抽样。优点:及时了解总体大致情况,总结经验教训,在进行大规模抽样调查之前的试点。缺点:非随机抽样容易产生倾向性误差,并且误差不能计算和控制,也就无法说明调查结果的可靠程度。,概率抽样与非概率抽样,抽样类型,概率抽样,
12、非概率抽样,简单随机抽样,分层随机抽样,整群抽样,系统抽样,方便抽样,判断抽样,其他非概率抽样,多阶段抽样,重复抽样与非重复抽样,重复抽样,又称回置抽样,是指从总体的N个单位中,每次抽取一个单位后,再将其放回总体中参加下一次抽选,连续抽n次,即得到一个样本。特点:样本是由n次相互独立的连续试验构成的,每次试验是在完全相同的条件下进行,每个单位中选的机会在各次都完全相等。“重抽”(考虑顺序)可能的样本数目(从总体中可能抽取的样本个数,用M表示)为:Nn个。,重复抽样与非重复抽样,不重复抽样,也叫不回置抽样,是指抽中的单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。特点:样本由n次连
13、续抽取的结果构成,实际上等于一次同时从总体中抽取n个样本单位。n次抽取结果不是独立的 可能的样本数目(考虑顺序):N(N-1)(N-2)(N-n+1)个。,重复抽样与非重复抽样,设有4名学生的月消费支出分别为:240,280,360,400元。我们分别用A、B、C、D替代。若从中抽取两个单位构成样本,则全部可能的样本数目为:重复:42=16个。它们是 AA AB AC AD;BA BB BC BD CA CB CC CD;DA DB DC DD不重复:43=12。它们是 AB AC AD;BA BC BD CA CB CD;DA DB DC,抽样误差,统计调查误差,是指调查所得结果与总体真实数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 分布
![提示](https://www.desk33.com/images/bang_tan.gif)
链接地址:https://www.desk33.com/p-259932.html