抽样调查第2章简单随机抽样.ppt
《抽样调查第2章简单随机抽样.ppt》由会员分享,可在线阅读,更多相关《抽样调查第2章简单随机抽样.ppt(95页珍藏版)》请在课桌文档上搜索。
1、2.1 定义与符号,一、定义,简单随机抽样:N个单元的总体中随机 抽取n个单元组成样本。,1.若抽样是放回的,则所有可能的样本有,个,每个样本被抽中的概率为,这种抽样方放回简单随机抽样。,2.若抽样是不放回的,则所有可能的样本有,不放回简单随机抽样。,1.简单随机抽样是等概抽样,即每个总体单元都有相同的入样概率;2.随机抽取是有严格要求的,不是随便抽取,必须按照某一随机原则进行。,注意,【例 2.1】设总体有5个单元(1,2,3,4,5),按,放回简单随机抽样的方式抽2个单元,则所有可,(放回简单随机抽样所有可能的样本),【例 2.2】设总体有5个单元(1,2,3,4,5),按,不放回简单随机
2、抽样的方式抽2个单元,则所有可,(不放回简单随机抽样所有可能的样本),在实际工作中,更多地采用不放回简单随机抽样,所以以下讨论的简单随机抽样一般都指不放回简单随机抽样.,二、符号,大写字母表示总体单元的标志值:如,小写字母表示样本单元的标志值:如,调查的总体目标量主要有:,比例 P;两个总体总量的比率 R。,对估计精度进行计算时,要涉及到总体方差和,样本方差等。下面分别列出:,总体方差,样本方差,还有一些其他符号,分别说明如下:,总 体,,,样 本,将左边式子中的大写字母改为小写字母。,到的总体指标的估计。如,估计量的方差用V表示,如,标准差用S表示,如,2.2 简单估计量及其性质,无论调查对
3、象是何种总体参数,其实所有估计量通常都是样本均值的某种线性组合,因此在抽样中不管讨论何种估计的基本性质,都只围绕样本均值进行。而对样本均值这个核心估计量的研究则分为两个方面:,一方面是求样本均值对所有可能样本的数学期望(检验估计量是否无偏)。,另一方面是求样本均值对所有可能样本的方差(检验估计量误差的大小)。,为了讨论简单估计的性质,首先我们来看两个引理:引理一 从大小为N的总体中抽取一个样本量为n的简单随机样本,则总体中每个特定单元的入样概率为:,两个特定单元都入样的概率为:,引理一的证明:在N个单元中取n个单元为样本,共有 个样本。在 个样本中,包含某个特定单元 的样本数为:每个样本被抽中
4、的概率为:。,同时包含两个特定单元 的样本数为 每个样本被抽中的概率为:,引理二 从总体规模为N的总体中抽取一个样本量为n的简单随机样本。若对总体中的每个单元,引进随机变量 如下:,由二项分布可知:,所以,不难推出:,下面我们用两种与数理统计中不同的方法来证明这一性质。思考:为什么不能用数理统计中常用的方法?,有了这些准备,我们很容易证明,根据前面提到的关于 的定义,有下式,证明:对于一个大小为N的总体,样本量为n的,其他几个估计量的无偏性可容易推出:,1、对于总体总量,2、对于总体比例,有限总体校正系数。,证明方法一,即,证明方法二:由定义,而,因此有,即,证明:将 改写成:,由前面性质1证
5、明用过的对称论证法有:,由性质2有:,下面我们从关系式,可以推出其他几个估计量的方差,总体总量的估计量方差是总体均值方差的直接推导,下面我们来推导总体比例估计量的方差。,设N个样本单元中有N1个具有某一特性,即有N1个单元取值为1,有N-N1个单元取值为0.,同理对样本方差有,因此,同样下面我们从关系式,可以推出,从式可以看出,影响估计量方差的因素有:,分析见教材P38,39,N通常很大,当f0.05时,可将1-f近似取为1,这时影响估计量方差的主要因素是样本量n和总体方差。的大小是我们无法改变的,因此,要提高估计量的精度就只有加大样本量。,注 意,【例2.3】我们从某个N=100的总体中抽出
6、一个大小为n=10的简单随机样本,要估计总体平均水平并给出置信度95%的置信区间。,解:依题意,N=100,n=10,f=,样本均值为:,样本方差为:,因此,总体平均值的估计为:,的方差为:,的方标准差为:,s,的置信度95%的置信区间为:,即 2.4295,7.5705.,V(,注意:不放回时的方差为放回时的约1-f倍,而,1-f1,因此不放回抽样的估计精度比放回抽样的,估计精度高。,【例2.4】我们从某个N=100的总体中抽出一个大小为n=10的简单随机样本,要估计总体总量并给出在置信度95%的条件下,估计量的相对误差。,解 依题意,N=100,由例2.3可知:,因此,对总体总量的估计为:
7、,=1005=500。,0,其标准差为:,因此,在置信度95%的条件下(对应的,t=1.96),的相对误差为:,【例2.5】,解:已知 n=200,a=130,1-f1,某超市开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该超市与附近几个小区居委会取得联系,在整体中按简单随机机样,抽取了一个大小为n=200人的样本。调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%条件下,给出估计的绝对误差和置信区间。假定这时的抽样比可以忽略。,在置信度95%的条件下,估计的绝对误差为:,的95%置信区间
8、为:,0.65,2.3 比率估计量及其性质,用样本均值作为总体均值的简单估计量,具有无偏等很多优良性质,且完全不依赖其它总体信息。但是,若我们有与调查变量相关的其它信息(通常称为辅助变量信息)可以利用,则估计的精度可以大大提高。这就是我们下面要讲的比率估计和回归估计。,一、估计的概念,设 主要变量为:Y 辅助变量为:X 两变量的比率为:,总体均值的比估计:,其中,二、比率估计的特点及注意事项,1、使用比估计首先要知道辅助变量的总体均值(或总体总量),调查时,既要观测主要变量的值还要观测辅助变量的值;2、辅助变量必须与主要变量高度相关且整体上应相当稳定;3、比估计虽然不是无偏的,但其精度要高于简
9、单估计量很多。,下面我们看一个简单估计与比估计对比的例题,【例】,对以下假设的总体(N=6),用简单随机抽,样抽取 n=2 的样本,比较简单随机抽样比率估计及简单估计的性质。,解:,对这个总体,我们列出所有可能的,个样本,以比较简单估计与比率估计的性质。,由此,可以算出:,总结1、从计算表格中可以看出,均值的比估计很稳定,而均值的简单估计则波动剧烈。2、虽然比率估计是有偏估计,但偏倚不大,而估计量方差要比简单估计的方差小得多。3、比估计是一种很好的估计量,是提高估计精度的最有效的途径。4、思考:比估计为什么能大幅度地提高估计精度?,对于简单随机抽样,n较大时,比率估计具有以下性质:,关于比率估
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 简单 随机 抽样
链接地址:https://www.desk33.com/p-671463.html