抽样调查教案1绪论.docx
《抽样调查教案1绪论.docx》由会员分享,可在线阅读,更多相关《抽样调查教案1绪论.docx(15页珍藏版)》请在课桌文档上搜索。
1、抽样调查教案1绪论李启才南京师范大学数学与计算机学院IiqiCainjnu.Cdu.Cn07级统计学目录第1章绪论第2章简单随机抽样(18)第3章分层抽样(48)第4章不等概率抽样(76)第5章整群抽样(3)第6章系统抽样(3)第7章多阶抽样(3)第8章二重抽样(3)第10章复杂样本的方差估计第11章调查中的非抽样误差(3)第12章案例及其它(3)1参考文献:1致谢:本讲义大量参考引用了文献1、2、3、4、5与其它文献内容,在此一并致谢!抽样技术金勇进蒋妍李序颖编著人大出版社(教材)抽样技术与应用杜子芳编著清华大学出版社抽样调查倪加勋 广西师范大学出版社抽样调查L. KishtUSA倪加勋主译
2、 中国统计出版社抽样调查樊鸿康高教出版社第一章绪论1.1统计与抽样调查引言:什么是统计?你觉得我们需要统计嘛?比如你想明白江苏省2008年人均年收入及其收入分布状况怎么办?像人口普查那样?你想要熟悉南师同学们每个月平均消费水平怎么办?一个个同学去询问?你想过下列问题嘛?当你买了一台电视时,被告知三年内能够免费保修。你想过厂家凭什么这样说吗?说多了,厂家会缺失;说少了,会失去竞争,也是缺失。到底这个保修期是如何决定的呢?如何通过大众调查来得到性别、年龄、职业、收入等各类因素与公众对某项事物(比如商品或者政策)的态度的关系呢?如何才能够客观地得到某个电视节目的收视率,以确定广告的价格是否合理呢?“
3、调查结果说明20%的观众喜欢某节目”“抽样调查结果的误差为3%“支持率的95%置信区间为(25%,30%)”“某学校排名第一”.“消费价格指数为120%”“该药品疗效99%”“该国贫富差距大”“该型号电器的有用年限是20年”你能够举出很多例子。实际上,上述诸多问题都是统计问题,统计学能够解决。因此你马上学习的数理(推断)统计很重要。通常来说,统计先从现实世界收集数据(抽样),然后根据数据作出推断。那么数据你怎么得到呢?像人口普查那样?当然你事实上也可从报纸、电视、互联网、年鉴等方面看到各类数据同时从这些数据能够提取对自己有用的信息。这些间接得到的(并非自己收集的)数据都是二手数据。获得第一手数
4、据要困难得多。某方便面企业每年至少花三四千万元来收集与分析数据,调查其产品及竞争者在市场中的状况、各类类型消费者对其产品的态度、收集各地方的经济交通等信息等等。可见获得统计数据,并对它分析,提取需要的信息是非常重要的,你的预测决策都需要。你能够有很多方法去获取数据,而我们马上进行的抽样调查就是科学获得局部数据并对它进行分析的一种有效手段。一、什么是抽样调查(SarnPIeSUrVey)调查(survey)是系统的信息搜集(或者收集)与分析活动。它通常包含调查主体、调查客体、调查目标、调查目的、调查方案等要素。人类社会在进展过程中离不开对数据、资料、信息的统计调查与分析,比如人口普查、工业生产普
5、查等等这些都是我们常见的。然而政府统计中的普查与定期报表只适于对基本国情(国势、国力等)等调查,而大量的社会现象都不可能作全面调查(一方面费时费力费财.,是否值得?我们是否会“为了明白牛肉的滋味而吞噬掉整头牛”(萨缪尔森Samuelson)?另一方面某些现象根本无法作合理的普查,由于被调查对象可能不完全清晰),因此进展非全面调查非常必要,通过局部数据推断全局特征,这正是统计的一条主线。广义意义上的抽样调查就是非全面调查。非全面调查根据抽取方式不一致,又能够分为非概率抽样与概率抽样。(一)非概率抽样非概率抽样没有严格的定义,也称非随机抽样,是一种不按照随机原则、总体中各单位被抽中概率事先未知或者
6、难以确定的抽样,样本的抽取要紧根据人们的主观推断或者简便性原则来进行。其致命的缺点是,难以计算与操纵抽样误差,难以保证推断的准确性与可靠性。非概率抽样有很多形式:随意抽样、典型抽样、重点抽样、推断抽样、定额抽样与流淌总体抽样等等。随意抽样:也称任意抽样,即抽样者随意地或者任意地(通常遵循便利原则)从总体中抽取样本。如我们常见的街头拦访、商场在柜台分发的问卷调查等。这样的样本往往有偏,不能代表总体。比如调查1840岁女性关于某品牌化妆品观点,则在柜台拦到的单元很可能属于更倾向于经常购买某类或者某品牌的人群,她们的观点显然不能代表全体1840岁的女性。典型抽样:只对总体中的典型(有代表性的)单元调
7、查。如调查一个地方农村经济进展情况,根据调查者对当地情况的熟悉,选择有代表性的村调查;典型案件的调查等。重点调查:只对总体的重点单元调查。这些被选择的单元尽管数目不多,但它们的标志总量在总体总量中占据了绝大部分。如调查我国钢铁行业的现状,则只对宝钢、鞍钢、首钢等几家国有特大型企业调查,由于这几家产量占全国产量大半,把握了它们的情况就能够把握总体情况。典型调查与重点调查中假如抽样者对典型或者重点把握比较准确,则会有较高精度,否则精度比价低。还有其它非概率抽样不一一赘述,本课程重点是在概率抽样上。(二)概率抽样概率抽样也称随机抽样,是遵循随机性的原则,使总体中的每个单位都有一个事先已知的、非零概率
8、被抽中的抽样。从总体中抽取部分单元,采取科学的统计方法,以其所得到的结果对总体的数量特征作出具有一定精度与信度的估计与推断的一种非全面调查方法。总体各单元被抽中的概率能够通过样本设计来规定,通过某种随机化操作来实现。通常所说的、狭义上的抽样就是指概率抽样,狭义上的抽样调查就是指概率抽样调查。常用的概率抽样方式有简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样。我们将在后面章节一一介绍。而抽样调查是遵循随机性的原则,采取科学的统计方法,从总体中抽取部分单元进行调查,以其所得到的结果对总体的数量特征作出具有一定精度与信度的估计与推断的一种非全面调查方法。因而在抽样调查中需要以较多的概率统计知
9、识为基础。二、抽样调查的随性原则抽样调查的随机性原则是指在抽样过程中,样本单元的抽取不受任何主观因素及其它系统因素的影响,从而保证总体中的每一个单元都有一定的概率被抽中。随机性原则是抽样调查所务必遵循的基本原则。有人把随机性原则懂得为任意性或者随意性,还有人将随机性原则等同于客观性原则,认为只要排除了人的主观意识就满足了随机性原则,这些都是不正确定。事实上,随机性原则包含两个缺一不可得方面:抽样的客观性与样本的随机性。(比如网络上的随机调查,随意很大,就不满足这样的条件)抽样的客观性是指在整体抽样过程中,总体每个单元是否被抽中不取决于任何主观因素的影响。这就是说,每个样本单元的取得,既不取决于
10、调查者的爱好与愿望,也不决定于被调查着的合作态度。即使调查者认为所抽取得某个调查单元,加入后会影响样本对总体的估计,也不能另取一个来代替被抽中的样本单元。由于这样就会破坏抽样的客观性,从而违背随机性原则,坚持抽样的客观性是坚持随机性原则的前提。抽样的随机性是指整个抽样过程中务必保证总体各个单元都有一定的被抽中的概率。只有这样才能保证样本结构类似总体结构,才能运用概率与数理统计知识进行合理推断。一个反面案例是:1936年美国作家文摘对总统选举的民意预测调查。该刊从电话簿与俱乐部成员中选取100O万样本进行调查,其中回收200万份,根据样本反映共与党候选人Landon(兰登,57%)大幅度领先民主
11、党候选人RoSSeVIt(罗斯福,43%),因此该刊预测共与党候选人LandOn将确信胜出。然而选举结果却是民主党候选人Rossevlt(62%)以很大优势胜出(LandOn,38%)。为什么作家文摘花费那么大精力收集那么多数据会产生那么大错误,最终导致该刊不久即“关门大吉”呢?原先作家文摘选取样本出了很大问题,完全没有遵循随机性原则。选取得IooO万份样本明显排斥穷人,由于在当时,通常穷人很少拥有私人电话或者属于哪个俱乐部。众所周知,经济地位很大程度上影响政治态度,穷人压倒性支持ROSSeVIt,而有钱人倾心LandOn,作家文摘选取样本没有反映出这样的社会现实(总体结构),从而犯了致命错误
12、。三、抽样调查的特点与作用(1)遵循随机性原则(2)能够科学合理推断总体(3)能够较好的操纵误差(在一定信度下)当今,抽样方法的应用范围不断扩大,它的原理(包含抽样调查理论与抽样推断理论)已成为统计学中进展最快、最活跃的一个分支。它在社会经济与科学领域的应用愈加广泛。 节约成本 时效性强 提高调查数据的质量-能够承担全面调查无法胜任的项目:(1)无限总体比如,气象调查、新工艺新设备新材料的功能调查等等(2)包含未来时间序列总体比如生产过程稳固性检查(3)破坏性的产品质量检验比如灯具寿命有些现象尽管属于有限总体,但是总体范围过大,如水库鱼苗数,森林蓄木量;有些现象根据研究的任务要求没有必要进行全
13、面调查,如民意测验。当然,抽样技术也并非十全十美,首先是由于技术性强而不易懂得与掌握,其次是抽样推断的结果有的时候也会产生差错,三是关于总体未被调查的部分很难提供有价值的信息,四是有些理论方法问题还没有得到完全解决。另外你得有思想准备:作为统计学类课程,它将面临大量实际问题与数据,很多时候计算量是巨大的,然而计算机的进展给你带来了很大的方便,因此应学会使用一些统计软件。(如SPSS)四、抽样调查的应用领域(一)人口调查1、人口调查是最早应用抽样技术的领域。2、我国抽样技术在人口调查中的应用要紧有三个方面:一是用于普查中提早估计人口总数与检验普查的质量;二是用于两次普查年份之间(逢5年份)的1%
14、的人口抽样调查;三是用于每年一次的经常性人口变动情况抽样调查。3、我国现行的人口变动情况抽样调查,使用在抽中的调查小区(调查群),按常住人口登记的原则以户为单位进行调查,全国约抽取120万人。抽样调查的要紧指标是人口出生率、死亡率与失业率。调查的标准时间为当年10月31日0时,现场登记的时间为11月份。调查以全国为总体,以省级单位为次总体,使用分层、多级、概率比例的抽样方法。多数省级单位使用五级抽样方法,直辖市与少数省级单位使用四级抽样方法。(二)经济调查1、经济调查是应用抽样技术最为普遍、也最重要的领域。目前各国在产业、贸易、金融、居民收入与支出、消费等方面,基本上都通过抽样调查来获取信息。
15、2、我国在经济调查方面应用抽样技术的要紧有下列这些方面:农村居民生产、生活情况调查,农产量调查,城镇居民生活情况调查,工业调查,批发零售贸易与餐饮业调查,第三产业调查,企业景气调查,物价调查,固定资产投资调查等政府统计调查,与不一致主体的各类市场调查、专题经济调查。3、不一致的调查,所应用的抽样技术也不一样。(三)社会调查1、抽样技术在社会调查中的应用要紧是各类社会专题调查与民意调查。2、我国有关主管部门与研究机构曾先后组织开展了公众对物价改革的社会心理反映调查,深入的生育率调查,全国专业技术人员状况调查,妇女地位调查,中国儿童情况调查,公众对科学技术态度调查,与老年人状况调查、青少年犯罪调查
16、、全国群众安全感调查等。3、2004年11月的第四次全国群众安全感抽样调查,按照多阶段、分层、整群、概率比例抽样方法,在全国共抽取了997个县、市与市辖区的3631个乡、镇、街道,共调查了102309个家庭,每个家庭随机抽取一名16岁以上的人员。4、我国这些年来,各类研究机构、民间团体也进行了大量民意调查。(四)其它调查抽样技术还在文化卫生调查、环境资源调查等方面得到广泛应用。比如,我国曾先后进行了全国使用语言文字情况调查,中国5岁下列儿童死亡率调查,国家卫生服务总调查,高血压流行病学调查,结核病流行病学调查,老年痴呆病调查,青少年肥胖症调查,儿童脯齿情况调查,粮食农药污染情况调查,耕地面积卫
17、星遥感调查等专题抽样调查。有些国家还开展了森林资源、草地资源与珍惜动物资源等的抽样调查。此外,各国在电视收视率调查方面也广泛使用了抽样技术。五、抽样调查进展简史(来源)1、1776年,法国经济学家麦桑斯在其所著的法国人口论中,以部分地区的人口清查数来推算全国人口。1786年,法国著名数学家拉普拉斯建议用某些地区的出生率来推算整个法国人口,并对推算误差进行了研究。1802年,他在全国选择了30个县,对连续三年内出生的人数进行了调查,得出人口出生率为35.27%o02、1853年,曾提出统计结果稳固性的“平均人”理论的比利时统计学家凯特莱主持召开了第一次国际统计会议,提出在家庭收支调查方面使用“代
18、表性”调查。3、1861年,英国的威廉法尔在人口普查中利用了部分抽样。19世纪末,任美国联邦劳动委员会委员的赖特,在国家工业与劳动统计中曾提到使用“代表性”的样本。4、挪威首任中央统计局局长凯尔是尽力提出并推广抽样技术的先驱者,他在1895年于瑞士伯尔尼召开的第五届国际统计学会会议上,根据1894年由他自己亲自组织进行的关于挪威退休金与疾病保险金抽样调查的经验(调查项目60多个,样本人数8万),提出了所谓“代表性调查”的抽样方法,首次引入了抽样益需代表性调查定义为“根据抽样设计,从总体的正常代表冲合理地收集数据”,认为“调查结果的准确性,不是取决于观察数量的多少,而是取决于正确的代表性方法”,
19、主张“按照一个以过去统计调查为基础的合理方法来选取样本单位”,也就是按照调查者的主观推断来取样,这就是我们所说的有目的抽样。由于凯尔没有提出完善的推断理论与解决如何检验“代表性”的问题,因此他的观点引起了猛烈争论。5、1899年,在俄国彼得堡召开的第七届国际统计学会会议上,凯尔继续捍卫“代表性调查”的方法,同时强调该方法不仅适用于社会经济调查,也适用于农业与林业,还提出了分层的思想与操纵调查结论、便于统计分析的主张,呼吁研究与进展这一方法的实际与理论的各个方面。国际统计学会任命一个分委员会来充分讨论这个问题,同时要求提出研究报告。6、1903年,第九届国际统计学会会议在柏林召开,对“代表性方法
20、”进行确信,并建议继续进行研究。此后,相继出现了随意抽样、推断抽样、定额抽样等非概率抽样形式,并在相当长的时期里得到应用。但非概率抽样毕竟不够科学,比如1936年美国文学摘要杂志用随意抽样方式与1948年美国盖洛普(GanUP)咨询公司用定额抽样方式对总统选举所作的推断预测都遭遇了失败。7、随着代表性方法逐步被同意,争论的焦点开始集中在如何保证样本的代表性上。德国统计学家波特基维茨(1901年)与英国统计学家鲍莱(1906年)都提出应以概率论作为抽样的理论根据。1908年,英国的戈塞特提出了小样本思想与t分布理论。1923年,费希尔提出了方差分析法,完善了小样本理论,阐述了实验设计原理。英国统
21、计学家蒂配特编制了历史上第一张随机数字表。8、1924年,国际统计学会成立“抽样方法应用研究委员会”。1925年,在罗马举行的第十六届国际统计学会会议上,公布了鲍莱的抽样精确度的测定与丹麦统计学家詹森的代表性方法的实践两个报告,首次对随机抽样与有目的抽样进行了比较研究,提出了要按照概率原理给每个单位都有被抽中机会的观点,从理论与实践上充分确信了抽样方法的科学性。91934年,美国统计学家奈曼根据概率论的原理提出了置信区间的推断理论,此后又提出了分层抽样的样本最优分配原理与方法,改进了整群抽样设计,探讨了比率估计方法与双重抽样技术,研究了不等概率抽样方法,并从对比研究中进一步确信了随机抽样的优越
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 教案 绪论
链接地址:https://www.desk33.com/p-570357.html