中科大概率论与数理统计讲义04数理统计的基本概念及抽样分布.docx
《中科大概率论与数理统计讲义04数理统计的基本概念及抽样分布.docx》由会员分享,可在线阅读,更多相关《中科大概率论与数理统计讲义04数理统计的基本概念及抽样分布.docx(20页珍藏版)》请在课桌文档上搜索。
1、第四章 数理统计的基本概念及抽样分布教学目的:1)使学生对什么叫数理统计及其发展史有一个初步的了解。2)使学生掌握数理统计的若干基本概念,如总体、样本、简单样本、统计模型等。3)使学生掌握统计量2、卜F、正态总体样本均值和样本方差的分布及其简单性质.?4.1引言什么叫数理统计学本课程的前四章介绍了概率论的基本内容,为数理统计学建立了重要的数学基础.从 本章起,我们转入本课程的第二部分一数理统计学.下面我们首先说明什么是数理统计 学.统计学的任务是研究怎样有效地收集、整理和分析带有随机性影响的数据,从而对 所考虑的问题作出一定结论的方法和理论.它是一门实用性很强的学科,在人类活动的 各个领域有着
2、广泛的应用.研究统计学方法的理论基础问题的那一部分构成数理统计 学”的内容.一般地可以认为数理统计是数学的一个分支,它是研究如何有效地收集和有效地使用带有随机性影 响的数据的一门学科.下面通过例子对此加以说明.1 .有效地收集数据收集数据的方法有:全面观察(或普查)、抽样调查和安排试验等方式.例4.1.1.人口普查和抽样调查.我国在2000年进行了第五次人口普查.如果普查的数 据是准确无误的,无随机性可言,不需用数理统计方法.由于人口普查,调查项目很多, 我国有13亿人口,普查工作量极大,而训练有素的工作人员缺乏.因此虽是全面调查,但 数据并不可靠,农村超计划生育瞒报、漏报人口的情况时有发生.
3、针对普查数据不可靠, 国家统计局在人口普查的同时还派出专业人员对全国人口进行抽样调查,根据抽样调 查的结果,对人口普查的数字进行适当的修正.抽样调查在普查不可靠时是一种补充办 法.如何安排抽样调查,这是有效收集数据的重要问题,这构成数理统计学的一个重要 分支一抽样调查方法.例4.12考察某地区IOooO农户的经济状况.从中挑选10。户做抽样调查.若该地区分成 平原和山区两部分,平原地区较富,占该地区农户的7。,山区的3。农户较穷.我们的 抽样方案规定在抽取的100户中,从平原地区抽7。户,山区抽3。户,在各自范围内用随机 化方法抽取.在本例中有效收集数据是通过合理地设计抽样方案来实现的.在通过
4、试验收集数 据的情形如何做到有效收集数据,请看下例:例4.1.3.某化工产品的得率与温度、压力和原料配方有关.为提高得率,通过试验寻找 最佳生产条件.试验因素和水平如下样品因素/1234期8100012001400压力10203040配方ABCD3个因素,每个因素4个水平共要做43 = 64次试验.做这么多试验人力、物力、财力都不 可能.因此,如何通过尽可能少的试验获得尽可能多的信息?比如来用正交表安排试验 就是一种有效的方法.如何安排试验方案和分析试验结果,这构成数理统计的另一分支一试验的设计和 分析.在本例中有效收集数据是通过科学安排试验的方法来实现的.在有效收集数据中一个重要问题是:数据
5、必须具有随机性.2 .有效的使用数据获取数据后,需要用有效的方法,去集中和提取数据中的有关信息、,以对所研究的 问题作出一定的结论,在统计上称为“推断”.为了有效的使用数据进行统计推断,需要对数据建立一个统计模型,并给定某些准 则去评判不同统计推断方法的优劣.例4.1.4.为估计一个物体的重量a才巴它在天平上称5次获得数据Xi , X2, X X X , 5,它们都 受到随机性因素的影响(天平的精度反映了影响的大小).估计a的大小有下列三种不同 方法:(1)用5个数的算术平均值J = 1(1 + XXX + X5)去(古计a;(2)将Xi , X2 , X X X , 5按大 小排列为X(1)
6、 2 X(2) 2 X X X 2 X,取中间一个值X去估计a;(3)用W = YX+ x(5) 去估计a你可能认为7优于x(3),而x(3)优于W.这是不是对的?为什么是这样?在什 么条件下才对?事实上,对这些问题的研究正是数理统计学的任务.要回答这些问题我们需要对数据建立一个统计模型和制定评判不同统计推断方法 的准则.本例中在适当的假定下,可认为数据服从正态模型.下面我们举一个例子说明采用合适的统计方法也是有效使用数据的一个重要方面.例4.15某农村有100户农户,要调查此村农民是否脱贫.脱贫的标准是每户年均收入 超过1万元.经调查此村90户农户年收入5000元,10户农户年收入10万元,
7、问此村农民是 否脱贫?(1)用算术平均值计算该村农户年均收入如下:f = (90 0.5 + 10 c),作为用 推断a的正福桂的合理指标.统计推断包括下列三方面内容:提出种种的统计推断的方法.(2)计算有关统计 推断方法性能的数量指标,如前述例子中用用 估计N(a,垃)中的a,用P(IS . a C)表示 推断性能的数量指标.在一定的条件和优良性准则下寻找最优的统计推断方法,或证 明某种统计推断方法是最优的.?4.3统计量?4.3.1统计量的定义数理统计的任务是通过样本去推断总体.而样本自身是一些杂乱无章的数字,要对 这些数字进行加工整理,计算出一些有用的量,这就如同为了织布,我们首先要把棉
8、花 加工纺成纱,然后利用纱去织布.可以这样理解:这种由样本算出来的量,把样本中与所 要解决的问题有关的信息集中起来了.我们把这种量称为统计量,其定义如下:定义431.由样本算出的量是统计量,或日,统计量是样本的函数.对这一定义我们作如下几点说明:(1)统计量只与样本有关,不能与未知参数有关.例如X N(a, 2),X,xxx,X.是从 总体X中抽取的iid.样本,则0 Xi和 Xf都是统计量,当a和。2皆为未知参数时,。(i.i=1i=1i=1a)和Xf 2都不是统计量.i=1(2)由于样本具有两重性,即样本既可以看成具体的数,又可以看成随机变量;统计 量是样本的函数,因此统计量也具有两重性.
9、正因为统计量可视为随机变量(或随机向 量),因此才有概率分布可言,这是我们利用统计量进行统计推断的依据.(3)在什么问题中选用什么统计量,要看问题的性质.一般说来,所提出的统计量应 是最好的集中了样本中与所讨论问题有关的信息,这不是容易做到的.?4.3.2若干常用的统计量1 .样本均值:设Xi , X X X , X.是从某总体X中抽取的样本,则称_ 1 Xi . i=1为样本均值.它分别反映了总体均值的信息.2 .样本方差:设Xi , X X X , X.是从某总体X中抽取的样本,则称S2 = (Xi . V)2n 1i= 1为样本方差,它分别反映总体方差的信息.而S称为样本标准差,它反映了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中科大 概率论 数理统计 讲义 04 基本概念 抽样 分布

链接地址:https://www.desk33.com/p-393176.html