统计学假设检验.ppt
《统计学假设检验.ppt》由会员分享,可在线阅读,更多相关《统计学假设检验.ppt(125页珍藏版)》请在课桌文档上搜索。
1、第七章 假设检验,第七章 假设检验,第一节 假设检验的一般问题 第二节 一个正态总体的参数检验第三节 两个正态总体的参数检验第四节 假设检验中的其他问题,假设检验在统计方法中的地位,学习目标,了解假设检验的基本思想 掌握假设检验的步骤能对实际问题作假设检验利用置信区间进行假设检验利用P-值进行假设检验,第一节 假设检验的一般问题,假设检验的概念假设检验的步骤假设检验中的小概率原理假设检验中的两类错误双侧检验和单侧检验,假设检验的概念与思想,什么是假设检验?,概念事先对总体参数或分布形式作出某种假设利用样本资料检验总体参数的真伪。(原假设是否成立)类型参数假设检验非参数假设检验特点采用逻辑上的反
2、证法依据统计上的小概率原理,假设检验的基本思想,例:以往新生儿体重X(3190,2),现随机抽取30个新生儿,得平均体重3120g,问与往年相比,体重是否发生了显著变化。,样本均值3120与总体均值3190是有差异的,这种差异表示为。如果H0真,则这种差异一般是很小的,根据 的差异的大小,可决定接受还是拒绝H0。如果 越大,越倾向于拒绝原假设,大到何种程度,需要时定一个检验规则:,当 时,拒绝H0,当 时,接受H0,以样本3120检验总体3190,提出假设,H0:=3190,续,利用统计量,小概率事件在一次试验中几乎是不可能发生的。如果原假设为真,以样本数据判断总体参数,所冒风险仅为,假如发生
3、了,则对原假设表示怀疑。,称C为临界值。它是根据小概率事件原理来确定的。即:,是一个小概率事件,给定一个显著性水平,认定:,几个相关的的概念,原假设和备择假设:根据样本数据推断总体参数真伪,事先提出两个必居其一的假设,假设总体参数为真或假设总体参数为假,习惯上把其中一个称为原假设记为H0,而另一个为对立假设(备择假设)记为H1。,检验统计量:用于假设检验问题的统计量。选择 统计量的方法与参数估计相同,检验统计量的基本 形式为:,续,显著性水平:是一个概率值即原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域,以表示,常用的 值有0.01,0.05,0.10 通常由研究者根据被研究的对象特点
4、及研究任务的要求加以确定。,假设检验的过程(提出假设抽取样本作出决策),假设检验的步骤,提出原假设和备择假设 计算检验统计量 根据显著性水平,确立分位数 比较统计量与分位数并作出统计决策,假设检验中的两类错误(决策风险),续,的概率,是H0成立时,被舍弃的概率;(1-)的概率,即不发生的概率。一个好的检验应把一切不真得H0全都舍弃,尽量不要犯错误,所以(1-)越接近于1,说明检验功效越好,反之越差。所以(1-)成为检验功效大小的统计指标。的大小,取决于0的真值与H0假设的伪值1之间的差距的大小,差距越小,越难鉴别,越容易犯错误;差距越大,越容易鉴别,越不易犯错误。,双侧检验和单侧检验,双侧检验
5、与单侧检验(假设的形式),双侧检验,双侧检验属于决策中的假设检验。我们都必需作出“是”还是“非”假设。例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格建立的原假设与备择假设应为 H0:=10 H1:10,1-,单侧检验,左单侧检验:0 一般统计量为负值时。,右单侧检验:0一般统计量为正值时。,如何确定原假设和备择假设,检验研究中的假设:将所研究的假设作为备择假设 H1,然后再确立原假设。,例1,采用新技术生产后,将会使产品的使用寿命明显 延长到1500小时以上。,H0:1500 H1:1500,例2,改进生产工艺后,会使产品的废品率降低到2%以下。,H0:2%H1
6、:2%,例3,学生中经常上网的人数超过25%吗,H0:25 H1:25,检验某项声明的有效性 将所作出的说明(声明)作为原假设H0,然后将其对立面作为备择假设。例:某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上 建立的原假设与备择假设应为 H0:1000 H1:1000,续,第二节 一个正态总体的参数检验,一.总体方差已知时的均值检验二.总体方差未知时的均值检验三.总体比例的假设检验,一个总体的检验的参数,总体方差已知时的均值检验(双尾 Z 检验),一个总体的检验,均值的双尾 Z 检验(2 已知),1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)
7、2.原假设为:H0:=0;备择假设为:H1:0使用z-统计量,实例,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),计算结果,H0:=0.081H1:0.081=0.05n=200临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,总体方差已知时的均值检验(单尾 Z 检验),均值的单尾 Z 检验(2 已知),
8、假定条件总体服从正态分布若不服从正态分布,可以用正态分布来近似(n30)2.使用z-统计量,实例一,根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),计算结果,H0:1020H1:1020=0.05n=16临界值(s):,检验统计量:,在=0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,NORMS(0.95),实例二,某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均
9、不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(0.05),计算结果,H0:1000H1:1000=0.05n=100临界值(s):,检验统计量:,总体方差未知时的均值检验(双尾 t 检验),一个总体的检验,均值的双尾 t 检验(2 未知),1.假定条件总体为正态分布如果不是正态分布,只有轻微偏斜和大样本(n 30)条件下2.使用t 统计量,实例,【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本
10、标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,计算结果,H0:=1000H1:1000=0.05df=9-1=8临界值(s):,检验统计量:,总体方差未知时的均值检验(单尾 t 检验),实例,【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由120个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(=0.05),计算结果,H0:40000H1:40000=0.05df=1
11、20-1=119临界值(s):,检验统计量:,在=0.05的水平上拒绝H0,有证据表明轮胎使用寿命显著地大于40000公里,决策:,结论:,总体比例的假设检验(Z 检验),适用的数据类型,离散数据,连续数据,数值型数据,数 据,品质数据,一个总体的检验,一个总体比例的 Z 检验,假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的 z 统计量,为假设的总体比例,实例,【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(=0.05),结果,H0:p=0.3H1:p 0.3=0.05n=200临界值(s):,检
12、验统计量:,在=0.05的水平上接受H0,有证据表明研究者的估计可信,决策:,结论:,总体方差的检验(2 检验),一个总体的检验,方差的卡方(2)检验,1.检验一个总体的方差或标准差2.假设总体近似服从正态分布3.原假设为 H0:2=024.检验统计量,实例,【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(=0.05),计算结果,H0:2=0.0025H1:2 0.0025=0.05df=20-1=19临界值(s):,统计量:,在=0.05的水平上接受H
13、0,有证据表明该日纤度的波动比平时没有显著差异,决策:,结论:,第三节 两个正态总体的参数检验,一.两个总体参数之差的抽样分布两个总体均值之差的检验假设检验中相关样本的利用两个总体比例之差的检验,两个正态总体的参数检验,两个独立样本的均值检验,两个总体均值之差的Z检验(假设的形式),两个独立样本之差的抽样分布,两个总体均值之差的Z检验(12、22 已知),1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和 n230)原假设:H0:1-2=0;备择假设:H1:1-2 0检验统计量为,实例,【例】有两种方法可用于制造某种以抗拉强度为重要特征的产
14、品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05),计算结果,H0:1-2=0H1:1-2 0=0.05n1=32,n2=40临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,NORMSINV(0.025)=1.96,NORMSINV(0.975)=-1.96,两个总体均值之差的 t 检验(12、22未知),
15、检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=22检验统计量,其中:,实例,【例】一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12s22。试问能否认为用第二种方法组装比用第一中方法组装更好?(=0.05),计算结果,H0:1-2 0H1:1-2 0=0.05n1=10,n2=8临界值(s):
16、,检验统计量:,决策:,结论:,接受H0,没有证据表明用第二种方法组装更好,TINV(0.1,16),假设检验中相关样本的利用,两个相关(配对或匹配)样本的均值检验,两个总体均值之差的检验(配对样本的 t 检验),1.检验两个相关总体的均值配对或匹配重复测量(前/后)2.利用相关样本可消除项目间的方差3.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似(n1 30,n2 30),配对样本的 t 检验(假设的形式),注:Di=X1i-X2i,对第 i 对观察值,配对样本的 t 检验(数据形式),配对样本的 t 检验(检验统计量),自由度df nD-1,统计量,样本均值,样本标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 假设检验

链接地址:https://www.desk33.com/p-259908.html