中科大概率论与数理统计讲义06假设检验.docx
《中科大概率论与数理统计讲义06假设检验.docx》由会员分享,可在线阅读,更多相关《中科大概率论与数理统计讲义06假设检验.docx(17页珍藏版)》请在课桌文档上搜索。
1、第六章假设检验教学目的:1)理解假设检验的一些基本概念:零假设、对立假设、两类错误、拒绝域、显著性水 平、功效.2)学会将实际问题转化成假设检验问题来处理.3) 一样本和两样本正态总体均值和方差的假设检验.4) 0-1分布参数的假设检验.5)拟合优度检验、列联表的独立性和齐一性检验.?6.1基本概念和问题的提法?6.1.1零假设,对立假设,两类错误,拒绝域,显著性水平,功效在参数估计问题中,常常在抽样前先对未知总体作一些假定.例如假定总体X服从 正态分布,假定某个正态总体的方差为一个已知值等等.在数理统计中,关于总体分布 的概率性质的假定称为(统计)假设.抽样前所作出的假设是否与实际符合,可以
2、用样本 所提供的信息来检查,检查的方法与过程称为(统计)检验.假设检验问题就是研究如何 根据抽样后获得的样本来检验抽样前所作出的假设.首先,由一个例子引出一些基本概 念.例611.某饮料厂在自动流水线上罐装饮料.在正常生产情况下,每瓶饮料的容量(单 位:毫升)X服从正态分布N (500, 102)(由以往的经验得知).经过一段时间之后,有人 觉得每瓶饮料的平均容量减小到49。,于是抽取了9瓶样品,称得它们的平均值为i = 492 毫升.试问此断言是否正确?即问平均每瓶饮料的容量仍是500毫升还是变成490毫升? 假定标准差10毫升不变.在这个问题中,设经过一段时间后罐装饮料容量X的平均值为,则
3、由题意可设X s N (, 102).记x , . . . , X9为取自这个正态总体X的一组样本观测值,则了 = ; 3 Xi = 492.我们需要在“饮料平均容量为500毫升与“饮料平均容量为490毫升”之间作判断 即在 = 500和“ = 490”之间作判断.数理统计中,把它们看成两个假设 习惯上,称 前者为原假设或零假设,记作Ho;后者称为备择假设或对立假设,记作或Ha.所谓检 验Ho : = 500 O Hi : = 490.就是要根据样本判断究竟是“Ho成立还是Hi成立.断言Ho成立称为接受Ho;断言Fh成 立”称为拒绝Ho .下面讨论如何检验上述假设,即给定一个接受或者拒绝零假设
4、的准则.设从总体中 抽取一个样本K ,. . ., Xn,我们可以用极大似然估计T = S (称之为检验统计量)来估 计 .由于该估计值接近 (尤其是当样本量较大时),故当T的绝对值小的时候有利于HI 而不利于HO ,此时应该拒绝HO .我们可以事先取定一个常数 ,称之为临界值,当T的取 值小于该临界值时拒绝Ho,即样本满足W = V 中时拒绝Ho,称W为拒绝域.即样本的取值落在拒绝域中,就拒绝Ho,否则不能拒绝之. 一个拒绝域就对应于一个检验方法.现在的问题是T应该取多大?这涉及到两类错误. 、 事实 、Ho成立Hi成立接受HO不犯错第类错误拒绝HO第I类错误不犯错称实际上Ho成立但是它被拒
5、绝这个错误为第I类错误(弃真),而实际上Ho不成立 但是它被接受”这样一类错误为第H类错误(存伪).由于我们的方法是基于观测数据,而 观测数据是带有随机误差的,故难免在做出决策的时候犯错,我们能做的是控制犯错的 概率一个理想的检验应该使这两类错误的概率都小,但是在实际问题中不可能使这两 类错误一致地小:要让犯第I类错误的概率小,应该让T小,而要让犯第II类错误的概率 小,则T不能太小.解决这个矛盾的一个方法是在控制I类错误的基础上,尽量少犯第H 类错误(在下一小节中我们讨论如何设定假设时会提到,应该将受保护对象设为零假设, 故犯第I类错误的严重性更大,因此必须尽量避免犯第I类错误).具体地,选
6、定一个小的 常数。,取T使得犯第I类错误的概率,即T小于T的概率小于。.称。为显著性水平.理想 情况下,取得恰好满足Ph(T Tf则称T为临界值.如果零假设成立但拒绝了零假 设,则称犯了第I类错误,如果对立假设成立但接受零假设,则称犯了第H类错误.如对 任意的0eo,犯第I类错误的概率Pe(T(X1,. . .,Xn)eA)小于或等于某个正的常数), 则称。为显著性水平.显然显著性水平不是唯一的,事实上,如果。是一个显著性水平, 则任意大于。的数都是显著性水平.实际中通常采用显著性水平最小的那一个.一个检 验对应于一个拒绝域,称B() = P (Ho被拒绝)为检验的功效函数.如果检验的显著性
7、水平为 ,则当6 e Oo时,B() 2 .而当6 e 0,我们希望功效值越大越好(这样犯第 类错误的概率1二()就越小),所以功效可以作为评价一个检验优劣的准则.?6.1.2假设检验问题的提法在有时候需要自己判断如何提假设检验问题.在建立假设检验问题时有两个原则O原则一:将受保护的对象置为零假设.如我国按照以前的司法制度,公安机关抓到 嫌疑犯后,很多情况下要犯人自己证明无罪(有罪推断),这对嫌疑犯很不利,从而容易 导致冤案.现在的司法制度则总假定嫌疑犯是无罪的,要司法部门证明其有罪(无罪推 断),这样做大大地有利于保护公民的利益,如果要将真正的嫌疑犯绳之以法,则司法部 门必须有充分的证据,这
8、样做可以有效保护公民的权益,对司法部门要求也变高了.又 比如药厂生产出一种新药,在上市前要通过食品与药品监管局的检验.显然使用药品的 病人是应该受保护的对象,这时应该设定一个有利于病人的命题作为零假设,这个命题 就是“新药不比安慰剂效果好,以尽量避免病人用无效甚至有副作用的新药.当然,对立 假设就是“新药比安慰剂效果好.将检验的显著性水平设定得较小,以保证零假设不 被轻易推翻.在实际问题中,如果根据某个合理的检验方法发现零假设被推翻,则有充 分的理由认为零假设不成立而对立假设成立,这是因为万一零假设成立而被误据的概率 不会超过。;另一方面,如果发现零假设未被拒绝,并不表明有充分理由接受零假设,
9、而是因为零假设被保护得较严密以至于未被拒绝.原则二:如果你希望“证明”某个命题,就取相反结论或者其中一部分作为零假设(类 似于反证法).这种提法往往是在两个假设命题中不太清楚哪个应受保护,此时可以借 用司法制度里的“谁主张,谁举证,即若想用统计方法向人证明一个命题,则将那个 命题置为对立假设.注意这里的证明不是数学上的严格证明,而是允许犯错的一种统计 推断方法.用统计方法证明一个命题不是一件容易的事情,所以如果没有足够把握,人 们应该避免用统计方法去证明一个命题.上述两原则是统一的:一般不应该让受保护对象去证明一个命题.?6.1.3检验统计量的选取及假设检验的步骤通过解答例6.1.1来说明假设
10、检验的步骤.例6.12 (例6.1.1续)能否在显著性水平0.05下认为饮料的平均容量确实减少到49。毫 升?解:基于统计量,我们采用“标准化过的检验统计量(减均值再除以标准差)T n(r 二 500)=10以使该统计量服从标准正态分布,检验的拒绝域仍取形如 T1 ,我们控制犯第I类 错误的概率等于。,即P(TIVTIle = 500) = .由于e = 500时TI服从标准正态分布,易知上面关于TI的方程的解为TI=二Ua,其中UC 等于标准正态分布的上C分位数,即检验的拒绝域为Tl 0 或者Ho : 2 0o Hi : 0(4) Ho : = o o Hi : o 或者HO : o o H
11、i : (,. .,Xn是取自总体X的一个样本.取显著性水平为。.(1)方差已知时均值的检验先考虑双侧假设,即要检验Ho : = o- Hi : o .由于的极大似然估计为1,取“标准化”后的检验统计量U = U(1 , . . .,Xn)= E -O注意到当HO成立时,U、N(0,1), |UI应该较小,反之当IUl的观测值U(XIxn)较大 时,不利于零假设HO应该拒绝之.所以选拒绝域形如).要求显著性水平为。,即Ph0(U I t ) = ,解得T = ua2.于是检验的拒绝域为U I Ua2.即当观测值(X1, . .,Xn)满足不等式人TiIf - A): Ua/2时拒绝Ho.类似地
12、,检验单侧假设Ho : = o- Hi : o 或者 Ho : o仍然用统计量U ,由于U大时不利于Ho,取拒绝域为 Ua.而检验另一个单侧假设Ho : = o t Hi : o 或者 Ho : W o t Hi : o的拒绝域为U IUa六.虽然我们取的临界值只考虑使检验在 = o处的犯I类错误的概率为。,从检验的拒绝 域的形状上可直接看出来在零假设下 W 0 (或小)时犯第I类错误的概率恒小于或 等于.以上三个检验统称为U检验.例621.随机地从一批铁钉中抽取16枚,测得它们的长度(单位:厘米)如下:2.9423712.988662 3.106234 3.109316 3.118427 3
13、.132254 3.140042 3.1701882.902562 3.128003 3.146441 2.978240 3.103600 3.003394 3.044384 2.849916已知铁钉长度服从标准差为0.1的正态分布,在显著性水平 = 0.01下,能否认为这批铁 钉的平均长度为3厘米?如显著性水平为 = 0.05呢?解:这是方差已知时关于均值的假设检验问题,Ho : = 3 t Hi : 3.u/2.由样本算得检验统计 量的值为U 5 2.16,如显著性水平为0.01,则临界值为SOO5 5 2.58,跟检验统计量的值比 较发现不能拒绝零假设,即不能推翻铁钉平均长度为3厘米的假
14、设;而如果显著性水平 为0.05时,临界值为so25 = 1.96,此时可以拒绝零假设,认为铁钉平均长度不等于3厘米 这个例子说明结论可能跟显著性水平的选择有关:显著性水平越小,零假设被保护得越 好从而更不容易被拒绝.(2)方差未知时均值的检验考虑检验Ho : = o t o ,由于方差未知,可以在将S标准化的过程中用样本方差S2代替总体方差2,得检验统计 量_ V I UoT= tn-1 (2).此检验称为t检验.类似地可以得到另外两个单侧假设的检验拒绝域,列于表6.2.1中.例6.2.2.(例6.2.1续)设方差未知,则在水平0.01和0.05下能否认为铁钉平均长度为3厘 米?解:这是方差
15、未知时关于均值的假设检验问题,Ho : = 3 O Hi : 3取检验统计量为T=A取:二3)S ,检验的拒绝域为IT I t- (a2).由样本算得检验统 计量的值约为2.21,与显著性水平0.01对应临界值熊(0005) 口 2.95比较,不能拒绝零假 设,而与显著性水平005对应临界值1 (0.025) 口 2.13比较,可以拒绝零假设,即在显著 性水平0.01下不能拒绝铁钉平均长度为3厘米的假定,但在显著性水平0.05下可以认为 铁钉平均长度不等于3厘米,此结论与方差已知情形一致.(3)方差的检验考虑假设检验问题Ho : 2 = o Hi : 2 g.对均值已知的情形,由。2的极大似然
16、估计2 = - (Xi 二 )2 i=1可以构造检验统计量在H。下,X2 s 2 , 2的平均值为n,而在HI下,2 = 分 的均值为沙 n,因此当2 的值过于偏离n时应该拒绝HO ,于是拒绝域取成,2 X式W2)、.对均值未知的情形,构造检验统计量2 (n 二 1)S2X = O-o其中S2为样本方差.在Ho下,2 s2.1,拒绝域取成/X2 2 .1 (a2)x .对于单侧假设,可以类似得到检验的拒绝域,参看表621.上述检验称为2检验.例6.23 (例6.2.1续)在水平0.1下能否认为铁钉的标准差大于0.1厘米?解:这是均值未知时关于方差。2的假设检验问题,Ho : 2 2 0.12
17、O Hi : 2 0.12.取检验统计量为2 =勺P ,检验的拒绝域为2 2 .1 (a).由样本算得检验统计量 的值2 口 14.32,与显著性水平0.2对应临界值X覆0l) 口 2231比较,不能拒绝零假设,即 在显著性水平0.1下可以认为铁钉的标准差小于0L表621总结了有关一样本正态总体的假设检验.?6.2.2两样本正态总体的情形为了检验某肥料是否能显著提高玉米产量,可以设计一个随机试验:选择两块条件 一样的试验区把两试验区各分成若干小块,一个试验区的各小块施肥,另一个试验区 的各小块不施肥,最后统计收成,可以采用如下的检验方法来检验玉米产量差别,从而 知道肥料是否有效.设总体X s
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中科大 概率论 数理统计 讲义 06 假设检验

链接地址:https://www.desk33.com/p-393169.html