欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    中科大概率论与数理统计讲义06假设检验.docx

    • 资源ID:393169       资源大小:40.89KB        全文页数:17页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    中科大概率论与数理统计讲义06假设检验.docx

    第六章假设检验教学目的:1)理解假设检验的一些基本概念:零假设、对立假设、两类错误、拒绝域、显著性水 平、功效.2)学会将实际问题转化成假设检验问题来处理.3) 一样本和两样本正态总体均值和方差的假设检验.4) 0-1分布参数的假设检验.5)拟合优度检验、列联表的独立性和齐一性检验.?6.1基本概念和问题的提法?6.1.1零假设,对立假设,两类错误,拒绝域,显著性水平,功效在参数估计问题中,常常在抽样前先对未知总体作一些假定.例如假定总体X服从 正态分布,假定某个正态总体的方差为一个已知值等等.在数理统计中,关于总体分布 的概率性质的假定称为(统计)假设.抽样前所作出的假设是否与实际符合,可以用样本 所提供的信息来检查,检查的方法与过程称为(统计)检验.假设检验问题就是研究如何 根据抽样后获得的样本来检验抽样前所作出的假设.首先,由一个例子引出一些基本概 念.例611.某饮料厂在自动流水线上罐装饮料.在正常生产情况下,每瓶饮料的容量(单 位:毫升)X服从正态分布N (500, 102)(由以往的经验得知).经过一段时间之后,有人 觉得每瓶饮料的平均容量减小到49。,于是抽取了9瓶样品,称得它们的平均值为i = 492 毫升.试问此断言是否正确?即问平均每瓶饮料的容量仍是500毫升还是变成490毫升? 假定标准差10毫升不变.在这个问题中,设经过一段时间后罐装饮料容量X的平均值为,则由题意可设X s N (, 102).记x , . . . , X9为取自这个正态总体X的一组样本观测值,则了 = ; 3 Xi = 492.我们需要在“饮料平均容量为500毫升"与“饮料平均容量为490毫升”之间作判断 即在" = 500"和“ = 490”之间作判断.数理统计中,把它们看成两个假设 习惯上,称 前者为原假设或零假设,记作Ho;后者称为备择假设或对立假设,记作或Ha.所谓检 验Ho : = 500 O Hi : = 490.就是要根据样本判断究竟是“Ho成立"还是"Hi成立".断言"Ho成立"称为接受Ho;断言"Fh成 立”称为拒绝Ho .下面讨论如何检验上述假设,即给定一个接受或者拒绝零假设的准则.设从总体中 抽取一个样本K ,. . ., Xn,我们可以用极大似然估计T = S (称之为检验统计量)来估 计 .由于该估计值接近 (尤其是当样本量较大时),故当T的绝对值小的时候有利于HI 而不利于HO ,此时应该拒绝HO .我们可以事先取定一个常数 ,称之为临界值,当T的取 值小于该临界值时拒绝Ho,即样本满足W = £ V 中时拒绝Ho,称W为拒绝域.即样本的取值落在拒绝域中,就拒绝Ho,否则不能拒绝之. 一个拒绝域就对应于一个检验方法.现在的问题是T应该取多大?这涉及到两类错误.'' 、 事实 '、'、Ho成立Hi成立接受HO不犯错第类错误拒绝HO第I类错误不犯错称"实际上Ho成立但是它被拒绝"这个错误为第I类错误(弃真),而"实际上Ho不成立 但是它被接受”这样一类错误为第H类错误(存伪).由于我们的方法是基于观测数据,而 观测数据是带有随机误差的,故难免在做出决策的时候犯错,我们能做的是控制犯错的 概率一个理想的检验应该使这两类错误的概率都小,但是在实际问题中不可能使这两 类错误一致地小:要让犯第I类错误的概率小,应该让T小,而要让犯第II类错误的概率 小,则T不能太小.解决这个矛盾的一个方法是在控制I类错误的基础上,尽量少犯第H 类错误(在下一小节中我们讨论如何设定假设时会提到,应该将受保护对象设为零假设, 故犯第I类错误的严重性更大,因此必须尽量避免犯第I类错误).具体地,选定一个小的 常数。,取T使得犯第I类错误的概率,即T小于T的概率小于。.称。为显著性水平.理想 情况下,取得恰好满足Ph°(T <) = .为控制犯第I类错误的发生,通常将a取为0L 0.05, 0.01等较小的数,具体取值视实际需要而定,有时候要求。很小,比如在涉及到数 十万个基因标记的基因关联分析中,单个位点检验的。一般是IO ?这样的量级.现在将问题一般化.设有假设检验问题Ho :0eOooHi :0eOi.(6.1.1)其中HO为零假设或原假设而HI为对立假设或备择假设.构造一个适当的检验统计量 T = T(Xl,. .,Xn),其中X,. . .,Xn为从总体中抽得的一个样本.根据对立假设的形状 构造一个检验的拒绝域w = T(X1 , . . . , Xn) e A,其中A为一个集合,通常是一个区间. 比如拒绝域可取为T(X1 , . . . , Xn) > Tf则称T为临界值.如果零假设成立但拒绝了零假 设,则称犯了第I类错误,如果对立假设成立但接受零假设,则称犯了第H类错误.如对 任意的0eo,犯第I类错误的概率Pe(T(X1,. . .,Xn)eA)小于或等于某个正的常数), 则称。为显著性水平.显然显著性水平不是唯一的,事实上,如果。是一个显著性水平, 则任意大于。的数都是显著性水平.实际中通常采用显著性水平最小的那一个.一个检 验对应于一个拒绝域,称B() = P (Ho被拒绝)为检验的功效函数.如果检验的显著性 水平为 ,则当6 e Oo时,B() 2 .而当6 e 0,我们希望功效值越大越好(这样犯第 类错误的概率1二()就越小),所以功效可以作为评价一个检验优劣的准则.?6.1.2假设检验问题的提法在有时候需要自己判断如何提假设检验问题.在建立假设检验问题时有两个原则O原则一:将受保护的对象置为零假设.如我国按照以前的司法制度,公安机关抓到 嫌疑犯后,很多情况下要犯人自己证明无罪(有罪推断),这对嫌疑犯很不利,从而容易 导致冤案.现在的司法制度则总假定嫌疑犯是无罪的,要司法部门证明其有罪(无罪推 断),这样做大大地有利于保护公民的利益,如果要将真正的嫌疑犯绳之以法,则司法部 门必须有充分的证据,这样做可以有效保护公民的权益,对司法部门要求也变高了.又 比如药厂生产出一种新药,在上市前要通过食品与药品监管局的检验.显然使用药品的 病人是应该受保护的对象,这时应该设定一个有利于病人的命题作为零假设,这个命题 就是“新药不比安慰剂效果好",以尽量避免病人用无效甚至有副作用的新药.当然,对立 假设就是“新药比安慰剂效果好.将检验的显著性水平设定得较小,以保证零假设不 被轻易推翻.在实际问题中,如果根据某个合理的检验方法发现零假设被推翻,则有充 分的理由认为零假设不成立而对立假设成立,这是因为万一零假设成立而被误据的概率 不会超过。;另一方面,如果发现零假设未被拒绝,并不表明有充分理由接受零假设,而是因为零假设被保护得较严密以至于未被拒绝.原则二:如果你希望“证明”某个命题,就取相反结论或者其中一部分作为零假设(类 似于反证法).这种提法往往是在两个假设命题中不太清楚哪个应受保护,此时可以借 用司法制度里的“谁主张,谁举证",即若想用统计方法向人"证明"一个命题,则将那个 命题置为对立假设.注意这里的证明不是数学上的严格证明,而是允许犯错的一种统计 推断方法.用统计方法证明一个命题不是一件容易的事情,所以如果没有足够把握,人 们应该避免用统计方法去证明一个命题.上述两原则是统一的:一般不应该让受保护对象去证明一个命题.?6.1.3检验统计量的选取及假设检验的步骤通过解答例6.1.1来说明假设检验的步骤.例6.12 (例6.1.1续)能否在显著性水平0.05下认为饮料的平均容量确实减少到49。毫 升?解:基于统计量,我们采用“标准化"过的检验统计量(减均值再除以标准差)T n(r 二 500)=10以使该统计量服从标准正态分布,检验的拒绝域仍取形如< T1 ,我们控制犯第I类 错误的概率等于。,即P(TIVTIle = 500) = .由于e = 500时TI服从标准正态分布,易知上面关于TI的方程的解为TI=二Ua,其中UC 等于标准正态分布的上C分位数,即检验的拒绝域为Tl < 二Ua.现在取显著性水平为005,则临界值U0.05 口 1.645.另一方面,样本均值7 = 492,样本 量n = 9,故检验统计量 的观测值等于二2.4,小于临界值1.645,即样本落在拒绝域中, 从而可以在显著性水平0.05下拒绝零假设,认为饮料的平均容量确实减少为490毫升.下面列举几种常见的假设检验问题:(1) Ho : = 0oH :6 = 01;(2) Ho : = o o Hi : o;(3) Ho : = 0o Hi : > 0 或者Ho : 2 0o Hi : > 0(4) Ho : = o o Hi : < o 或者HO : o o Hi : < o称为简单假设,(2)为双侧假设因为对立假设是双侧的,(3)和(4)为单侧假设因 为对立假设是单侧的.这里强调对立假设的原因是检验方法(对应于一个拒绝域)只跟 对立假设有关.下面我们给出检验上述假设的一般步骤,它的基本思想是:一个好的点估计应该是 一个优良检验的的主要依据,设定显著性水平为 .第1步求出未知参数的一个较优的点估计e= (Xi , . . Xn),如极大似然估计.第2步:以C为基础,寻找一个检验统计量T = t(×1 , . . . , Xn)且使得当6 = %时,T的分布已知(如N (0. 1), tn, Fm,n),从而容易通过查表或计算得 到这个分布的分位数,用以作为检验的临界值.第3步:以检验统计量T为基础,根据对立假设T的实际意义,寻找适当形状的拒绝域, 它是关于T的一个或两个不等式),其中包含一个或两个临界值.第4步:当零假设成立时,犯第I类错误的概率小于或等于给定的显著性水平 ,这给出 一个关于临界值的方程,解出临界值,它(们)等于T的分位数,这样即确定了检验的 拒绝域.第5步:如果给出样本观测值,则可算出检验统计量的样本观测值,如落在拒绝域中则 可拒绝零假设,否则不能.?6.2重要参数检验本节介绍最基本的假设检验问题:一样本和两样本正态总体的有关均值和方差的检 验,简单的大样本检验(0-1分布参数的假设检验).?6.2.1 一样本正态总体均值和方差的检验现实中经常碰到诸如此类的问题:假设用于某用途的合格铁钉要求长度为10厘米, 现有经销商从生产厂家订购了一批这样的铁钉,为了检验该批检验产品是否合格,可以 从中抽取一小部分进行测量检验,通常铁钉的长度服从一个正态分布,这类问题属于一 样本正态总体的假设检验问题.一般地,设总体X、N(,02),-的vv的,°2>(,. .,Xn是取自总体X的一个样本.取显著性水平为。.(1)方差已知时均值的检验先考虑双侧假设,即要检验Ho : = o- Hi : o .由于的极大似然估计为1,取“标准化”后的检验统计量U = U(×1 , . . .,Xn)= E -O注意到当HO成立时,U、N(0,1), |UI应该较小,反之当IUl的观测值U(XIxn)较大 时,不利于零假设HO应该拒绝之.所以选拒绝域形如>).要求显著性水平为。,即Ph0(U I > t ) = ,解得T = ua2.于是检验的拒绝域为U I > Ua2.即当观测值(X1, . .,Xn)满足不等式人TiIf - A)':> Ua/2时拒绝Ho.类似地,检验单侧假设Ho : = o- Hi : > o 或者 Ho : < o Hi : > o仍然用统计量U ,由于U大时不利于Ho,取拒绝域为 > Ua.而检验另一个单侧假设Ho : = o t Hi : < o 或者 Ho : W o t Hi : < o的拒绝域为U < IUa六.虽然我们取的临界值只考虑使检验在 = o处的犯I类错误的概率为。,从检验的拒绝 域的形状上可直接看出来在零假设下 W 0 (或小°)时犯第I类错误的概率恒小于或 等于.以上三个检验统称为U检验.例621.随机地从一批铁钉中抽取16枚,测得它们的长度(单位:厘米)如下:2.9423712.988662 3.106234 3.109316 3.118427 3.132254 3.140042 3.1701882.902562 3.128003 3.146441 2.978240 3.103600 3.003394 3.044384 2.849916已知铁钉长度服从标准差为0.1的正态分布,在显著性水平 = 0.01下,能否认为这批铁 钉的平均长度为3厘米?如显著性水平为 = 0.05呢?解:这是方差已知时关于均值的假设检验问题,Ho : = 3 t Hi : 3.< 一取检验统计量为U= n(S3)/0.L检验的拒绝域为一U >u/2.由样本算得检验统计 量的值为U 5 2.16,如显著性水平为0.01,则临界值为SOO5 5 2.58,跟检验统计量的值比 较发现不能拒绝零假设,即不能推翻铁钉平均长度为3厘米的假设;而如果显著性水平 为0.05时,临界值为so25 = 1.96,此时可以拒绝零假设,认为铁钉平均长度不等于3厘米 这个例子说明结论可能跟显著性水平的选择有关:显著性水平越小,零假设被保护得越 好从而更不容易被拒绝.(2)方差未知时均值的检验考虑检验Ho : = o t o ,由于方差未知,可以在将S标准化的过程中用样本方差S2代替总体方差2,得检验统计 量_ V I UoT= <n S '由于在Ho下,T s U1 ,于是拒绝域取成IT I > tn-1 (2).此检验称为t检验.类似地可以得到另外两个单侧假设的检验拒绝域,列于表6.2.1中.例6.2.2.(例6.2.1续)设方差未知,则在水平0.01和0.05下能否认为铁钉平均长度为3厘 米?解:这是方差未知时关于均值的假设检验问题,Ho : = 3 O Hi : 3取检验统计量为T=A取:二3)S ,检验的拒绝域为IT I > t- (a2).由样本算得检验统 计量的值约为2.21,与显著性水平0.01对应临界值熊(0005) 口 2.95比较,不能拒绝零假 设,而与显著性水平005对应临界值1 (0.025) 口 2.13比较,可以拒绝零假设,即在显著 性水平0.01下不能拒绝铁钉平均长度为3厘米的假定,但在显著性水平0.05下可以认为 铁钉平均长度不等于3厘米,此结论与方差已知情形一致.(3)方差的检验考虑假设检验问题Ho : 2 = § o Hi : 2 g.对均值已知的情形,由。2的极大似然估计2 = - (Xi 二 )2 i=1可以构造检验统计量在H。下,X2 s 2 , 2的平均值为n,而在HI下,2 = 分 的均值为沙 n,因此当2 的值过于偏离n时应该拒绝HO ,于是拒绝域取成,2 < X(l 二 a2)或者 X2 > X式W2)、.对均值未知的情形,构造检验统计量2 (n 二 1)S2X = O->o其中S2为样本方差.在Ho下,2 s2.1,拒绝域取成/X2 < Xa ,1 (1 二 2)或者 X2 > 2 .1 (a2)x .对于单侧假设,可以类似得到检验的拒绝域,参看表621.上述检验称为2检验.例6.23 (例6.2.1续)在水平0.1下能否认为铁钉的标准差大于0.1厘米?解:这是均值未知时关于方差。2的假设检验问题,Ho : 2 2 0.12 O Hi : 2 > 0.12.取检验统计量为2 =勺P ,检验的拒绝域为2 > 2 .1 (a).由样本算得检验统计量 的值2 口 14.32,与显著性水平0.2对应临界值X覆0l) 口 2231比较,不能拒绝零假设,即 在显著性水平0.1下可以认为铁钉的标准差小于0L表621总结了有关一样本正态总体的假设检验.?6.2.2两样本正态总体的情形为了检验某肥料是否能显著提高玉米产量,可以设计一个随机试验:选择两块条件 一样的试验区把两试验区各分成若干小块,一个试验区的各小块施肥,另一个试验区 的各小块不施肥,最后统计收成,可以采用如下的检验方法来检验玉米产量差别,从而 知道肥料是否有效.设总体X s N (, f)z Y s N (2, ), "o < 1, 2 < ot > 0; XiXn 是从总体X中抽取的一个样本,Yi, . . . , Yn是从总体Y中抽取的一个样本.设来自不同总体 的样本相互独立.下面设考虑有关均值差小二2和方差比。/的检验.取显著性水平 为。.举例说明.例6.2.4.甲乙两个农业试验区种植玉米,除了甲区施磷肥外,其他试验条件都相同,把 两个试验区分别均分成1。个和9个小区统计产量(单位:千克),得数据如下甲区 62 57 65 60 63 58 57 60 60 58表6.2.1 一样本正态总体N(,。2).检验对象检验统计量分布拒绝域十 (2已知)A-U = n(T - 0 )N (0,1)1:IU I > ua2U > ua .( U<-ua (2未知)T = n( V - 0 )stn -1:>tn.1 (2)T>tn. (a) '(<-tn.1(a)2 (已知)X2 = 工伊一产Xn':X2 > X乳a2)或者2 < 2(l - a2) X2 >X(a),(2<(l-a) 2 (未知)X2 = :(Xi一/Xn -1 : X2 > Xa -1 (a2)或者2 <g .1 (1 - a2) X2 >XS -1 (a).仅2< XLl(I-a)4有关均值的检验:对立假设分别为o, > 0和 < Ro .有关方差的检验:对立假设分别 为。2 .OQO 2 > 兔和< 2乙区 5。59 56 57 58 57 56 55 57假定甲乙两区中每小块的玉米产量分别服从N(,2),N(2,o2),其中小刀2,。2未 知.试问在显著性水平。=0.1下磷肥对玉米的产量是否有效? 解:磷肥对玉米产量有效果等价于臼> R2,故将其设为对立假设,假设检验问题是Ho : 1 < 2 = 0 Hi : 1 > 2.构造基于 - 2的极大似然估计Y- <的检验统计量T V V T = t SW+ !当Ho成立时,T写tm+n.2 ,于是拒绝域为T > tm+n-2 ().由所得数据算得检验统计量T的观测值为t ='二"=3.23.-/1.1 由 = 0.1得临界值为tm+n2 (。=t7(0.1) 口 1.33 < 3.23,因此拒绝Ho,即可以在显著 性水平0.1下认为磷肥对玉米的产量有显著性影响.例6.25在例6.2.4中假定了两个正态总体的方差是相等的,即。彳=/ =。2.现在我们 根据样本来检验这个方差齐性的假设,即要检验Ho 可=IoHI :母.1.解:因为。帛和小的极大似然估计分别是1 m1 n扉二(Xi 二 V)2 , l= - (Yi 二 V)2 .r i-1n i.1在e =。fi的极大似然估计-=第伍的基础上可以构造检验统计量S彳(m - l)mF ="= S(n 二 l)n '注意到F中的分子和分母分别是X和Y的样本方差.当零假设成立时,F s Fmie . 于是拒绝域为F < Fm-I,n-1 (2)或 F > Fmin-I (1 二 a2).由数据算得检验统计量F的观测值f = 1.19,如果取显著性水平。=0.2,那么临界值 为F9,8 (0.1) = 2.44, F9,8 (0.9) = 1F8,9 (0.1) = 0.41 (如果X S Fm,n,则 1/X S Fn,m).易 见0.4IV 1.19 < 2.44,因此不能拒绝Ho,即在显著性水平0.2下可以认为上例中所作的方 差齐性假定是合理的.表622总结了两样本正态总体的双侧假设检验.?6.2.3成对数据在上述两样本正态总体的假设检验中,要求两个样本是独立的,但是没有要求样本 量相等.有一类数据叫做成对数据(X,H), . ,(Xn,Yn),比如一个病人在用药前后测 得的指标分别为X和Y,贝IX与Y总是一起出现的,且由于它们是同一个体的指标,故 具有很大的相关性而绝对不是独立的,这与两样本正态总体有本质区别.另外,两样本 检验问题要求样本2 , . . . , Xm是同分布的(YIYn亦然),而成对辘则无此要求,而要求M二丫1,. ., Xn二Yn是同分布.比如病人可以是来自两个不同性别、种族、年龄层 的人.要检验用药前后的指标有无显著差别,可以构造一个新的总体Z =Y二X及样 本ZI=XI二丫1 , . . , Zn = Xn二Yn,相应的假设检验是一样本的!在实际问题中,如果发 现有两个样本且其样本量是相等的,则要检查独立性和同分布性,否则可能是成对数据.表622两样本正态总体的假设检验检验对象检验统计量分布拒绝域十均值(方差已知)U = .2N (0,1)':IU I > u(a2) U > u(a) .( U<ru(a)均值(方差未知)主-rtm+ n - 2:IT I > tnu.n-2 (a2) T > tr+n -2 S) (<U-2(a)方差(均值已知)P = Z Xi1 '-p*)i-aJ '一”1!尸Fm. n:F> Fmn(a2)或F < .c:72) F > Fm (a)(F < y-V. 方差(均值未知)f = Fm -1 , -1F > F”(a2)或F < E57,F > Frn , 7 (a)(F < 1!t有关均值的检验:对立假设分别为 * M2, I > 2和 < 2有关方差的检验:对立假设分别 为* > 和* <.主假定方差相等 ?6.2.4 0-1分布中未知参数P的假设检验产品验收时,需要检验不合格率是否小于某给定的一个数.设(X1, ., Xn)是取自总体X的一个样本,该总体服从0-1分布,取1的概率为p.常 见的假设有三种:(1) Ho :p =po O Hi: p / po;(2) Ho :p =po 0 Hi: p > po 或Ho: p 2 po o Hi: p > po;(3) Ho :p =po 0 Hi: p < po 或Ho: p po o Hi: p < po .假定样本量n较大取显著性水平为。.由于P的极大似然估计为取“标准化”过 的检验统计量po (1 二 PO)其中PO和PO (1二Po )n分别为V在零假设P = Po下的期望和方差,从而当Ho成立时,由 中心极限定理近似地有T s N (0, 1).于是上述三种检验的拒绝域分别为Tl>2, T>U 和 T < Z例6.2.6.某厂产品不合格率通常为05厂方希望知道原料产地的改变是否对产品的质 量发生显著的影响.现在随机地从原料产地改变后的产品中抽取了80个样品进行检验, 发现有5个是不合格品.试问,在显著性水平0下,厂方由此可以得出什么结论? 解:总体X s B(ls p),其中P未知.在显著性水平。=0.1下,产品质量无变化等价 于P = 0.05,故我们要检验Ho : p = 0.05 O Hi : p 0.05.由于7 = 5/80 = 0.0625,因此检验统计量T的观测值_r Po podPo)=0.513.由 = 0.10得临界值So5 = 1.645.易见,Itl < 1.645,因此不能拒绝Ho,即在近似显著性水平0.10下可以认为原料产地的改变对该厂产品的质量没有发生显著的影响.?6.3拟合优度检验前面的假设检验基本上是在假定总体是正态的条件下做的,但是这个假设本身不一 定成立,需要收集样本(Xi . . . . , Xn)来检验它.一般地,检验Ho : X服从某种分布可以采用Karl PearSon提出的2拟合优度检验.?6.3.1离散总体情形(1)理论分布不含未知参数的情形设某总体X服从一个离散分布,且根据经验得知总体落在类别, . . . , ak的理论频 率分别为6 ,,现从该总体抽得一个样本量为n的样本其落在类S3 ,. . , ak的观 测数分别为6,.,侏.感兴趣的问题是检验理论频率是否正确,即下面假设是否正确:H0 : P(Xeal) = P1P(Xeak) = pk.这类问题只提零假设而不提对立假设,相应的检验方法称为拟合优度检验.显然,在零 假设下,各类别的理论频数分别为叩I, . . .,叩匕将理论频数和观测频数列于下表:类别a1电. a¼理论频数P P2 .npk观测频数12.k由大数定律知,在零假设成立时,n/n依概率收敛于p,故理论频数叩与观测频 数川接近.而检验统计量取为v2 _ k Si 二 npM X 一i=1 叩简单地,就是y2 .(。二 E)2其中O为观测频数,E为期望频数.这个统计量中每项的分母的选取有点讲究,我们可以这样粗略地解释:假设卬服 从POiSSOn分布,则ni的均值和方差均为np,从而(ni二npi)npi的极限分布为标准正态 分布,因此2近似为k个服从自由度为1的2分布的随机变量之和,由于 3(用二np)= 0,故这k个随机变量满足一个约束,从而2的自由度为k二1.事实上,可以严格地证明, 在一定的条件下,X2的极限分布就是自由度为k二1的2分布,但其证明超出本课程的 要求范围.下面给出一个例子来说明拟合优度检验的应用.例631 .有人制造一个含6个面的骰子,并声称是均匀的.现设计一个实验来检验此命 题:连续投掷60。次,发现出现六面的频数分别为97, 104, 82, no, 93, H4 .问能否在显 著性水平0.2下认为骰子是均匀的?解:该问题设计的总体是一个有6个类别的离散总体,记出现六个面的概率分别为Pl, . , P6, 则零假设可以表示为Ho : p = 1/6, i = 1,. . . , 6.在零假设下,理论频数都是100.故检验统计量2的取值为(97- 娜 IOO2 82 哪 loo2哪IOO2 =跟自由度为6二1 = 5的2分布的上0.05分位数(0.2) 口 7.29比较,不能拒绝零假设,即 可在显著性水平0.2下认为一子是均匀的.(2)理论分布含若干未知参数的情形当理论总体总含有未知的参数时,理论频数叩一般也与这些参数有关,此时应该 用适当的估计如极大似然估计代替这些参数以得到Pi的估计的,得到的统计量记为2_ k (川二 np%)2i=1 nP i拟合优度检验的提出者Karl Pearson最初认为在零假设下,检验统计量的2的极限分布 仍等于自由度为k二1的2分布,R. A. Fisher发现自由度应该等于k二1减去估计的独 立参数的个数r,即k二1二r.例6.3.2.从某人群中随机抽取1。个人的血液,并测定他们在某基因位点处的基因型. 假设该位点只有两个等位基因A和a,这ioo个基因型中AA, Aa和aa的个数分别为3。, 4。, 30,则能否在005的水平下认为该群体在此位点处达到Hardy- Weinberg平衡态?解:取零假设为Ho : Hardy-Weinberg 平衡态成立.设人群中等位基因A的频率为p,则该人群在此位点处达到Hardy-Weinberg平衡态指的 是在人群中3个基因型的频率分别为P(AA) = p2, P (Aa) = 2p(l二p)和P(aa) = (1二p)2, 即零假设可等价地写成Ho : P(AA) =p2,P (Aa) = 2p(l 二 p), P (aa) = Q 二 p)2.在h。下,3个基因型的理论频!妫ioo < p2l ioo < 2 < pa2(1二pa)和Ioo < (1二其中PA等 于估计的等位基因频率05代入2统计量表达式,得统计量的值等于4.该统计量的值 大于自由度为3 -1-1 = 1 (恰好一个自由参数被估计)的2分布上0.05分位数3.84,故 可在0.05的水平下认为未达到Hardy-Weinberg平衡态.?6.3.2列联表的独立性和齐一性检验(1)独立性检验下面考虑很常用的列联表.列联表是一种按两个属性作双向分类的表.例如肝癌病 人可以按所在医院(属性A)和是否最终死亡(属性B)分类.目的是看不同医院的疗效是 否不同.又如婴儿可按喂养方式(属性A分两个水平:母乳喂养与人工喂养)和小儿牙齿 发育状况(属性B,分两个水平:正常与异常)来分类.这两个例子中两个属性都只有两个 水平,相应的列联表称为“四格表",一般地,如果第一个属性有a个水平,第二个属性有b 个水平,称为a < b表(见教材p268).实际应用中,常见的一个问题是考察两个属性是否 独立.即零假设是Ho :属性A与属性B独立.这是列联表的独立性检验问题.假设样本量为n,第(i, j)格的频数为nij.记Pij = P (属性A, B分别处于水平i, j), Ui = P (属性A有水平i), Vi = P (属性B有水平j).则零假设就是Pij = UM .将Ui和Vj看成参 数则总的独立参数有a二1 + b二1 = a + b二2个.它们的极大似然估计为曲=",吟=七.Hn正好是它们的频率(证明参看教材).其中值=3刖,.j = = nij.在HO下,第(i, j)格的理论频数为np;j = i.n.jn,因此在HO下, 幻-51 (nj二np)应该较小.故取 检验统计量为2 _ a b Inii 二 ni.n.jn)2i= i= Sm")在零假设下2的极限分布是有自由度为k rir = abl(a + b2) = (a l)(b二1) 的2分布.对于四格表,自由度为L(2)齐一性检验跟列联表有关的另一类重要的检验是齐一性检验,即检验某一个属性A的各个水平 对应的另一个属性B的分布全部相同,这种检验跟独立性检验有着本质的区别.独立性 问题中两属性都是随机的;而齐一性问题中属性A是非随机的,这样涉及到的分布实际 上是条件分布.虽然如此,所采用的检验方法跟独立性检验完全一样.例6.3.3.下面表是甲乙两医院肝癌病人生存情况.需要根据这些数据判断两医院的治 疗效果是否一样.甲、乙两院肝癌的近期疗效甲院I5()88(n12)238(n1.)乙院36(2i)18(22)54(2.)H 186(n.1) o6(n.2)292(n)解:这是一个齐一性检验问题.检验统计量2的观测值为0.1195,远远小于自由度为1 的2分布的上0.05分位数,故可以接受零假设,即在水平0.05下可以认为两个医院的疗 效无差别的.当有某个格子的频数较小时,如果允许的话可以合并格子是每个格子的频数足够 大,实际问题中不允许合并格子(合并后失去了实际意义),此时可以用FiSher的精确检 验法.?6.3.3连续总体情形设(Xi . ., Xn)是取自总体X的一个样本,记X的分布函数为F(X),需要检验的那 种分布中含有r个总体参数我们要在显著性水平下检验Ho : F(X)= F(x; 1 , . . . , r),其中F(x; 1,. . .r)表示需要检验的那种分布的分布函数.例如,当我们要检3佥Ho : X s N (, 2)时,r = 2, 1 = ,出=。2.'北 I二 1Fo(x; , 2) =exp - (t )2 dt.上述假设可以通过适当的离散化总体分布,采用拟合优度法来做检验.首先把实数 轴分成k个子区间.,aj,j = l, . . .fk,其中a。可以取二。,ak可以取。.这样构造了 一个离散总体,其取值就是这k个区间.记pj = PHo(aj- <X2aj) = Fo(ajj,. . . , r) Fo(aj-i; 1,. . .,r),j = l,. . .,k如果HO成立,则概率Pj应该与数据落在区间(a> , aj的频率fj = nj/n接近,其中nj表 示相应的频数.当Pi的取值不含未知参数时,取检验统计量2 卜(nj 二 rip-X =j. 咱否则取2二卜(%二 np7)2j-1np j其中吟是将Pi中的未知参数换成适当的估计后得到的Pi的估计.拒绝域取为,X2 > Xk.-1(°)、如果Pi中不含未知参数,则r = 0.使用2进行拟合优度检验时T殳要求n 50, np; 5, j = 1, . . . , k,如果不满足这个 条件,最好把某些组作适当合并.例6.3.4.从某连续总体中抽取一个样本量为10。的样本,发现样本均值和样本标准差分 别为二0.225和1.282,落在不同区间的频数如下表所示:区间(-0,二 1)-1,二05)rz0.5, 0)0,0.5)0.5,1)l,o)观测频数25101824IO13理论频数271415141317可否在显著性水平。5下认为该总体服从正态分布?解:设理论正态分布的均值和方差分别为和。2,记第个区间为(a" , a, i = 1, . . . , 6,则 样本落在第i个格子的理论概数为IoOP(弧V X 2由 其中X s N (t 2 ).将 =二0.225 和。=1.282代入得到估计的理论频数,列于上表中.Ho :总体服从正态分布由此算得检验统计量2的值约为9.34,与自由度为5的2分布的上0.1分位数Xg(0.1) 口 9.24比较可以拒绝零假设,即可以在显著性水平0.1下认为该总体不服从正态分布.

    注意事项

    本文(中科大概率论与数理统计讲义06假设检验.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开