统计学t检验.ppt
t 检验,河南科技大学医学院流行病与卫生统计学,配对 检验,配对样本(paired sample):指两个样本中的观察对象由于存在某种联系或具有某些相近的重要特征而结成对子(matching),每对中的两个个体随机分配接受两种不同的处理。,控制与研究无关的变量对研究的影响(年龄,性别,种族,etc.),从而在两组比较时排出配对因素的干扰。使比较更精确,提高研究效率。,Why?,Three types of Paired Samples.,配对样本的类型,配成对子的两个受试对象分别给予两种不同的处理(如把同窝、同性别和体重相近的动物配成一对;把同性别、同病情和年龄相近的病人配成一对等);同一受试对象同时分别接受两种不同处理(如同一动物的左右两侧神经、同一份标本分成两部分);同一受试对象自身前后的比较(如高血压患者治疗前后的舒张压比较、肝炎患者治疗前后的转氨酶比较等)。,异体配对,自身配对,Type,异体配对,Treatment A,Treatment B,Age&Gender,Age&Gender,Age&Gender,Age&Gender,TreatmentA,Treatment B,No.,Type,自身配对(同时接受两种处理),Treatment A,Treatment B,New Electronic Sphygmomanometer,Old Sphygmomanometer,No.,Type,自身配对(前后比较),BeforeTreatment,AfterTreatment,BeforeTaking New Diet Pills,AfterA Course of Taking Pills,No.,Paired t-test,两配对样本所代表的总体之间是否有差异,两均数的差异等同于差异的均数,or,d=0 or d 0,这样我们你只需考虑配对样本之间差值的均数即可,当两种处理结果无差别时,理论上差值的总体均数应该为0,故可将配对样本资料的假设检验视为样本均数与总体均数=0的比较。对于配对样本数据,应该首先计算出各对数据的差值,差值的均数。,要求差值的总体分布为正态分布,即差数来自正态分布总体。,n为对子数,配对 t 检验,9,目的,计算,条件,配对样本 两组数据之间有无差异。,例2:分别用两种测量肺活量的仪器测得12名妇女的最大呼气率(L/min),资料如表,问两种方法的检测结果有无差别?,表 两种方法检测12名妇女最大呼气率(L/min)结果被检测者号 方法A 方法B 差值 差值2 1 525 490 35 1225 2 415 397 18 324 3 508 512-4 16 4 444 401 43 1849 5 500 470 30 900 6 460 415 45 2025 7 390 431-41 1681 8 432 429 3 9 9 420 420 0 0 10 227 275-48 2304 11 268 165 103 10609 12 443 421 22 484 206 21426,(1)建立检验假设,确定检验水准H0:两仪器检验结果相同,即d=0 H1:两仪器检验结果不同,即d0 双侧=0.05(2)计算统计量今n=12,d的均数=d/n=206/12=17.17(L/min)差值的标准差为:,(3)确定P 值,作出统计推断=n-1=12-1=11 查t界值表,得0.10P0.20,按=0.05水准不拒绝H0,尚不能认为两种仪器检查的结果不同。,例3:将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?,例4:有12名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如表4-2所示。试判断此减肥药是否有效。,判断是否配对样本,配对样本类型配对t检验方法,例5 某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12 X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18,例3:将20只按体重、月龄及性别配对的大白鼠随机分入甲、乙2组,甲组给正常饲料,乙组饲料缺乏维生素E。10天后测定大白鼠肝脏的维生素A含量(IU/g),结果如下。问2组大白鼠肝脏维生素A含量是否有差别?,思考:两份资料有何不同?例5中的数据是成组的,组内个体相互独立,组间个体没有联系例3中的数据是成对出现的,每一对观察对象之间是存在联系的,样本类型例5是两独立样本设计(完全随机设计,成组设计)例3是刚才所学的配对设计样本,两独立样本(two independent sample)把受试对象完全随机分为两组,分别给予不同处理,两组的个体之间相互独立,不存在联系(完全随机设计);从两个人群分别随机抽取一定量的样本,对某一项指标进行组间比较(成组设计),2023/3/31,21,两独立样本 t 检验,两总体方差相等(方差齐,),两样本均数均来自正态分布总体,两样本符合正态分布,2023/3/31,22,两独立样本 t 检验,计算,条件,比较两独立样本所代表的总体均数是否相同。,目的,例5 某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12 X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18,n1=18,=4.454mg/dl,s1=1.324mg/dln2=16,=5.299mg/dl,s2=1.382mg/dl,(1)建立假设检验,确定检验水准H0:1=2,即两总体均数相等H1:12,即两总体均数不相等双侧=0.05(2)计算统计量,(3)确定P值,作出统计推断=n1+n2-2=18+16-2=32 查t界值表,得0.05 P 0.10,按=0.05水准不拒绝H0,尚不能认为慢性支气管患者尿17酮类固醇的排出量与健康人不同。,6,两独立样本 检验,如果两总体方差不相等(方差不齐,),校正的 t 值和 v 值,例8 由线片上测得两组病人的1值(肺门横径右侧距,cm),算得结果如下,试检验肺癌病人与矽肺0期病人的1值的均数间差异是否明显。,肺癌病人:,矽肺0期病人:,(1)建立检验假设,确定检验水准H0:两类病人R1值总体均数相等,即1=2 H1:两类病人R1值总体均数不等,即1 2 双侧=0.05(2)计算统计量,(3)确定P 值,作出统计推断=9 查t界值表,得0.005P0.01,按=0.05水准拒绝H0,可以认为两类病人1值不相同,,两独立样本方差的齐性检验,两独立小样本均数的 t 检验,除要求两组数据均应服从正态分布外,还要求两组数据相应的两总体方差相等,即方差齐性。即使两总体方差相等,两个样本方差也会有抽样误差,两个样本方差不等是否能用抽样误差解释?可进行方差齐性检验。,例8 由线片上测得两组病人的1值(肺门横径右侧距,cm),算得结果如下,试检验肺癌病人与矽肺0期病人的1值的均数间差异是否明显。,肺癌病人:,矽肺0期病人:,(一)先作方差齐性检验,(二)作 t 或 t 检验(根据 P 值),1.建立检验假设,确定检验水准 0:12=22,设两总体方差相等 1:1222,设两总体方差不等=0.05 2.计算值,3.确定P 值,做出统计推断v1=n11=9,v2=n21=49 查附表3(方差分析表,方差齐性检验用)0.05(9,49)2.39 因为 大于0.05(9,49)所以 0.05,拒绝0。认为因为两总体方差的差异有统计学意义。,例9 某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。,深层水:n1=8,样本均数=1.781(mg/L),S1=1.899(mg/L)表层水:n2=10,样本均数=0.247(mg/L),S2=0.210(mg/L),确定P值 作出推断结论 本例18-1=7,210-1=9,查附表3,F界值表(方差齐性检验用),得F0.05,7,9=4.20,本例F80.97 F 0.05,7,9=4.20;故P 0.05,按=0.05 水准,拒绝H0,接受H1,结论:故可认为两总体方差不齐。,10,判断两样本总体方差是否齐性,其中一个样本标准差是另一个的3倍以上,一般可以认为方差不齐。,进行数据分析时根据资料类型选择合适的检验方法单样本t检验配对t检验总体方差相等的两独立样本 t 检验注意:正态分布思考:配对t样本可否用两独立样本t 检验两独立样本总体方差不等的情况下变量变换t检验,小结,两类错误,I型错误和II型错误,假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。,I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)。,型错误和型错误,1-:检验效能(power):当两总体确有差别,按检验水准 所能发现这种差别的能力。,45,a,b,减少(增加)I型错误,将会增加(减少)II型错误增大n 同时降低a 与 b,a 与 b 间的关系,减少I型错误的主要方法:假设检验时设定 值。,减少II型错误的主要方法:提高检验效能。,提高检验效能的最有效方法:增加样本量。,如何选择合适的样本量:实验设计。,减少错误的主要方法,假设检验的注意事项,1 保证组间的可比性所谓可比性就是各组间除了要比较的主要因素不相同外(如新药和常规药),其它影响结果的非处理因素(如年龄、性别、病程、病情轻重等)应尽可能相同或基本相近为了保证资料的可比性,必须要有严密的试验设计严格随机分组,假设检验的注意事项,2 正确选用检验方法应根据研究目的、设计类型、资料类型及其分布特征等选用适当的假设检验方法。如完全随机设计的两数值变量资料比较时,若n小且方差齐,则选用两样本t检验;若方差不齐,则选用t检验或成组设计的两样本比较的秩和检验;若n1、n2均大于50,则选用两样本Z检验。,假设检验的注意事项,3 对差别有无统计学意义的判断不能绝对化 假设检验的结论是根据概率推断的,所以不是绝对正确的当 P,不能拒绝 H0,不能接受H1,也可能犯错误,没有拒绝实际上不成立的H0,这类称为 II 类错误做统计结论时要留有余地,不宜用“肯定”,“一定”,“必定”等词,而且最好列出检验统计量的值,写出P值的确切范围,以便读者与同类研究进行比较,假设检验的注意事项,4 正确理解“显著性”的含义对假设检验结论中的“拒绝H0,接受H1”称为“有统计学意义”;“不拒绝H0”称为“无统计学意义”。不应把“有统计学意义”误解为差别很大,甚至在医学实践中有重要的价值;同理,也不应把“无统计学意义”误解为差别不大,或一定相等例如,用某降压药后舒张压平均下降2mmHg,经t检验可能得到P0.05,由此得出的“用药前后的差异有显著性”的统计学结论,并不意味此药在临床上有“显著疗效”。事实上2mmHg的差值并无实际意义,假设检验的注意事项,5 单双侧检验的选择要根据研究目的、专业知识和问题的要求检验水准和单侧、双侧检验的确定要在设计时决定,而不能受样本结果的影响,假设检验的注意事项,上述检验方法应用条件t检验的应用条件:未知且n较小时,要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差相等。但在实际工作中,与上述条件略有偏离时,也可应用。Z检验的应用条件:已知或未知但n足够大(如n50)。,