第6章两样本定量资料假设检验.ppt
2023/11/7,1,两样本定量资料的假设检验,2023/11/7,2,【教学内容】,配对t检验配对资料的符号秩和检验,2023/11/7,3,【教学要求】,掌握两独立样本定量资料的分析思路掌握配对设计两样本定量资料的分析思路理解两独立样本和配对样本在设计上的不同,2023/11/7,4,两独立样本的比较,t检验,2023/11/7,5,t检验的模型假设:两样本均来自正态总体并且 总体方差齐。,2023/11/7,6,【例6.1】为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药治疗,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表6.1。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?,表 6.1 两种药物治疗贫血患者结果,2023/11/7,7,【案例解析】研究目的:该例目的在于比较用新药治疗的人群和用常规药治疗的人群的血红蛋白平均增加量(g/L)有无差异,即 是否成立。,?,2023/11/7,8,【案例解析】资料类型:定量资料设计类型:两独立样本统计方法:根据正态性检验和方差齐性检验结果来定(后边的电脑实验部分显示两样本均来自正态分布的总体且总体方差齐,因此采用t检验)。,2023/11/7,9,两独立样本资料抽样过程,方案1,方案2,2023/11/7,10,两样本均数比较 t检验的统计量,其中,2023/11/7,11,(1)H0:新药和常规药治疗贫血患者后血红蛋白平均增加量相 同,即:H1:新药和常规药治疗贫血患者后血红蛋白平均增加量 不同,即:(2)计算检验统计量,(3)查 t界值表,得P0.05,按0.05水准拒绝H0,接受H1,可以认为新药和常规药治疗贫血患者后血红蛋白增加量不同,根据样本均数的信息,认为,即服用新药后血红蛋白含量平均增加量高于常规药。,2023/11/7,12,【电脑实现】,正态性检验 Analyze Descriptive Statistics ExploreDependent list框 y Factor list框group Plots框Normality plots with testsContinue OK,P98,2023/11/7,13,【电脑实现】,结果输出,2023/11/7,14,【电脑实现】,两独立样本的t检验 Analyze Compare means Independent-sample T TestTest Variable(s)框 y Grouping Variable框group Define Groups框 Group 1:1;Group 2:2ContinueOK,2023/11/7,15,【电脑实现】,两样本比较的t检验,2023/11/7,16,【电脑实现】,结果输出,2023/11/7,17,【结果报告】,2023/11/7,18,刚才我们介绍了两 样本均数的t检验,数据的正态性和方差齐性是t检验的前提条件;如果两样本所属总体均为正态,但方差不齐,则应采用校正t检验(检验)。,2023/11/7,19,两独立样本的比较,校正t检验,2023/11/7,20,【例6.2】为探讨硫酸氧钒对糖尿病性白内障大鼠血糖的影响,研究人员将已诱导糖尿病模型的100只大鼠随机分为两组,实验组给予硫酸氧钒治疗,对照组为空白对照。结果如下,硫酸氧钒治疗组=6.5mmol/L,=1.35mmol/L对照组=13.2mmol/L,=4.20mmol/L 试问两种处理疗效的总体均数是否相同?,2023/11/7,21,【案例解析】此例在设计类型上和例6.1相同,通过对数据的初步考察,发现两组资料方差差别较大,故先进行方差齐性检验。其检验统计量为:,2023/11/7,22,2023/11/7,23,2023/11/7,24,两独立样本的比较,秩和检验,2023/11/7,25,【例6.3】,2023/11/7,26,【案例解析】,2023/11/7,27,非参数统计,在统计推断方法中,在已知总体分布的前提下对总体参数进行估计或检验的方法,称作参数统计。实际工作中,有时总体的分布不易确定,或分布不符合要求的条件,则需用一种不依赖总体分布类型的统计推断方法,即 非参数统计,2023/11/7,28,秩和检验的基本思想,在不知总体分布或数据呈偏态分布时如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。,2023/11/7,29,优点:,适用范围广。对变量的类型和分布无特殊要求,不论样本资料所来自的总体分布形式如何,甚至是未知的,都能适用。对数据要求不严。对某些指标不便准确测定,只能以严重程度,优劣等级,先后次序等作记录的资料也可应用。,2023/11/7,30,缺点:,对于符合参数检验的资料如果用秩和检验,由于没有充分利用资料提供的信息,故检验效能低于参数检验,若要使检验效能相同,往往需要更大的样本含量。,2023/11/7,31,因此,在实际工作中对符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;若不能满足参数检验条件的资料,应选用秩和检验。,2023/11/7,32,2023/11/7,33,2023/11/7,34,(3)确定P值,作出统计推断结论 查表法 查附录中的T界值表(两样本比较的秩和检验用),先从左侧找到较小的样本量,本例较小的样本量为n1=10;再从表上方找两组例数的差,本例,n2-n1=6;在两者纵横交叉处即为T的界值。将检验统计量T1值与T界值相比,若T值位于界值范围内,其P值大于相应的概率;若T值等于界值或在界值范围外,其P值等于或小于相应的概率。,2023/11/7,35,97-173,2023/11/7,36,2023/11/7,37,【电脑实现】,2023/11/7,38,【电脑实现】,2023/11/7,39,【结果报告】,2023/11/7,40,配对设计两样本的比较,配对t检验,2023/11/7,41,配对设计是研究者为了控制可能存在的非处理因素,增加两组的可比性而采用的一种实验设计方法,当总样本量一定时,采用配对设计往往会获得较高的检验效能。,2023/11/7,42,!“#$%&()*!“#$%&()*,10只小鼠,10只小鼠,配对,抽签,实验组,对照组,20只小鼠,20只小鼠,配对设计实施的主要形式:将受试对象按一定条件配成对子(同种属、同体重、同年龄、同性别等),再随机分配每对中的两个受试对象到不同的处理组;同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别。,2023/11/7,43,【例6.4】为研究某种抗癌新药对小白鼠移植性肉瘤S180的抑瘤效果,将20只小白鼠按性别、体重、窝别配成对子。每对中随机抽取一只服用抗癌新药扶正消瘤汤,另一只作为阴性对照,服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效果,经过一定时间,测得小白鼠瘤重如表7.4所示。问小白鼠服用抗癌新药和生理盐水后平均瘤重有无不同?,2023/11/7,44,表6.6 不同组别抑瘤效果(瘤重,g),2023/11/7,45,【案例解析】,在设计类型上,该例属于配对设计。配对设计下的资料并不是两个独立样本,对子内部相减之后,得到的差值资料实际上是一个样本,因此配对设计资料的假设检验类似于单样本的检验,即检验差值的均数(或中位数)是否等于零。对于配对设计定量资料的统计分析,若差值服从正态分布,可采用配对检验(paired t test);否则,采用配对资料的符号秩和检验(signed rank sum test)。,2023/11/7,46,配对t检验的基本原理:设两种处理的效应相同,即1=2,则1-2=0(即已知总体0)。故配对t检验可看成是差值d的样本均数 所代表的未知总体均数与已知总体均数0=0的比较。,2023/11/7,47,2023/11/7,48,【结果报告】,2023/11/7,49,【电脑实现】,Data6-4.sav,2023/11/7,50,【电脑实现】,结果输出,2023/11/7,51,【电脑实现】,Analyze Compare means paired-samples T TestPaired Variables框controlnewdrugOK,Data6-4.sav,2023/11/7,52,【电脑实现】,配对t检验,2023/11/7,53,【电脑实现】,结果输出,2023/11/7,54,配对设计两样本的比较,配对资料的符号秩和检验,2023/11/7,55,【例6.5】,留取12名在医用仪表厂工作的工人尿液,分成两份,一份用离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法测得尿汞值平均含量有无差别?,表6.8 两种方法测得的尿汞值含量(单位:mg/L),2023/11/7,56,【案例解析】,本研究属于配对设计的定量资料,首先判断是否符合配对设计t检验的适用条件,即差值是否来自正态分布。通过对差值进行正态性检验(见后),发现差值不是来自正态总体,所以用配对资料的符号秩和检验进行统计分析。,2023/11/7,57,配对资料的符号秩和检验的基本思想是:如果两种检测方法的效果无差别,这些配对数值之差应服从于以0为中心的对称分布,也就相当于把这些差值按其绝对值大小编秩并标上原来的符号后,正秩和与负秩和在理论上应是相等的(都等于n(n+1)/4,n为有效对子数),即使有些差别,也只能是一些随机因素造成的、在一定范围内的差别。如果差别太大,超出了规定的范围,就拒绝H0,接受H1,认为差值的总体中位数不等于0。,2023/11/7,58,配对符号秩和检验步骤 1 建立假设,确定检验水准H0:两种方法测得尿汞值含量差值的总体中位数为零,即Md=0H1:两种方法测得尿汞值含量差值的总体中位数不等于零,即Md0=0.052 计算检验统计量,2023/11/7,59,求差值 见第(4)列编秩 将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,编秩时如遇差值为0,则舍去不计。求秩和 分别求出正、负秩次之和,正秩和以T+表示,负秩和以T-表示,取两者中较小的秩和为统计量T,本例取T=33。,2023/11/7,60,表6.9 两种方法测得的尿汞含量和编秩用表,2023/11/7,61,2023/11/7,62,2023/11/7,63,正态近似法(n50),2023/11/7,64,校正公式:,2023/11/7,65,【电脑实现】,2023/11/7,66,【电脑实现】,配对资料的秩和检验,2023/11/7,67,【电脑实现】,结果输出,2023/11/7,68,【结果报告】,采用配对资料的符号秩和检验:Z=0.471,P=0.638。,2023/11/7,69,小结,2023/11/7,70,两样本定量资料平均水平比较的分析思路,2023/11/7,71,2023/11/7,72,2023/11/7,73,(1)欲评价A、B两种药物对肥胖患者是否有效,应分别对A、B两组患者服药前后体重进行配对检验,求得值后与界值进行比较,从而得出药物治疗前后体重变化有无差异的推断。另外,即使在进行配对检验时获得了一个较小的P值,拒绝了H0,下结论也一定要慎重。差异有统计学意义并不能说明药物就有效,药物是否有效以及疗效的好坏一方面要结合专业知识方可得出结论,另一方面服药前后肥胖患者的饮食习惯、运动情况等因素对体重都会有影响。因此,对同一个体处理前后某项指标进行比较,一定要保证非处理因素在处理前后保持不变,否则难以得出正确的结论。,2023/11/7,74,(2)欲评价A、B两种药物的疗效有无差别,应分别计算出各组治疗前后体重的差值,然后作完全随机设计两样本比较的t检验,因为A、B两组样本是从同一总体中随机抽取的,肥胖病没有传染性,两组受试者间是相互独立的,由题中条件可知,定量资料满足正态性和方差齐性的前提条件。,2023/11/7,75,Thank you!,