第 五 章 方差分析.ppt
《第 五 章 方差分析.ppt》由会员分享,可在线阅读,更多相关《第 五 章 方差分析.ppt(72页珍藏版)》请在课桌文档上搜索。
1、医学统计学及其软件包,第 五 章 方差分析,第一节 概论,方差分析(Analysis of Variance,简记为:ANOVA)的应用范围很广,本章的方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。以一个实例说明方差分析的基本思想和原理。,第二节 单因素方差分析(one-way ANOVA,completely random design ANOVA),例5.1 小白鼠给药前后发生咳嗽的推迟时间(秒)复方 复方 可待因 40 50 60 15-10 30-5 105 77。例数 15 15 10 均值 31.67 44 60.7,常见的错误是进行三组之间的两两t检验。这将
2、增加第一类误差的概率。如两组比较作一次t检验取=0.05;三组之间的两两t检验作三次t检验,至少有一次拒绝H0的概率为0.14。五组之间的两两t检验作十次t检验,至少有一次拒绝H0的概率为0.40。两组以上均数的比较不能用两两t检验,而必须用方差分析。,要比较三种药物的平均推迟咳嗽时间有否差异?,总体1N(1,12)样本1(n1,S1)总体2N(2,22)样本2(n2,S2)总体3N(3,32)样本3(n3,S3)已知:12=22=32,不相等 问:1=2=3??1,2,3不相等,方差分析法的模型,方差分析法的基本思想,组间变异(不同药物引起,包含误差)总变异 组内变异(误差引起)如不同药物的
3、作用相同,并且无抽样误差,则:F=组间变异/组内变异=1 由于抽样误差,F不等于1,但和1相差不大,F越大概率越小,如概率P0.05,则可认为不同药物的作用是不相同的。即样本均数之间的差异有统计学意义。,总变异,组内变异,组间变异,方差分析法的基本思想为:根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分为相应的各个部分,各部分的离均差平方和除以相应自由度得出各个均方,然后列出方差分析表算出F值,作出统计推断。,方差分析法的基本思想,方差分析法的基本思想,H0:1=2=3H1:至少有一个等式不成立或:H0:三种药物对小白鼠镇咳作用相同H1:三种药物
4、镇咳作用不完全相同,方差分析法的基本思想,离均差平方和用SS表示,自由度用DF表示,均方(MEAN SQUARE)用MS表示 MS=SS/DF 即方差。SS总=SS组间+SS组内 DF总=DF组间+DF组内 F=MS组间/MS组内=(SS组间/DF组间)/(SS组内/DF组内)根据F和DF组间,DF组内查方差分析用F界值表,得P值。如P0.05,拒绝H0。,方差分析法的基本思想,以上分解和检验可列成方差分析表的形式:方差分析表 变异来源 平方和 自由度 均方 F值 P值 Source SS DF MS F P 总变异 组间 误差,方差分析法的基本思想,如果影响数据变异的因素不止一个,则可作二因
5、素或三因素等的方差分析,总变异可分解成和各因素相对应的各个变异;这样,分解越细,误差越小,检验的效率就越高。,方差分析的基本要求,1.各组样本来自正态分布的总体。2.各总体的方差相等。3.各效应的可加性。如不符合基本要求时,可进行变量变换,变换成正态分布后再进行检验或用非参数检验的方法。,变 量 变 换,1.服从对数正态分布的资料可用对数变换 y=log(x)2.服从泊松分布的资料可用平方根变换 y=3.表达成百分数的资料可用平方根反正弦变换 y=arcsin,校正数,总平方和,组间平方和,方差分析基本步骤,组内平方和=总平方和组间平方和,DF总=N-1,DF组间=组数-1,DF组内=DF总-
6、DF组间,方差分析表变异来源 SS df MS F P 总变异 31939.9 39药物间变异 5062.4667 2 2531.2333 3.4845 0.05 误差 26877.4333 37 726.4171,由df1=2,df2=37 查F临界值表(附表五)得F0.05=3.25,现FF0.05故知P0.05,结论为在=0.05水平上,拒绝H0,而认为三种药物平均推迟咳嗽时间不相同。,例5.1 的方差分析结果,第三节 均数间两两比较,K组均数比较时,经方差分析,拒绝H0:总体中各组均数相同,即1=2=K时,如果需确定那二个均数间有显著差异,可用均数间的两两比较。如有三个组A,B,C时,
7、每两个均数进行比较时可有A与B,A与C,B与C共三种,如有四个组时将有=6 种比较。进行均数间两两比较的方法很多。本书介绍Student-Newman-Keuls(SNK)检验法。,均数间两两比较,H0:A=B H1:A B,求得q值后,据误差项自由度及组数a查附表六q界值表,得q0.05,q0.01。a为均数从小到大排队后,所比较的二组相隔的组数。,均数间两两比较,均数一 均数二 均数三,a=2,a=2,a=3,均数间两两比较,例5.1资料中误差项df=37,MS=726.4171,复方:n1=15,=31.6667;复方:n2=15,=44;可待因:n3=10,=60.7均数由小到大排列后
8、,组别依次为复方,复方,可待因。比较复方与复方,其a=2 q=|31.666-44|/=1.772 比较复方与可待因,其a=3 q=|31.666-60.7|/=3.732 比较复方与可待因,其a=2 q=|44-60.7|/=2.146,均数间两两比较,查附表六,由误差项df=37,组数a=2查得q0.05=2.87,q0.01=3.84;a=3查得q0.05=3.46,q0.01=4.40。复方与可待因比较,q=3.7323.46,故P0.05,而其余二个Q皆小于q0.05;因此复方与可待因两药对小白鼠平均推迟咳嗽时间,在=0.05水平上有显著差异,其余任两药间差异皆不显著。,均数间两两比
9、较,进行均数间两两比较的方法很多:SNK(Student-Newman-Keuls)检验,DUNCAN检验,Tukey检验,LSD(最小显著差)检验,Scheffe检验,等。如只须几个实验组和一个对照组比较,实验组之间不比较:DUNNETT检验,DUNCAN新法,等,第四节 方差齐性检验,H0:各个正态总体方差相等,即12=22=K2H1:至少存在一对i,j,有i2 j 2 本书中介绍一种稳健的(Robust)方差齐性检验方法-Levene检验,它可以用于两个或两个以上方差的齐性检验。(1)对于K组的样本资料,求得各组的均数后计算观察值距各自组均数的绝对离差。(2)以绝对离差作为主要变量,使用
10、前述的方差分析法。当拒绝H0时,认为各组方差不齐;当不拒绝H0时,认为方差齐性。,算得三个药物组:=31.6667,=44,=60.7,得绝对离差如下:复方 复方 可待因 8.3333 6 0.7 21.6667 24 30.7.18.3333 14 再用上表中绝对离差值进行方差分析。,第四节 方差齐性检验,第四节 方差齐性检验,变异来源 SS DF MS F P 总变异 9108.39 39 药物间 679.56 2 339.78 1.49 0.2382 误差 8428.83 37 227.80 由于P=0.2382,因此不拒绝H0,而认为三组方差齐性,因此符合均数间比较的方差分析法的基本要
11、求。,第五节 随机单位组设计方差分析(randomized block design ANOVA),随机单位组设计又称随机区组设计,随机配伍组设计,它是两样本配对试验的扩大。,单位组 处理1 处理2.处理k 1 X11 X12 X1k 2 X21 X22 X2k。b Xb1 Xb2 Xbk,随机单位组设计方差分析,大白鼠注射不同剂量雌激素后的子宫重量(g)雌激素剂量(g/100g)大白鼠种系 0.2 0.4 0.8 A 106 116 145 B 42 68 115 C 70 111 133 D 42 63 87,随机单位组设计方差分析,欲比较因素的K个水平的各变量均值,同时控制另一个因素的作
12、用。试验设计时,先将受试对象按其它控制因素性质相同或相近者组成单位组,每个单位组有K个受试对象,分别随机分配至因素的K个水平上。这时每个水平的受试对象不仅数量相同,而且性质亦相同或相近,就能缩小误差,提高实验效率。这样的设计可将单位组亦看作一个因素,就成为二个因素的设计,随机单位组设计方差分析,处理间变异 组间 总变异 单位组间变异 组内 误差(误差)和单因素方差分析相比,误差减少了,检验效率提高了。,随机单位组设计方差分析,可作二个假设检验:(1)H0:因素各水平x的均值相同 H1:因素中至少有二个水平的x均值不相同 F1=MS因素/MS误差 DF因素=K-1,DF误差=(bk-1)-(k-
13、1)-(b-1)=bk-k-b+1(2)H0:各个单位组的x均值相同 H1:至少有二个单位组的x均值不相同 F2=MS单位组/MS误差 DF单位组=b-1,DF误差=bk-k-b+1当欲进一步比较因素中任二个的水平x均值是否相同。可用本章第三节中均数间两两比较的检验。,大白鼠注射不同剂量雌激素后子宫重量,处理组:雌激素剂量,三水平(0.2,0.4,0.8)单位组:大白鼠种系,四水平(A,B,C,D),变异来源 SS DF MS F P 总 13075 11剂量间 6074 2 3037 33.54 0.01种系间 6457.67 3 2152.56 23.77 0.01 误差 543.33 6
14、 90.56 F0.01(2,6)=10.92,F0.01(3,6)=9.78,大白鼠注射不同剂量雌激素后子宫重量,方差分析得各个不同剂量的平均子宫重量不相同。可进一步比较任二个剂量的平均子宫重量的差异是否有统计意义。可用SNK方法。比较结果为三种剂量两两之间的差异都有统计学意义。,第六节 拉丁方设计方差分析(latin square design ANOVA),欲比较一个因素中K个水平的各均数,同时要控制另二个因素作用时,可用拉丁方设计。用K个拉丁字母排列成K行K列的方阵,使每行,每列中每个字母仅出现1次,这样的方阵称为拉丁方。,第六节 拉丁方设计方差分析,例如:22拉丁方 33拉丁方 A
15、B A B C B A C A B B C A 44拉丁方 55拉丁方 A B C D A B C D E B C D A B E D A C D A B C C A E B D C D A E D C A E B E D B C A 拉丁方的行和行,或列和列交换,仍为拉丁方。,第六节 拉丁方设计方差分析,拉丁方设计实际上是一种特殊类型的三因素试验设计,三个因素的水平数必须相同。(1)首先根据水平数选定拉丁方。(2)再随机交换拉丁方的行或列。(3)然后将三个因素分别放置于拉丁方的行,列 及字母上面,主要考察因素放置于字母上。(4)根据设计进行试验,把试验结果记入相应位置。(5)进行方差分析,得
16、出结论。,第六节 拉丁方设计方差分析,5个不同日期,5个受试者,穿5种不同防护服的脉搏数 受试者 日期 1 2 3 4 5 1 A B C D E 2 B C D E A 3 C D E A B 4 D E A B C 5 E A B C D,第六节 拉丁方设计方差分析,字母间(处理间)总变异 行间 列间 误差 由于总变异分解更细,误差更小,效率也更高。,第六节 拉丁方设计方差分析,可作三个方差分析:(1)H0:各种防护服的平均脉搏数相同;H1:各种防护服的平均脉搏数不全相同;F1=MS防护服间/MS误差(2)H0:各个受试者的平均脉搏数相同;H1:各个受试者的平均脉搏数不全相同;F2=MS受
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析

链接地址:https://www.desk33.com/p-675454.html