石大医学统计学讲义07方差分析.docx
第七讲方差分析方差分析(analysisofvariance),简称ANOVA,由英国统计学家R.A.Fisher首先提出,后人为纪念FiSher,以F命名方差分析的统计量,故方差分析又称F检验。样本均数的差异,可能有两种原因所致。1、可能由随机误差所致随机误差包括两种成分:个体间的变异和测量误差两部分;2、可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。一般来说,个体之间各不相同是繁杂的生物界的特点;测量误差也是不可避免的,因此第一种原因肯定存在。而第二种原因是否存在,这正是假设检验要回答的问题。方差分析的基本思想是将所有观察值之间的变异(称总变异)按设计和需要分解成几部分。如完全随机设计资料的方差分析,将总变异分解为处理间变异和组内变异两部分,常将后者称为误差。将各部分变异除以误差部分,得到统计量F值,并根据F值确定P值作推断。由于方差分析是根据实验设计将总变异分成若干部分,因此设计时考虑的因素越多,变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易,同时由于变异划分的精细,误差部分减小,提高了检验的灵敏度和结论的准确性。方差分析应用很广泛,可用于:(1)两个或多个样本均数间的比较;(2)分析两个或多个因素的交互作用;(3)回归方程的假设检验;(4)方差齐性检验等。多个样本均数间比较的方差分析应用条件为:(1)各样本必须是相互独立的随机样本;(独立性)(2)各样本均来自正态总体;(正态性)(3)相互比较的各样本所来自的总体其方差相等,(方差齐性)一、完全随机设计的方差分析医学实验中,根据某一实验因素,用随机的方法将受试对象分配到各组,各组分别接受不同的处理后,观察各种处理的效果,比较各组均数之间有无差别。临床研究中,还可能常常比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的疗效;或比较某种疾病不同类型之间某一指标有无差别等。这些都是一个因素不同水平(或状态)间几个样本均数的比较,可用单因素的方差分析(one-wayANOVA)来处理此类资料。例题:某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果见下表:问三组石棉矿工的肺活量有无差别?表三组石棉矿工的用力肺活量(L)石棉肺患者可疑患者非患者1.82.32.91.42.13.21.52.12.72.12.12.8Xij1.92.62.71.72.53.01.82.33.41.92.43.01.82.43.41.83.32.03.5合计(Xij)19.120.833.974.4(X)j1191131(N)均数Xj1.792.313.082.4(X)(x2ij)35.6948.34105.33189.36(X2)从表中的测量结果可以看出,三个组31名矿工的用力肺活量测定值大小不等,这是总变异。将其分为两个部分:一是组内变异,它反映矿工用力肺活量测定值的随机误差;另一个是组间变异,它反映随机误差和石棉肺对用力肺活量的影响。计算分析步骤:(1)建立假设和和确定检验水准H0:三组矿工用力肺活量的总体均数相等,=2=3H1:三组总体均数不等或不全相等=0.05计算检验统计量F值本例:校正数C=(74.4)2/31=178.560SS总=X2-C=189.36-178.56=10.800dfx=N-I=31-1=30SS纲间=Z(ZXij)_c一n=21Z2i+(20.89)2+£2122:_178.56=9.26611911df狙间=k-1=3-1=2SS组内二SS砂-SS组间=10.8-9.266=1.534df组内=N-k=31-3=28MS组间=SS纲间df组间=9.266/2=4.633MS组内=SS级内df姒内=1.534/28=0.0548F=MS姐间/MS组内=4.633/0.054=84.544方差分析结果表变异来源SSDfMSFP总10.80030组间9.26624.633084.544<0.01组内1.534280.0548(3)、确定P值和作出推断结论查表得P<0.01,按=0.05水准拒绝Ho,接受H,故可以认为三组矿工用力肺活量不同。(4)、结论表明,总的说来三组矿工用力肺活量有差别,但并不表明任何两组矿工的用力肺活量均有差别,只能说至少有两组矿工的用力肺活量有差别,需进一步作两两比较。