研究生实验设计方法.ppt
12 实验设计,实验设计(Design of Experiment,DOE),顺利进行科学研究和数据统计分析的先决条件获得预期结果的重要保障,设计,专业设计:,统计设计:,从各专业角度考虑实验的科学安排。选题、建立假说、确定研究对象和技术方法等。,从统计学角度考虑资料的搜集、整理和分析的设计。设计类型、样本含量、统计分析指标及统计分析方法。,医学科学研究方法分类:,研究是以客观、真实的观察为依据,对观察结果进行对比分析 不能人为地施加干预措施(即处理因素);受试对象接受何种处理因素或同一处理因素的不同水平不是由随机化而定的。,1.观察性研究(Observational study):,又称非实验性研究(Non-experiment study);对比研究(Comparative study);是以客观、真实的观察为依据,对结果进行对比分析。,举例:1.研究吸烟与肺癌的关系。2.研究母乳喂养和人工喂养儿童的生长发育情况。,特点:,2.实验性研究(Experiment study):,从指研究者能够人为给予干预措施的研究。它的设计叫作实验设计,包括专业设计和统计设计两部分。,举例:1.研究健康教育能否预防控制小学生意外伤害的发生。2.两种毒物致畸变作用的研究-大白鼠染毒实验。,优点:可以较好地控制处理因素,排除干扰,使比较组间有较好的均衡性和可比性。缺点:样本量较小时,均衡性和可比性难以保证;伦理学方面的问题。,举例:拟考察一种新药“A脂”降血脂的疗效。拟选择40只小鼠作为研究对象,考察A脂与“洛伐他仃”降血脂之间的差别,以低密度脂蛋白(LDL)作为疗效判断的指标。,12.1 实验设计的概念。12.2 实验设计的三要素12.3 实验设计的四原则12.4 实验设计的类型。,12.2 实验设计的三要素,实验设计的三要素:,受试对象(object),实验效应(Experimental effect),实验因素(Treatment),处理因素,实验效应,其它因素,其它效应,举例:研究某药对2型糖尿病患者的降糖效果,1.受试对象(Object):可是生物体和非生物体,前者可是人或动物。实验可根据对象不同分动物实验、临床实验、现场实验三大类。,动物选择:种类、品系、年龄、体重、窝别、营养等,保证其同质性和代表性明确其纳入标准和排除标准,病例选择:诊断明确、依从性好、年龄性别、病情病程等,现场人群:正常人,注意性别、年龄、民族、职业、文化 程度、经济状况等。,抓住主要处理因素;区分处理因素与非处理因素;处理因素标准化,且实施中恒定不变。,2.实验因素(Treatment):研究者希望着重考察的某些实验条件,能引起受试对象直接或间接反应的因素。,非实验因素:与处理因素同时存在,能使受试对象产生效应的因素,叫,因其常常干扰效应与所研究因素间的观察与分析,又常叫混杂因素(Confounder)。,举例:药剂、手术方法、射线、毒物等等,研究中注意:,肺癌?,年龄,举例:考察吸烟与肺癌的关系,3.实验效应(Experimental effect):是实验因素作用于受试对象的作用(response)和结局(outcome),通过观察指标来体现的。,指标选择:包括客观、主观指标;关键是选择好的指标。,12.3 实验设计的四原则,四原则:,对照原则,重复原则,随机原则,英国统计学家 R.A.Fisher 提出实验设计三原则:,均衡原则,12.3.1 对照原则(Control)对照是比较的对象;设置的目的是控制混杂因素和偏倚,以减少实验误差和系统误差。,同期对照(concurrent control):在整个实验过程中,实验组与对照组始终处于同时同地。基线比较(baseline):对照组设置后,应检验两组开始时的状态是否均衡。,常用的对照形式:,安慰剂对照(Placebo control),处理效应,其它因素,其它效应,处理因素,效应,其它因素,其它效应,安慰剂,实验组:,对照组:,安慰剂(Placebo),无药理作用的“假药”或“伪药”(dummy medication)外观(剂型、大小、顔色)、重量、气味及口味等与试验药物一致。,目的:克服研究者、受试对象、评价者等由于心理因素所造成的偏倚;消除疾病自然进程的影响,分离出由于试验药物引起的真正反应。,注意:慎用,以不影响人的健康为前提。,空白对照(Blank control),处理效应,其它因素,其它效应,处理因素,效应,其它因素,其它效应,不处理,实验组:,对照组:,空白对照(Blank control),对照组不施加任何措施,反映研究对象在实验过程中的自身变化。,由于处理手段非常特殊,安慰剂盲法试验无法执行,或执行起来非常困难;如放射治疗或手术治疗。试验药的不良反应非常特殊,以至无法使研究者处于盲态(blindness),用安慰剂意义不大,这时采用空白对照。,一般物理化学实验中扣除本底值的差异;临床试验中,可用于不适合安慰剂对照或慢病研究中。,标准对照(Standard control):实用现有的标准方法或常规方法,或现有的标准值或参考值作对照。,新效应,其它因素,其它效应,新处理,标准效应,其它因素,其它效应,实验组:,对照组:,标准处理,注意:用现有的标准值或参考值作对照-不好!,自身对照(Self control):实验和对照在同一受试对象身上进行,如身体对称部分或前后接受两不同处理。,A效应,其它因素,其它效应,A,B 效应,其它因素,其它效应,B,实验组:,对照组:,举例:研究某治疗烧伤新药的疗效。,同个体某部位,同个体对称的部位,举例:研究盐酸西布曲明的减肥效果-前后对照,注意:单一的前后对照是不提倡的;要设对照组。,前后对照不是同期对照;在实验中同样需要另设一个对照组,用处理前后效应的差值来比较实验组和对照组。,西布曲明,肥胖患者体重(服药前),肥胖患者体重(服药后),自身对照(Self control),相互对照(Mutual control),A 效应,其它因素,其它效应,处理A,B 效应,其它因素,其它效应,处理B,实验组:,对照组:,实验对照(Experimental control):对照组不施加处理因素,但施加与处理因素有关的实验因素。,A+B 效应,其它因素,其它效应,A+B,B 效应,其它因素,其它效应,B,实验组:,对照组:,举例:赖氨酸添加实验,考察补充赖氨酸对儿童发育的影响,赖氨酸+面包,面包,赖氨酸+面包,面包,历史对照(Experimental control):拿当前的实验结果与历史上的同类实验结果相比较,即为,一般不宜采用。,安慰剂对照 空白对照 标准对照 自身对照 相互对照 实验对照 历史对照,对照,A.实验对照 B.空白对照 C.安慰剂对照 D.相互对照 E.自身对照1.为研究某新药治疗胃溃疡的效果,对照组选用雷尼替丁治疗,这属于。2.为明确某食物疗法对贫血的疗效,选用治疗前、后血红蛋白量作为疗效观察指标,这属于。3.为研究某感冒药物疗效,实验组服用该新药,对照组不使用任何药物,这属于。4.若上题,对照组服用感冒通胶囊,则属于。,练习题:,12.3.2 重复原则 在相同的实验条件下,进行多次研究或多次观察,以提高实验的可靠性和科学性。,重复实验:相同条件下,独立重复观测多个样品,或受试对象,目的是降低以个体差异为主的各种实验误差。关键:要有足够的样本含量。重复取样:同一时间点从同一受试对象或样品中取多个样本,目的是看受试对象身上某定量观测指标含量的分布情况。重复测量:保证了观察结果的精度,包括:,目的:估计实验误差、降低实验误差。,12.3.3 随机原则(Randomization)(一)目的:使实验组与对照组之间在非实验因素的分布尽量保持均衡一致,统计学上常采用随机化的方法。,抽样的随机:每个附合条件的受试对象被抽取的机 会均等。分组的随机:每个受试对象被分到各组的机会均等。实验顺序的随机:每个受试对象先后接受处理的机 会均等。,随机化应贯穿研究设计和实施的全过程,包括:,抽样的随机:,【例1】某班有学生100名,采用单纯随机抽样的方法抽取15人参加英语口语考试。,单纯随机抽样(simple random sampling),【例2】如要在1000名新生中抽取50人作样本,其抽样间隔为100050=20;若随机抽取的第一号为8,则抽取的个体号依次为8,28,48,68,88,2.系统抽样(systematic sampling),【例3】如调查某县农村妇女下生殖道感染情况,可按乡镇分层(如好、中、差三层),在各个乡镇再随机抽样,各个乡镇可以独立分析。,分层抽样(stratified sampling):先将总体全部个体按某种特征分成若干层,再从每一层内随机抽取一定数量的个体合起来组成样本。,【例4】如调查某县农村儿童贫血状况,可按乡镇分群体,再随机抽取几个乡镇,对其中的全部儿童进行调查。,整群抽样(cluster sampling):先将总体分成若干群,形成一个抽样框;从中随机抽取几个群体组成样本;对抽中群体的全部个体进行调查,称为整群抽样。,4.整群抽样 Cluster sampling,Section 4,Section 5,Section 3,Section 2,Section 1,1.抽签或掷硬币2.随机数字表(Table of random number)3.计算机的伪随机数发生器(Pseudo random number,PRN)或:专业化软件RandA1.0,(二)随机化的方法,软件种子数,(三)常用的两种随机化方法,完全随机化(Complete randomization):直接将受试对象进行随机化分组。,步骤:,编号:动物按体重大小、患者按就诊次序 取随机数(与n的位数相同)确定组别,举例:试将同性别、体重相近的 30只动物分 到A、B、C三组。,表5-1 随机数字表(随机数字表的一部分),采用完全随机化进行分组,通常得到不同组的观察单位数不同。在实验设计时若希望各组的单位数相同,可采用对随机数排秩的办法,此时检验效能最高。,配对随机化(Paired randomization):以“对子”为层区组随机化(Block randomization):以“区组”为层,步骤:,编号;取随机数;确定组别,2.分层随机化(Stratified randomization):先对可能影响实验过程和结果的混杂因素分层,然后在每一层内进行完全随机化,即是分层随机化。,常用的有:,举例:为比较四种抗癌新药的疗效,将小白鼠体重作分层或区组因素,试分配处理。,表8-2 小白鼠区组随机化的结果,12.3.4 均衡原则 所谓均衡就是指实验组与对照组之间在非实验因素方面应力求均衡一致。主要作用:是确保实验因素各水平组间不受其他实验因素或重要的非实验因素的不平衡的影响。,为最大限度的减少偏倚,在临床试验设计中还常采用盲法的原则,特别是临床药物实验:,12.4 实验设计类型方法,常用的实验设计方法:,方案 1,方案 2,1.成组设计:,2.配对设计(Paired design)将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组。配对因素:可能影响实验结果的主要混杂因素,同源配对设计 条件相似者配对设计 自身配对设计,包括:,A B,配对设计:,配对设计的主要形式有:将两条件相同或相近的受试对象配成对子(含同一个体两对称器官或组织),分别接受两种不同的处理。如:小鼠配对实验。同一受试对象(人或标本)分别接受两种不同处理。前后配对:同一受试对象接受一种处理前后。,优点:抽样误差小;实验效率较高;所需样本含量较小。缺点:配成对子比较困难;丢失对子 配对欠佳或配对失败时,反而降低效率。,3.随机区组设计(Randomized block design)又称随机单位组设计,随机配伍组设计。,b 个区组:A 和 B 每个区组内:k 个受试对象 k 个处理:有待比较,特点:,将受试对象按性质(如动物按窝别、性别、体重;病人按病情、性别、年龄等非处理因素)相同或相近者组成b个区组(或称单位组、配伍组);每个区组中k个受试对象随机分配到每个区组k个处理组中去。,随机区组设计(配伍组设计),A B C D,举例:30只实验用大白兔,按窝别同,体重近划分为10个区组,每区组3只大白兔随机采用A、B、C三种处理方案,问三方案处理后血白蛋白减少量有无不同?,随机区组设计:,4.交叉设计(Cross-over design)是一种特殊的自身对照设计,按事先设计好的试验次序,在各个时期对研究对象实施各种处理,比较各处理组间的差异。,两种处理:A 和 B 两个阶段:I 和 II 随机分为两组:组1 先 A 后 B 组2 先 B 后 A,22 交叉:,能够分析:处理因素之间的差别 时间先后顺序的差别,双因素设计,两阶段,两处理,表8-3 二阶段交叉设计模式,某医生为研究某新药A治疗哮喘的疗效,以旧药舒喘宁B为对照。将40名哮喘者随机分为2组,按22交叉设计模式给药,测服药8小时的PEF值。,表12-2 配对交叉设计考察催醒宁和等量NS对氟呱啶的作用,研究催醒宁对氟呱啶 的作用。用 6 只大鼠作实验,均于腹腔注射氟呱啶和硫酸阿托品,在大鼠入睡后15min后再注射 0.5mg/kg 的催醒宁,并以等量NS作对照药品,以用药后动物出现蹲和走动作为观测指标。,优点:不受个体差异的影响,适用于慢性病。所需样本例数可少一些;缺点:处理时间不能太长;若患者治愈或死亡,则后一阶段无法进行。受试对象在某一阶段退出实验,就会造成该阶段及以会数据的丢失。,交叉试验:,注意事项:清除阶段旨在消除前一处理的剩余效应,其长短取决于 药物在血清中衰减程度,一般大于68个半衰期。盲法:以提高受试对象的依从性,避免偏倚。不宜用于有自愈倾向或病程较短的疾病研究。,5.析因设计(Factorial design)又称完全交叉分组设计,是将两个或多个实验因素的各水平进行组合,对各种可能组合都进行实验,从而探讨:各实验因素的主效应(main effect)各因素间的交互作用(interaction):当某一因素在各水平间变化时,另一个或多个因素各水平的效应也相应地发生变化。,表示方法:,1.等水平析因设计:m个因素、k个水平,记作:mk,2.不等水平析因设计:如 3253表示:3个因素2个水平,5个因素3个水平,如 32析因分析表示:3个因素有2个水平,举例:某研究人员要了解某升白细胞(A)和纯苯(B)对大鼠吞噬指数的影响,以及两者同时使用时的效应,测得吞噬指数结果如下:,各因素的主效应(main effect)各因素间的交互作用(interaction):当某一因素在各水平间变化时,另一个因素各水平效应也发生相应地变化。,析因设计:,优点:全面高效性 以最小实验次数探讨各因素的主效应,同时获得各因素间的交互作用;通过比较各种实验的组合,寻求最佳组合。缺点:工作量大;统计分析复杂。,6.重复测量设计(Repeated measurement design)按实验分组因素将受试对象分成若干个组,每一组受试对象接受一种特定的处理。之后,在几个不同的时间点从同一受试对象身体上重复获得指标的观察测,即为。,设计特点:,1.同一受试对象的数据高度相关;2.处理因素在受试对象间为随机分配的,但受试对象内各时间点往往是固定的,不能随机分配;3.有专门用于重复测量资料的方差分析方法。,举例:研究两种药物噻胺酮、氯胺酮,对大鼠肌电图频数的影响,实验测计与观测结果见下表示:,12.5 样本含量的估计,样本含量(Simple size)指观察例数的多少,又称样本大小。,一、样本含量估计的意义,原则:科学实验需要重复,所得结果不必真实;检验效能低。,样本量过大:,实际工作困难,浪费人力物力、时间;引入过多的混杂因素,影响数据质量。,样本量过小:,必需正确地估计样本含量,用最少的经费达到要求的精度!,二、影响样本含量估计的主要因素:,四个主要因素:、,1.第一类错误概率,也称检验水准 所设小,所需样本含量大;相同,双侧检验比单侧检验所需样本含量多;所以要注意单双侧;一般设为0.05,0.01,2.第二类错误概率b,或检验效能1-b 所设b小或检验效能1-b 高,则所需样本量大;一般设b在0.80 以上。,3.容许误差 容许误差大,所需样本含量小;的数值由问题的性质决定。,反映资料的变异度,愈大,所需样本含量愈多。总体概率越近于0.50,说明资料变异度越大,则 所需样本含量也愈多。或的数值由预实验,或文献、专业知识决定。,4.总体标准差 或总体概率,此外,样本含量大小与下列因素也有关系:研究中比较组的多少。研究中比较的组别越多,则样本含量越大。欲分析变量的多少。研究所采用的抽样调查方法。一般而言,整群抽样单纯随机抽样系统抽样分层抽样的抽样误差,因此整群抽样一般需更大的样本量,而分层抽样所需样本量则较少。,三、样本含量的估计方法:,查表法:方便,但受到列表的限制;计算法:根据检验效能的公式反推过来,求样本含量。,(1)单样本均数检验或均数的配对检验:,均取单侧临界值,为标准正态分布的双侧临界值;为单侧检验时的。,双侧检验:,单侧检验:,举例:为了解高温作业工人心率是否高于一般人群。某研究者随机抽取10名高温作业工人做预试,测得标准差S=6.2次/分。若高温作业工人心率高于一般人群3.0次/分才有专业意义,问=0.05,0.10时,需要多大样本含量?,解:,代入公式:,=0.05,0.10,=3.0次/分,=6.2次/分,查表:,故需检测37位高温作业工人,才有90%的概率发现高温作业工作与一般人群脉博3.0次/分的差异。,(2)两样本均数的检验:,Q1和Q2为样本例数(sample fraction),Q1=n1/N,Q2=n2/N,N=n1+n2,因而:n1=Q1N,n2=Q2N,Q1+Q2=1若:n1=n2,则:Q1=Q2=0.5,双侧检验:,举例:某人欲比较黄芪与生血散对粒细胞减少症的疗效。据以往经验,黄芪可平均增加粒细胞1109个/L,生血散可平均增加粒细胞2109个/L,若=1.8 109个/L,取单侧0.05,检验功效为0.80,每组例数相等,问每组需要多少病例?若黄芪组样本含量占整个样本含量的60%,则每组又各需要多少病例?。,解:,代入公式:,=0.05,0.20,=2.0-1.0=1.0,=1.8,查表:Za=Z0.05=1.648;Zb=Z0.20=0.842,则:每组所需病例均为40例。,(1)若两样本含量相等,则Q1=Q2=0.5,(2)若黄芪组样本量占整个样本含量的60%即:Q1=0.60,Q2=1-Q1=0.40,所以:黄芪组需 n1Q1N=0.684=50例 生血散组需 n2Q2N=0.484=34例,可看出:在其他条件不变的情况下,若两组样本含量的比例相同,则所需的样本含量最少。,(3)单个样本率的检验(大样本):,则:=1-2,双侧检验:,0为已知总体概率,1为预期实验总体概率,(5)两个独立样本频率的检验,(4)配对二分类资料的检验,小 结,科研方法按是否给预干预措施分为:实验型研究实验设计 观察性研究调查设计实验设计的三要素:实验对象、处理因素、实验效应实验设计的四原则:对照原则、随机化原则、重复原则、均衡原则常用的实验设计方案有:成组设计、配对设计、随机区组设计、交叉设计、析因设计、重复设计等。研究者可根据其研究目的,处理因素的多少和水平数进行合理选择。,THANK YOU!,