《统计学实验设计.ppt》由会员分享,可在线阅读,更多相关《统计学实验设计.ppt(77页珍藏版)》请在课桌文档上搜索。
1、实验设计,实验设计(design of experiment,DOE)顺利进行科学研究和数据统计分析的先决条件获得预期结果的重要保证 设计:专业设计:从各专业角度考虑实验的科学安排,选题、建立假说、确定研究对象和技术方法等;统计设计:从统计学的角度考虑资料搜集、整理和分析的设计。-设计类型、样本含量、指标和分析方法,医学科学研究方法:(1)观察性研究(observational study)又称 非实验性研究(non-experimental study)或 对比研究(comparative study)-非随机化对比研究。以客观、真实的观察为依据,对观察结果进行描述和对比分析;不能人为施加干
2、预措施(即处理因素);受试对象接受何种处理因素或同一处理因素的不同水平不是由随机化而定的。例如,研究母乳喂养与人工喂养儿童的生长发育情况.-观察性研究的设计属于调查设计(survey design),(2)实验性研究(experiment study)指研究者能够人为给予干预措施的研究,例如,健康教育能否预防和控制小学生意外伤害发生的研究。随机将小学生分为实验组和对照组,实验组给予有关预防和控制意外伤害发生的健康教育措施,对照组则不给予。观察一段时间后,比较两组小学生意外伤害的发生率。-它的设计对应于实验设计。以下主要介绍实验设计的统计部分 包括:基本要素、基本原则、常用设计方案、样本含量的估
3、计和临床试验设计,第一节 实验设计的基本要素,其他,处理 对象 效应 其他效应,受试对象(object)处理因素(treatment)实验效应(experimental effect)例如,研究某药对型糖尿病病人的降血糖效果。受试对象:型糖尿病病人处理因素:某药实验效应:血糖的变化值,1处理(treatment)例:药剂、手术方法、毒物(1)抓住主要处理因素(2)区分处理与非处理因素(3)处理因素必须标准化2受试对象动物的选择:种类、品系、年龄、体重、窝别、营养病例的选择:纳入标准、剔除标准3效应(effect)指标的选择:准确(accuracy);精密(precision)灵敏(sensit
4、ivity);特异(specificity),第二节 实验设计的基本原则,一、对照(control)目的:比较的对象;控制实验误差和系统误差同期对照(concurrent control):在整个实验过程中,对照组和实验组应始终处于同时同地基线(baseline)比较:对照组设立后,应检验两组开始时的状态是否均衡。,常用对照(1)安慰剂(或空白)对照处理组:其他处理 对象I 效应 其他效应对照组:其他安慰剂 对象II 效应(或空白)其他效应,安慰剂(placebo)无药理作用的“假药”或称伪药物(dummy medication);外观(剂型、大小、颜色)、重量、气味及口味等与试验药物一致。目
5、的:1)克服研究者、受试对象、评价者等由于心理因素所形成的偏倚,控制安慰作用;2)消除疾病自然进程的影响,分离出由于试验药物所引起的真正反应。安慰剂对照的使用要慎重,应以不损害病人健康为前提。,空白对照:在实验研究中,设置空白管并同时测定,以检测本底值。在临床试验中,空白对照可用于以下两种不适用于安慰剂对照的情况:1)由于处理手段非常特殊,安慰剂盲法试验无法执行,或者执行起来非常困难。例如,试验组为放射治疗或外科手术等;2)试验药的不良反应非常特殊,以至于无法使研究者处于盲态(blindness),这时使用安慰剂对照意义不大,不如采用空白对照。,(2)实验对照 例如,赖氨酸添加实验中,实验组儿
6、童的课间餐为加赖氨酸的面包,对照组为不加赖氨酸的面包。处理组:其他A+B 对象I A+B效应 其他效应对照组:其他 B 对象II B效应(或空白)其他效应,含赖氨酸面包+非处理因素赖氨酸效应+面包效应+非处理因素效应,面包+非处理因素 面包效应+非处理因素效应,赖氨酸 赖氨酸效应,非处理因素+非处理因素效应,(3)相互对照 处理组:其他A 对象I A效应 其他效应对照组:其他B 对象II B效应 其他效应,(4)自身对照例如,研究治疗烧伤新药,一部位用烧伤新药,另一部位用其它公认有效药物;其他A 对象I A效应 其他效应对照组:其他B 对象II B效应(或空白)其他效应,注意:前后对照不是同期
7、对照。在实验中同样需要另外设立一个对照组,用处理前后效应的差值来比较实验组与对照组。,又如,研究盐酸西布曲明的减肥效果,以肥胖病人用药前的体重作对照。,(5)标准对照(standard control)用现有标准方法或常规方法作对照。这种对照在临床试验中用得较多,因为很多情况下不给病人任何治疗是不道德的。另外,在实验室研究中常用于某种新检验方法是否能代替传统方法的研究。(6)历史对照(historical control)与本人或他人过去的研究结果作比较-不好!,二、随机化原则,随机化(randomization)目的:对付大量不可控制非处理因素的另一个重要统计学手段;对资料进行统计推断的前提
8、 随机化应贯穿于研究设计和实施的全过程:,1)抽样的随机化:总体中每个个体都有相同机会被抽到样本中来。保证所得样本有代表性,使实验结论具有普遍意义。2)分组的随机化:每个受试对象被分配到各组的机会相等。保证受试对象的其他状况在对比组间尽可能均衡,提高组间的可比性。3)实验顺序的随机化:每个受试对象先后接受处理的机会相等。使实验顺序的影响达到均衡。,随机化方法1)抽签或掷硬币(已过时)2)随机数(random number)随机数字表(现场用)伪随机数(pseudo random number,PRN):介于0和1之间均匀分布的数字 统计软件中的伪随机数发生器:如果每次将种子数(seed num
9、ber)设为一样,产生的伪随机数便具有重复性。-必须报告:用什么统计软件产生伪随机数?种子数?,随机化实验设计方法1)完全随机化(complete randomization)步骤:编号 取随机数(与n的位数相同)确定组别 例8-1 试将同性别、体重相近的30只动物分到A、B、C三组。(用随机数字表)先将动物按体重编号 再从随机数字表中任一行(如第16行)最左开始连续取30个两位数字 最后将这30个两位数字分别除以3,余数0、1、2分别对应于A、B、C三组,表8-1 30只动物完全随机分组的结果,2)分层随机化(stratified randomization)完全随机化并不能保证各组间一定达
10、到良好的均衡性。配对随机化(paired randomization)以对子为“层”区组随机化(block randomization)以区组为“层”,例8-2 为比较四种抗癌药物(A,B,C,D)的疗效,将小白鼠体重作为分层因素,试分配处理。,三、重复原则,重复:在相同实验条件下进行多次研究或多次观察,以提高实验的可靠性和科学性。1)整个实验的重复 不可重复的研究是没有科学性的。2)用多个受试对象进行重复 个别-普遍?偶然-必然?要有足够的样本含量(sample size)3)同一受试对象的重复观察 降低实验误差 估计实验误差,第三节 常用的实验设计方案,考察单个因素的效应?可选用 完全随机
11、设计 配对设计 随机区组设计 交叉设计 考察多个因素的效应?可选用 析因设计,一、完全随机设计(completely randomized design)又称 简单随机分组设计(simple randomized design)将同质的受试对象随机地分配到各处理组,再观察其实验效应平衡设计(balanced design):各组样本含量相等非平衡设计(unbalanced design):各组样本含量不等,二、配对设计(paired design)将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。配对依据:可能影响实验结果的主要混杂因素动物实验:窝别、性别、体重等作为
12、配对条件临床试验:病情轻重、性别、年龄、职业等作为配对条件。,在医学科研中,配对设计主要有以下情形:1)将两个条件相同或相近的受试对象配成对子(含同一个体的两对称器官或组织),分别接受两种不同的处理。例 欲研究维生素E缺乏时对肝中维生素A含量的影响,将同种属的大白鼠按性别相同,月龄、体重相近配成对子,分别随机喂以正常饲料和维生素E缺乏饲料。2)同一受试对象(人或标本)分别接受两种不同的处理。,3)前后配对?-同一受试对象接受一种处理的前后若仅观察一组,则要求在处理因素施加前后的影响因素如气候、饮食、心理状态等要相同,但常常难于做到,故存在一定缺陷,现已不提倡单独使用。配对设计的优点:抽样误差较
13、小、实验效率较高、所需样本含量也较小;配对设计的缺点:配对失败或配对欠佳时,反而降低效率,三、交叉设计(cross-over design)两种处理:A和B两个阶段:I和随机分两组:先A后B;先B后A,优点:不受个体差异的影响,适用于慢性病。缺点:受试对象一旦在某一阶段退出试验,就会造成该阶段及其以后的数据缺失。注意:1)清除阶段(washout period)旨在消除剩余效应(carry-over effects)该阶段的长短取决于药物在血清中的衰减程度,一般要求大于6-8个药物半衰期;2)盲法,以提高受试对象的依从性,避免偏倚;3)不宜用于具有自愈倾向或病程较短的疾病研究,四、随机区组设计
14、(randomized block design)又称随机单位组设计、随机配伍组设计。b 个区组:很不相同 每个区组内:k个受试对象 k 个处理:有待比较 将受试对象按性质(如动物的性别、体重,病人的病情、性别、年龄等非实验因素)相同或相近者组成b个区组(或称单位组、配伍组);每个区组中的k个受试对象分别随机分配到k个处理组中去。,例9-2 为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,即在松止血带前分别给予丹参2ml/kg、丹参1ml/kg、生理盐水2ml/kg;在松止血带前及松后
15、1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表9-6所示。问A、B两方案分别与C方案的处理效果是否不同?,表9-6 A、B、C三种方案处理后大白兔血中白蛋白减少量(g/L),优点:区组内有较好的同质性;容易察觉处理间的差别缺点:要求区组内受试对象数与处理数相等,五、析因设计(factorial design)又称完全交叉分组设计 将两个或多个实验因素的各水平进行组合;对各种可能的组合都进行实验.,例9-3 某研究人员为了解升白细胞药物(A)和纯苯(B)对大鼠吞噬指数的影响,以及两者同时使用的作用。,各因素的主效应(main effect)因素间交互效应(interaction)
16、:当某一因素在各水平间变化时,另一个因素各水平的效应也相应地发生变化。,记号等水平析因设计mk:k个因素,每因素m个水平的析因设计。如三因素两水平,记为23析因设计不等水平析因设计3253:两个因素有3个水平,三个因素有5个水平优点:1)全面高效性 以最小的实验次数探讨各因素的主效应,同时可获得因素间的交互;2)通过比较各种实验组合,还能寻求最佳组合缺点:工作量较大;统计分析复杂,第四节 样本含量的估计样本含量(sample size)又称样本大小本节主要讨论假设检验时的样本含量估计。一、样本含量估计的意义 科研设计需要“重复”样本含量过小:所得结果未必真实 检验的功效低 样本含量过大:实际工
17、作困难;浪费人力、物力和时间;引入更多的混杂因素,影响数据的质量 必须正确合理地估计样本含量,用最少的经费达到要求的精度,二、影响样本含量估计的因素 1.第一类错误概率的大小 也称检验水准 要求小,所需样本含量多;相同,双侧检验比单侧检验所需样本含量更多。一般要求=0.05。2.第二类错误概率的大小 或检验功效(1)要求检验功效愈大(第二类错误的概率愈小),所需样本含量多。一般要求检验功效在0.80及以上。,3.容许误差 大,所需样本含量小。的数值由问题的性质决定4.总体标准差 或总体概率 反映资料的变异度,大,所需样本含量越多 总体概率 越近于0.50,所需样本含量越多 或 的数值由 预试验
18、 或 专业知识决定,三、样本含量估计的方法 查表法:方便,但受到列表的限制 计算法:根据检验功效的公式反推过来求样本含量,(1)单样本均数检验或均数的配对检验,例8-3 为了解高温作业工人的心率是否高于一般人群。某研究者随机抽取了10名高温作业工人做预试,测得其标准差S=6.2次/分。若高温作业工人的心率高于一般人群3.0次/分才有专业意义,问=0.05,=0.10时,需要多大样本含量?=6.2次/分,=3.0次/分=0.05,=0.10 均取单侧,查表得 Z=Z0.05=1.645,Z=Z0.10=1.282,,故需37位高温作业工人,才有90%的概率发现高温作业工人与一般人群3.0次/分的
19、脉搏差异。,(2)两样本均数检验Q1和Q2为样本比例(sample fraction)Q1=n1/N Q2=n2/N N=n1+n2因而 n1=Q1N n2=Q2N Q1+Q2=1 若n1=n2,则Q1=Q2=0.5。,例8-4 某人欲比较黄芪与生血散对粒细胞减少症的疗效。据以往经验,黄芪可平均增加粒细胞1109个/L,生血散可平均增加粒细胞2109个/L。若=1.8 109个/L,取单侧0.05,检验功效为0.80,每组例数相等,问每组需要多少病例?若黄芪组样本含量占整个样本含量的60%,则每组又各需多少病例?=1.8(109个/L)=21=1(109个/L)Z=Z0.05=1.645,Z=
20、Z0.20=0.842,若两组样本含量相等,则Q1=Q2=0.5,可算得 n1=n2=N/280/2=40即每组均需病例40例。若Q1=0.60,Q2=1Q1=0.40 则黄芪组 n1=Q1N=0.684=50生血散组 n2=Q2N=0.484=34,(3)单样本频率检验(大样本)1为预期实验结果的总体概率,例8-5 用常规方法治疗过敏性鼻炎的有效率为85%,现试验某一新药,预计有效率为95%。若=0.05,=0.10,问需多少病例?本例,0=0.85,1=0.95,=0.10。Z0.05=1.645,Z0.10=1.282,代入式(8-3)得,(4)两独立样本频率检验 例8-7 比较两种药物
21、治疗乙型肝炎后表面抗原HBsAg的阴转情况。预试中,甲药的阴转率为60%,乙药的阴转率为75%。若取=0.05,=0.10,甲药组的样本含量占55%,乙药组占45%,问两组各需多少乙型肝炎患者?*(5)配对二分类资料的检验例8-6 拟比较甲、乙两种血清学方法对鼻咽癌患者的检出情况,初步估计甲法的阳性检出率为91%,乙法的阳性检出率为75%,两种方法一致的阳性检出率为73%。请估计样本含量。,第五节 临床试验设计临床试验:在人体(病人或健康志愿者)中进行的关于药品(常为新药)的系统性研究,前瞻性。主要目的:确定药品的疗效和安全性特点:1)以人为试验对象;2)对干预措施进行前瞻性的追踪研究;3)试
22、验过程易受多种因素影响,可能有偏倚;4)试验病例需一定时间的积累,1.明确研究目的 研究要解决什么问题?是考核新的诊断、治疗方法还是评价一种或几种新药?通常一次临床试验只解决一个问题。,2.确定研究对象 选择合适的研究对象,包括试验组和对照组。选择研究对象应制订严格的纳入和排除标准,这些标准应以书面形式明确规定,并严格执行。,一般选择研究对象需要遵循以下原则:选择对干预措施有效的对象 选择预期发病率较高的对象 选择干预对其无害的对象 选择能将实验坚持到底的对象 选择依从性好的人群,一、临床试验概况有关法规:中华人民共和国药品管理法、新药审批办法、药品临床试验管理规范(Good Clinical
23、 Practice,GCP)化学药品和生物制品临床试验的生物统计学指导原则在进入临床试验前,新药一般要经过实验室和动物实验阶段;细胞培养、动物实验不能取代临床试验,动物实验结果的有效,并不意味对人体一定有效。新药的有效性和安全性需由临床试验确认,其结论必须以统计学原理为基础。,(1)临床试验的分期 I期临床试验:初步的临床药理学及人体安全性评价试验 在数名志愿者身上进行,必要时可包括病人。观察人体对于新药的耐受程度(tolerance)和药物代谢动力学(pharmacokinetics),为制定给药方案提供依据。期临床试验:对新药的有效性和安全性作出初步评价,推荐临床给药剂量。盲法的随机对照试
24、验(randomized controlledtrial,RCT),期临床试验:遵循随机对照的原则,进一步评价药物的有效性、安全性。扩大的多中心临床试验(multi-centerClinical trials)期临床试验:在广泛使用的条件下,考察药品的疗效和不良反应。药品上市后的监测(post marketing surveillance),(2)病例报告表(case report form,CRF)表格文件,用以记录每一名受试对象在试验过程中的数据一式三份,用不同颜色标示,使用无碳复写纸复写内容和格式简明确切观察项目:主要变量和相关信息填写者:对效应的判断有统一认识、理解并直接接触受试对象者
25、 不应涂改,如需更正,应将原数据划去,填上更正数据,并保证能看清,还需由更正者签字并注明日期。各种实验室数据均应记录或将原始报告粘贴在CRF上,在参考值范围内的数据也应记录。对明显偏离或在临床可接受范围以外的数据须加以核实,由研究者作必要的说明。,二、临床试验设计的特殊问题临床试验设计仍属实验设计的范畴,还需考虑其特殊的一面。怎样在临床试验中正确采用盲法?如何在临床试验中避免给病人带来不必要的痛苦?如何进行多中心试验?如何对临床试验的结果作出正确的评价?,(1)盲法-纠正偏倚的重要措施优点:能够避免受试对象和研究者的心理或精神因素影响,使评价、测量更为客观。如条件许可,均应采用盲法试验,双盲不
26、行,则单盲采用单盲或非盲均应制订控制偏倚的措施盲法常和安慰剂同时采用盲法应自始至终地贯彻于整个试验之中:随机数的产生、编制盲底(blind codes)、试验药品的编码、受试对象入组用药、研究者记录试验结果和做出评价、监察员(monitor)进行检查、数据管理直至统计分析盲底泄露,试验视作无效!,注意:1)安慰剂与药品在剂型、外形等方面完全一致,并不含有任何有效成份。2)双模拟(double dummy)技术试验药与对照药各准备一种安慰剂胶囊技术(capsule technique)。因改变剂型可能会改变药物代谢动力学或药物效应学的特性,故需有相应的技术资料支持。3)药品编盲与盲底保存 每一个
27、编盲号设置一份应急信件(emergency envelope),密封,随相应编号的试验用药品发往各临床试验中心,由该中心负责保存,非必要时不得拆阅。,4)应急信件与紧急揭盲 在发生紧急情况时,由研究人员按试验方案规定的程序拆阅。一旦拆阅,该病例中止试验-脱落(drop out),中止原因记录在CRF中。所有应急信件在试验结束后随CRF一起收回,以便试验结束后盲态审核。,5)揭盲(unblinding)当试验组和对照组例数不相等时,一次揭盲 当试验组和对照组例数相等时,两次揭盲试验结束后,方案规定的入组病例的CRF全部输入计算机,并经过监察员、数据管理员、统计学专业人员审核检查。数据文件经过盲态
28、审核(blind review),并认定可靠无误后将被锁定(lock)。第一次揭盲:只列出每个病例所属的处理组别(如A组或B组),进行统计分析。第二次揭盲:统计分析结束后,标明A、B中哪一组为试验组。,(2)医学伦理 在寻求医学进步和保障病人得到最好的医疗之间找出一个平衡点。1960,世界医学会(World Medical Association),赫尔辛基宣言(Declaration of Helsinki),1975(东京)、1983(威尼斯)、1989(香港)第29、35和41届世界医学大会修订。,注意:1)临床试验必须符合道德原则 赫尔辛基宣言和人体生物医学研究国际道德指南-公正、尊重
29、人格、力求使受试者最大程度受益和尽可能避免伤害。2)临床试验必须有充分的科学依据 试验的目的、要解决的问题、预期的治疗效果、可能产生的危害 3)伦理委员会(ethics committee)试验前,伦理委员会同意试验期间,方案任何修改应经伦理委员会批准试验中,任何严重不良事件,均应向伦理委员会报告,4)充分保障受试对象的个人权益知情同意(informed consent)向受试对象提供详细材料:试验目的、预期的益处、受试对象被分配到不同试验组而可能发生的风险与不便、因参加试验而可能受到损害或影响身体健康时能够获得的治疗和补偿。不能强迫,受试对象同意后,须由受试者或其法定代理人在书上签字并注明日
30、期,执行知情同意过程的研究者或其代表也需在知情同意书上签名,并注明日期。受试对象保留在任何时候退出试验的权利。,(3)多中心临床试验 优点:可以在较短的时间内搜集所需的病例;病例范围、临床条件广,结果具代表性实施:统一组织领导统一试验方案统一人员培训统一监控措施(4)临床试验的评价 设计、随机化、样本含量、指标选择、测量、盲法、伦理学要求,三、临床试验的统计分析(1)治疗意向(intention-to-treat,ITT)的数据分析 根据临床试验的要求,对经随机化并分配到各组的全部病例进行统计分析,而不管其是否依计划完成治疗试验。对于未能观察到全部疗效的病例资料:把最后观察到(脱落时)的结果作
31、为其疗效(carry forward of the last observation,CFLO),这样的数据集称为全分析集(full analysis set),(2)符合方案(per protocol,PP)的数据分析,对所有符合试验方案、依从性好(如服用试验用药数量在该病例需要服用量的80%-120%)、试验期间未服用违禁药、完成CRF规定填写内容的病例进行统计分析,这样的数据集称为符合方案集(per protocol set)。对不符合上述条件的不纳入分析,但在计算不良反应发生率时应包括在内。其数据集称为安全集。,小结,1.科研方法的分类:按是否给予干预措施分为实验性研究(有干预)和观察
32、性研究(无干预)。实验性研究的设计属于实验设计,而观察性研究的设计则属于调查设计。2.实验设计的三个基本要素:受试对象、处理因素、试验效应。实验中应抓住主要因素,规定明确的纳入标准和排除标准,合理选择受试对象。选用客观、准确、精确的指标来反映实验的效应。实验效应的观察应尽量采用盲法,避免偏倚。,3.试验设计的基本原则:对照、随机、重复对照和随机化是使各组均衡可比的重要手段。应根据研究目的和内容选择对照:安慰剂对照、空白对照、实验对照、自身对照以及标准对照等。没有对照的研究无法鉴别产生的效应是否真正来自处理因素。通常借助计算机进行随机化或分层随机化。各种统计分析方法均建立在随机化的基础之上。重复
33、既保证科学性和可靠性,又保证观察结果的精度。,4.常用的试验设计方案:考察单个因素的效应:完全随机设计 配对设计 交叉设计 随机区组设计 考察多个因素的效应:析因设计 研究者可根据研究目的、处理因素的多少或水平数来合理选择。,5.正确估算样本含量既可节约资源,也可防止因样本含量过少导致检验效能过低,出现“假阴性”结果。估计假设检验所需样本含量应当考虑:1)第一类错误的概率2)第二类错误的概率或检验效能13)允许误差或总体参数间的差值4)总体标准差或总体概率。样本含量的估计建议使用计算法。,6.临床试验是以人(含病人与健康人)为试验对象,对干预措施(通常为新药)的疗效和安全性进行前瞻性的追踪研新药临床试验设计必须严格遵守中华人民共和国药品管理法、新药审批办法、药品临床试验管理规范(Good Clinical Practice,GCP)以及化学药品和生物制品临床试验的生物统计学指导原则等相关规定。,新药临床试验分为四期。期临床试验应采用随机对照试验(RCT)对新药的有效性和安全性作出初步评价,推荐临床给药剂量。期临床试验则采用扩大的多中心临床试验。遵循随机对照的原则,进一步评价药物的有效性、安全性。病例报告表(CRF)是临床试验最为重要的原始记录,必须准确,真实可靠。,谢谢,
链接地址:https://www.desk33.com/p-259931.html