生存分析统计学.ppt
《生存分析统计学.ppt》由会员分享,可在线阅读,更多相关《生存分析统计学.ppt(78页珍藏版)》请在课桌文档上搜索。
1、复 习,Logistic回归模型是一种概率模型,适合于病例对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类的。可用影响结果变量发生的因素为自变量与因变量建立回归方程。,复 习,1.Logistic回归分析的数据结构2.Logistic回归分析的模型3.筛选变量的常用方法4.Logistic回归分析的结果解释,目的:作出以多个自变量(影响因素)估计应变量(结果变量)的logistic回归方程资料:1.应变量为反映某现象发生与不发生的二值变量;2.自变量(影响因素)可能是二值数据或等级资料或计量资料。分类变量要数量化用途:研究某种疾病或现象发生和多个危险因素(或保护因子)
2、的数量关系,1.Logistic回归模型的数据结构,设资料中有一个因变量Y、p个自变量X1,X2,Xp,对每个实验对象共有n次观测结果,可将原始资料列成表1形式。,表1.Logistic回归模型的数据结构实验对象 Y X1 X2 X3.XP 1 Y1 a11 a12 a13 a1p 2 Y2 a21 a22 a23 a2p 3 Y3 a31 a32 a33 a3p n Yn an1 an2 an3 anp,其中:Y取值是二值或多项分类,5,表2.肺癌与危险因素的调查分析例号 是否患病 性别 吸烟 年龄 地区 1 0 1 0 30 0 2 0 0 1 46 1 3 1 0 0 35 1 30 1
3、 0 0 26 1 是否患病:1代表否,0代表是 性 别:1代表男,0代表女 吸 烟:1代表吸烟,0代表不吸烟 地 区:1代表农村,0代表城市,表3.配对资料(1:1)对子号 病例 对照 X1 X2 X3 X1 X2 X3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3 精 神 状 况,取值:0,1,2,2、Logistic回归模型,令:Y=1 发病(阳性、死亡、治愈等)Y=0 未发病(阴性、生存、未治愈等)将发病(Y=1)的概率记为P,它与
4、自变量x1,x2,xp之间的Logistic回归模型为:,定义:为Logistic变换,即:,2.Logistic回归的模型,3.筛选变量的常用方法,向前法(forward selection)后退法(backward selection)逐步回归法(stepwise selection),4.Logistic回归的结果解释,4.Logistic回归的结果解释,设第i个因素的回归系数为bi,表示当有多个自变量存在时,其它自变量固定不变的情况下,自变量Xi每增加一个单位时,所得到的优势比的自然对数。也就是其它自变量固定不变的情况下,自变量Xi每增加一个单位时,影响因变量Y=0发生的倍数 设第i个
5、因素的回归系数为bi当bi0时,对应的优势比ORi=exp(bi)1,说明该因素是危险因素;当bi0时,对应的优势比ORi=exp(bi)1,说明该因素是保护因素,生存分析,医学科研中的统计学方法,对于急性病的疗效评价,一般可以用治愈率、病死率等指标但对于肿瘤、结核及其他慢性疾病,其预后不是短期内所能明确判断的,因此上述指标不太适用。,临床试验研究通常观察各个对象在各个时点上事件的发生情况(结局),以评价临床疗效。在比较不同疗法的疗效时,不仅要考虑是否有效,还要考虑从试验开始到产生疗效的时间。,例:假定用甲、乙两种药物治疗某病,其治愈率均为80,能否说两种疗效一致?还应考虑时间效应问题,如果甲
6、药平均3天治愈80,而乙药平均7天治愈80,则可以认为甲药比乙药的疗效好。,评价两种治疗方法的好坏,不能简单地比较治愈率和有效率,还要看出现结局的时间长短,因此,不能用t检验和卡方检验等不包含时间因素的方法,需要学习新的方法。可以对疾病进行长期随访,统计一定年限后的生存和死亡情况以判断疗效。这就需要用生存分析(survival analysis)。,18,主要内容,基本概念生存率估计与生存曲线生存曲线的log-rank检验,生存时间:是任何两个有联系事件之间的时间间隔,终点(失效)事件与起始事件之间的时间间隔,常用符号t表示。广义的生存时间定义为从某种起始事件到终点事件所经历的时间跨度。狭义的
7、生存时间常指患某种疾病的病人从发病到死亡所经历的时间跨度;,一、基本概念,21,一、基本概念,生存时间(survival time):疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短,所经历的时间称为生存时间,一、基本概念,起始事件 是反映生存时间起始特征的事件,如疾病确诊、某种疾病治疗开始、接触毒物等,研究设计时需要明确规定。终点事件 指反映结局特征的事件,又称为死亡事件、失效事件。如肾移植病人因肾功能丧失引起的死亡,急性白血病患者的复发,癌症患者的死亡等。研究设计时也需事先明确规定。,生存时间举例,起始事件 终点事件 治疗开始(服药)痊愈 疾病确诊 死亡 手
8、术切除 死亡 接触毒物 出现反应 化疗 缓解 缓解 复发,生存分析(survival analysis)是将事件的结局(终点事件)和出现这一结局所经历的时间结合起来分析的一种统计分析方法。能分析完全数据的资料,同时也可以分析包含不完全数据的资料生存分析与其它多因素分析的主要区别就是生存分析考虑了每个观测出现某一结局的时间长短。,一、基本概念,25,生存分析(survival analysis):不完全数据提供了部分信息。必须用专门的方法进行统计处理,这类统计方法起源于对寿命资料的统计分析,故称为生存分析。,26,生存分析(survival analysis):研究生存时间的分布规律以及生存时间
9、和相关因素之间关系的一种统计分析方法。主要用于反映慢性病的指标能较好地处理不够完整的随访资料,27,一、基本概念,临床试验及其随访资料的特点一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的,称为完全数据(complete data);另一部分病人由于失访、意外事故、或到观察结束时仍存活等原因,无法知道确切的生存时间,它提供了不完全的信息,称为不完全数据(截尾数据、删失数据 censored data)。,生存时间的类型,完全数据(complete data):从起点至死亡(死于所研究疾病)所经历的时间。截尾数据(删失数据,censored data):从起点至截尾点所经
10、历的时间。截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。,资料收集,生存时间一般是通过随访收集。随访内容 确定开始随访的时间(观察起点)如入院时间、确诊时间、开始治疗时间等。例如:乳腺癌:乳腺切除的第一天,或出院日 白血病:出院日,或开始治疗的日期。确诊时间、手术时间、开始治疗时间、出院时间等相对较确切,常作为随访开始时间。,随访的结局可能有以下几种:死亡,即处理失效,终止时间即为“死亡”时间 生存但中途失访,包括拒绝访问、失去联系或中途退出试验,其终止时间以最后一次访问时间为准 死于其他与研究疾病无关的原因,如肺癌患者死于心肌梗死、自杀或车祸等,其终止随访的时间为死亡时间 随访截止,
11、随访研究结束时观察对象仍存活,终止随访时间为研究结束时间,影响生存时间的有关因素(协变量),如患者的年龄、病程、术前健康状况、经济、文化、职业等以便分析这些因素对生存时间的影响,随访方式,全体观察对象同时接受处理措施,观察到最后一例出现结果,或者事先规定的随访截止时间,图中“”表示“死亡”,“o”表示失访、退出研究或死于与本研究无关的其它原因,随访方式,全体观察对象在不同时间接受治疗处理,完成一定数量随访病例后决定随访截止时间,或按事先规定的时间停止随访这是临床试验最常见的形式,图中“”表示“死亡”,“o”表示失访、退出研究或死于与本研究无关的其它原因,ta+tb+tc+td,35,截尾数据的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 统计学

链接地址:https://www.desk33.com/p-259040.html