• / 44
  • 下载费用:10 金币  

第16章 生存分析.ppt

关 键 词:
第16章 生存分析.ppt
资源描述:
第十六章,苏州大学卫生统计学教研室,随访资料的分析,前 言,为什么要引入生存分析方法? 临床上有许多随访资料,如有两组肺癌病人,病情、性别、年龄等因素齐同,一组并病人用单纯手术治疗,另一组用手术+放疗,随访5年,怎样综合评定治疗效果?,表16-1 甲(手术组)、乙(手术+放疗)两组治疗方案肺癌病人临床随访结果,什么是生存时间资料?,所以疾病预后的好坏,出现这种结局所需要的时间。 慢性疾病 , 如恶性肿瘤、糖尿病、高血压、心血管等疾病疗效的分析,单纯的治愈率不能敏感地反映出治疗的效果。 有一类资料含有结局和时间两方面的信息,它源于寿命统计,通过随访收集,特称为生存时间资料(survival data)。 生存时间资料的分析方法简称为生存分析。,生存分析,5,某临床医生将22例肺癌患者随机分成两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,随访时间(月)如下(带“+”号的数据表示患者至少活了多少个月)。,,化疗组 1, 2, 3, 5, 6, 9+,11, 13, 16, 26, 37+,放化疗联合组 10, 11+, 14, 18, 22, 22, 26,32, 38, 40+, 42+,生存分析,6,共 同 特 点,①蕴涵有结局和时间两个方面的信息; ②结局为两分类互斥事件; ③一般是通过随访收集得到,随访观察往往是从某统一时间点(如确诊、入院或实施手术等某种处理措施后)开始,观察到某规定时间点截止; ④常因失访等原因造成某些研究对象的生存时间数据不完整,分布类型复杂。,第一节 生存分析中基本概念,2.起始事件:反映研究对象生存过程起始特征的事件如疾病“确诊”、“开始治疗”、“接触毒物”等。 3.终点事件(死亡事件、失效事件):反映研究对象生存过程特定结局的事件,如“死亡”、“痊愈”、 “出现毒性反应”。,1.生存时间(失效时间):起始事件与终点事件的时间间隔t。时间的尺度可以是分、小时、天、月、年等。,、基本概念,截尾值(censored value) (终检) 随访过程中,由于某种原因未能观察到所期望的事件发生,这些个体所提供的数据称截尾值或删失值。 删失原因:1.随访对象失访、死于其他疾病2.随访结束时对象仍存活3.治疗措施改变,4.生存资料的类型,完全数据:是指在整个随访研究期间能够观察到终点事件,即能够观察到从起点到终点的生存时间,5.1 观察对象同时进入研究,即研究起始时间相同,这类研究常见于:队列研究 、动物实验等。,5.随访研究的模式,5.2 观察对象逐个进入研究,即研究起始时间不同,多见于临床随访研究。,死亡率:,死亡概率:q=年内死亡人数/年初观察人数,生存概率:P=该年活满一年的人数/年初 观察人数=1-q,6.生存函数(survival function),生存函数又称累积生存概率,记为 S(tk), 是病人活到t时刻仍然存活的概率常用S(tk)=P(Ttk)。 实际应用中计算:tk时刻仍然存活的例数/观察总例数。其中T为病人存活的时间。但如果含有截尾数据,分母分段校正。故采用概率乘法原理计算生存率,生存概率用p表示,生存率估计的应用公式为: S(tk)=P(Ttk)=p1p2… pk S(0) = 1 S() = 0,生存曲线:各时点的累积生存概率连接在 一起的曲线图。,半数生存期 中位生存期(median survival time):即寿 命表中的中位数,表示有50%的个体存活的时间。,7.死亡函数:表示一个观察对象从开始观察到时间t为止的死亡概率,随时间上升的函数F(t,X)=P(Tt,X) ,t +时,F(t,X)=1 生存函数与死亡函数的关系:S(t,X)=1- F(t,X),,8.死亡密度函数:所有观察对象在t时刻的 瞬时死亡率,,9.风险函数:生存时间达到t的一群观察对象在 t+∆t区间内死亡的概率极限。,例16-1 现有40个肝癌病人的随访资料,见表16-2, 试估计生存函数、死亡密度函数和风险函数。,表16-2 40个肝癌病人的随访资料,二、生存分析的基本内容,2.生存过程的比较,1.生存过程的描述,3.影响因素的分析,生存分析已形成了一套较为完善的理论体系, 可概括如下:,三、生存分析的基本方法,第二节 生存率的估计,一、小样本生存率的乘积极限法(Kaplan-Meier),例16-2 在儿童急性淋巴细胞白血病(ALL)的生存研究中,有21例高危儿童ALL的临床随访资料。生存时间定义为确诊日期到病人死亡日期的时间跨度,得到的生存时间(月),见表16-3第(1)栏,其中有“+”者是截尾数据,表示病人仍生存或失访。试计算其生存率与标准误。,表16-3 高危ALL儿童生存率计算方法,生存率的标准误计算,,,,表示把小于和等于t时刻的各种非截尾值所对应的,全部加起来,(式15-6),(式15-7),,总体生存率的可信区间,,计算公式:,第五个月总体生存率的95%CI:,(1)正态分布法,(2)尾部总体率的区间估计,,G(Tt)的渐近标准误为:,生存率的对数变换公式,,G(Tt)的95%CI:,,总体生存率95%CI:,,生存曲线,,高危儿童ALL病人生存曲线,中位生存时间的计算,采用内插法:,t=15.5(月),二、大样本生存资料的寿命表估计法,在样本较大时,随访病例的生存时间常可按年、月或日进行分组,得出具有若干时间段的频数表。,例16-4 某研究收集了1980-1993年中山市肺癌新发患者2238例,经随访将有关资料整理后列于表16-5,其中生存时间是以月计算的,试计算其生存率及其标准误。,生存分析,29,表16-5 2238例肺癌病人生存率及其标准误计算,生存分析,30,图16-4 2238例肺癌病人生存率曲线,生存分析,31,第三节 生存曲线的比较,两组及多组生存曲线的比较一般用log-rank检验。log-rank 检验是以生存时间的对数为基础推导出来的,其基本思想是实际死亡数与期望死亡数之间的比较。,,,,v=组数-1,,,例 根据例16-2和例16-3的随访资料,问高危儿童和标危ALL儿童的生存率有无差别?,,注意事项,对于大样本资料生存率比较,可以将其整理成频数表形式,其基本原理与上述方法相同。用log-rank检验对样本生存率进行比较时,要求两组生存曲线不能交叉,生存曲线的交叉提示有某种混杂因子存在。此时应采用分层的方法或多因素的方法来校正混杂因素。另外,当假设检验推断有差别时,可以通过生存曲线、半数生存期及相对危险度等指标来评价其效果。,对于生存分析数据,国外学者提出针对具体问题提出了许多处理方法,包括统计描述和统计推断 在实践中,人们发现许多生存分析资料,尤其是医学随访资料有其特殊性:生存时间分布复杂;存在截尾数据;有时需要将多个因素同时考虑 1972年英国统计学家Cox提出了比例风险模型(Cox’s proportional hazard regression model),解决了上述的问题,如何进行生存时间的影响因素分析?,第四节 Cox比例风险模型,Cox模型的基本形式,生存分析的目的在于研究因素X与观察结果之间的关系;当累积生存率或称生存函数S( t, X)受到因素的影响时,传统的方法是考虑回归分析,即各因素对S( t, X)的影响 Cox模型不直接考察生存函数S( t, X)与因素之间的关系,而用风险率函数h (t, X)作为应变量,Cox模型的表达形式及含义,,中,右侧可以分为两部分:h0(t)没有明确定义,其分布与形状无明确的假定,这是非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计。由于h0(t)分布类型未知,将它移到等式左边,并取自然对数,得到:,由式中可以看到,j 表示当协变量Xj每改变一个单位时,所引起的相对危险度的自然对数值的改变。,,,t时刻个体暴露于危险因素与非(低)暴露状态下发病的风险比,,参数估计与假设检验,Cox模型中的参数是在偏似然函数(Partial likelihood function)的基础上采用最大似然法估计的,在得到参数后,还需对参数进行假设检验。,1.似然比检验,2.得分检验,3.Wald检验,生存分析,38,例16-5 为了探索影响儿童急性淋巴细胞白血病(ALL)长期生存的预后因素。采用回顾性队列研究,对1990年1月1日至1995年12月30日期间在苏州大学附属儿童医院血液科就诊, 治疗时间大于2周,年龄15周岁获得有效随访的118例ALL初诊患儿进行生存分析。通过设计调查表调查:人口学特征资料如性别、年龄、家庭年收入;临床资料包括ALL类型、初诊白细胞数等,可通过摘录病史获得;而调查对象的存活状态及死亡时间通过随访的方式获得,本研究通过信访、电话和上门采访相结合的方式,以提高应答率(92%)。表16-6显示了部分调查对象的关键变量调查信息。本研究的起始时间为ALL的确诊日期,终点日期为病人的死亡日期;如果研究对象仍存活,研究的截尾日期设定为2000年6月30日。,生存分析,39,表16-7 变量赋值表,拟合Cox模型的方法和策略,一般先做单因素Cox模型筛选因素 尽量纳入专业上比较关心的因素(虽然无显著意义) 年龄、性别等一般要作为调整因素进入模型 要避免相关性较高的因素(r0.7)一起进入模型,否则易引起多重共线性 具体SAS程序也可用:逐步回归法,Cox模型的注意事项,样本量不能太小,40以上,为协变量数目的5~20倍 尽量避免失访的发生,否则易引起结果偏性 要求病人“死亡”的风险与基础风险在各时点恒定的,即Cox模型的假设是风险率不随时间变化而变化,否则应用非比例风险模型。,生存分析,42,验证等比例风险的方法:在模型中增加协变量与时间的交互作用项,考察该项是否有统计学意义。如有,则等比例风险不成立。,当等比例风险不成立,可以引入时间变量,建立非比例风险模型,并对这种现象进行解释。,生存分析,43,时依协变量,定义:随时间而改变的协变量称时依协变量。 1.外在时依变量:变量的取值不随时间改变,效应随时间改变。 例 1945后日本妇女乳腺癌的发生率,t自1945后的随访时间,x为协变量,x=1暴露过原子弹辐射,x=0未暴露,,生存分析,44,2.内在时依变量:变量的取值随时间改变,导致效应随时间改变。如肺癌的研究中,构造X(t)表示累积吸烟量;或随访期间,病人改变了习惯,如不吸烟改为吸烟;等。 合理地构造时依变量,得到很多有用的信息。,
展开阅读全文
  微传网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:第16章 生存分析.ppt
链接地址:https://www.weizhuannet.com/p-10035942.html
微传网是一个办公文档、学习资料下载的在线文档分享平台!

网站资源均来自网络,如有侵权,请联系客服删除!

 网站客服QQ:80879498  会员QQ群:727456886

copyright@ 2018-2028 微传网络工作室版权所有

     经营许可证编号:冀ICP备18006529号-1 ,公安局备案号:13028102000124

收起
展开