原文链接:http://tecdat.cn/?p=23869
1 引言
在比拟性的纵向临床钻研中,次要起点往往是产生特定临床事件的工夫,如死亡、心衰住院、肿瘤停顿等。_危险_比例估计值简直被惯例用于量化医治差别。然而,当根底模型假如(即比例危害假如)被违反时,这种基于模型的组间总结的临床意义可能相当难以解释,而且很难保障模型的建设在教训上的正确。例如,拟合度测验的非显著性后果并不一定意味着_危险_比例假如是 "正确的"。基于限制性均匀生存工夫(RMST)的组间总结指标是_危险_比例或其余基于模型的措施的有用代替办法。本文阐明了如何应用该包中的函数来比拟两组限度均匀生存工夫。
2 样本数据
在这个文章中,咱们应用了梅奥诊所进行的原发性胆汁性肝硬化(pbc)钻研中的局部数据,该钻研包含在R语言的生存包中。
> library(survival)> ?pbc
生存包中的原始数据由418名患者的数据组成,其中包含加入了随机临床试验的患者和没有加入的患者。在上面的阐明中,咱们只应用了312个加入了随机试验的病例(158个病例在Dpenicillamine组,154个病例在安慰剂组)。从原始数据文件中抉择子集。
> head(D\[,1:3\])
这里,工夫是指从注销到死亡或最初已知活着的年数,状态是事件的指标(1:死亡,0:审查),臂膀是医治调配指标(1:Dpenicillamin,0:安慰剂)。上面是每个实验组的死亡工夫的卡普兰-梅尔(KM)预计。
3 限度均匀生存工夫(RMST)和限度均匀损失工夫(RMTL
RMST被定义为生存函数曲线下的面积,直到一个工夫(< ∞)。
其中S(t)是所关注的工夫-事件变量的生存函数。对RMST的解释是:"当咱们对患者进行的随访时,患者均匀会存活",这是对删减的生存数据的相当间接和有临床意义的总结。如果没有删减的察看值,咱们能够应用均匀生存工夫
而不是。对的一个天然预计是
其中S(t)是S(t)的KM预计。µ的标准误差也是用分析法计算的;具体的公式在[3]中给出。请留神,即便在重度删减的状况下,也是能够预计的。另一方面,只管中位生存工夫S-1(0.5)也是生存工夫散布的一个持重总结,但因为重大删减或常见事件,当KM曲线没有达到0.5时,它变得不可预计。
RMTL被定义为截止到某一时间的生存函数曲线 "上方 "的面积。
在下图中,粉红色和橙色的区域别离是D-青霉胺组的RMST和RMTL估计值,当为10年时。结果显示,在10年的随访中,D-青霉胺组的均匀生存工夫为7.28年。换句话说,在10年的随访中,承受D-青霉胺医治的患者均匀缩小2.72年。
3.1 未经调整的剖析及其施行
让(1)和(0)别离示意医治组1和0的RMST。当初,咱们用RMST或RMTL来比拟这两条生存曲线。具体来说,咱们思考用以下三种措施来进行组间比照。
1. RMST的差别
2. RMST的比值
3. RMTL的比率
这些预计是通过简略地用它们的教训对应(即别离为µ(1)和µ(0))来取代µ(1)和µ(0))。对于比率度量的推断,咱们应用delta办法来计算标准误差。具体来说,咱们思考log{µ(1)}和log{µ(0)},并计算log-RMST的标准误差。而后,咱们计算RMST的对数比率的置信区间,并将其转换回原始比率尺度。上面展现了如何实现这些剖析。
> time=D$time> status=D$status> arm=D$arm
第一个参数(time)是工夫到事件的向量变量。第二个参数(status)也是一个向量变量,其长度与工夫雷同,每个元素取1(如果有事件)或0(如果没有事件)。第三个参数(arm)是一个向量变量,示意每个受试者的指定试验;这个向量的元素取1(如果踊跃实验组)或0(如果控制组)。第四个参数(tau)是一个标量值,用于指定RMST计算中的截断工夫点。请留神,须要小于两组中每组的最大察看工夫的最小值(咱们称其为最大)。
只管程序代码容许用户抉择一个比默认大的(如果它小于最大的),但咱们总是确认,在每组指定的下,危险集的规模足够大,来确保KM预计的稳定性。上面是指定=10(年)时的pbc例子的输入。rmst2函数返回每组的RMST和RMTL以及上述组间比照测量的后果。
> print(obj)
在本例中,RMST的差别(输入中 "组间比照 "局部的第一行)为-0.137年。该点估计表明,在对病人进行10年的跟踪调查时,承受踊跃医治的病人比安慰剂组的病人均匀生存工夫短0.137年。尽管没有察看到统计学意义(P=0.738),但0.95置信区间(-0.665至0.939)在0左近绝对严密,表明RMST的差别最多为+/-1年。能够生成一个图。下图是在运行上述未经调整的剖析后生成的。
> plot(obj)
3.2 调整后的剖析和利用
在大多数随机临床试验中,调整后的剖析通常包含在打算剖析中的一项。起因之一是对重要的预后因素进行调整能够进步检测组间差别的能力。另一个起因是咱们有时会察看到一些基准预后因素的散布不均衡,即便随机化保障了两组的均匀可比性。本文实现了Tian等人[4]提出的ANCOVA类型的调整剖析,此外还有上一节中提出的未经调整的剖析。设Y为限制性均匀生存工夫,设Z为医治指标。同时,让X示意一个q维的基准协变量向量。田氏办法思考以下回归模型
其中g(-)是一个给定的平滑且严格减少的链接函数,(, , 0 )是一个(q + 2)维的未知参数向量。在Tian等人[4]之前,Andersen等人[5]也钻研了这个回归模型,并提出了一个未知模型参数的推断程序,应用伪值技术来解决删减的观测值。与Andersen的办法[5, 6, 7]相比,Tian的办法[4]利用反概率删减加权技术来解决删减的观测值。如下图所示,对于实现Tian的RMST的调整剖析,惟一的区别是用户是否向函数传递协变量数据。上面是一个执行调整后剖析的示例代码。
covariates=x
其中covariates是基准特色数据的向量/矩阵的参数,x。为了阐明问题,让咱们试试以下三个基准变量,在pbc数据中,作为调整的协变量。
> x=D\[,c(4,6,7)\]> head(x)
rmst2函数将数据拟合到三个对比度量(即RMST的差别、RMST的比率和RMTL的比率)中的每个模型。对于差别度量,上述模型中的链接函数g(-)是链接。对于比率指标,采纳的是对数链接。具体来说,通过这个pbc例子,咱们当初试图将数据拟合到以下回归模型中。
1. RMST的差别
2. RMST的比值
3. RMTL的比率
上面是rmst2对调整后的剖析所返回的输入。
输入的第一块是调整后的试验成果的总结。随后,对三个模型中的每一个都进行了总结。
4 论断
危险比的问题在其余中央曾经探讨过了,也提出了许多代替办法,但危险比的办法依然被惯例应用。受限的均匀生存工夫是一个持重的、临床上可解释的生存工夫散布的总结办法。与中位生存工夫不同,即便在重大的删减状况下,它也是能够预计的。对于限制性均匀生存工夫,有相当多的方法学钻研能够代替危险比办法。然而,这些办法在实践中仿佛很少被应用。不足用户敌对的、有明确例子的程序将是一个新的代替办法在实践中应用的次要阻碍。咱们心愿这个文章有助于临床钻研人员尝试超过舒服区--危险比。
参考文献
[1] Hernan, M. A. ´ (2010). The hazards of hazard ratios. Epidemiology (Cambridge, Mass) 21, 13–15.
[2] Uno, H., Claggett, B., Tian, L., Inoue, E., Gallo, P., Miyata, T., Schrag, D., Takeuchi, M., Uyama, Y., Zhao, L., Skali, H., Solomon, S., Jacobus, S., Hughes, M., Packer, M. & Wei, L.-J. (2014). Moving beyond the hazard ratio in quantifying the between-group difference in survival analysis. Journal of clinical oncology : official journal of the American Society of Clinical Oncology 32, 2380–2385.
[3] Miller, R. G. (1981). Survival Analysis. Wiley.
最受欢迎的见解
1.R语言绘制生存曲线预计|生存剖析|如何R作生存曲线图
2.R语言生存剖析可视化剖析
3.R语言如何在生存剖析与Cox回归中计算IDI,NRI指标
4.r语言中应用Bioconductor 剖析芯片数据
5.R语言生存剖析数据分析可视化案例
6.r语言ggplot2误差棒图疾速指南
7.R 语言绘制性能富集泡泡图
8.R语言如何找到患者数据中具备差别的指标?(PLS—DA剖析)
9.R语言中的生存剖析Survival analysis早期肺癌患者4例