关于算法:R语言使用限制平均生存时间RMST比较两条生存曲线分析肝硬化患者

72次阅读

共计 3710 个字符,预计需要花费 10 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=23869

1 引言

在比拟性的纵向临床钻研中,次要起点往往是产生特定临床事件的工夫,如死亡、心衰住院、肿瘤停顿等。_危险_比例估计值简直被惯例用于量化医治差别。然而,当根底模型假如(即比例危害假如)被违反时,这种基于模型的组间总结的临床意义可能相当难以解释,而且很难保障模型的建设在教训上的正确。例如,拟合度测验的非显著性后果并不一定意味着_危险_比例假如是 “ 正确的 ”。基于限制性均匀生存工夫(RMST)的组间总结指标是_危险_比例或其余基于模型的措施的有用代替办法。本文阐明了如何应用该包中的函数来比拟两组限度均匀生存工夫。

2 样本数据

在这个文章中,咱们应用了梅奥诊所进行的原发性胆汁性肝硬化(pbc)钻研中的局部数据,该钻研包含在 R 语言的生存包中。

> library(survival)
> ?pbc

生存包中的原始数据由 418 名患者的数据组成,其中包含加入了随机临床试验的患者和没有加入的患者。在上面的阐明中,咱们只应用了 312 个加入了随机试验的病例(158 个病例在 Dpenicillamine 组,154 个病例在安慰剂组)。从原始数据文件中抉择子集。

> head(D\[,1:3\])

这里,工夫是指从注销到死亡或最初已知活着的年数,状态是事件的指标(1:死亡,0:审查),臂膀是医治调配指标(1:Dpenicillamin,0:安慰剂)。上面是每个实验组的死亡工夫的卡普兰 - 梅尔(KM)预计。

3 限度均匀生存工夫(RMST)和限度均匀损失工夫(RMTL

RMST 被定义为生存函数曲线下的面积,直到一个工夫 τ(< ∞)。

其中 S(t)是所关注的工夫 - 事件变量的生存函数。对 RMST 的解释是:” 当咱们对患者进行 τ 的随访时,患者均匀会存活 μτ”,这是对删减的生存数据的相当间接和有临床意义的总结。如果没有删减的察看值,咱们能够应用均匀生存工夫

而不是 μτ。对 μτ 的一个天然预计是

其中 Sˆ(t)是 S(t)的 KM 预计。ˆµτ 的标准误差也是用分析法计算的;具体的公式在 [3] 中给出。请留神,即便在重度删减的状况下,μτ 也是能够预计的。另一方面,只管中位生存工夫 S -1(0.5)也是生存工夫散布的一个持重总结,但因为重大删减或常见事件,当 KM 曲线没有达到 0.5 时,它变得不可预计。

RMTL 被定义为截止到某一时间 τ 的生存函数曲线 “ 上方 “ 的面积。

在下图中,粉红色和橙色的区域别离是 D - 青霉胺组的 RMST 和 RMTL 估计值,当 τ 为 10 年时。结果显示,在 10 年的随访中,D- 青霉胺组的均匀生存工夫为 7.28 年。换句话说,在 10 年的随访中,承受 D - 青霉胺医治的患者均匀缩小 2.72 年。

3.1 未经调整的剖析及其施行

让 μτ(1)和 μτ(0)别离示意医治组 1 和 0 的 RMST。当初,咱们用 RMST 或 RMTL 来比拟这两条生存曲线。具体来说,咱们思考用以下三种措施来进行组间比照。

1. RMST 的差别

2. RMST 的比值

3. RMTL 的比率

这些预计是通过简略地用它们的教训对应(即别离为 µτ(1)和 µτ(0))来取代 µτ(1)和 µτ(0))。对于比率度量的推断,咱们应用 delta 办法来计算标准误差。具体来说,咱们思考 log{µˆτ(1)}和 log{µˆτ(0)},并计算 log-RMST 的标准误差。而后,咱们计算 RMST 的对数比率的置信区间,并将其转换回原始比率尺度。上面展现了如何实现这些剖析。
 

> time=D$time
> status=D$status
> arm=D$arm

第一个参数(time)是工夫到事件的向量变量。第二个参数(status)也是一个向量变量,其长度与工夫雷同,每个元素取 1(如果有事件)或 0(如果没有事件)。第三个参数(arm)是一个向量变量,示意每个受试者的指定试验;这个向量的元素取 1(如果踊跃实验组)或 0(如果控制组)。第四个参数(tau)是一个标量值,用于指定 RMST 计算中的截断工夫点 τ。请留神,τ 须要小于两组中每组的最大察看工夫的最小值(咱们称其为最大 τ)。

只管程序代码容许用户抉择一个比默认 τ 大的 τ(如果它小于最大的 τ),但咱们总是确认,在每组指定的 τ 下,危险集的规模足够大,来确保 KM 预计的稳定性。上面是指定 τ =10(年)时的 pbc 例子的输入。rmst2 函数返回每组的 RMST 和 RMTL 以及上述组间比照测量的后果。

> print(obj)

在本例中,RMST 的差别(输入中 “ 组间比照 “ 局部的第一行)为 -0.137 年。该点估计表明,在对病人进行 10 年的跟踪调查时,承受踊跃医治的病人比安慰剂组的病人均匀生存工夫短 0.137 年。尽管没有察看到统计学意义(P=0.738),但 0.95 置信区间(-0.665 至 0.939)在 0 左近绝对严密,表明 RMST 的差别最多为 +/- 1 年。能够生成一个图。下图是在运行上述未经调整的剖析后生成的。

> plot(obj)

3.2 调整后的剖析和利用

在大多数随机临床试验中,调整后的剖析通常包含在打算剖析中的一项。起因之一是对重要的预后因素进行调整能够进步检测组间差别的能力。另一个起因是咱们有时会察看到一些基准预后因素的散布不均衡,即便随机化保障了两组的均匀可比性。本文实现了 Tian 等人 [4] 提出的 ANCOVA 类型的调整剖析,此外还有上一节中提出的未经调整的剖析。设 Y 为限制性均匀生存工夫,设 Z 为医治指标。同时,让 X 示意一个 q 维的基准协变量向量。田氏办法思考以下回归模型

其中 g(-)是一个给定的平滑且严格减少的链接函数,(α, β, γ0)是一个 (q + 2) 维的未知参数向量。在 Tian 等人 [4] 之前,Andersen 等人 [5] 也钻研了这个回归模型,并提出了一个未知模型参数的推断程序,应用伪值技术来解决删减的观测值。与 Andersen 的办法 [5, 6, 7] 相比,Tian 的办法 [4] 利用反概率删减加权技术来解决删减的观测值。如下图所示,对于实现 Tian 的 RMST 的调整剖析,惟一的区别是用户是否向函数传递协变量数据。上面是一个执行调整后剖析的示例代码。

 covariates=x

其中 covariates 是基准特色数据的向量 / 矩阵的参数,x。为了阐明问题,让咱们试试以下三个基准变量,在 pbc 数据中,作为调整的协变量。

> x=D\[,c(4,6,7)\]
> head(x)

rmst2 函数将数据拟合到三个对比度量(即 RMST 的差别、RMST 的比率和 RMTL 的比率)中的每个模型。对于差别度量,上述模型中的链接函数 g(-)是链接。对于比率指标,采纳的是对数链接。具体来说,通过这个 pbc 例子,咱们当初试图将数据拟合到以下回归模型中。

1. RMST 的差别

2. RMST 的比值

3. RMTL 的比率

上面是 rmst2 对调整后的剖析所返回的输入。

输入的第一块是调整后的试验成果的总结。随后,对三个模型中的每一个都进行了总结。

4 论断

危险比的问题在其余中央曾经探讨过了,也提出了许多代替办法,但危险比的办法依然被惯例应用。受限的均匀生存工夫是一个持重的、临床上可解释的生存工夫散布的总结办法。与中位生存工夫不同,即便在重大的删减状况下,它也是能够预计的。对于限制性均匀生存工夫,有相当多的方法学钻研能够代替危险比办法。然而,这些办法在实践中仿佛很少被应用。不足用户敌对的、有明确例子的程序将是一个新的代替办法在实践中应用的次要阻碍。咱们心愿这个文章有助于临床钻研人员尝试超过舒服区 – 危险比。

参考文献

[1] Hernan, M. A. ´ (2010). The hazards of hazard ratios. Epidemiology (Cambridge, Mass) 21, 13–15.

[2] Uno, H., Claggett, B., Tian, L., Inoue, E., Gallo, P., Miyata, T., Schrag, D., Takeuchi, M., Uyama, Y., Zhao, L., Skali, H., Solomon, S., Jacobus, S., Hughes, M., Packer, M. & Wei, L.-J. (2014). Moving beyond the hazard ratio in quantifying the between-group difference in survival analysis. Journal of clinical oncology : official journal of the American Society of Clinical Oncology 32, 2380–2385.

[3] Miller, R. G. (1981). Survival Analysis. Wiley.


最受欢迎的见解

1.R 语言绘制生存曲线预计 | 生存剖析 | 如何 R 作生存曲线图

2.R 语言生存剖析可视化剖析

3.R 语言如何在生存剖析与 Cox 回归中计算 IDI,NRI 指标

4.r 语言中应用 Bioconductor 剖析芯片数据

5.R 语言生存剖析数据分析可视化案例

6.r 语言 ggplot2 误差棒图疾速指南

7.R 语言绘制性能富集泡泡图

8.R 语言如何找到患者数据中具备差别的指标?(PLS—DA 剖析)

9.R 语言中的生存剖析 Survival analysis 早期肺癌患者 4 例

正文完
 0