|

楼主 |
发表于 2022-8-19 19:17
|
显示全部楼层
比较两条生存曲线
以上对孟德尔遗传学中的拟合优度检验之回顾将有助于我们深度理解对数秩检验何以能确定两条生存曲线差异的统计显著性。我们将通过一个来自文献[11]的实例来阐明对数秩统计量的计算过程。这是一个总共 54 位病人的急性淋巴性白血病 (acute lymphoblastic leukemia,ALL) 临床试验,目的是比较异体 (allogenic) 骨髓移植和自体 (autologous) 骨髓移植这两种疗法的差异。对 ALL 的一线治疗需要高强度的化疗和放疗,但这同时也会损伤成年患者的骨髓造血系统。很多 ALL 病人在一线治疗后还需要通过骨髓移植来修复造血功能和免疫系统。最理想的骨髓来自配型成功的病人亲属,这种异体骨髓移植的预后效果最佳。若病人没有合适的异体骨髓来源,就只能退而求其次,将病人自身的骨髓抽出体外进行药物处理,在杀灭 ALL 恶性细胞后再移植回病人体内。临床实践表明,在自体骨髓移植过程中,恶性细胞很难被消灭干净,因此其预后效果一般不如异体移植。我们对该临床试验的结果用上一节介绍的时间点排序后,整理成下面的表格:
表 4. 急性淋巴性白血病临床试验的生存数据[11, 4]
我们对这些数据进行前文已经介绍过的 Kaplan-Meier 乘积极限运算,就可画出这样两条生存曲线:
图 7. 通过对表 4 数据计算得出的 Kaplan-Meier 生存曲线。
从图 7 可以看出,接受异体骨髓移植的 ALL 病人生存状况要明显好于自体骨髓移植。但是这个试验的样本不大,随机取样引起的波动依然可以让我们对两条生存曲线差异的显著性存疑。对数秩检验可以帮助我们来定量统计显著性,它的零假设是:两条生存曲线代表的病人群体在任意时间点上的生存概率没有差别。与零假设对立的备择假设无需赘述。需要特别指出的是:与 Cox 回归模型一样,对数秩检验也依赖于比例风险假设的近似成立。
对数秩检验的统计量与前述卡方拟合优度统计量在概念上颇有相似之处,只是由于删失数据点的存在,其计算过程要相对复杂一些。与 Kaplan-Meier 曲线的计算相似,第一步也是将两组病人发生死亡事件的各时间点 t 从小到大排序,每个 ti 值代表时段的起点。我们用 A 代表自体骨髓移植,用 B 代表异体骨髓移植,并将表 4 重新整理以清晰呈现详细的计算过程:
表 5. 对表 4 生存数据进行对数秩检验的计算过程
表 5 中的变量多数都有两个下标:第一个下标代表疗法的分组,A 或者 B 。下标符号为 T 时表示同一行中 A 组和 B 组计数相加;第二个下标 i 还是时间点序号。变量 O 代表时段内发生死亡事件的人数,变量 r 代表时段起点的存活人数,变量 f 代表时段内两组累计的死亡比例。r 与 f 的乘积就是时段内的预期死亡人数,用 E 变量来表示,这和卡方拟合优度检验中的 E 变量是同一个概念。重要的是,发生删失的时间点由于对 E 变量的计算没有直接贡献而无需列入表 5 ,但是相应的删失病人数需要从下一时段的 r 值中扣除。
对于熟练的临床生统专家而言,琐碎的计算过程早就被隐藏在简单的几行代码背后而由电脑来完成。但对于生存分析的初学者而言,若能在阅读本文时拿起纸笔对表 5 中行间与列间的联系进行简单验算,将会有助于彻底掌握对数秩检验的神髓。算出各时段内 E 变量的数值后,我们将表 5 中的四列数字累加,就得到了与前文孟德尔豌豆杂交实验结果的卡方拟合优度检验非常相似的四个数值:OA,OB,EA,EB 。对数秩统计量最简明的计算方法可以采用下面的卡方公式:
该统计量在零假设前提下也近似遵循自由度为 1 的卡方分布。把相应的数值代入公式,我们得到的结果是:2.22 + 2.96 = 5.18 。运用统计学软件或者查卡方分布的累积概率表,可以算出当统计量为 5.18 时的对数秩检验概率值:p = 0.023<0.05。因此试验数据提供了足够的证据让我们拒绝零假设而采纳备择假设:异体移植组和自体移植组的两条生存曲线有统计显著性差异。有兴趣深究对数秩检验的读者,不妨先验证 OA + OB = EA + EB 。随后可以研读生存分析的常用教科书 (比如图 2 来源的那本),掌握另一种运用方差的对数秩统计量估算法。由此通过笔算或专业软件得到的卡方值为 5.48 ,通常与本文采用的算法结果相似。
仅仅确立两种疗法差异的统计显著性 (statistical significance) 还不能让临床医生们完全满意,他们还想知道这个差异的幅度有多大。如果我们对图 7 中的两条生存曲线“横切”与“纵切”,虽然能提取出反映临床显著性 (clinical significance) 的一些数值,但是它们只是生存曲线“电影”的几个“截屏”。例如本例中自体移植组的中位生存期是 17 个月,而异体移植组的中位生存期尚未达到 (not yet reached, NYR),该“截屏”说明异体骨髓移植疗法在临床上有优势,但却不能在整体上说出这个优势有多大。
其实我们在基本概念一节中定义的风险比 (HR) 才是衡量临床显著性的更重要指标,它的数值体现了两条曲线的整体差异度。虽然 Cox 回归分析是临床生统实践中更为常用的估算 HR 方法,但是对数秩方法也能用一个简单公式来近似估算HR [12],它与用 Cox 模型算出的 HR 在样本数足够大的渐近意义上等价:
将前文算出的四个数值代入该公式,我们得到的 HR 数值为 0.41 ,也就是说异体移植组病人的死亡风险比自体移植组病人下降了 59% 左右,这无疑体现了异体骨髓移植的巨大临床优势。作为比较,用 R 语言的 Cox 回归分析算出的 HR 数值是 0.39 ,与对数秩方法的估算非常接近。HR 数值代表的相对死亡风险下降程度虽然更加重要,但也不宜把它看成是衡量临床显著性的唯一指标,对生存曲线的多点横切与纵切可以起到辅助作用,从而为临床医学工作者提供一幅完整的画面。
致谢:在修订本文的 2016 年初稿过程中,北京天坛医院谷鸿秋博士、美国 Karyopharm Therapeutics 公司汤诗杰博士、美国斯坦福大学统计系田鲁教授先后提供了有益的建议,笔者在此特别感谢。
参考文献
[1] Weinberg, R.A. (2013) Chapter 15, The Biology of Cancer, 2nd ed. Garland Science, Taylor & Francis Group, LLC.
[2] Hodi, F.S. et al. (2010) New England Journal of Medicine 363: 711-723.
[3] Linoff, G.S. & Berry, M.J.A. (2011) Chapter 10, Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management, 3rd ed. Wiley Publishing, Inc.
[4] Glantz, S.A. (2012) Chapter 11, Primer of Biostatistics, 7th ed. The McGraw-Hill Companies, Inc.
[5] Marks, H.M. (2004) Clinical Trials 1: 131-138.
[6] Kaplan, E.L. & Meier, P. (1958) Journal of the American Statistical Association 53: 457-481.
[7] Peto, R. & Pike, M.C. (1973) Biometrics 29: 579-584.
[8] Baker, M. (2016) Nature 531: 151.
[9] Tamarin, R.H. (2001) Chapter 4, Principles of Genetics, 7th ed. The McGraw-Hill Companies, Inc.
[10] Dallal, G.E. (2012) The Little Handbook of Statistical Practice (http://www.jerrydallal.com/LHSP/dof.htm)
[11] Vey, D. et al. (1994) Bone Marrow Transplantation 14: 383-388.
[12] Machin, D. & Gardner, M.J. (1988) British Medical Journal 296: 1369-1371. |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|