李文乐 胡朝晖 王永辉 高森 陈史胜 张文婷
随着对循证医学和精确医学的重视,数据的价值越来越受到重视。如今大数据的获取与信息的传递较以往有迅速的发展,个性化的医疗也成为可能[1]。临床预测模型 (clinical prediction models,CPMs) 作为一种评估风险和获益的工具,可以为临床医生和患者以及从事公共卫生事业的行政管理人员带来更加直观和理性的信息,其在骨肿瘤的预防和治疗及相关研究上有着非常大的潜力[2]。利用 CPMs 指导临床医生做出治疗决定,对患者的预后有利,因为 CPMs 可以将多变量信息合成为一个统一的分 析[3-4]。然而,先前的一项研究表明,虽然 CPMs 有很好的预测结果的能力,但是临床医生使用 CPMs 作为决策工具的频率仍然很低[5]。在骨科肿瘤疾病的临床工作中,医生或者患者在进行医疗决策时,普遍是根据相关经验或者上级医生指示,如果有客观的、科学的参考,会给骨科医生在制订医疗方案给予帮助和给患者带来更大的疗效上的 收益。
CPMs 是指用数学公式估计某一特定个体将来患某种疾病或某种结果的概率[2,6-8]。CPMs 可应用于多种的临床场景:筛查高风险个体的无症状疾病,预测未来事件,如疾病或死亡,协助医疗决策和健康教育。CPMs 本质上是预测因子的数学公式的组合,为了便于临床应用,研究者往往给不同等级的预测因子给出不同的数值,最终总分对应一定的发生概率,得分即概率表,使用者可以根据得分高低划分高危人群,进行临床干预。常见的预测因素包括社会人口学特征 (如年龄、性别、种族)、现病史、既往史、个人史、用药史、体检结果、影像学、电生理学、血样尿检、病理学检查、疾病阶段和特征、组织学[8]等。CPMs 并非适用于所有临床问题的研究,回答疾病的诊断或预后相关问题是其最合适的,特别是基于预测因子的组合如何准确的估计患病或事件发生的概率[9]。CPMs 包括诊断模型和预后模型[6]。列线图 (Nomogram) 是一种常见的表示形式。诊断模型主要研究基于当前症状、体征、病史和辅助检查的临床特点的疾病诊断概率。预后模型关注的是在当前健康状况 (健康或疾病) 下,一定时期内一定的患病率、复发率、病死率、残疾和并发症的发生概率,这在队列研究中经常看到,已在多种肿瘤疾病中构建并证明是有效的[10]。在 CPMs 中,最常见的结果是疾病、疾病复发、病死、残疾和并发症。
相对于其它科室的疾病,肿瘤疾病的诊断相对明确,拥有较多“金标准”,例如病理学的相关证据,因此预后模型的使用在骨科占据主流。在骨肿瘤的临床治疗中,以骨科肿瘤的预后相关研究、开发与验证为主。
1. 骨肉瘤:在骨科相关肿瘤、转移瘤中 CPMs 也有相关研究。骨肉瘤是儿童青少年最常见的原发性骨恶性肿瘤,发病率为 4~5 / 百万人[11-12]。骨肉瘤以恶性程度高、生长迅速、早起诊断困难、预后不佳为主要特点,病死率和致残率居高不下,给患者和患者家庭及社会带来了巨大负担[13-14]。尽早识别出高风险的潜在骨肉瘤患者,有助于提高患者的预后。黄纲等[15]构建了骨肉瘤预后个体化预测模型 Nomogram (图 1),该模型通过收集 10 年的骨肉瘤患者的相关数据,分析出了包含了 5 个独立预后因子构建的预测模型,对比于传统的 Enneking 分期和 AJCC 分期系统更直观、准确,实现个体化的骨肉瘤患者预测。基于多因素的个体化的预测图出现,除了提高预测精确度,每位患者可以计算出各自生存率,为院外防治以及随访监控提供重要信息。
图1 黄纲等建立的基于肿瘤分期、大小、治疗等因素预测骨肉瘤患者总体生存率的 Nomogram。在使用时,将患者各变量在相应的轴上找到对应的点的分数,将各变量的分数求和,求和的结果在生存率轴上得分,便是相应时间的生存可能性Fig.1 Nomogram established by Huang, etc. to predict overall survival of patients with osteosarcoma based on tumor stage, size, treatment, and other factors. To sum the score of each variable on the corresponding axis to show the survival possibility of the corresponding time
随着人们对骨肉瘤发病机制的认识越来越清楚,一些 miRNA 可以作为预后因素考虑[16-19]。有学者建立了基于 miR-203 和临床病理特征预测的非转移性骨肉瘤患者新辅助化疗和手术后生存率的 Nomogram,其对于非转移性骨肉瘤患者的预后有更准确的预测[20]。虽然多学科联合治疗的方法显著提高了骨肉瘤的存活率,但肿瘤转移的存在使骨肉瘤成为一种具有挑战性的疾病,有相关研究发现伴有转移的骨肉瘤存活率约为 20%[21]。因此,能尽早筛选出高风险的骨肉瘤转移的患者有重大的临床价值。有学者开发了术后预测 Enneking ⅡB 期四肢骨肉瘤转移概率的 Nomogram,其具有高性能和通用性的术后 Nomogram 预测 Enneking ⅡB 期四肢骨肉瘤的转移概率[22]。该 Nomogram 的开发将有助于骨肉瘤转移风险的个体化评估。自从引入联合全身化疗以来,骨肉瘤患者的长期存活率显著提高。不幸的是,尽管在过去的几十年里进行了大量的临床试验,但患者的存活率并没有显著提高。骨肉瘤具有明显的异质性临床行为。高达 15% 的患者仅通过手术就可以治愈[23]。Kim 等[24]开发了预测 AJCC Ⅱ 期肢体骨肉瘤新辅助化疗和确定性手术后 5 年转移概率预后的 Nomogram,该图可以进行个性化的风险评估,并可以作为风险适应治疗的基础。
有报告指出,骨肉瘤的患者近 90% 的病例在诊断为时被归类为高级别骨肉瘤[25]。患者的 5 年整体生存率 45%~75%。虽然有众多治疗手段,包括诸如手术治疗和辅助化疗,有利于可能表现出较差生存期的患者,但并不是所有的骨肉瘤患者都能从这些治疗中获益[26-27]。目前研究发现,一些临床因素,如年龄、肿瘤体积、分期、组织学亚型和病理骨折都与治疗结果相关[28-29]。Wu 等[30]从预处理诊断的计算机断层摄影图像中提取放射学特征,利用每例患者的放射组学特征计算放射组学评分以反映生存概率,结合放射组学评分和临床因素,建立预测骨肉瘤患者 5 年预期生存率的 Nomogram。该 Nomgram 结合放射组学特征和临床因素,较以往的预测模型提高了预测精度,成为一个独立组成部分。基于放射学的骨肉瘤早期生存预测 Nomogram,可以让医生为患者提供更合适的治疗策略,可以安排合理的随访时间间隔,从而避免不必要的医疗资源和费用。
2. 软骨肉瘤:软骨肉瘤约占骨肉瘤的 20%,是一种常见的原发性恶性骨肿瘤,复发率较高[31-32]。然而,目前尚缺乏一种有效的方法评估盆腔 CS 术后是否会复发,从而影响临床治疗方案的制订[33]。Yin 等[34]建立并验证基于三维多参数 MRI 成像特征和临床特征的临床放射学 Nomogram (图 2),估计盆腔 CS 的早期复发可能性。基于多序列联合特征的放射组学模型是骨盆 CS 患者术前评估早期复发的有力工具,特别是在缺乏手术相关临床资料的情况下。该研究有助于临床医师在术前对患者进行更好的分层,在临床实践中进行准确的个性化治疗。对于这些复发风险较高的患者,可以开发更积极的治疗方案,如一些放疗和化疗。
图2 基于 3D 多参数 MRI 特征和临床特征的预测骨盆软骨肉瘤早期复发的 Nomogram。基于组合特征 + 临床数据 (a) 和弥散加权成像 + 临床数据 (d) 的 Nomogram。该 Nomogram 的使用方式与图 1 相同。该模型同时将数据分为训练组与验证组,使用校准图进行内部和外部检验更进一步增加了 Nomogram 的可靠性。校准曲线显示在训练集 (b,e) 和验证集 (c,f) 中。两者越靠近虚线,预测效果越好Fig.2 Nomogram to predict early recurrence of pelvic chondrosarcoma based on 3D multi-parameter MRI and clinical features. Nomogram was based on combined features and clinical data (a) diffuse-weighted imaging and clinical data (d). The Nomogram was used in the same way as that in Figure 1. The model divided the data into training and validation groups; calibration diagrams for internal and external validation were used to further increase the reliability. The calibration curve was shown in the training set (b, e) and the validation set (c, f). The closer they are to the dotted line, the better the prediction
3. 尤文氏肉瘤:尤文氏肉瘤是一种小圆形细胞高度恶性肉瘤。是儿童和青少年中第二常见的原发性恶性骨肉瘤。既往研究表明,年龄、肿瘤部位、肿瘤大小、手术方式、放疗、化疗等临床相关预后因素和临床特征已证明为尤文氏肉瘤患者的独立预后因素[35-37]。然而,影响 ES 生存率的因素很多,没有单一因素能够准确预测尤文氏肉瘤患者的生存率。因此,建立预后预测模型,可以综合所有重要的预后因素,准确预测尤文氏肉瘤患者的生存期。Zhou 等[38]通过 Cox 多因素分析,开发了包括年龄、种族、分期、肿瘤部位、肿瘤大小及化疗等相关预测因子的生存预测模型 (图 3、4)。该 Nomogram 的研究人员通过 X-tile 软件,确定连续变量年龄和肿瘤大小的最佳临界值,增加了 Nomogram 的预测能力。该 Nomogram 是区分和预测尤文氏肉瘤患者生存期的可靠工具,可以帮助患者更好地选择医学检查,帮助肿瘤内科医生和外科医生优化治疗方案,促进个体化的医疗方案进步。
图3 通过 X-tile 软件,确定连续变量年龄和肿瘤大小的最佳临界值,增加了 Nomogram 的预测能力。(a,d) 黑点表示已确定年龄和肿瘤大小的最佳临界值。(b,e) 直方图和 (c,f) Kaplan-Meier 是基于确定的临界值构建的Fig.3 X-tile software to determine the optimal threshold of continuous variable age and tumor size, which increased the predictive power of Nomogram (Qiang Zhou, etc.). (a, d) The black dots represented the optimal threshold for determined age and tumor size. (b, e) Histograms and (c, f) Kaplan-Meier were constructed based on determined thresholds
4. 骨转移:骨转移是恶性肿瘤常见的并发症,常见于乳腺癌、前列腺癌、肺癌、直肠癌、肾癌和甲状腺 癌[39-41]。骨转移引起的与骨相关的症状和表现,如疼痛、恶性高钙血症、病理性骨折、脊髓压迫等,严重损害了患者的生活质量[42-43]。骨转移明显影响癌症患者的生活质量,对骨转移患者的全程管理在当前的临床实践中具有重要的意义[44-45]。如何预测骨转移瘤的风险,筛选高危人群,提高患者预后成为关注焦点。有学者通过筛选相关因素,开发了基于肿瘤部位、组织学、分级、T 分期、N 分期、癌胚抗原 (CEA) 等的骨转移风险预测模型和基于组织学、肿瘤分级、T 分期、N 分期、CEA、化疗、手术、肝和肺转移的骨转移生存的预后模型[42],这两个模型将帮助临床医生确定 BM 患者的治疗决策和指导合理使用医疗资源。
综上所述,近年来预测模型的研究在帮助骨科医生与患者选择治疗方式起到积极的作用,并能有效地减轻医疗花费。笔者在临床中也遇见许多相关问题,在与患者沟通时,因患者的学历背景等诸多因素,患者往往无法理解的治疗方案选择原因,Nomogram 的可视化图在此有重大的临床价值。
图4 预测尤文氏肉瘤患者的 3 年和 5 年总生存期 (a) 和癌症特异性 (b) 生存期Fig.4 To predicts 3-year and 5-year overall survival (a) and cancer-specific survival (b) in patients with Ewing’s sarcoma
临床模型应该准确地预测具体的事件,并且相对简单和易于使用。如果预测模型对未来事件的发生提供了不准确的估计,就会误导医护人员对患者治疗选择困难和医疗资源的管理不足。另一方面,如果一个模型具有很高的可预测性,但难以应用 (例如,计算复杂或不熟悉的问题、项目或单位)、耗时、昂贵或相关性较低 (例如,上述部分模型基于美国的数据库简历),它将不会被普遍使用。因此,在可预测性和简单性之间取得平衡是一个好的 CPMs 的关键。
CPMs 需要不断更新与验证的,但很少有预测性能进行外部验证。由于模型开发是复杂的,咨询统计学专家可以提高精确预测模型研究的有效性和质量。在开发模型之后,在将模型应用于实际的之前,应该使用多个外部数据集进行有力的验证,并向相关方进行有效的传播[46]。
目前,上述骨肿瘤 CPMs 的研究有一定的局限性, (1) 数据来源均为单中心,并没有多中心的研究报告,在临床应用前应该进行多来源的数据外部验证;(2) 其数据多数来源于 SEER (the surveillance,epidemiology,and end results) 数据库[47]。该数据库由美国国家癌症研究所支持,17 个基于人群的癌症登记收集发病率和存活率数据,约占美国人口的 26%,但是该数据库并未收集较多关于癌症的详细治疗方式及复发情况,并且人种构成与中国差异非常大,在国内无法直接使用。开发多中心外部验证并且及时更新模型,其需要多个地区多个医院配合才能真正发挥预测模型的价值。