香港大学深圳医院(518000)张永胜 杨利 姜勇
宫颈癌是女性生殖器最常见的妇科恶性肿瘤。尽管宫颈癌的发病率和死亡率在过去几十年中都在下降[1][2],但它仍然是一个重要的世界性公共卫生问题。全世界每年约有569847例宫颈癌新诊断病例,311365例患者死于该病[3]。腺癌和鳞癌是宫颈癌的最主要的两种病理类型,得到了广泛的关注与研究。宫颈腺鳞癌是一种不同于宫颈腺癌、鳞癌的一种单独亚型,只有在明确存在恶性腺样分化及鳞状分化的情况下才可诊断为腺鳞癌[4]。宫颈腺鳞癌较为少见,约占宫颈癌的8%~10%[5]。
研究表明,宫颈腺鳞癌的生物学行为和对治疗反应与宫颈鳞癌及宫颈腺癌不同[6]。国际妇产科联合会(FIGO)分期系统是目前用于预测宫颈癌预后和指导治疗的最准确的分期方法。然而,宫颈腺鳞癌在治疗策略上与宫颈鳞癌及腺癌没有差异。宫颈腺鳞癌的发病率较低,在宫颈腺鳞癌患者群体中进行的前瞻性随机对照临床试验较有限。由于该病的罕见性和资料的缺乏,预测宫颈腺鳞癌预后的文献鲜见报道。因此,需要一种更准确的方法来预测宫颈腺鳞癌患者的个体化生存率,而列线图是一种很好的方法。
本研究基于美国多个机构建立的监测、流行病学和最终结果(SEER)数据库,分析了宫颈腺鳞癌的临床病理特征和预后因素。根据生存分析结果,本文进一步建立并验证宫颈腺鳞癌患者的列线图,以更好地预测患者的预后。
美国国立癌症研究所的SEER数据库是美国癌症发病率和生存率最权威的信息来源(https://seer.cancer.gov/)。SEER目前收集和发布癌症发病率和生存率的数据,这些基于人群的癌症登记处的数据覆盖了大约34.6%的美国人口。本研究的数据来自SEER数据库。本SEER分析得到了医院医学伦理委员会的批准。从SEER数据库中提取的数据不需要个人知情同意书。本研究中,患者的数据在所有阶段都是采用匿名管理的,包括数据清理和统计分析阶段。这项研究根据赫尔辛基宣言进行展开。
1.1 研究人群 研究人群包括所有诊断为宫颈腺鳞癌的妇女,使用SEER*Stat 8.3.8软件提取。SEER*Stat软件识别宫颈腺鳞癌患者的特定标准如下:①部位和形态(TNM 7/CS v0204+ Schema)限定于宫颈;②根据国际肿瘤疾病分类第3版(ICD-O-3),将宫颈腺鳞癌的组织学亚型编码限定为8560。因此本研究的诊断年份限定在2004年至2016年。
1.2 变量 从SEER数据库获取每个病例的人口统计学、临床和治疗特征。人口统计学特征包括性别(男性、女性)、确诊时的年龄(≤45岁、46~65岁、≥66岁)、婚姻状况(已婚、未婚)、种族(白人、黑人、其他)。病理分级分I+II级和III+IV级。FIGO分期包括I期、II期、III期和IV期。治疗特征包括接受放疗(是、否)、化疗(是、否)和手术(是、否)。排除标准如下:①任何人口学或临床特征信息不完整的患者;②不是第一个或者仅有一种原发恶性肿瘤者;③生存时间小于1个月者。在种族类别中,“其他”被定义为美洲印第安人/阿拉斯加土著或亚洲/太平洋岛民。本研究的主要终点是肿瘤特异性生存(Cancer-specific survival,CSS)。CSS被定义为从确诊宫颈腺鳞癌后到死于该特定疾病的时间段。随访时间截止日期为2016年12月31日。
1.3 列线图的构建 符合条件的患者被随机分为训练集(n=748)和验证集(n=316)。利用训练集建立列线图。采用单因素和多变量Cox回归分析来确定这些因素的预后价值。使用R版本3.6.2[8]中的rms包,利用独立预后因子建立了预测总生存期的列线图。
1.4 列线图的验证 列线图在训练集中进行内部验证,在验证集中进行外部验证。用Harrell's C-指数评价列线图的分辨力。C指数越高,预后预测就越准确[7]。C指数在0.71~0.90之间具有较好的鉴别能力,而C指数>0.90则显示出较好的准确性。校准图也被用来评估列线图的性能。在理想校准的模型中,预测值应落在校准图中的45°对角线上[8][9]。
1.5 统计分析 训练集和验证集的临床和病理特征通过卡方检验或Fisher精确检验进行比较。用Kaplan-Meier分析方法计算每个患者的累积生存曲线。通过单因素和多变量Cox回归分析确定了这些变量的预后价值。P值是双侧的,且<0.05的值被认为具有统计学意义。采用SPSS24.0软件(IBM公司,Armonk,NY,USA)进行单变量和多变量Cox分析。使用R 3.6.2(http://www.R-project.org)软件的survival和rm包构建列线图并进行验证。
2.1 训练集和验证集的临床病理学特征 纳入1574名SEER数据库(2004~2016)诊断为宫颈腺鳞癌的患者。其中510名患者因信息不完整而被排除在外;剩余1064名患者被最终纳入分析。符合条件的患者被随机分为训练集(n=748)和验证集(n=316)。训练集和验证集的临床病理学特征如附表1所示。
附表1 训练集和验证集的临床病理学特征
2.2 训练集中的独立预后因素与列线图的构建 用训练集建立列线图。附表2显示了CSS潜在预测因素的单变量和多变量分析。在单因素分析中,诊断年龄、病理分级、FIGO分期、放疗、化疗和手术是CSS的危险因素。因此,这些显著的危险因素被纳入多因素分析。多因素分析表明,病理分级、FIGO分期和手术均能独立预测总生存期(附表2)。独立因素被用来构建1年、3年和5年CSS的列线图(附图1)。
附表2 根据Cox比例风险回归模型得出CSS的危险因素
附图1 列线图预测宫颈腺鳞癌患者1年、3年和5年CSS。注:可在每个变量和点刻度之间绘制垂直线,以获取每个变量的点。根据总积分量表与总生存量表之间的垂直线,计算预测生存率
2.3 列线图的验证 利用训练集对列线图进行内部验证。在训练集中,显示辨别能力的Harrell's C-指数为0.784。同样,在外部验证集中,Harrell's C-指数为0.769。这些结果表明列线图可以准确地预测CSS。内部和外部校准图也用于评估列线图的性能。如附图2所示,训练集和验证集的1年、3年和5年CSS预测的校准图非常一致。
附图2 1年(A)、3年(B)和5年(C)CSS预测的校准图。在X轴上绘制列线图预测CSS的实际概率图,在Y轴上绘制实际CSS的预测概率图。预测落在校准图中的对角线45°处,表明预测精度较高
FIGO分期系统是目前预测患者预后最常用的方法。然而,在同一分期的宫颈腺鳞癌与鳞癌、腺癌患者中却存在着较大的生存差异[10]。由于其少见,关于宫颈腺鳞癌的临床病理特征和预后的资料多为小样本的回顾性研究。列线图在预测大多数癌症类型的预后方面比常规分期系统更准确[11]。在本研究中,笔者对SEER数据库中大样本的宫颈腺鳞癌患者进行了分析,以研究这种高度侵袭性疾病。笔者开发了一个从Cox回归模型衍生的列线图来预测宫颈腺鳞癌患者的1年、3年和5年CSS。列线图在内部和外部验证中显示出良好的区分性和良好的性能。
通过单因素分析和随后的多因素Cox回归分析,本研究确定病理分级、FIGO分期和手术治疗为宫颈腺鳞癌的独立预后危险因素[12]。然而,在本研究中,种族、婚姻状态和年龄等因素与宫颈腺鳞癌患者的CSS无显著相关。可能的原因是样本大小的差异和纳入变量的选择偏差。此外,本研究还显示放疗与化疗不是宫颈腺鳞癌患者的CSS的独立预后危险因素。吴婉莉等也报道了类似的结果[13],他们的结论与本研究一致。本研究根据多因素Cox回归结果,选取所有显著变量构建预测肿瘤特异性生存的列线图。结果表明,病理分级、FIGO分期和手术治疗与宫颈腺鳞癌患者的CSS存在显著相关。
宫颈癌患者的治疗策略和预后预测主要基于FIGO分期系统。宫颈腺鳞癌有着其独特的临床病理和预后特征,但由于宫颈腺鳞癌较为罕见,其治疗策略和预后预测主要参照宫颈鳞癌和宫颈腺癌。在本研究中,FIGO分期对宫颈腺鳞癌预后的影响最大。不可否认,FIGO分期系统仍然是预测宫颈癌患者生存和指导治疗的最重要工具,但结合临床病理特征能获得更准确的预后。列线图能结合分期与其他预后相关的独立因素,能更加准确地推测预后结果,并具有数字化、可视化的特点。列线图作为癌症患者预后预测的工具已广泛应用于各种肿瘤,其提供的预测效能明显优于单纯的TNM分期系统。本研究建立的宫颈腺鳞癌预后列线图预测模型有助于个体化预测患者的预后。
与以往的同类研究相比,本研究有以下独特之处。首先,宫颈腺鳞癌的样本量足够大,能提供足够的统计效能。其次,本研究建立了宫颈腺鳞癌的预测模型,通过列线图能提供准确和个体化的生存预测。
虽然列线图显示出良好的辨识度和良好的表现,但本研究仍有一些局限性。第一,1574例患者中有510例(32.40%)因数据缺失而被排除在外,这可能导致选择偏倚。第一,SEER数据库没有提供关于化疗方案和放疗剂量的信息。第三,缺乏其他预后因素的更多信息,关于复发的资料也没有。第四,这个列线图是基于一个回顾性的数据集,需要在前瞻性临床试验中进一步验证。尽管有这些局限性,本研究建立的预后列线图仍是一个重要和有效的模型,为宫颈腺鳞癌患者提供准确和个性化的预后预测。
综上所述,本研究确定病理分级、FIGO分期和手术是宫颈腺鳞癌患者CSS的独立预后因素。这些独立因素被用来建立宫颈腺鳞癌患者的预后评估列线图。该列线图准确可靠地预测了宫颈腺鳞癌患者1年、3年和5年的CSS。