李扬,王向明,谷霄龙,杨丽,王琦,时高峰,随义,徐校胜,岳萌,王明博,任嘉梁
全世界范围内,食管癌位居癌症发病率第七位,与其相关的死亡率则位居第六位[1]。食管鳞癌(esophageal squamous cell carcinoma,ESCC)是全球最常见的病理类型,占所有食管癌病例的90%[2]。在中国,食管癌的发病率位居第六位,死亡率位居第四位,其发病率与死亡率约为世界平均水平的2倍[3]。尽管食管癌患者的护理和治疗有所改善,但总体效果仍然很不理想,总体5年生存率不到10%,食管切除术后5年生存率在15%~40%之间[4]。淋巴血管侵犯(lymphovascular invasion,LVI)是一种与肿瘤生物侵袭性相关的组织病理学特征,被定义为在内皮衬里空间内存在肿瘤细胞,通常被称为淋巴管和血管浸润[5,6]。只有显微镜下在血管样内皮衬里结构中发现癌细胞簇,才能确定LVI的存在[7]。作为食管癌患者预后不良的危险因素,LVI与早期复发相关[5,8,9]。因此,术前有效评估及判断LVI对于食管癌患者个性化诊疗具有重要价值。作为食管癌术前常规检查,增强CT能够有效区分肿瘤组织与正常食管,在发现肿瘤、显示肿瘤范围和分期方面具有重要价值[10,11],但对于肿瘤的LVI无法直接显示。
新兴的影像组学技术能够从医学图像中高通量地提取肿瘤组织的组学特征,用以描述肿瘤内部异质性及生物学特性,从而弥补常规影像诊断方法的不足,为食管癌患者个体化治疗方案的制定和调整提供更多有价值的信息[12-16]。目前,影像组学技术已被应用于食管癌的无创定量评价[17]。已有研究证实,影像组学可以作为预测消化道肿瘤LVI的潜在生物标志物[18-21],然而关于影像组学在术前预测食管鳞癌LVI方面的研究还很少。因此,本研究旨在探讨基于增强CT影像组学在术前预测食管鳞癌LVI状态中的价值。
回顾性分析我院2017年1月-2019年2月收治的224例食管鳞癌患者的CT和临床病理资料,其中男157例,女67例,年龄37~77岁,平均(62.8±7.45)岁。病例纳入标准:①经根治性切除术治疗,且病理证实为食管鳞癌,LVI状态明确;②具有完整的临床和病理资料;③在术前2周内行胸部增强CT扫描;④具有动脉期软组织算法重建的1.0 mm薄层图像。病例排除标准:①患者在手术前接受过任何形式的抗肿瘤治疗;②非单一肿瘤或食管鳞癌合并其他病理类型肿瘤;③病变太小无法在CT图像上识别;④有明显的光束硬化伪影或运动伪影。为了确保研究结果的准确性,本研究选择的患者将按7:3的比例随机分为训练集和测试集。本研究获得了我院伦理委员会的批准,并免除了书面知情同意的要求。
入组患者在接受CT检查后的两周内,进行食管癌的根治性切除术。患者的临床和病理特征包括性别、年龄、肿瘤位置、肿瘤分化程度、病理厚度、病理长度、病理T分期、病理N分期、病理AJCC分期、神经侵犯和LVI状态。这些特征均由拥有11年和9年食管癌病理诊断经验的两位病理学家进行评估。病理分期分类依据美国癌症联合委员会(AJCC)/国际抗癌联盟(UICC)第八版癌症分期手册。
2.检查方法
所有患者均使用西门子第二代双源CT扫描仪(Somatom Definition Flash,Germany)进行CT检查,在检查前4~6 h内禁食,并于检查前1~5 min饮用500~1000 mL纯净水,以确保扫描时食管腔内清洁。检查时采用仰卧位头先进模式,吸气后屏住呼吸进行采集,扫描范围从胸腔入口延伸至腹腔主干动脉。扫描参数:管电压120 kV,管电流采用自动mA技术,层厚5.0 mm,旋转时间0.5 s,矩阵512×512,螺距1.2,重建算法为b30f,重建层厚1.0 mm。通过高压注射泵经肘静脉注射对比剂碘海醇(浓度300 mg I/mL,注射流率3.0~4.0 mL/s,剂量1.5 mL/kg),延迟30 s后进行动脉期扫描,随后以相同流率注射20 mL生理盐水。用于影像组学分析的动脉期1.0 mm薄层CT图像从影像储存和传输系统(picture archiving and communication system,PACS)中获取。
3.肿瘤分割
使用3D slicer软件(4.11.0版)在动脉期1.0 mm薄层CT图像上对全肿瘤感兴趣区(region of interest,ROI)进行逐层分割。识别肿瘤的标准定义为:异常增厚的食管壁>5 mm,或直径>10 mm(闭合状态下),管腔局部不规则狭窄[22-24]。肿瘤的ROI包括瘤内坏死区,但不包括食管腔内的气体、液体、周围脂肪组织、淋巴结、心肺组织、血管和骨组织。手动逐层对肿瘤ROI进行勾画后,可参照多平面重建图像进行修改(图1)。
图1 肿瘤勾画示意图。食管鳞癌(低分化)患者,男,50岁,LVI阳性,使用3D Slicer 软件勾画全肿瘤ROI。 a) 在轴面图像上逐层勾画全肿瘤ROI(红色区域);b) 矢状面图像;c)冠状面图像;d) 肿瘤勾画完毕后的3D感兴趣区。全肿瘤ROI的勾画主要在轴面进行,参照矢状面及冠状面对ROI进行修正。
肿瘤分割过程由两位具有10年胸部影像诊断经验的放射科医生进行手动操作,其中医生1对224例患者进行了肿瘤分割,而医生2则随机选择30例患者进行独立分割。两周后,医生1再次对这30例患者进行了肿瘤分割,并使用组内相关系数(interclass correlation coefficient,ICC)评估医生1与医生2之间以及医生1前后两次分割内部的一致性和影像组学特征提取的可重复性,当ICC>0.75时,表明影像组学特征提取的一致性和可重复性良好。
4.影像组学特征提取与模型建立
沸溢可能发生在固定顶储罐,特别是沸点大于250 ℃、黏度较高的重质原油或宽沸点的重质油品,发生沸溢可能性较大。储罐沸溢事故虽较少发生,但会造成火灾迅速扩散,罐内油品会喷射而出,火焰和热辐射强度突然增加,火灾范围瞬间扩大,极易引燃相邻储罐而导致灾难后果[5]。
使用Python软件的Pyradiomics包来提取影像组学特征[22],在此之前对图像进行重采样和灰度离散化处理,以使CT图像标准化。总共提取了1130个影像组学特征,包括一阶特征、形状特征、纹理特征及高阶特征。为了筛选出最佳的影像组学特征,本研究采用了以下四个步骤:首先,计算ICC值以评价医生1与医生2之间、医生1前后两次影像组学特征提取的一致性及重复性,并保留ICC值>0.75的特征;其次,通过Wilcoxon秩和检验筛选出LVI-阳性与LVI-阴性之间有统计学差异的影像组学特征(P<0.05);第三,使用Spearman相关分析,剔除内部相关系数>0.9的特征;最后,通过最小绝对收缩和选择算子算法(Least absolute shrinkage and selection operator,LASSO)回归分析与10倍交叉验证,并对剩余的特征进行逐步Logistic回归分析,最终筛选出具有最低Akaike信息准则(akaike information criterion,AIC)值的特征集作为最佳模型。
5.统计学分析
1.患者的临床和病理特征
224例食管鳞癌患者中包括66例LVI阳性(29.5%)和158例LVI阴性(70.5%)患者。LVI阳性组与LVI阴性组在年龄、性别、肿瘤位置和神经侵犯等方面差异无统计学意义(P>0.05);两组在病理长度、病理厚度、肿瘤分化程度、病理T分期、病理N分期、病理AJCC分期等方面差异有统计学意义(P<0.05,表1)。
2.影像组学特征筛选和模型构建
在提取的1130个影像组学特征中,有937个特征具有良好的观察者间和观察者内的一致性和再现性(ICC值>0.75)。通过Wilcoxon秩和检验,发现有525个影像组学特征在LVI阳性与LVI阴性患者之间差异具有统计学意义,并被纳入随后的Spearman相关性分析中。经过Spearman相关性分析,排除相关系数>0.9的影像组学特征,保留了77个影像组学特征用于后续的LASSO回归分析。经过LASSO回归分析保留15个影像组学特征(图2)。最后,通过多因素逐步Logistic回归建立影像组学模型,保留AIC值最低的特征集,最终保留了7个影像组学特征,具体特征及其系数见表2。
图2 LASSO回归曲线和二项偏差曲线图。a)十折交叉验证图。图中红点及所在线段上下端之间分别表示每个log(λ)值对应的二项式偏差的均值及其范围。在最佳值log(λ)处,通过最小标准设置了垂直虚线,其中选择了15个特征;b)LASSO回归的变量解析路径图。每条曲线代表自变量系数变化,图上方数字是剩余非零系数变量的个数。图3 影像组学模型预测食管鳞癌LVI状态的ROC曲线。红色曲线为训练集,蓝色曲线为测试集。 图4 影像组学模型预测LVI的校准曲线。纵轴为实际存在LVI的概率,横轴为影像组学模型预测存在LVI的概率。灰色斜线为参考线,红色曲线为训练集实际校准曲线,蓝色曲线为测试集实际校准曲线,实际校准曲线越接近参考线,表示影像组学模型的预测概率与实际概率一致性越好。训练集与测试集实际校准曲线接近参考线,且HL检验的P值均大于0.05值,提示模型拟合良好。 图5 影像组学模型术前预测LVI的DCA曲线。横坐标为阈值概率,纵坐标为净效益。横线为所有患者均不干预,净效益为0。灰线为所有患者均进行干预,净效益为斜率为负值的反斜线。图中显示在大部分的阈值概率范围内,影像组学模型均具有较高的净效益。
表2 最终保留的7个影像组学特征
3.影像组学模型的诊断效能
采用ROC曲线分析影像组学模型在训练集和测试集中的诊断效能(表3、图3)。在训练集中,影像组学模型预测食管鳞癌LVI状态的AUC值为0.930(0.882~0.977),敏感度为0.851(0.638~0.936),特异度为0.919(0.721~0.973),准确度为0.899(0.841~0.941),阳性预测值为0.816(0.769~0.830),阴性预测值为0.936(0.920~0.939)。在训练集中,影像组学模型预测食管鳞癌LVI状态的AUC值为0.897(0.823~0.971),敏感度为0.789(0.579~1.000),特异度为0.787(0.660~0.957),准确度为0.788(0.670~0.879),阳性预测值为0.600(0.524~0.655),阴性预测值为0.902(0.886~0.918)。
表3 影像组学模型的诊断效能
在训练集和测试集中模型的校准曲线接近参考线,表明预测概率与实际概率一致性良好(图4)。采用HL检验评估影像组学模型的拟合度,在训练集和测试集中的P值分别为0.315和0.082(图4),均大于0.05,提示模型拟合良好。采用DCA曲线评估影像组学模型的临床价值,模型在大部分阈值概率范围均有较高的净获益,表明其临床价值良好(图5)。
在中国,食管癌的发病率及死亡率均高于世界平均水平[23]。食管癌LVI作为影响患者预后的危险因素,近年来受到越来越多的关注[5,24]。LVI与淋巴结转移密切相关,其出现往往提示患者生存预后较差[25]。作为食管癌患者的常规检查技术,增强CT能准确显示肿瘤及周围组织器官的侵犯情况,在食管癌的鉴别诊断、术前分期、放疗定位、疗效评价和预后评估中具有较高的应用价值[26-31]。术前如果能预测患者的LVI状态,有助于制定积极合理的治疗计划。对于疑似存在LVI的患者需要更积极的治疗,如更广泛的手术或增加辅助治疗[32]。然而,CT无法直接显示肿瘤的LVI状态,因此本研究的意义在于提出了一种预测食管鳞癌LVI状态的新方法。
作为一种无创性技术,影像组学可以从不同模态的医学图像中提取高通量的组学特征,并进行深入的数据挖掘,可以客观地反映肿瘤的异质性,进而可用于肿瘤分子分型、鉴别诊断、治疗方案选择、疗效和预后评估等[33],从而定量地揭示图像和医疗结果之间的联系[13]。
肿瘤ROI的精确选取是食管癌影像组学分析的前提[14, 34]。食管为管状空腔脏器,肿瘤组织与正常食管的分界相对不明显。从理论上讲,食管癌全肿瘤ROI比单一最大层面ROI包含更多的肿瘤异质性信息,能够更全面地反映肿瘤的病理生理情况[14]。因此,本研究采用手动逐层分割的方式来提取全肿瘤ROI,其优势在于可以最大程度确保肿瘤病灶区域被准确有效地提取出来。本研究基于增强CT图像,从全肿瘤ROI中共提取出1130个组学特征,经过对冗余特征的筛选后,最终保留了7个影像组学特征,包含2个形态学特征、2个高斯拉普拉斯变换特征和3个小波特征,并使用多因素逐步Logistic回归建立影像组学模型。研究结果显示,影像组学模型可以有效预测食管鳞癌的LVI状态,同时校准曲线表现出良好的拟合度。在训练集和测试集中,AUC值分别为0.930和0.897,敏感度分别为0.851和0.789,特异度分别为0.919和0.787,准确度分别为0.899和0.788。Peng等[20]使用全肿瘤影像组学方法预测食管鳞癌的LVI状态,最终保留了18个影像组学特征,在训练集和测试集中模型AUC值分别为0.824和0.738,准确度分别为0.739和0.690,敏感度分别为0.744和0.691,特异度分别为0.684和0.691。由此可见,本研究建立的影像组学模型更为简单高效。不同于上述研究,本研究保留了两个与肿瘤密切相关的形态学特征,即original_shape_Sphericity_3D(Sphericity)和original_shape_Max 2D Diameter Slice_3D (Max 2D Diameter Slice)。Sphericity即球形度,是一种影像组学的形状特征,可以描述物体体积与完美球体之间的差异性[35]。Sphericity值的范围为0~1,其中1表示完美球体[36]。作为一种无量纲度量,球度与尺度和方向无关。与其它影像组学特征相比,Sphericity的特点是具有较高重复性[37]。Hatt等[38]研究发现,Sphericity与分割方法无关,但与肿瘤体积有关,体积越大,Sphericity越低。Sphericity可以用于预测脑膜瘤患者的肿瘤分级、局部复发和总生存期,而低Sphericity则是预后较差的预测指标[39]。在李昂等[40]基于PET 影像组学方法构建预测食管癌脉管侵犯的模型中,Sphericity同样被保留下来。本研究发现,Sphericity值较低的肿瘤更容易发生LVI。另一个重要的形态学特征是Max2DDiameterSlice,其定义为行列(通常是轴向)平面中肿瘤表面网格顶点之间的最大成对欧几里得距离。本研究结果显示,Max2DDiameterSlice值越大,肿瘤出现LVI的可能性相应增大。因此,肿瘤最大层面的直径对于预测LVI状态有重要意义。
此外,影像组学模型还包含2个高斯拉普拉斯变换特征和3个小波特征。高斯拉普拉斯变换是一种边缘增强滤波器,强调的是灰度变化的区域,常用于图像边缘的检测[41]。经过高斯拉普拉斯变换,可以从原始图像中获得更多的数据和信息,从而提取出更多有价值的影像组学特征。灰度大小区域矩阵特征(gray level size zone matrix,GLSZM),是一种能够反映图像纹理均匀性的特征;SizeZoneNonUniformityNormalized,即尺寸区域非均匀归一化,可以测量整个图像中大小区域体积的可变性,值越低表示图像中区域大小体积之间的同质性越高。灰度依赖矩阵(gray level dependence matrix,GLDM) 特征是一种能够反映图像亮度的特征;LargeDependenceEmphasis,即大依赖分布的度量,值越大表示依赖越大,纹理越均匀。此外,灰度游程矩阵(gray level run length matrix,GLRLM)特征中的短行程高灰度强调(short run high gray level emphasis,SRHGLE)、灰度共生矩阵特征(gray level co-occurrence matrix,GLCM)中的最大相关系数(maximal correlation coefficient,MCC)及一阶特征中最大特征值(firstorder_Maximum)经过小波变化最终也被保留下来。影像组学特征能够反映肿瘤的异质性[12,13],本研究结果显示异质性大的肿瘤更容易出现LVI。
本研究具有以下局限性:首先,本研究使用的CT数据均来自同一家医院,缺乏多中心的外部验证;其次,纳入患者均为接受根治性手术的患者,这可能会带来选择偏倚;再次,由于样本量相对较小,产生的偏倚导致模型在测试集中的诊断效能略低于训练集;此外,由于这是一项回顾性研究,未包含平扫和多期增强扫描,因此可能没有纳入更有意义的定量和分类变量。包含更多信息的前瞻性研究有望获得性能更高的预测模型;最后,本研究尚未应用影像组学的方法来评估LVI状态对患者预后的影响,这将是我们未来研究的重点方向。
综上所述,基于增强CT影像组学构建的预测模型,能够在术前有效预测食管鳞癌的LVI状态,从而辅助临床对患者进行危险分层和决策支持,为患者的个体化治疗提供更多有价值的参考信息。