李 靖,高剑波,王 睿,方梦捷,许春苗,黎海亮*
[1.郑州大学附属肿瘤医院(河南省肿瘤医院)放射科,河南 郑州 450008;2.郑州大学第一附属医院放射科,河南 郑州 450052;3.中国科学院自动化研究所分子影像重点实验室,北京 100190]
胃癌发病率居全球第5位,病死率居第4位[1-2]。手术是治疗胃癌的主要方法之一,而淋巴结转移(lymph node metastasis, LNM)是影响临床治疗决策的重要因素[3]。CT是评估肿瘤N分期的首选影像学方法[4],但准确率低于70%[5]。利用影像组学可提高肿瘤分期、疗效评估和预后预测准确率[6-8]。目前CT影像组学研究多基于静脉期图像[9-10]。本研究分析基于增强CT影像组学模型术前预测胃腺癌LNM的价值。
1.1 一般资料 回顾性收集2015年1月—2020年10月193例于郑州大学附属肿瘤医院经手术病理证实的单发胃腺癌患者,男150例,女43例,年龄28~79岁,平均(58.6±10.2)岁;92例年龄<60岁,101例≥60岁。纳入标准:①接受标准胃癌根治术(Ⅱ式)+淋巴结清扫术,术后病理证实为胃腺癌,并确定有无LNM;②术前未接受其他抗肿瘤治疗;③术前1周接受腹部双期增强CT扫描,胃腔充盈较好,图像无明显伪影;④病灶显示清晰,最大径≥5 mm。以计算机随机数法将97例患者归入训练集,男71例,女26例,年龄28~79岁,平均(58.9±11.1)岁;以96例为验证集,男69例,女27例,年龄30~79岁,平均(58.3±11.8)岁。
1.2 仪器与方法 采用GE Light Speed Ultra 16和64层螺旋CT仪行腹部扫描,范围自膈顶至双肾下极水平;参数:管电压120 kV,管电流260 mAs,层厚5.0 mm,螺距1.375。平扫结束后采用高压注射器经肘静脉以3.0 ml/s流率推注非离子型对比剂优维显(370 mgI/ml,1.5 ml/kg体质量),延迟30 s、70 s采集增强动脉期和静脉期图像。
1.3 图像分析 扫描结束后自动重建层厚1.25 mm的薄层图像。由2名具有5年腹部影像学诊断经验的主治医师采用双盲法独立阅片,意见存在分歧时提请另1名影像科副主任医师判定;评估以下各项:①肿瘤厚度[11],即轴位CT显示肿瘤最大层面上与肿瘤长轴垂直的最大短径;②Borrmann分型[12],Ⅰ型为局限肿块型,Ⅱ型为局限溃疡型,Ⅲ型为溃疡浸润型,Ⅳ型为弥漫浸润型;③腹腔淋巴结状态,以短径>10 mm和/或不均匀强化[4-6]者为阳性淋巴结。
1.4 提取影像组学特征及建立标签 由上述医师之一采用分割软件ITK-SNAP 3.6.0(www.itksnap.org)分别于动脉期和静脉期薄层CT图像所示病灶最大层面沿边缘勾画ROI(图1),存在浆膜受累时,将边缘毛刺和壁外脂肪浸润部分纳入ROI; 3个月后随机于训练集中抽取30例,再次勾画病灶ROI。
应用在Matlab 2017a上编写的工具箱提取病灶基于公式的人工定义影像组学特征,采用以TensorFlow库(https://www.tensorflow.org)为后端的Keras软件包(https://github.com/fchollet/keras)实现深度卷积神经网络,以深度学习方法提取影像组学特征。分别以Python 3.6平台、Scipy软件包(https://www.scipy.org)和Scikit-Learn软件包(http://scikit-learn.org)对影像组学特征进行降维并建立标签。以组内相关系数(intra-class correlation coefficient, ICC)评估观察者内提取影像组学特征的一致性,筛选一致性高(ICC>0.75)的特征。采用Pearson相关分析(r>0.8)去除冗余的影像组学特征。应用人工神经网络(artificial neural network, ANN)、K近邻(K-nearest neighbor, KNN)、随机森林(random forest, RF)和支持向量机(support vector machine, SVM)多种机器学习(machine learning, ML)方法,分别基于动脉期和静脉期CT构建影像组学标签,并对训练集数据进行多重5折交叉验证,筛选性能最佳的ML方法及其影像组学标签。
1.5 统计学分析 采用R软件3.5.0(http://www.rproject.org)。以ICC检验评估观察者间测量肿瘤厚度的一致性,ICC<0.40为一致性差,0.40≤ICC<0.60为中等,0.60≤ICC<0.75为好,ICC≥0.75为非常好。以χ2检验或Fisher精确概率法比较计数资料。以±s表示符合正态分布的计量资料,以中位数(上下四分位数)表示不符合者,行t检验或Mann-WhitneyU检验。分别将单因素分析显示差异有统计学意义的参数及其影像组学标签纳入多因素logistic回归分析,筛选胃腺癌LNM的独立预测因素,建立预测胃腺癌LNM的临床模型及影像组学列线图(图2),并以受试者工作特征(receiver operating characteristic, ROC)曲线评估其诊断效能,计算曲线下面积(area under the curve, AUC),以DeLong检验比较其差异。分别针对不同年龄(<60岁及≥60岁)、性别、不同部位(贲门胃底、胃体及胃窦幽门)肿瘤患者及所有患者绘制ROC曲线,比较前3者与后者的AUC差异,验证模型稳定性。P<0.05为差异有统计学意义。
2.1 临床资料及CT表现 训练集含54例LNM(+)和43例LNM(-),验证集含58例LNM(+)和38例LNM(-)患者。观察者间测量肿瘤厚度的一致性非常好(ICC=0.967)。训练集及验证集LNM(+)患者肿瘤厚度和阳性淋巴结占比均高于LNM(-)者(P均<0.05)。见表1。多因素logistic回归分析显示,肿瘤厚度和淋巴结状态是LNM的独立预测因素(P均<0.01,表2),可据此构建临床模型。
图1 勾画胃腺癌病灶ROI示意图 A、B.于腹部增强动脉期轴位CT图上勾画病灶ROI并以红色填充; C、D.于腹部增强静脉期轴位CT图上勾画病灶ROI并以红色填充
图2 基于腹部增强CT构建预测胃腺癌LNM影像组学的列线图的流程图
表1 LNM(-)与LNM(+)胃腺癌患者临床资料及CT表现比较
2.2 影像组学标签 分别基于动脉期及静脉期CT提取136个深度学习影像组学特征和133个人工定义影像组学特征,共269个影像组学特征。经ICC检验及Pearson相关分析,分别保留动脉期36个、静脉期37个影像组学特征。5折交叉验证结果显示,基于训练集动脉期CT以双曲正切激活ANN、基于静脉期CT以径向基函数SVM构建的影像组学标签最佳,其交叉验证精度分别为0.73及0.71。
2.3 影像组学模型及其效能 多因素logistic分析显示,淋巴结状态和静脉期影像组学标签是胃癌LNM的独立预测因素(表3),以之建立的影像组学列线图(图3)预测训练集和验证集LNM的AUC分别为0.810[95%CI(0.730,0.886)]和0.778[95%CI(0.664,0.888)],临床模型的AUC分别为0.772[95%CI(0.692,0.852)]、0.762[95%CI(0.642,0.882)],差异均无统计学意义(Z=1.11、0.27,P=0.27、0.78),见图4。影像组学列线图预测训练集和验证集患者LNM的AUC差异无统计学意义(Z=0.48,P=0.63)。以最大约登指数(0.52)对应的阈值(0.63)为最佳临界值,影像组学列线图针对训练集和验证集数据的诊断准确率、敏感度、特异度分别为0.77[95%CI(0.68,0.83)]、0.79、0.73和0.68[95%CI(0.55,0.79)]、0.71、0.63。
影像组学列线图对年龄<60及≥60岁患者的AUC分别为0.81[95%CI(0.72,0.89)]及0.79[95%CI(0.70,0.88)],对男性及女性患者分别为0.83[95%CI(0.76,0.89)]及0.72[95%CI(0.57,0.86)],对贲门胃底、胃体及胃窦幽门肿瘤患者分别为0.78[95%CI(0.68,0.89)]、0.83[95%CI(0.72,0.94)]、0.83[95%CI(0.63,0.89)];对全部患者的AUC为0.80[95%CI(0.74,0.86)],与对前三者AUC差异均无统计学意义(Z=0.18、0.09、0.54、1.00、0.22、0.48、0.47,P均>0.05)。见图5。
影像组学列线图预测训练集结果与实际结果的一致性较高(χ2=1.97,P=0.58),但对验证集数据存在偏移(χ2=10.28,P=0.02,图6)。
表2 多因素logistic回归分析筛选变量用于构建预测胃腺癌LNM临床模型
表3 多因素logistic回归分析筛选变量用于构建预测胃腺癌LNM影像组学模型
增强静脉期CT是医学图像分析最常见的数据源[7-10]。影像组学的基础是大量高分辨率图像,理论上输入图像越多,所得影像组学特征越丰富,可提高模型效能[10-11]。临床实践对胃癌患者常行双期或多期增强CT扫描。本研究针对双期增强CT进行影像组学分析,以ML方法建立术前预测胃腺癌LNM的影像组学标签,构建基于CT表现及影像组学标签的影像组学列线图;多因素回归分析显示,仅静脉期影像组学标签为LNM的独立预测因素,可能与典型胃腺癌于静脉期显著强化有关[12]。肿瘤厚度是胃腺癌LNM的独立风险因素[13-14]。本研究发现肿瘤厚度和淋巴结状态均与LNM有关,并以此构建了临床模型,而影像组学列线图中仅包括淋巴结状态,未包括肿瘤厚度,推测主要原因在于淋巴结状态在多因素分析中显著性水平均较高,影响肿瘤厚度显著性水平的表达,且以ML方法提取的影像组学特征稳定性高,亦可降低肿瘤厚度显著性水平。
图3 以淋巴结状态和静脉期影像组学标签构建的预测胃腺癌LNM的影像组学列线图
图4 影像组学列线图和临床模型预测胃腺癌LNM的ROC曲线 A.训练集; B.验证集
胃癌的基因、肿瘤表型均具有高度时空异质性[15],导致LNM潜能不同。影像组学标签能反映肿瘤异质性,联合CT参数等临床指标构建影像组学列线图可实现结果可视化,便于临床应用[8-10]。本研究影像组学列线图预测验证集LNM的AUC均高于0.75,且稳定性较高,不受性别、年龄和肿瘤部位的影响,但其与临床模型的AUC差异无统计学意义,可能与样本量小有关。
综上,基于增强CT影像组学模型术前预测胃腺癌LNM的效能较佳。但影像组学列线图在验证集中的拟合优度欠佳,与样本量小且训练集和验证集患者CT特征分布有所差异有关,有待进一步深入研究。
图5 影像组学列线图模型预测不同年龄(A)、性别(B)和部位(C)胃腺癌患者LNM的ROC曲线
图6 影像组学列线图模型在训练集和验证集的校正曲线