陈芳莹,陆海迪,沈浮△,高显华,陆建平
1海军军医大学第一附属医院影像医学科 上海200433
2海军军医大学第一附属医院肛肠外科 上海200433
结直肠癌是常见的消化道恶性肿瘤之一。预计至2030年,全球范围内将年新增超过220万结直肠癌患者,死亡人数将超过110万[1]。其中,直肠癌患者约占27%~58%[2]。准确的术前评估是做出恰当治疗决策的重要前提,其中包括淋巴结转移情况的判断。医学影像学检查因其无创性及可重复性成为直肠癌术前评估的重要手段。目前临床上主要通过综合观察淋巴结的大小、形态、轮廓及内部信号判断有无淋巴结转移[3-5],但这样的评估方法主观性较强,依赖于医师的临床经验,缺乏量化数据的支持,不能达到精准医学的要求[6]。而影像组学(radiomics)为临床医师提供了新的诊断思路。影像组学在大量获取高质量标准化图像的基础上,自动化提取高维度特征数据并建立模型,从而可以为疾病的诊断、疗效评估、预后预测等提供更多的参考信息,有望成为精准影像医学的重要基石[7]。本研究基于MRI高分辨率T2WI图像,通过影像组学的方法,提取直肠癌的影像组学特征,探讨其对评估直肠癌术前N分期的应用价值,现报告如下。
纳入2017年3月至2018年9月在海军军医大学第一附属医院经手术病理证实,术前行直肠MRI高分辨率T2WI检查的152例直肠癌患者为研究对象,年龄24~78岁,平均(58.9±8.3)岁,患者一般临床病理特征详见表1。所有患者获取原始DICOM数据并详细记录术后病理报告结果,根据N分期分为无淋巴结转移组(N0)和淋巴结转移组(N1~2),其中N0组94例(61.8%),N1~2组58例(38.2%)。部分患者高分辨率T2WI图像与病理大切片对照如图1、2所示。排除标准:(1)图像质量差、伪影明显导致病灶显示欠清,无法准确勾画感兴趣区(region of interest,ROI);(2)患者手术前或MRI检查前后接受过任何的全身或局部治疗;(3)术后病理检查未包含直肠系膜筋膜内至少12枚淋巴结。
表1 患者临床病理特征
图1 病例 1高分辨率 T 2WI图像与病理大切片对照
图2 病例 2高分辨率 T 2WI图像与病理大切片对照
MRI扫描采用Siemens MAGNETOM Skyra 3.0T MRI成像系统。所有患者检查前4 h禁食。检查前嘱患者使用一支开塞露(20 mL甘油)清洁肠道。采用腹部相控阵线圈。扫描序列均采用包括高分辨率T2WI的常规直肠MRI序列。常规序列包括矢状面T2WI脂肪抑制序列,横断面T1WI及增强、DWI序列。高分辨率T2WI为斜横断面,扫描平面垂直于病灶所在肠管的长轴。扫描参数:TR 4 000 ms,TE 108 ms,FOV 18 cm,矩阵320×320,层厚3 mm,层间距0,层数28层,反转角度150°,带宽108 Hz/像素。无脂肪抑制,GRAPPA并行采集模式,加速因子为3,平均累加次数2,回波链长度16,扫描时长为4分10秒。
1.3.1 病灶VOI选取及特征提取 将原始高分辨率T2WI的DICOM图像导入后处理平台(大数据智能分析云平台,慧影医疗科技有限公司,北京),一名放射科医师采用手动方式在T2WI图像上沿直肠癌原发灶边缘逐层勾画感兴趣区(region of interest,ROI),计算机自动生成病灶的三维感兴趣容积(vol-ume of interest,VOI),另一名高年资放射科医师检查勾画结果(图3)。使用上述平台自动提取VOI影像组学特征,分为以下两类:(1)基于特征类:①一阶统计量特征(first order statistic);②形状特征(shape-based);③纹理特征(texture),包括:灰度级共生矩阵(gray level co-occurrence matrix,GLCM)、灰度级长度矩阵(gray level run length matrix,GLRLM)、灰度级形状矩阵(gray level size zone matrix,GLSZM)和领域灰度差分矩阵(neighborhood gray-tone difference matrix, NGTDM)。(2)基于过滤器类:小波分析(Wavelets)、拉普拉斯转换(Laplacian transforms)、对数特征(logarithm)、指数特征(exponential)、明可夫斯基函数(Minkowski functionals)、分形维数(fractal dimensions)等方式处理后再提取的特征,共1 029个放射组学特征。
图3 直肠癌病灶分割示意图
1.3.2 特征降维及模型构建 将上述获取到的全部特征采用最小绝对收缩算子算法(least absolute shrinkage and selection operator, LASSO)进行降维,选择对诊断直肠癌N分期最有价值的特征。随机选取70%的病例作为训练集进行机器学习(machine learning,ML),剩余30%的病例作为验证集进行验证。训练集采用5折交叉验证(cross-validation) 建立多层感知机 (multilayer perceptron,MLP)、决策树(decision tree,DT)、逻辑回归(logistic regression,LR)、随机森林(random forests,RF)、支持向量机(support vector machine,SVM)及K最邻近值(K-nearest neighbor,KNN)六种机器学习模型。分别绘制受试者工作曲线(receiver operating characteristic curve,ROC),计算曲线下面积(area under the curve,AUC)、敏感度、特异度及95%置信区间(95%CI)。
选用SPSS 25.0统计学软件及MedCalc 15.2.2软件对数据进行处理。计数资料以[n(%)]表示。
共提取到1 029个影像组学特征。通过LASSO算法筛选后,最终得到与N分期相关的特征11个。见表2。
表2 N分期相关特征
DT、LR、RF、MLP、SVM、KNN六种机器学习模型训练集与验证集的AUC、敏感度、特异度见表3。其中RF模型验证集的AUC为0.746(95%CI:0.622~0.872),敏感度79.3%,特异度72.2%(图4)。
表3 六种机器学习模型训练集及验证集ROC分析
图4 RF模型ROC曲线
直肠癌的N分期是重要的独立预后因素[8]。评估直肠癌患者有无淋巴结转移(N分期)是术前分期不可或缺的一部分,影响着患者治疗方案的制定[9]。MRI是指南推荐的术前影像学评估方法,高分辨率T2WI根据形态学特征,除了能够较好地评估肿瘤本身浸润程度、直肠系膜筋膜和肠壁固有肌层外血管是否受到侵犯外,还能够较清晰地显示盆腔淋巴结的情况,是直肠癌术前分期的重要手段。
评估直肠癌患者的淋巴结状态一直是术前分期的难点。除了临床常用的综合评估淋巴结大小、形态、轮廓及内部信号的方法外,MRI功能成像也越来越多地被运用于评估直肠癌患者的淋巴结情况,其中最常见的就是DWI及ADC值。虽然DWI有助于检出淋巴结,但是对于淋巴结良恶性的判别能力很弱[10]。相较于正常淋巴结,转移淋巴结的平均ADC值较低,但仅依靠ADC值判定的特异性并不高[11]。
影像组学的概念是由Lambin等[12]首次提出,是指从医学影像图像中高通量地提取特征数据,加以分析挖掘,得到具有特征性的影像学标识物,基于数字化的图像特征规避了观察者本身对于影像特征解读的主观偏向,实现对疾病的精准预测、诊断及预后评估等[13]。目前影像组学已经在结直肠癌的术前分期、新辅助治疗疗效评估及预后预测等方面有所应用[14-17]。
本研究基于直肠癌MRI图像进行影像组学研究,通过在高分辨率T2WI上手动勾画原发病灶的VOI进行特征提取,采用LASSO算法筛选出11个对N分期最有价值的特征,均属于经过小波变换(Wavelets)后再提取的高阶特征,这说明了原发灶的低阶特征并不能完全反映其发生淋巴结转移的内在异质性改变,而影像组学深度发掘了大量人眼无法识别的数字化信息[18],从而有可能成为术前评估淋巴结转移的新路径。
我们建立了DT、LR、RF、MLP、SVM、KNN六种机器学习模型,其中RF模型的AUC最大为0.746,较其他模型具有更优的诊断效能,可用于直肠癌术前的N分期评估。随机森林(random forest,RF)属于监督式学习(supervised learning),即给定大量样本,每个样本都有一个类别,这些分类是事先确定的,通过学习可以得到分类器,能够对新出现的对象给出正确的分类,即使用医学影像中的特征与病理金标准构建分类器模型。RF是一个包含多个决策树的分类器,其输出的类别是由个别树输出的类别的众数而定。用随机的方式建立一个森林,森林由很多的决策树组成,分别进行判断分类,选择最多的分类就作为预测样本的分类,能够减少问题的复杂性和节省训练时间,增强了分类模型的泛化能力。
但我们的研究仍存在以下不足:(1)本研究系单中心回顾性研究,纳入的病例数相对较少,可能存在选择偏倚,这也可能是其他几个机器学习模型的诊断效能不理想的原因,未来有必要扩大数据量,进行进一步验证及前瞻性多中心研究。(2)由于常规淋巴结病理取材无法与影像检查一一对应的限制,本研究通过勾画直肠癌原发灶的VOI来提取特征,没有采取勾画周围淋巴结的方法,所以没有比较不同图像分割方法建立模型的差异,因此需要进一步深入研究不同的组学方法的对模型的影响。(3)本研究仅基于MRI T2WI高分辨率图像,未加入DWI、增强等其他MRI序列分析。未来研究还可以结合超声、CT等其他影像学检查方法及临床指标,构建多模态影像组学,有可能进一步提高判断直肠癌淋巴结转移的准确性。
综上所述,基于MRI T2WI高分辨率图像的影像组学模型对直肠癌术前N分期的评估具有一定价值。