曹瑕尹,李蕊,王婉琼,薛颖,江建芹,崔磊*
作者单位 1.南通大学第二附属医院放射科,南通 226006;2.南通市中医院放射科,南通 226007;3.盐城市第一人民医院放射科,盐城 224006
肺癌仍然是全球癌症死亡的主要原因[1],非小细胞肺癌(non-small cell lung cancer, NSCLC)约占肺癌的85%[2],淋巴结转移的NSCLC患者5年生存率仅在26%~53%之间[3],一旦肺癌患者纵隔淋巴结受累,与纵隔淋巴结未受累患者的治疗策略有所不同[4]。因此,术前准确预测NSCLC 患者的淋巴结转移情况,对于选择合适的治疗方法、提高生存率非常重要。
影像组学是提取、分析和建立与预测目标相关联的组学特征的预测模型以及医学图像和目标之间的定量映射的过程[5]。与主观描述病变的体积和形状等定性指标相比,影像组学可以更全面地定量描述病灶内部信息,可以量化肿瘤内外灰度值的差异[6]。
研究证明MRI 对NSCLC 纵隔淋巴结转移的评估有着很高的准确性[7-8],弥散加权成像(diffusion weighted imaging, DWI)能准确判断出正电子发射断层(positron emission tomography, PET)检查中的假阳性结果[9],但临床上对MRI评估肺癌患者纵隔淋巴结转移的价值认识仍不足。MRI 结合影像组学预测淋巴结的转移已经在乳腺癌[10-11]、宫颈癌[12-13]、直肠癌[14-16]等疾病中应用,然而目前在肺癌中的应用极少,且未见基于最常用的MRI序列[包括T1WI、T2WI、表观扩散系数(apparent diffusion coefficient, ADC)、DWI]的影像组学预测模型评估NSCLC 患者纵隔淋巴结转移情况的相关研究。因此,本研究采用不同机器学习方法基于常规MRI 序列构建影像组学模型,并识别出最优模型,评估其预测NSCLC 纵隔淋巴结转移的价值,以期减少活检等有创方式对患者的伤害,有利于术前风险分层并指导手术规划。
本研究遵守《赫尔辛基宣言》,经南通市第一人民医院伦理委员会批准,免除受试者知情同意,批准文号:院伦审[2018]第038号。
回顾性收集2012 年10 月至2022 年5 月南通市第一人民医院因肺结节/肿块而行肺叶部分切除术、系统性淋巴结清扫术的患者数据。纳入标准:(1)患者术前行胸部MRI 检查;(2)术后病理确诊为NSCLC;(3)病灶直径>1 cm,且至少连续2 个层面肉眼可见病灶;(4)图像质量可,无明显伪影、畸变。排除标准:(1)MRI 检查前患者接受抗肿瘤治疗(放化疗、靶向治疗)或接受支气管镜、穿刺等侵入性检查;(2)手术前接受抗肿瘤治疗(放化疗、靶向治疗)。
根据以上纳入、排除标准,90例NSCLC患者最终被纳入本研究。术前胸部MRI检查距离手术的间隔时间为1~17天。术后病理学检查存在淋巴结转移患者52例,无淋巴结转移患者38例(患者病理示意图见图1);另外盐城市第一人民医院的患者数据作为独立的外部验证集(31 例),纳入与排除标准同上,术后病理学检查存在淋巴结转移的NSCLC 患者9 例,无淋巴结转移者22例。
图1 女,47 岁,右上肺结节,截面大小约2.7 cm×1.9 cm。1A:原发病灶病理(HE ×100)图,示腺癌;1B:送检淋巴结病理(HE ×100)图,见癌转移。Fig.1 A 47-year-old woman with right upper lob, 2.7 cm×1.9 cm.1A:Pathologic results (HE ×100) of the primary lesion are adenocarcinoma;1B: Pathologic results (HE ×100) of the lymph nodes sent for examination show metastasis of cancer.
使用德国Siemens Verio 3.0 T MR 扫描仪和8 通道相控阵体表线圈对患者进行胸部平扫。患者腹部束缚带以限制腹部呼吸,使线圈尽量贴紧胸部,同时嘱患者保持平静呼吸。扫描序列:(1)横断位脂肪抑制T1WI(TR 4.22 ms,TE 1.9 ms,矩阵288×288,视野380 mm×310 mm,层厚3 mm,层间距0.6 mm),一次屏气完成扫描;(2)横断位脂肪抑制T2WI( TR 2000 ms,TE 90 ms,矩阵320×320,视野360 mm×360 mm,层厚5 mm,层间距1.5 mm),采用膈肌导航呼吸触发;(3)DWI(TR 7300 ms,TE 71 ms,矩阵128×160,视野380 mm×310 mm,层厚5 mm,层间距1 mm,并行采集因子2,采集时间226 s),自由呼吸下采集。取b=0、300、800 s/mm2,通过工作站自动生成ADC图像。
将患者的MR 图像上传至深睿医疗科研平台(https://keyan.deepwise.com/)进行影像组学分析。
1.3.1 病灶分割
一名具有5 年工作经验的放射科住院医师A 在T1WI、T2WI、高b 值DWI 及ADC 图像上逐层勾画病灶所在区域,利用软件基于计算机水平集勾画算法自动勾勒病灶边界,最后人工手动修正、确认感兴趣区(region of interest, ROI)。病灶ROI 的勾画范围包括病灶整体,不避开钙化、坏死等成分。一个月后随机抽取30例图像分别由放射科医师A 和放射科主治医师B(10 年工作经验)再进行半自动逐层勾画及修正。ROI勾画示意图见图2。
图2 ROI勾画示意图。2A~2D 分别为ADC、高b 值DWI(b=800 s/mm2)、T1WI、T2WI图像,红色部分为勾画的靶区。ROI:感兴趣区;ADC:表观扩散系数;DWI:弥散加权成像。Fig.2 Schematic outline of the ROI.2A-2D are ADC, high b-value DWI (b=800 s/mm2), T1WI, and T2WI images, respectively, with the red portion representing the delineated target zone.ROI: region of interest; ADC: apparent diffusion coefficient; DWI: diffusion weighted imaging.
1.3.2 特征提取
提取特征时对图像进行重采样、均一化等处理,消除图像分辨率的差异及规范化图像。同时基于小波转化、拉普拉斯高斯变换、无滤波处理条件下提取分割病灶的纹理特征。T1WI、T2WI、高b 值DWI、ADC 图像各提取1630、1839、1590、1512 个纹理特征。
1.3.3 特征选择
初步特征筛选:(1)采用组内相关系数(inter-class correlation coefficient, ICC)评估放射科医师A 勾画2 次所得影像组学特征的观察者内一致性、放射科医师A 和B 各勾画一次所得影像组学特征的观察者间一致性,保留一致性分析ICC≥0.9的组学特征;(2)执行特征相关性分析,当2 个特征间皮尔逊相关系数ρ≥0.9 时,保留更高相关系数特征,剔除影响较小特征以减少冗余。
降维算法特征筛选:采用L1 正则化、树模型、单因素方差分析等方法进行特征筛选降维。
1.3.4 建立模型
采用筛选出的特征分别建立逻辑斯特回归(logistic regression, LR)、支持向量机(support vector machine, SVM)、随机森林(random forest, RF)、K-近邻(K-nearest neighbor, KNN)、决策树(decision tree,DT)、梯度提升(gradient boosting, GBM)、极限梯度提升(exterme gradient boosting, XGBoost)、线性支持向量分类(linear support vector classification, LinearSVC)、随机梯度下降法(stochastic gradient descent, SGD)、自适应提升算法(adaptive boosting, AdaBoos)、高斯朴素贝叶斯(Gaussian naive Bayes, Gaussian NB)共11 种模型。选择超参数搜索(基于网格搜索法),可为模型自动寻找最佳特征筛选算法,再对算法参数进行修正,避免纳入过多影像组学特征产生的模型可解释性变差和过拟合,最终各序列均纳入10 个影像组学特征用于建模,模型特征权重示意图见图3。采用完全随机法按照7∶3 比例将患者分为训练集和测试集。
图3 基于T1WI的逻辑斯特回归(LR)模型特征权重图,纵坐标代表特征名称,横坐标代表特征权重。Fig.3 The weight map of the radiomics features about logistic regression(LR) model based on T1WI images, the ordinate represents the name of the radiomics features, the abscissa represents feature weight.
采用SPSS 27.0软件进行统计学分析。计量资料以均数±标准差表示,组间对比采用独立样本t检验;分类资料的组间对比则采用卡方检验。采用曲线下面积(area under the curve, AUC)、准确度、敏感度、特异度等评估指标评估不同影像组学模型诊断效能。受试者工作特征(receiver operating characteristic,ROC)曲线间比较采用DeLong 检验。P<0.05 表示差异具有统计学意义。
最终入组90 例NSCLC 患者,男56 例,女34 例;年龄(62.6±9.6)岁。病理类型包括:腺癌64 例,鳞癌23 例,大细胞癌2 例,NSCLC 1 例(无明确分类)。训练集、测试集及验证集中淋巴结转移组和无淋巴结转移组在年龄、病灶直径、性别因素中均无显著差异(P>0.05)。两组患者间临床信息对比见表1。
表1 患者基本临床资料Tab.1 Basic clinical data of the patient
在构建的多种鉴别NSCLC 患者纵隔淋巴结转移的模型中,分别基于T1WI、ADC图像构建的DT模型、基于T2WI 图像构建的SVM 模型及基于DWI 图像构建LR 模型效能较佳(表2~3)。其中,基于T2WI图像构建的SVM模型效能最佳,训练集、测试集及验证集AUC 值分别达0.98 [95% 置信区间(confidence interval,CI):0.96~1.00]、0.98(95%CI:0.94~1.00)、0.72(95%CI:0.54~0.91)(图4A),准确度分别为96%、67%、61%、敏感度分别为88%、67%、55%、特异度分别为100%、67%、78%;决策曲线表明模型的决策有利于预测NLCLC纵隔淋巴结转移(图4B)。
表2 基于不同序列构建的最佳模型鉴别NSCLC纵隔淋巴结转移的效能Tab.2 Performance of the best model based on different sequences to identify mediastinal lymph node metastasis in NSCLC
表3 基于不同序列构建的11种模型鉴别NSCLC纵隔淋巴结转移的AUC值Tab.3 The AUC values of 11 models based on different sequences in identifying mediastinal lymph node metastasis in NSCLC
图4 基于T2WI 图像构建的SVM 模型训练集、测试集、验证集的ROC曲线(4A)及决策曲线(4B)。SVM:支持向量机;ROC:受试者工作特征;AUC: 曲线下面积。Fig.4 ROC curve (4A) and decision curve (4B) for the training set, test set, and validation set of SVM models constructed based on T2WI images,respectively.SVM: support vector machine; ROC: receiver operating characteristic; AUC: area under the curve.
本研究率先利用NSCLC 患者原发肿瘤的常规MRI序列图像,包括T1WI、T2WI、DWI和ADC,建立相应影像组学模型预测纵隔淋巴结转移,并且创新性地比较了11 种机器学习算法,为不同序列机器学习方法的选择提供参考。结果显示,基于T2WI图像的SVM 模型的预测效能最好,不仅在训练集中AUC值达0.98,且在外部验证集中也取得良好的预测效能,AUC 值达0.72,在临床实际应用中易于推广,可减少活检等有创方式对患者的伤害,提供巨大的临床获益。
对于淋巴结转移的NSCLC 患者,除了切除原发病灶外,还应进行系统性淋巴结清扫,可以显著改善患者预后[2]。然而,对于无淋巴结转移的NSCLC 患者,系统性淋巴结清扫不仅不能提供较高的生存获益,还可能导致淋巴水肿等并发症,增加患者的护理成本[17-18]。因此术前准确评估淋巴结转移是影响NSCLC分期和治疗方式选择的重要因素。活检是诊断淋巴结转移的金标准,具有较高的敏感性和特异性,但可能会导致气胸和出血等并发症[19];影像组学则可避免进行过多的活检,减少对患者的伤害[20]。
目前,大多数研究探讨了从原发肿瘤中提取的CT 或PET/CT 影像组学特征在预测NSCLC 患者淋巴结转移中的价值[21-23]。ZHENG 等[24]从原发肿瘤的PET/CT 图像中提取影像组学特征,使用SVM 和RF来构建模型预测纵隔淋巴结分期,其AUC 值为0.81。ZHONG 等[25]从患者胸部CT 平扫图像提取特征并使用SVM 构建模型,准确度为91%,AUC 值达0.97。但PET/CT 因检查耗时、价格昂贵、辐射剂量高、信噪比较低等因素,在临床上难以广泛推广;与CT 相比,MRI 具有无辐射、多参数成像的优点,可以同时反映形态学[26]和功能信息[27],在肺部诊断中具有很大的应用潜力,已推荐用于临床[28]。本研究率先基于常规MRI序列建立的影像组学模型能达到与CT、PET/CT类似的效果。王莹等[29]建立基于三维超短回波时间(three-dimensional ultrashort echo time, 3D-UTE)MRI序列的影像组学模型评估NSCLC 患者的淋巴结转移,进一步证实了MRI在肺部病变评估中的价值,其AUC 值为0.89,略低于本研究,推测可能是该3D-UTE 组学模型仅使用了SVM 算法,而本研究使用多种用于机器学习的预处理器和分类器,并进行比较选取了最佳模型。此外,本研究使用的常规MRI 序列较3D-UTE MRI 序列在临床实际应用中可及性佳、易于推广。
T2WI 和DWI 是临床上最常用的MRI 非造影序列。本研究结果显示基于T2WI 图像构建的组学模型效能最佳,因T2WI 可提供更多的解剖信息细节、肿瘤形态和间质信息,已被用于评估许多癌症[30-32],并且基于不同厂家的MRI 检查设备提取的T2WI 影像特征具有高度可重复性[33],易于临床广泛使用。DWI是目前唯一能评价活体组织中细胞内外水分子扩散情况的技术[34],但基于DWI图像构建的影像组学模型并没有展现出明显优势,分析原因可能是DWI序列存在变形和局部漂移等问题,当病灶与周围血管、器官和胸壁分界不清时较难准确勾勒病灶,导致提取到的特征纹理无法准确反映病灶实际状态。
诸多因素可影响模型的预测效果,例如图像类型、ROI 勾画范围和模型构建方法等[35-36]。故本研究比较了11 种机器学习模型预测NSCLC 患者淋巴结转移的性能,在这些模型中,DT、SVM、LR 模型在训练集中都表现出了良好的预测性能。DT 在每个节点上做出最优的分割决策并保持这一决策,在结构上是相当稳健的。SVM 是一个具有稀疏性和稳健性的分类器,可以通过核方法进行非线性分类,但其稳定性要求有充裕的空间包容测试样本。LR是一种线性模型,鼓励让模型做决策的时候考虑更多的特征,可以增强模型的泛化能力,防止过拟合。RF 是由许多决策树组成的模型,本研究中RF 模型在不同序列的训练集中都表现良好,但内外部验证集中效果欠佳,减少特征数量后依然出现过拟合现象,猜测可能与样本量较少有关。因此利用影像组学特征建立分类模型,需要综合考虑患者样本量和疾病特征等,并进行参数调整和优化。本研究结果可为不同序列机器学习方法的选择提供参考。
本研究存在以下不足:(1)样本量较小,尤其是测试集及验证集,可能导致模型的预测性能及稳定性欠佳,将来会从多个中心收集更多的样本量来检验模型的重复性和普适性;(2)仅纳入直径>1 cm 且各序列均可显示的肺实性结节和肿块,存在一定选择偏倚;(3)部分病例临床资料有缺失(如血清肿瘤标志物、症状体征、TNM分期等),将来可开展前瞻性研究,将影像征象、临床及影像组学特征联合建立组合模型,进一步提高预测效能。
综上所述,从常规MRI 序列中提取影像组学特征建立的预测模型可帮助识别NSCLC 患者纵隔淋巴结是否转移,比较了11 种机器学习方法建立的模型,确定最佳建模方法为基于T2WI 图像的SVM 模型,为临床提供了规避辐射风险的新型评估手段。
作者利益冲突声明:全体作者均声明无利益冲突。
作者贡献声明:崔磊设计本研究的方案,对稿件重要内容进行了修改,获得了南通市科技局指导性项目-社会民生科技计划项目及南通市卫生健康委员会科研课题面上项目的资助;曹瑕尹起草和撰写稿件,获取、分析并解释本研究的数据;李蕊、王婉琼、薛颖、江建芹获取、分析或解释本研究的数据,对稿件重要内容进行了修改;全体作者都同意发表最后的修改稿,同意对本研究的所有方面负责,确保本研究的准确性和诚信。