乳腺良恶性病变鉴别的MRI影像组学预测模型构建:基于随机森林、支持向量机、逻辑回归分类器

2021-10-23 02:16吴佩琪杨雅俪周妍璐郭粉玲毛小明
分子影像学杂志 2021年5期
关键词:组学恶性乳腺

吴佩琪,杨雅俪,周妍璐,郭粉玲,毛小明

1南方科技大学盐田医院(深圳市盐田区人民医院)放射科,广东 深圳 518081;2湖南中医药大学医学院,湖南长沙410208

全球最新癌症负担数据显示,乳腺癌已经取代肺癌成为“全球第一大癌”[1]。在我国,乳腺癌发病率居城乡女性首位,是45岁以下女性癌症死亡的主要原因,已成为妇女健康的最大威胁[2-3]。早期诊断乳腺癌可以明显降低诊疗费用并延长患者的生存期[4]。

目前,乳腺MRI已广泛应用于临床诊断乳腺癌[5],并且其报告也已经十分规范,普遍采用美国放射学会BI-RADS报告系统[6]。但传统的乳腺MRI影像分析一般均基于医师的主观经验判断,诊断效能十分有限,其中很多深层次影像信息未被充分挖掘和利用,导致乳腺癌诊断的假阴性和假阳性率较高[7]。影像组学可分析从MRI等医学影像中高通量提取的大量高级且定量的影像学特征并进一步分析,并可能进一步提供比传统医学影像更为准确的诊断[8]。乳腺动态增强磁共振成像(DCE-MRI)影像蕴含着大量信息,基于DCE-MRI的影像组学已经在乳腺癌中广泛应用[9],包括良恶性病变鉴别诊断[10]、乳腺癌分子分型[11]、乳腺癌新辅助化疗反应预测[12]、乳腺癌复发风险预测[13]和乳腺癌淋巴结转移预测[14]等。但影像组学在乳腺良恶性病变的鉴别中仍存在一定的挑战[15],部分研究存在采用肿瘤最大层面(即2D)进行分割导致肿瘤信息部分丢失[16]、纳入的乳腺良恶性病变类型不足以及仅采用单一方法建立预测模型[17]等问题。本研究拟对DCE-MRI影像上的乳腺良恶性病灶进行3D分割并提取影像组学特征,然后采用随机森林(RF)、支持向量机(SVM)和逻辑回归(LR)分类器进行建模,旨在构建具有良好诊断效能并且较为稳定的乳腺良恶性病变鉴别的MRI影像组学预测模型。

1 资料与方法

1.1 一般资料

回顾性分析南方科技大学盐田医院2018年3月~2020年12月符合纳入标准的患者。纳入标准:经手术病理证实为乳腺良性病变或恶性病变(乳腺癌);术前行乳腺MRI检查。排除标准:MRI检查前曾行穿刺活检、放化疗或切除术者。最终共纳入34例女性乳腺疾病患者,患者年龄为43.38±8.99岁,其中乳腺良性病变患者18例,年龄40.56±8.75岁,乳腺恶性病变(均为乳腺癌)患者16例,年龄46.56±8.41岁,乳腺良性病变组与恶性病变组的年龄差异无统计学意义(P>0.05,图1)。所纳入的18例乳腺良性病变中,乳腺炎5例,乳腺纤维腺瘤9例,乳腺增生2例,乳腺良性叶状肿瘤2例;16例乳腺恶性病变均为乳腺癌,其中导管原位癌3例,浸润性导管癌11例,混合癌2例。以0.8∶0.2的比例将患者分为训练集(n=27)和测试集(n=7),训练集中乳腺良恶性病变患者的年龄为43.85±9.64岁,测试集中乳腺良恶性病变患者的年龄为41.57±6.11岁,训练集和测试集中患者的年龄差异无统计学意义(P>0.05,图1)。本研究经南方科技大学盐田医院伦理委员会批准。

图1 患者年龄的小提琴图Fig.1 Violin chart of the age of the patients.

1.2 检查方法

采用SIEMENS 1.5T超导MR系统(MAGNETOM Avanto 1.5T),线圈为乳腺表面专用线圈。检查时患者呈俯卧位,双侧乳腺自然悬垂于乳腺表面专用线圈的凹形孔内,同时进行双侧乳腺扫描。先进行常规的T1WI及抑脂T2WI扫描,扫描参数:T1WI:TR 8.6 ms,TE 4.7 ms,翻转角20°,FOV 340 mm×340 mm,层厚1.2 mm,层间距0.24 mm,矩阵448×448;抑脂T2WI 采用SPAIR 序列,平均次数2次,TR 5000 ms,TE 59 ms,回波链长度8.44 ms,翻转角142°,FOV 340 mm×340 mm,层厚4 mm,层间距0.8 mm,矩阵320×320。DWI 采用EPI序列,b值取0、400、1000 s/mm2,TR 5800 ms,TE 83 ms,FOV 340 mm×204 mm,层厚4 mm,间隔0.8 mm,矩阵256×256,激励次数3次。DWI扫描结束后,再进行动态增强扫描:注药前平扫1次,采用高压注射器经肘静脉通道快速团注钆喷替酸葡甲胺,剂量0.1 mmoL/kg,然后快速推注生理盐水20 mL。动态增强扫描采用FGREET序列,扫描参数:TR 4.65 ms,TE 1.74 ms,翻转角10°,平均次数1次,FOV 340 mm×340 mm,层厚1.6 mm,层间距0.32 mm,矩阵384×384,分别于注药前、注药25 s后连续进行5次扫描,扫描总时间7 min 28 s。

1.3 DCE-MRI图像上乳腺病变的3D分割和影像组学特征提取

本研究使用动态增强MRI图像中注射对比剂后第3 min的增强扫描图像用于影像组学特征提取,因为此时病灶区一般已达到强化峰值或强化较明显,而周围正常乳腺实质的强化尚不明显,病灶与周围正常的乳腺实质对比度更佳,有利于进行乳腺病灶的精确分割。本研究中乳腺病变的分割采用手动分割法,由2名从事乳腺疾病MRI 诊断工作2 年以上的放射科医师,采用3DSlicer软件(version 4.11.20200930)对乳腺MRI图像上的乳腺病变区域进行逐层勾勒感兴趣区,从而提取3D感兴趣区体积(图2)。人工手动分割所提取的病灶区域是目前的分割方法中最为精确的,可作为“金标准”。分割完成后,使用3D Slicer软件中的radiomics工具进行影像组学特征提取,提取的影像组学特征种类包括:Firstorder、GLCM、GLDM、GLSZM、NGTDM、Shape3d、Shape2d、Log Kernel Sizes(4,5)、Wavelet-Based Features。对每个乳腺病灶提取的总的影像组学特征数为1037个。

图2 1例左侧乳腺癌在DCE-MRI图像上手动勾画的3D感兴趣区体积结果Fig.2 The 3D volume of interest result of manual delineation of the target area of the left breast cancer on the DCE-MRI image.

1.4 影像组学特征降维

计算2名影像医师勾画的靶区所提取的影像组学特征的组内相关系数(ICC),ICC≥0.80的影像组学特征具有较高可重复性,保留ICC≥0.80的特征。对通过一致性检验的影像组学特征在乳腺良恶性组间的差异进行Mann-WhitneyU检验,筛选出差异有统计学意义的特征(以P<0.05为差异有统计学意义)。采用标准化法对以上通过Mann-WhitneyU检验的特征数据进行标准化处理,消除不同特征之间的单位和量纲影响,以保证结果的可靠性。再进一步采用LASSO对以上标准化后的影像组学特征数据进一步降维,筛选出影像组学标签。

1.5 统计学分析

统计学分析均采用python 3.7.0软件进行。将所纳入的乳腺良恶性病变患者按80%∶20%的比例随机分配到训练集和测试集,在训练集中采用随机森林(RF)、支持向量机(SVM)和逻辑回归(LR)分类器构建鉴别乳腺良恶性病变的MRI影像组学预测模型,然后用测试集进行评估,分别绘制训练集和测试集中RF、SVM和LR模型的受试者工作特征曲线(ROC),并计算曲线下面积(AUC)。同时,计算模型的敏感度、特异性、阳性预测值、阴性预测值。

2 结果

2.1 乳腺良性病变MRI影像组学标签筛选

从每个乳腺良恶性病变的MRI影像靶区中各提取1037个影像组学特征,计算2名医师勾画的靶区所提取的影像组学特征之间的ICC,共有769个特征通过一致性检验(ICC≥0.80),这些影像组学特征具有较高可重复性。对通过一致性检验的769个特征在乳腺良恶性组间的差异进行Mann-WhitneyU检验,筛选出差异有统计学意义的特征(P<0.05),共有162 个特征通过Mann-WhitneyU检验。采用标准化法对以上影像组学特征数据进行标准化处理,再进一步采用LASSO对以上标准化后的影像组学特征数据进一步降维(图3),共筛选出6个影像组学标签,具体为wavelet-HHL_Large AreaHighGrayLevelEmphasis、orginal_shape_Sphericity,wavelet- HHH_firstorder_90Percentile、wavelet-LHL_glcm_MCC、log-sigma-5-0-mm-3D_ngtdm_Contrast和wavelet-LLL_gldm_DependenceNon UniformityNormalized,以上影像组学标签的系数(图4)。LASSO降维所得的各影像组学标签在乳腺良病变和恶性病变组间的差异(图5)。

图3 LASSO进行DCE-MRI影像组学特征降维的结果Fig.3 The dimensionality reduction results of DCE-MRI based radiomic features by LASSO.

图4 LASSO降维后6个惩罚系数非零的影像组学标签及其系数Fig.4 The six radiomic signatures with non-zero penalty coefficients after LASSO dimensionality reduction and their coefficients.

图5 LASSO降维所得的各影像组学标签在乳腺良病变和恶性病变组间的差异的小提琴图Fig.5 Violin chart of the difference between the benign breast lesions and malignant breast lesions of each radiomic signatures obtained by LASSO dimensionality reduction(P<0.05).

2.3 3种乳腺良恶性病变MRI影像组学预测模型的诊断效能

在训练集中,3种影像组学预测模型的AUC、特异性和阳性预测值的比较结果为:RF>SVM>LR;准确度、阴性预测值的比较结果为RF>LR>SVM;敏感度方面RF与LR模型相同,均大于SVM模型(表1)。所构建的3种影像组学预测模型在训练集中的ROC曲线(图6)。

图6 3种影像组学预测模型在训练集中的ROC曲线Fig.6 The ROC curve of the three radiomic prediction models in the training set.

表1 3种乳腺良恶性病变MRI影像组学预测模型在训练集中的诊断效能Tab.1 Diagnostic efficacy of the three MRI based radiomic prediction models for differentiating benign and malignant breast lesions in the training set

在测试集中,3种影像组学预测模型的AUC、准确度、阳性预测值、阴性预测值的比较结果为:SVM与LR模型相同,均大于RF模型;敏感度的比较结果为RF>LR>SVM;特异性的比较结果为RF>SVM>LR(表2)。所构建的3种影像组学预测模型在测试集中的ROC曲线(图7)。

图7 3种影像组学预测模型在测试集中的ROC曲线Fig.7 The ROC curve of the three radiomic prediction models in the test set.

表2 3种乳腺良恶性病变MRI影像组学预测模型在测试集中的诊断效能Tab.2 Diagnostic efficacy of the three MRI based radiomic prediction models for differentiating benign and malignant breast lesions in the test set

尽管基于RF分类器构建的乳腺良恶性病变MRI影像组学预测模型在训练集中的诊断效能优于SVM和LR,但其在测试集中的AUC、准确度等大部分诊断性能指标均明显低于另外两种模型,本研究构建的3种预测模型的稳定性比较结果为:LR>SVM>RF。虽然基于LR分类器构建的乳腺良恶性病变MRI影像组学预测模型在训练集中的AUC低于RF和SVM,但差距较小,且均>0.90,并且除了特异性的值是LR=RF>SVM外,LR的所有诊断效能指标均>0.80,达到了较好的诊断效能,同时该模型在测试集中的整体表现较另外2种预测模型更优。

3 讨论

本研究将DCE-MRI上提取的乳腺良恶性病变的影像组学特征进行降维后,采用RF、SVM和LR分类器,成功建立了乳腺良恶性病变的预测模型,并且在测试集中评估了3种模型的诊断效能,结果显示基于LR分类器构建的预测模型具有良好诊断效能且更为稳定,提示通过高通量提取DCE-MRI影像上的深层次影像组学信息所建立的预测模型,可作为术前无创精准预测乳腺良恶性病变的临床辅助工具,具有良好的应用前景。

本研究采用人工分割方法对乳腺良恶性病变的病灶进行了完整的3D分割,充分保留了肿瘤所有特征,在此基础上进行3D图像特征提取,可充分反映肿瘤的整体生物学特征和异质性,从而提高影像组学预测模型的性能和稳定性。不同的影像组学研究中,采用2D图像特征和3D图像特征均有之。既往有的研究是基于肿瘤最大层面的2D分割靶区提取的图像特征,丢失了部分的乳腺肿瘤信息[17]。有研究对多种恶性肿瘤的2D和3D图像的影像组学预测模型进行了研究,结果发现基于3D图像的影像组学预测模型的预测性能优于2D图像,并且3D图像中的部分影像组学特征可能与患者的预后相关,因此推荐在影像组学研究中使用3D图像特征进行预测模型构建,以提高预测性能[16]。另一研究也提示,基于3D图像的影像组学特征的内部和观察者间差异比2D图像更小,即更稳定,且基于3D图像的影像组学特征模型在训练集和测试集中的预测性能都优于2D图像[18]。

有研究邀请了4名影像医师对50例乳腺癌患者的术前DCE-MRI图像进行肿瘤靶区的人工手动分割,基于影像医师标注的靶区提取影像组学特征并进一步分析,结果发现从肿瘤靶区提取的影像组学特征的平均观察者间稳定性仅0.6348(95%CI:0.5391~0.7257),提示由于观察者间变异的存在,乳腺DCE-MRI影像组学特征在稳定性方面差异很大,需要采取适当的措施来减少这种变异[19]。为了减轻观察者间变异对影像组学特征的影响,本研究中,我们在3D影像特征提取完成后计算了2名影像医师所勾画的靶区提取的影像组学特征的ICC,之后仅保留ICC≥0.80的特征,这些保留的ICC≥0.80的影像组学特征具有较高可重复性,有利于进一步分析并建立预测模型。影像组学研究中,特征向量维数过高造成的特征冗余会极大地降低预测模型的诊断性能[20],我们为了提升预测模型性能、减少模型训练时间、避免模型过度拟合、提高模型泛化能力,在本研究中采用了LASSO L1正则化法[21],将线性模型系数的H范数作为惩罚项加到损失函数上,使弱项相关特征所对应的系数为0,从而实现了乳腺病灶的MRI影像组学特征压缩和降维,以进一步筛选出对乳腺良恶性病变鉴别有价值的影像组学特征,最终选出了6个关键影像组学标签进行后续建模。

本研究采用的是影像组学分析中较为常用的建模方法,包括基于机器学习的RF[22]和SVM[23]分类器、以及基于统计学的LR[24]方法。本研究未采用基于深度学习的卷积神经网络[25]等方法,原因是基于深度学习的建模方法需要极大的样本量(往往>1000),难以实现。既往研究表明,以术后病理结果为金标准,术前穿刺活检诊断乳腺导管原位癌的准确性仅0.824,术中冰冻病理的准确性则仅为0.508[26]。本研究建立的RF、SVM和LR影像组学预测模型在乳腺良恶性病变鉴别上均表现出较好的预测性能,训练集中准确度分别为0.889、0.778、0.815,测试集中准确度分别为0.571、0.714、0.714,这表明本研究所建立的影像组学预测模型对乳腺良恶性病变具有较高的预测价值,可作为临床术前无创预测乳腺良恶性病变的有效辅助工具。也有研究得到了类似的结果[27],其采用RF方法建立的MRI影像组学预测模型在训练集和验证集中预测乳腺良恶性病变的AUC和准确度分别为0.98和0.93、0.93、0.91。

本研究中基于LR分类器构建的乳腺良恶性病变MRI影像组学预测模型在训练集中的诊断效能未明显优于另外2种预测模型,但差距较小,同时该模型在测试集中的整体表现较另外2种预测模型更优。总体来看,本研究构建的3种预测模型的稳定性比较结果为:LR>SVM>RF。提示本研究构建的3种预测模型中,基于LR分类器构建的预测模型不仅具有较好的诊断效能,还具有良好的稳定性,是更具有临床应用潜力的预测模型。有研究对173例患者的74个乳腺良性病变和99个乳腺恶性病变进行了影像组学研究[28],结果发现,与SVM、K邻近算法、贝叶斯分类所建立的预测模型相比,LR建立的鉴别乳腺良恶性病变的模型显示了最佳的诊断效能,训练集中准确度、特异性和敏感度分别为0.978、0.975、0.983,测试集中准确度、特异性和敏感度分别为0.886、0.900、0.867。并且,在人工判读方面,联合2名影像医师共同判断的准确度、特异性和敏感度在训练集中仅为0.772、0.710、0.862,在测试集中仅为0.769、0.695、0.858,低于Logistic回归建立的鉴别乳腺良恶性病变的模型的诊断效能[28]。

既往基于DCE-MRI的影像组学区别良恶性病变研究,病理类型缺乏多元化[17],而本研究纳入的乳腺癌病理类型更多样,其中良性病变中包括纤维腺瘤、增生、炎症等常见良性病变,还包括良性叶状肿瘤等较为少见的良性病变。本研究的局限性主要在于研究的样本量较小,并且是单中心的研究,在未来的进一步深入研究中,我们将会纳入更大样本量的不同病理类型的良恶性病变,并补充外部验证病例,以进一步完善预测模型。

综上所述,基于RF、SVM和LR的MRI影像组学预测模型在诊断乳腺良恶性病变方面都具有较好的诊断效能,其中LR模型更为稳定。提示基于MRI影像组学的预测模型在预测乳腺良恶性病变方面具有较高的价值,可为乳腺良恶性病变的预测提供新的手段,具有较好的临床应用前景。

猜你喜欢
组学恶性乳腺
影像组学在肾上腺肿瘤中的研究进展
乳腺结节状病变的MRI诊断
东莨菪碱中毒大鼠的代谢组学
恶性胸膜间皮瘤、肺鳞癌重复癌一例
卵巢恶性Brenner瘤CT表现3例
体检查出乳腺增生或结节,该怎么办
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
得了乳腺增生,要怎么办?
24例恶性间皮瘤临床分析
代谢组学在多囊卵巢综合征中的应用