王 猛,刘 周,文 洁,何翠菊,耿亚媛,罗德红,
1.国家癌症中心/国家肿瘤临床医学研究中心/中国医学科学院北京协和医学院肿瘤医院深圳医院放射诊断科,广东 深圳518116 ;
2.慧影医疗科技(北京)有限公司,北京 100089;
3.国家癌症中心/国家肿瘤临床医学研究中心/中国医学科学院北京协和医学院肿瘤医院放射科,北京 100021
乳腺癌是全球女性目前最常见的恶性肿瘤,每年约有130万人确诊为乳腺癌,约40万人死于该疾病[1]。乳腺原发病灶和区域淋巴结转移情况是临床评估和预测乳腺癌患者预后的两个重要因素[2],其中,腋窝淋巴结(axillary lymph node,ALN)是否转移对乳腺癌患者的临床分期、治疗方案选择及预后评估十分重要[3]。术前采用无创性方法准确评估ALN状态,可避免不必要的前哨淋巴结活检术和二次ALN清扫术,可减少淋巴水肿、肩部活动受限、疼痛及神经损伤等并发症的发生[4-5],对临床治疗具有重要的指导意义。
磁共振成像(magnetic resonance imaging,MRI)因其具有极高的软组织分辨率,已经成为乳腺癌术前评估原发病灶和ALN的常规检查[6],但其在术前评估淋巴结转移的准确度方面仍存在很大挑战[7],如过度依赖放射科医师的主观经验,或当转移淋巴结较小时在影像学图像上难以准确诊断淋巴结的病变性质。影像组学是一种能够提取图像信息,并将其转换为高通量及高维特征定量参数的技术,可精确量化组织的形态学异质性,提取肉眼不可见、不可描述或难以定量的图像深层次微观信息并用于建立临床诊断、分期、疗效和预后预测模型,已成为目前学术研究的一大热点[8-9];机器学习是利用计算机模拟或实现人类的学习行为,获取知识技能;两者结合可用于提高肿瘤诊断准确度、预测疗效及评估预后[10]。目前,大多数研究[11]是提取乳腺癌原发灶的影像组学特征进行分析建模,而基于乳腺癌ALN本身特征的影像组学研究[12]较少。T2加权成像压脂序列(T2-weighted imaging fat suppression,T2WI-FS)可准确评估正常组织结构和病变形态特点,反映ALN的大小、形态、脂肪门等结构[7]。因此,本研究探讨基于T2WIFS图像ALN的影像组学特征结合机器学习方法在术前预测乳腺癌患者ALN转移中的价值,旨在提高ALN术前评估的准确度。
回顾并分析2019年9月—2020年11月经病理学检查证实ALN病理学状态的乳腺癌患者68例。患者均为女性,年龄29~77岁,平均年龄(50±11)岁。纳入标准:
⑴ 术后病理学报告提示有1枚或多枚淋巴结为转移时,将T2WI-FS图像中短径≥5 mm,且至少具有以下两项恶性特征的淋巴结可入组为ALN转移组[13-14],但总数不超过病理学报告中的转移淋巴结个数:① 淋巴结呈圆形或长轴与短轴之比小于2;② 边缘不规则或呈分叶状;③ 局灶性或弥漫性皮质增厚;④ 淋巴结周围局灶性水肿;⑤ 脂肪门结构消失;⑥ 增强扫描呈明显强化或典型环形强化。
⑵ 术后病理学报告提示多于5枚淋巴结转移时,每个患者最多入组5枚淋巴结[12]。
⑶ 全腋窝ALN清扫术后病理学报告提示未见淋巴结转移时,将其中短径≥5 mm的淋巴结入组为ALN非转移组。
排除标准:① 所有短径<5 mm的淋巴结;② MRI检查前放疗、化疗或内分泌治疗史;③ MRI检查前腋窝手术史;④ 乳腺原发病灶为良性、癌前病变或原位癌;⑤ 临床、病理学及影像学资料不完整。最终入组171枚淋巴结,其中10枚淋巴结为经超声引导下前哨淋巴结活检术证实,161枚淋巴结为ALN清扫术后病理学检查证实。
采用美国GE公司的Discovery MR750W 3.0 T MRI扫描仪,8通道专用相控阵表面线圈进行MRI扫描。患者采取俯卧位,双侧乳腺自然下垂于线圈内。矢状位T2WI-FS序列参数如下:重复时间(repetition time,TR)=3 259 ms,回波时间(echo time,TE)=102 ms,层厚=4.0 mm,带宽=50×2,视野(felid of view,FOV)=240 mm×240 mm,矩阵=288×224,激励次数=2,扫描时间共93 s。
通过分析术前影像学诊断报告来评估基于常规诊断方法在ALN病理学状态预测中的价值,具体分为3种情况:① 给予临床治疗错误指导(将转移淋巴结诊断为阴性或倾向为阴性,非转移淋巴结诊断为转移或倾向为转移);② 给予临床有效正确指导(转移淋巴结诊断为转移,或倾向为转移;非转移淋巴结诊断为非转移,或倾向为非转移);③ 对临床治疗未提供任何有价值的信息,如仅建议跟踪随访,未给予任何倾向性的诊断。
将矢状位T2WI-FS图像提取为DICOM格式,上传至慧影医疗科技(北京)有限公司的汇医慧影放射组学云平台,手动勾画目标ALN作为三维容积感兴趣区(volume of interest,VOI),进行T2WI-FS图像特征自动提取。勾画VOI时,由1名影像科初级医师(工作9年)手动勾画VOI,由另一名影像科高级医师(工作21年)确认分割结果,意见不一致时通过讨论达成一致。
每个VOI自动提取定量成像特征共107个,共分为3组。第一组为一阶统计量特征,反映MRI图像中体素信号强度分布的特征组成,包括均数、方差、均方根、偏度、峰度、均匀度、能量和熵值等18个参数;第二组为几何形状特征,反映肿瘤形状和大小特征,包括表面积、体积、表面积体积比(surface volume ratio,SVR)、致密度、偏心度、球形度、最小轴长度和第二大轴长度等共14个参数特征;第三组为纹理特征,可定量评估感兴趣区域的空间异质性,包含基于灰度共生矩阵(grey level co-occurrence texture matrix,GLCM)、灰度游程矩阵(grey level run length matrix,GLRLM)、灰度区域大小矩阵(gray level size zone matrix,GLSZM)、灰度相关矩阵(gray level dependence matrix,GLDM)及邻域灰度差矩阵(neighboring grey tone dependence matrix,NGTDM)4种方法提取的75个定量特征。
采用SPSS 19.0软件进行统计学分析。由于淋巴结短径不符合正态分布,因此采用非参数秩和检验(Mann-Whitney U检验)方法对ALN转移组和非转移组短径进行比较。采用双样本t检验对两组患者年龄进行比较。采用χ2检验分析两组患者组织学类型和免疫组织化学标志物[雌激素受体(estrogen receptor,ER);孕激素受体(progesterone receptor,PR);人表皮生长因子受体2(human epidermal growth factor receptor 2,HER2);Ki-67增殖指数]的水平。P<0.05为差异有统计学意义。
在汇医慧影软件Radcloud平台中进行特征筛选及降维,使用计算机生成的随机数据集将转移及非转移ALN按照8∶2分配为训练集及验证集。对训练集数据采用K最佳及最小绝对收缩和选择算子(the least absolute shrinkage and selection operator,LASSO)算法依次降维,从而获得最优特征。
基于训练集筛选的最优特征,在Radcloud平台中采用K近邻(K-nearest neighbor,KNN)、支持向量机(support vector machine,SVM)和逻辑回归(logistic regression,LR)3种分类器构建转移及非转移ALN分类预测模型。在验证集上对训练集所构建模型效能进行验证,对3种模型在训练集与验证集中的分类预测效能进行评价。分类模型性能评价指标包括受试者工作特征(receiver operating characteristic,ROC)曲线分析所得ROC曲线的曲线下面积(area under curve,AUC)、灵敏度、特异度、精准度、召回率和F1值。使用Medcalc 15.2.2软件中的DeLong法比较不同预测模型间的AUC差异,P<0.05为差异有统计学意义。
ALN转移组和非转移组患者的临床资料中,除两组间ALN短径及年龄差异有统计学意义外,其他资料差异均无统计学意义(表1)。
表1 ALN转移组和非转移组乳腺癌患者的临床资料 n
68例患者中,55例(80.9%)患者经影像科医师诊断给予临床治疗有效指导;4例(5.9%)给予临床治疗错误指导(图1);且在9例(13.2%)患者的影像学诊断报告中未提供对指导临床治疗有价值的信息(图2)。图1、2的ALN均未见脂肪门,形态及信号特点大致相仿。
图1 典型病例1影像图
图2 典型病例2影像图
在训练集中,使用K最佳法从107个特征中筛选出55个特征(图3),然后通过LASSO算法降维获得6个最优特征(图4)。其中包括1个几何形态学特征和5个纹理特征。形态学特征为SVR,纹理特征分别为依赖熵(dependence entropy,DE)、游程熵(run entropy,RE)、归一化依赖不均匀性(dependence non uniformity normalized,DNN)、游程比(run percentage,RP)及大区域的高灰度值优势(large area high gray level emphasis,LAHGLE)。在6个特征中,几何形态学特征SVR在LASSO算法回归中系数最大,提示其与淋巴结转移的相关性最强,对于区分淋巴结病理学状态的作用最大。
图3 使用K最佳法筛选出的55个特征
图4 使用LASSO算法降维筛选出的6个最优特征
在训练组中,KNN、SVM、LR这3种预测模型的AUC分别为0.92、0.87、0.88;在验证组中,3种模型的AUC分别为0.86、0.86、0.88(表2)。LR模型评价ALN转移组的精准度、召回率、F1值较高,分别为0.80、0.86、0.83(表3)。DeLong检验显示差异模型两两比较差异均无统计学意义(P>0.05,表4)。
表2 3种预测模型对ALN转移的诊断性能比较
表3 通过精准度、召回率、F1值评价3种分类器的诊断效能
表4 3种预测模型对ALN转移的诊断效能比较的统计学结果
本研究通过提取基于T2WI-FS图像ALN的影像组学高通量特征,筛选出最佳特征,构建机器学习模型对乳腺癌ALN病理学状态进行预测,发现基于3种分类器的机器学习模型均具有较高的预测效能,提示基于ALN磁共振图像的影像组学特征在预测ALN转移方面有较高的稳定性,在传统影像学诊断的基础上可提供额外有价值的信息。
本研究发现在所有提取的影像组学特征中,几何形态学特征(1/6)和纹理特征(5/6)在预测乳腺癌ALN病理学状态中具有较高的参考价值,提示这两类特征可作为术前有效预测乳腺癌ALN病理学状态的潜在无创生物标志物。SVR为所筛选的唯一几何形态学特征,也是与淋巴结病理学状态相关性最高的特征,该值越低提示淋巴结越接近球形,转移可能性越大,这与临床上MRI图像上长短径之比变小(接近球形)的淋巴结倾向于恶性淋巴结的诊断标准相一致[15],提示影像组学中的几何形态学特征可通过一种更加客观、定量的方式量化转移淋巴结和非转移淋巴结几何形态学的差异,有效地辅助淋巴结病理学状态的判别,也说明医师基于经验的先验知识有助于寻找和定义特异性更强的影像组学特征,医工交叉、医师与图像工程师的共同参与是影像组学发展的必然趋势。
另外,本研究发现,纹理特征通过反映图像灰度空间异质性对于区分淋巴结病理学状态也有一定的作用。5个纹理特征分别为DE、RE、DNN、RP及LAHGLE。其中,RP和RE为基于GLRLM特征,DE和DNN为基于GLDM特征,LAHGLE为基于GLSZM特征。有研究[16]显示,基于不同矩阵的纹理特征反映不同的灰度空间相关特性或体素强度的空间分布。DE表示灰度依赖的熵值,RE表示游程长度和灰度分布的熵值,两者均可提示图像纹理的异质性强弱[17],熵值越大,表明病变在细微结构排列上有区别,图像异质性越强,与本研究中转移淋巴结熵值更高的结果相一致。RP通过在ROI中计算运行次数和体素数的比值来衡量纹理的粗糙程度,该值越大,短游程越多,表明纹理越细,DNN可衡量图像中灰度依赖程度的相似度,数值越低,像素依赖程度越均匀[18]。LAHGLE可评估图像中较高灰度值区域联合分布的比例[19],有助于预测宫颈癌的淋巴结转移[20],本研究也发现,该值越大,ALN转移可能性越大,原因可能是由于癌灶转移后,癌细胞具有的黏附性强于正常淋巴细胞,转移到该淋巴结的癌细胞越多,淋巴结中区域细胞团块的数量越多,从而表现为LAHGLE变大。
本研究中影像科医师基于常规MRI图像评估淋巴结转移给予临床正确指导的准确度约为80.9%(55/68),提示医师单纯基于淋巴结影像学表现的传统诊断方式存在一定的局限性,仍有部分乳腺癌患者的ALN病理学状态术前无法精确判断,影响临床医师制订个体化治疗方案。本研究发现,单纯基于T2WI图像ALN的影像组学特征构建的机器学习模型均能达到较高的诊断效能,可在单纯基于淋巴结影像学表现的传统诊断方式的基础上为术前预测乳腺癌患者ALN病理学状态提供额外有价值的信息。
本研究尚存在以下不足:第一,样本量偏小,且为回顾性研究,不能完全排除选择偏倚的可能。目前临床上即使基于病理学检查也无法达到淋巴结病变性质与金标准一一对应。为此,我们设计了严格的纳入和排除标准,兼顾ALN的病理学检查结果和常规影像学表现,目的是更严谨地挑选临床上病理学状态判断存在困难的ALN,今后应设计更好的前瞻性研究尽可能做到病理和影像学结果与ALN的一一对应。第二,乳腺癌病灶的VOI轮廓是由影像科医师手工勾画的,耗时较长,且在勾画者之间存在主观不一致性,但目前基于医师经验的分割仍为金标准,今后可开发应用更加成熟的人工智能自动分割算法,以提高分割速度和降低主观不一致性。第三,本研究主要分析了T2WI-FS序列,未纳入DWI、动态对比增强MRI等能反映功能信息的序列,今后需对功能序列进行影像组学分析。
综上所述,基于T2WI-FS图像提取影像组学特征构建机器学习模型,能够客观地反映乳腺癌ALN内部的几何形态学及空间形态学异质性特征,在术前预测乳腺癌ALN转移方面具有较高的诊断效能,有望为临床医师制订治疗方案提供额外有价值的参考依据。