周玮珺 刘 勇 徐 平 吴兰英 王 颖 肖 榕 杨 敏
乳腺癌是目前发病率最高的恶性肿瘤[1-2],随着2013 版BI-RADS 分类[3]的广泛应用,目前临床对乳腺癌的诊断准确性已大大提高。剪切波弹性成像(shear wave elastography,SWE)能在BI-RADS 分类基础上提高乳腺癌筛查的准确性,但BI-RADS 4 类乳腺良性病变的非必要活检发生率仍较高[4-5]。影像组学可从不同模态影像数据中高通量提取影像组学特征[6],有效鉴别肿瘤良恶性[7]。列线图作为一种定量、客观的图像分析方法[8],使预测模型更具可操作性和实用性。基于此,本研究拟构建一种结合临床资料、SWE 参数及超声影像组学的列线图模型,并探讨其对BI-RADS 4 类乳腺病变良恶性的鉴别诊断效能,以期减少良性病变非必要活检。
回顾性收集3 家医院共403 例经病理证实的BIRADS 4 类乳腺病变患者资料,年龄18~84 岁,平均(40.99±14.23)岁。共403 个乳腺病灶,其中良性病灶285 个,包括纤维腺瘤198 个,导管内乳头状瘤46 个,硬化性腺病30 个,良性分叶状肿瘤11 个;恶性病灶118 个,包括浸润性导管癌100个,导管内原位癌9 个,浸润性小叶癌5 个,黏液癌4 个。以2017 年12 月至2019 年6 月南京鼓楼医院的172 个乳腺病灶和2019 年6~12 月安徽医科大学第一附属医院的110 个乳腺病灶作为训练集,以2022 年4 月至2023 年6 月北京世纪坛医院的121个乳腺病灶作为验证集。根据病理结果将训练集和验证集分别分为良性组和恶性组。训练集中,良性组205 个,恶性组77 个;验证集中,良性组80 个,恶性组41 个。纳入标准:①均为单发病灶;②均于手术或穿刺活检前2 周内进行常规超声、SWE 检查且图像清晰;③临床、病理及影像资料完整。排除标准:①乳腺癌或其他恶性肿瘤病史;②妊娠、哺乳期或假体植入患者;③SWE 图像质量差。本研究经医院伦理委员会批准,所有患者均签署知情同意书。
1.仪器:训练集超声检查使用迈瑞Resona 7彩色多普勒超声诊断仪,验证集超声检查使用迈瑞Resona 8彩色多普勒超声诊断仪,L11-3线阵探头,频率3~11 MHz。
2.检查方法:常规超声检查按照《中国抗癌协会乳腺癌诊治指南与规范(2017年版)》[9]要求采集图像,记录病灶最大切面长轴径值,并根据2013 版BI-RADS分类标准[3]进行分类。然后进行SWE 检查,于患者屏气时选取病灶最大切面最佳灰阶图像,启动Elasto 按钮,选择STE 模式,剪切波速度阈值设为0~10 m/s,将病灶置于感兴趣区中心,包括部分正常腺体或脂肪组织;保持探头与皮肤垂直,勿施加压力,于质控图像质量为100%时冻结图像;按Measure 按钮,采用轨迹法沿病灶边界进行描记,系统自动获取病灶内部剪切波速度最大值、最小值、平均值及中位数(SWVmax、SWVmin、SWVmean 及SWVmedian),每个病灶均重复测量3 次取平均值。以上操作由3 名具有5 年以上乳腺检查经验的超声医师完成,意见不一致时经协商达成一致意见。
3.超声影像组学特征提取:由两名高年资主治超声医师在未知病理结果的情况下使用开源软件ITK-SNAP 3.6.0(http://www.itksnap.org)对病灶灰阶超声图像进行分割(图1),再应用MATLAB 2013a 平台(美国MathWorks公司)提取影像组学特征。从每个乳腺病灶的灰阶超声图像中共提取396 个影像组学特征,包含42 个一阶特征、9 个形态特征、300 个纹理特征(含180个灰度游程矩阵特征、11个灰度区域大小矩阵特征、109 个灰度共生矩阵特征)及45 个小波特征。2 周后采用简单随机抽样法抽取30 个病灶,由其中一名医师以同样的方法再次进行图像分割,计算组内相关系数(ICC)评估观察者间和观察者内重复性,保留ICC≥0.75的影像组学特征并进行Z-score标准化处理,在训练集中采用最小绝对值收缩和选择算子算法及多因素Logistic回归分析得到最优特征,计算特征相应的系数并获得影像组学评分(Rad-score)。
图1 BI-RADS 4B类病灶灰阶超声图像(A)及分割图像(B)
4.模型构建:基于训练集,采用单因素分析临床资料、Rad-score 及SWE 参数,选取P<0.05 的参数进行多因素Logistic 回归分析,筛选鉴别BI-RADS 4 类乳腺病变良恶性的影响因素,采用向后逐步法,构建预测BI-RADS 4类乳腺病变良恶性的模型并绘制列线图。
应用R 语言(版本4.2.0,http://www.Rproject.org)进行统计分析。使用Kolmogorov-Smirnov 检验分析计量资料的正态性,符合正态分布的计量资料以表示,采用t检验;不符合正态分布的计量资料以M(Q1,Q3)表示,采用Mann-WhitneyU检验。绘制受试者工作特征(ROC)曲线分析Rad-score、SWE参数及列线图模型鉴别训练集和验证集中乳腺病变良恶性的诊断效能,曲线下面积(AUC)比较采用Delong检验。绘制校准曲线并采用Hosmer-Lemeshow 拟合优度检验评价列线图模型的校准度,P>0.05 示模型校准度高;绘制临床决策曲线,通过量化验证集在不同阈值概率下的净收益来确定列线图模型的临床适用性。P<0.05 为差异有统计学意义。
训练集及验证集中恶性组年龄、病灶大小、SWVmax、SWVmin、SWVmean 和SWVmedian 均高于良性组,差异均有统计学意义(均P<0.001)。见表1,2。
表1 训练集中良性组与恶性组临床资料、SWE参数和Rad-score比较
表2 验证集中良性组与恶性组临床资料、SWE参数和Rad-score比较
对两名超声医师提取的影像组学特征进行重复性检验,结果提示有209 个特征的ICC≥0.75。经过特征筛选,最终纳入系数非零的13个影像组学特征用于计算Rad-score,公式为:Rad-score=-0.151*original_firstorder_Minimum-0.800*wavelet_LH_glcm_Correlation+0.089*wavelet_HL_firstorder_Skewness+0.296*wavelet_LL_glcm_Idmn-0.566*wavelet_LH_firstorder_Skewness-0.458*log_sigma_5_0_mm_3D_firstorder_Skewness+0.068*original_glcm_ClusterShade-0.129*wavelet_HH_firstorder_Mean-0.009*wavelet_LH_glcm_Imc2+0.297*wavelet_LL_gldm_DependenceEntropy+0.348*wavelet_HH_firstorder_Median+0.244*log_sigma_5_0_mm_3D_gldm_DependenceNonUniformityNormalized-0.111*log_sigma_4_0_mm_3D_glszm_SmallAreaLowGrayLevelEmp hasis-0.673。训练集及验证集良性组与恶性组Radscore比较差异均有统计学意义(均P<0.001)。见表1,2。
将上述差异有统计学意义的参数纳入多因素Logistic回归分析,结果显示患者年龄、SWVmax和Radscore 均为鉴别BI-RADS 4 类乳腺病变良恶性的独立影响因素[OR=1.107(95%可信区间:1.062~1.160)、3.919(95%可信区间:2.025~8.708)、4.180(95%可信区间:2.433~8.045),均P<0.001]。基于以上因素构建预测模型,绘制的列线图见图2。
图2 鉴别BI-RADS 4类乳腺病变良恶性的列线图
1.ROC 曲线分析显示,列线图模型鉴别训练集及验证集BI-RADS 4 类乳腺病变良恶性的AUC 均高于SWVmax 和Rad-score 单独应用,差异均有统计学意义(Z=2.42、4.01,均P<0.05)。见表3,4和图3。
表3 SWVmax、Rad-score及列线图模型预测训练集中BI-RADS 4类乳腺病变良恶性的诊断效能
表4 SWVmax、Rad-score及列线图模型预测验证集中BI-RADS 4类乳腺病变良恶性的诊断效能
图3 列线图模型、SWVmax 及Rad-score 鉴别BI-RADS 4 类乳腺病变良恶性的ROC曲线图
2.校准曲线分析显示,列线图模型在训练集和验证集的校准度均高(χ2=6.19、4.12,P=0.721、0.903)。见图4。
图4 列线图模型在训练集(A)及验证集(B)的校准曲线图
3.临床决策曲线分析显示,当阈值概率>5%时,使用列线图模型鉴别验证集中BI-RADS 4 类乳腺病变较全部治疗(假设所有病变均为恶性)或全部不治疗(假设所有病变均为良性)能获得更高的临床收益,且使用列线图模型预测乳腺恶性病变的收益较仅使用SWVmax或Rad-score更高。见图5。
图5 列线图模型、SWVmax及Rad-score在验证集的临床决策曲线图
术前准确预测BI-RADS 4 类乳腺病变良恶性有助于患者治疗方案的制定,降低穿刺活检率,从而减低穿刺并发症的发生、减少医疗资源的浪费。目前国内外学者提出多种方法用于提高对BI-RADS 4类乳腺病变的诊断准确率,包括针吸穿刺活检术、超声弹性成像、超声造影等,但均存在一些并发症或使用禁忌症等。本研究构建了一种结合临床资料、SWE 参数及影像组学的列线图预测模型,旨在提高鉴别BI-RADS 4 类乳腺病变良恶性的诊断效能,以期减少良性病变非必要活检。
本研究对比分析了训练集及验证集中良性组与恶性组患者年龄,结果显示恶性组年龄均高于良性组(均P<0.001);多因素Logistic 回归分析显示年龄为鉴别BI-RADS 4 类乳腺病变良恶性的独立影响因素(P<0.001)。既往研究[10-11]表明,在≥25 岁人群中,随着年龄的增长,乳腺癌整体发病率也增高,且亚洲女性乳腺癌发病年龄集中在40~69岁。本研究结果与其一致,恶性组患者年龄分布在50 岁左右,表明年龄是影响乳腺癌发病的重要因素。
超声弹性成像技术通过分析病灶硬度来判断其性质,是一种相对客观的组织硬度评估方法,其中SWE 的可重复性较应变式弹性成像更佳,对BI-RADS 4 类乳腺病变良恶性的鉴别具有较高的诊断效能[12]。李易凤等[13]研究发现SWVmax 鉴别乳腺病变良恶性的效能最高,能提高BI-RADS 4A 类乳腺病变的诊断特异度及准确率,并有效减少BI-RADS 4A 类乳腺病变非必要的穿刺活检或手术。本研究应用SWE 检测乳腺病变,结果显示训练集及验证集中恶性组SWVmax、SWVmin、SWVmean 及SWVmedian 均高于良性组,差异均有统计学意义(均P<0.001);多因素Logistic 回归分析显示SWVmax 为鉴别BI-RADS 4 类乳腺病变良恶性的独立影响因素(P<0.001),与上述研究结果一致。本研究应用SWVmax鉴别BI-RADS 4类乳腺病变良恶性具有较好的诊断效能,其在训练集和验证集的AUC 均较高(分别为0.904 和0.915),但由于SWE 反映病灶硬度,部分恶性病变如黏液癌质地较软或质地中等[14],部分良性疾病如硬化性腺病质地较硬[15],导致良恶性病变之间的弹性参数存在重叠,增加了假阳性及假阴性结果出现的概率。
影像组学可以高通量地提取灰阶超声图像中肉眼无法识别的特征信息,无创反映肿瘤内部异质性[16]。前期研究[7]通过对灰阶超声图像提取影像组学特征用于鉴别乳腺病变良恶性,结果显示其诊断效能与高年资主治医师诊断水平相当,且观察者间重复性较好。本研究在前期研究基础上,通过影像组学分析BI-RADS 4 类乳腺病变的灰阶超声图像,获得13 个系数非零的影像组学特征,包括6 个一阶特征和7 个纹理特征,与Wang 等[17]研究结果相似。其中一阶特征主要描述病灶图像内像素或体素强度的分布,灰度共生矩阵特征属于纹理特征,反映了肿瘤内部空间异质性[18],本研究基于上述影像组学特征计算获得Radscore,结果显示训练集及验证集中恶性组Rad-score均高于良性组(均P<0.001);且多因素Logistic 回归分析显示Rad-score 为鉴别BI-RADS 4 类乳腺病变良恶性的独立影响因素(P<0.001),与Luo 等[19]研究结果一致。根据临床诊断模型检验推荐方法[20],本研究采用独立外部数据作为验证集以检验Rad-score 的鉴别诊断效能,结果显示其在验证集中的AUC 为0.843,具有良好的诊断效能和泛化能力。由于影像组学特征能提示肿瘤的形态学信息,在一定程度上与肿瘤内部细胞异质性相关,可用于鉴别乳腺病变良恶性,有助于提高鉴别BI-RADS 4类乳腺病变良恶性的诊断效能。
本研究基于年龄、SWVmax 和Rad-score 构建鉴别BI-RADS 4 类乳腺病变良恶性的列线图模型,结果显示其在训练集及验证集中均具有较高的诊断效能(AUC分别为0.970、0.981),在验证集中的AUC均高于Rad-score 和SWVmax 单独应用(均P<0.05);且校准曲线显示该模型在训练集及验证集中的拟合度均良好,表明该模型预测BI-RADS 4 类乳腺恶性病变的概率与恶性肿瘤实际发生概率吻合度较高;临床决策曲线显示当预测概率为5%~99%时,使用列线图模型预测BI-RADS 4 类乳腺恶性病变的净收益高于单独使用SWVmax 和Rad-score,具有较高的临床适用性。对于BI-RADS 4 类及以上的乳腺病变,指南[3]建议进行穿刺活检,但BI-RADS 4 类病变涵盖了广泛的恶性预测概率(3%~94%),其中4A类病变恶性风险仅2%~10%,导致了很多非必要活检。本研究结果显示,列线图模型在验证集中的阴性预测值为92.8%,表明该模型能筛选出92.8%的良性病变免于穿刺活检,即可减少61.16%(74/121)的非必要活检,减轻了患者的痛苦和医疗资源浪费,与Wang 等[21]研究结果一致,提示联合临床资料、SWVmax 和Rad-score 综合诊断可以对乳腺病变进行有效分类,为减少非必要活检提供了依据。
本研究的局限性:①为回顾性研究,研究对象存在选择偏倚,且使用同一品牌超声诊断仪器,结果的适用性还需进行验证;②乳腺癌发生的影响因素较多,本研究仅选取患者基本信息及SWE 参数进行多因素分析,后期可将实验室检查指标如低密度脂蛋白等纳入分析,构建更全面的预测模型;③本研究仅对二维灰阶超声图像进行人工分割,不能完全展示病变的三维立体空间结构,可能导致抽样误差,后期可针对乳腺病变三维超声图像进行研究,获取更全面的影像组学信息。
综上所述,基于灰阶超声影像组学、SWE 参数及临床资料构建的列线图模型能有效鉴别BI-RADS 4 类乳腺病变良恶性,降低良性病变穿刺活检发生率,有一定的临床价值。