基于超声视频的深度学习在乳腺结节良恶性鉴别诊断中的价值

2023-12-03 17:53:26杨茹怡蔡叶华

中国医学计算机成像杂志 2023年5期

杨茹怡陈宏蔡叶华李梅

2020年全球癌症统计数据表明，乳腺癌已成为威胁女性健康的首位高发癌症［1］，因此，对于乳腺癌的早期发现、诊断和治疗显得尤为关键。近年来，深度学习在计算机视觉领域得到了广泛的应用［2］，其在医学图像分类领域的应用中取得了一系列的成果［3］。多示例学习（multiple instance learning， MIL）是由监督型学习算法演变出的一种方法，定义“包”为多个示例的集合，具有广泛的应用。本研究旨在探讨基于超声视频的深度神经网络多示例学习模型在乳腺结节良恶性鉴别诊断中的应用价值。

方法

1. 数据集

收集上海市静安区中心医院普外科乳腺结节手术病例285例，术后病理证实良性结节216例，恶性结节69例，术前均行超声检查，对病灶区进行纵切面连续扫查并获取超声影像视频完整资料，观察病灶的边界、形态、内部回声、有无钙化、彩色多普勒血流图像。

2. 深度学习模型

基于乳腺结节超声图像的影像组学分析流程主要包括以下步骤。（1）图像预处理：获取视频图像后，需要进行分帧处理并抽取静态图像中含有病灶的图像样本，以获取含病灶信息的图像数据集。（2）U-net图像分割：采用U-net 分割网络对乳腺超声图像进行分割，并经过后处理得到较为精准的分割掩模图像。（3）特征提取：基于原始含病灶图像及其对应的掩模图像，通过PyRadiomics 提取图像病灶特征。（4）两阶段特征选择：利用t检验和最小绝对收缩和选择算法（LASSO）进行两阶段的特征选择，实现高维特征信息的降维。（5）分类判决：采用逻辑回归（logistic regression， LR）算法对乳腺结节良恶性进行分类。

2.1 图像预处理

在进行定量分析之前，首先对乳腺超声视频进行分帧处理，将dicom 格式的视频图像转换为一系列静态图像，然后根据人工定位的病灶出现的起止位置，抽取出静态图像中含有病灶的图像子集。

2.2 U-net图像分割

近年来，U-net 网络架构在医学图像处理领域中被广泛应用，尤其在医学图像分割方面表现出了卓越的性能。该网络采用编码和解码的思想进行图像分割，具有完全对称的网络架构，并通过跳跃连接部分使用拼接操作进行特征融合。相比于其他分割网络，U-net 具有灵活、简单的优点，已成为医疗图像分割的主流方法。本研究利用训练好的基于现有数据集的U-net 分割网络模型，对乳腺超声静态图像进行分割推理，并采用开闭运算技术对其结果进行后处理，以获得更为精准的分割掩模图像（图1）。

图1 分割效果图（a～e为不同的病灶）

2.3 特征提取

PyRadiomics 是一个开源的python 软件包，可用于从医学图像中提取影像组学特征，支持3D 图像特征提取。图像可以是原始图像或经过滤波器处理的派生图像。本研究使用了PyRadiomics 提取影像组学特征，其中包括基于原始图像、高斯滤波器的拉普拉斯算子和小波滤波后的派生图像。高斯滤波器的拉普拉斯算子是一种边缘增强滤波器，参数sigma 可以设置，低sigma 值增强精细纹理，高sigma 值增强粗糙纹理。本研究sigma参数分别设置为3和5。小波滤波涵盖了8 种不同的组合模式，包括高通和低通滤波器。

本研究将每位患者的一组超声静态原始图像以及相应的分割掩模图像分别合并为nii 格式的三维图像时间序列；然后依据原图像与掩模图像分别提取3 种图像类型下的影像组学特征。本研究每种图像类型提取了7 种影像组学特征，分别是：（1）一阶统计量特征；（2）3D 形状特征；（3）灰度共生矩阵特征；（4）灰度级运行长度矩阵特征；（5）灰度级尺寸区域矩阵特征；（6）灰度级依赖性矩阵特征；（7）相邻灰调差异矩阵特征。

2.4 两阶段特征选择

利用t检验和LASSO 进行两阶段的特征选择。首先，采用t检验选择出具有统计学差异的特征，其次，通过LASSO 对经过t检验筛选后的特征子集进行降维处理，去除冗余信息和无关特征，从而选择出对诊断有益的特征子集。

2.5 LR分类

本研究采用逻辑回归算法对乳腺结节进行良恶性分类，选取筛选出的特征子集作为LR 分类器的输入数据。将特征子集以8∶2 的比例划分为训练集和测试集，并在训练集上训练分类器。通过网格搜索调整LR 模型的核函数参数获取最优模型，再将其应用于测试集进行分类判决。分类效果评估采用以下5 个指标：受试者工作特征（ROC）曲线的曲线下面积（AUC）、准确度、灵敏度、特异度和约登指数。

结果

1. 临床一般资料

共使用乳腺结节手术病例285 例，术后病理证实良性结节216例，恶性结节69例。其中良、恶性乳腺肿块患者平均年龄分别为（41.35±11.64）岁、（50.37±10.86）岁，训练集和测试集患者比例为8∶2，平均年龄分别为（46.66±13.05）岁、（46.99±11.06）岁。超声诊断为恶性病例中：US BI-RADS 3类占4.3%；US BI-RADS 4A 类占17.5%；US BIRADS 4B 类占29%；US BI-RADS 4C 类占39.1%；US BI-RADS 5类占10.1%；。

2. 特征提取及选择结果

使用PyRadiomics 对图像进行特征提取后，基于3 种图像类型共获得了1 051 个特征，经过两阶段特征选择后，共保留了17个特征。

3. LR算法分类结果

使用LR 算法进行分类，其中AUC 达到0.89，准确度为86.0%，灵敏度为85.7%，特异度为86.0%，约登指数为71.8%。同时，本文根据分类指标绘制了ROC曲线和混淆矩阵，如图2和图3所示。

图2 乳腺结节良恶性分类ROC曲线

图3 乳腺结节良恶性分类混淆矩阵

讨论

目前，超声是我国诊断及筛查乳腺癌的主要手段，但较依赖操作者经验，诊断结果差异较大［4］。为此，建立乳腺超声图像计算机辅助诊断系统，用于辅助乳腺肿瘤的分类，可以有效提高临床诊断效率，降低误诊率，对于乳腺疾病的防控任务具有重要的意义［5］。

深度学习算法已经在乳腺图像分析领域取得了多项研究成果［6］，但由于深度学习算法的复杂性和灵活性，其模型的构建仍然面临着许多挑战［7］。现有的计算机辅助诊断系统主要采用S-Detect［8］进行单帧图像分析，虽然可以提高就诊效率，但客观性缺失。例如，如何从视频序列中选择代表此病例的单帧图像，不同的医生可能选取不同的图像，这会影响计算机诊断的准确性。为了解决这个问题，本研究采用基于U-net和PyRadiomics的深度学习与影像组学相结合的方法对乳腺肿瘤视频序列进行分析，能够获取连续的超声视频中含有病灶信息的超声图像，以更精准地进行乳腺肿瘤诊断。

本研究运用深度学习对超声视频序列中提取特征图像进行了处理。利用PyRadiomics 提取图像病灶特征，并将原始图像与经过高斯滤波器、拉普拉斯算子和小波滤波器处理后的派生图像进行比较。针对高维特征信息，使用t检验和LASSO 进行两阶段的特征选择，并将其降维，最终选取了17 种特征，多数取于小波滤波后的派生图像，得到对诊断有益的特征子集。通过对LR 算法模型的训练，我们获得了分类准确度、灵敏度以及曲线下面积分别为86.0%、85.7%和0.890 的良好结果。有研究者使用迁移学习来克服模型训练时数据量有限的这一限制［9］，余美慧等［10］基于ResNet-50 建立的第2 次迁移学习模型鉴别诊断乳腺肿块良恶性的准确度为88.0%，灵敏度为82.7%，曲线下面积为0.915。本研究的模型灵敏度高于迁移学习模型的灵敏度，但由于数据量有限，准确度稍低。

综上所述，本研究采用了基于U -net 和PyRadiomics 的深度学习方法，并将其与影像组学相结合，以提高乳腺结节良恶性鉴别诊断的效能，克服单帧图像的缺陷，减少人为主观因素对结果的影响，可为临床医师提供决策参考，具有较高的临床应用价值。但本研究也具有一定的局限性，数据量较少，结果可能会有一定的偏移误差，需要多中心大样本量的研究验证。