张 钒 陆正大 李春迎 焦竹青 倪昕晔
由于人体各组织声阻抗的差异性,不同组织反射的信息亦有不同,超声能体现不同组织的声信号,并显示不同的亮度,从而形成层次分明的切面图像[1]。相较于X 线、CT 等,超声无电离辐射,且成像速度快,对软组织及血流有较好的成像效果[2]。目前,图像分割在医学诊断中十分重要,能用于可视化分析、图像引导放疗和手术等[3]。但超声图像存在高散斑噪声、低信噪比和强度不均等问题,简单的图像分割方法不能获得理想的分割结果[4]。因此,自动准确地分割超声图像是一项具有挑战性的任务。目前,超声图像分割主要应用于乳腺、肝脏、前列腺、妇科、甲状腺等疾病诊断,以及颈动脉超声图像分类等领域。本文就超声图像分割的传统方法、基于形变模型的分割方法及结合深度学习方法的研究进展进行综述。
传统的超声图像分割方法主要是人为根据临床经验手动分割,其精度不能满足临床需求。根据方法不同大致可以归类为基于边缘检测的方法和基于区域生长的方法,前者根据图像中感兴趣区域与其相邻区域不连续的性质进行分割;后者利用局部相似实现图像分割。
边缘检测法是通过检测相邻像素特征值的突变性,提取图像的所有边缘,利用此类算法提取特定区域的边缘以有针对性地改进算法本身,或对提取的边缘图像进行一定的预处理。边缘检测法可分为阈值分割法、聚类法及马尔科夫随机场等方法。阈值分割法是通过设定不同的特征阈值,将图像像素点进行分类,计算简便且较为稳定快速;聚类法可分为k-means(k均值)聚类法和分层聚类法,k-means聚类法是按照一定的方法度量样本间的相似度,然后通过不断的迭代来更新聚类的中心,当中心不再变动时,说明图像分割完成;分层聚类法是将每个像素各自分为一类,通过迭代将最近的两类合并形成新的类。Saranya 等[5]提出了常规k-means的3种变体,即正则化k-means、模糊k-means和正则化模糊k-means来分析和克服乳腺分割鲁棒性低的问题,准确率达98%。Shao 等[6]采用基于最大类间方差(Otsu)法和差分搜索算法的多级阈值分割法对模拟超声图像进行分割,结果表明相较于传统的区域增长、活动轮廓模型等方法,该算法的分割效果得到了最大的相似度和最小的面积误差。Shao 等[7]基于隐马尔科夫模型结合Otsu 法进行图像处理,采用改进的矢量法进行修复,提高了图像的可识别性,建立了可靠的特征提取算法,以及综合诊断模型,并通过实验验证了该模型具有一定的临床价值。
赫新雨等[8]提出了一种基于脊柱超声边缘生长的边缘提取方法,直接对图像中特定区域边缘附近像素点的灰度值与灰度阈值进行逐点比较,并利用边缘点的特点(平滑性和连续性等)进行选择与排除,与边缘检测法相比能较大程度地减少斑点噪声对边缘提取的影响。倪豪等[9]结合Otsu法先对超声图像做预分割,以此确定绝对背景区自动设置种子的起始点,然后再通过区域生长法将其从背景中分割,最后通过数字形态学降噪法进一步提高缺陷的识别度,分割时间为1984 ms,在兼顾分割质量的同时也能缩短时间。Fan等[10]结合迭代四叉树分解(QTD)和病灶的灰度特征建立两个约束条件来定位病灶内的种子,再根据提取区域的最大变化率,采用渐进均分算法对最优阈值进行无限逼近,对96 张病灶图像分割的结果显示,该方法能自动找到病灶内的种子,准确率达92.27%,平均耗时为12.02 s。在图像样本较多的情况下,其分割效率高于人工分割。
由于超声图像灰度不均且边缘不一定连续,存在一定的斑点噪声及伪影,分割时可能会出现伪边缘,无论是边缘检测法还是区域生长法均存在分割准确率不足的问题,且区域生长法的分割结果受种子点的影响较大。随着各种辅助方法的结合,传统分割方法大部分情况下可用于超声诊断的参考,但因其算法本身的不足,分割时间往往较长,不能对实时动态的超声图像进行高效分割,具有一定局限性。
为解决传统分割方法算法的缺陷,将形变模型用于超声图像分割的方法已广泛应用。其中水平集模型是一种利用整幅图像信息而非梯度信息来引导曲线进行边缘分割的方法,对边缘信息较弱的图像具有很好的分割效果。Chan 和Vese[11]提出的CV 模型是一种经典的水平集模型,其是基于MumfordShah(MS)模型,通过假设区域内图像灰度均匀提出的一种基于全局信息的无边缘主动轮廓分割模型,该方法对灰度均匀图像的分割效果较好。Li 等[12]提出了局部区域可控的拟合(RSF)模型,能实现对灰度不均匀图像的分割。RSF 模型以局部信息为依据,因此初始轮廓对分割结果影响较大。为解决初始轮廓精度不高对灰度不均超声图像分割的问题,邵蒙恩等[13]提出了一种结合全局信息和局部信息的CV-RSF 模型对甲状腺结节进行分割,可降低RSF 模型的敏感性,实现准确分割。不同组图像的分割结果与医师手动分割的重叠率分别为99.17%、99.58%、99.83%,均优于RSF 模型的97.83%、99.23%、97.98%。但该分割方法对初始轮廓仍有一定依赖,为此,邵蒙恩等[14]在CV 模型中引入一个基于梯度的边缘引导函数,根据面积变化自动勾画甲状腺结节的粗分割轮廓,并解决手动设置迭代次数的问题,从而实现甲状腺结节图像有效、准确、自动分割,平均重叠率为0.9064±0.0355,且在迭代次数上也小于CV 模型和RSF模型。但该研究样本量仅30例,后续还需更多的数据验证其普遍性和准确性。Bi 等[15]基于水平集模型引入局部瑞利分布拟合能量来处理超声图像的不均匀性,以实现对子宫图像的分割,无论对模拟或真实图像均有很好的分割精度,平均骰子相似系数(DSC)可达0.95±0.02。
此外,Kass等[16]提出的snake模型也是一种活动轮廓模型,分割结果对初始轮廓较敏感,但对复杂多变的边缘提取效果较差。因此,Ma 等[17]提出了基于局部相位改进的snake 模型,在snake 框架中使用强度不变的局部相位特征来生成图像能量,能对血管超声图像进行分割,DSC 为0.933±0.013。与传统的基于梯度的图像能量不同,基于局部相位的图像能量在所有边缘上均相同,从而能实现准确分割,但对一些边缘泄露部位仍然无法处理。Mcinerney 和Terzopoulos[18]提出一种自适应拓扑主动轮廓模型(T-snake),其能够根据轮廓变化自适应地改变拓扑结构,对初始轮廓的要求较低,对CT 和MRI 图像分割效果较好,但对有斑点噪声、边界连续性差、灰度不均匀的超声图像分割结果还需进一步验证。周春瑜和程显毅[19]将自适应滤波与改进的T-snake模型相结合,能有效抑制斑点噪声,有助于解决甲状腺超声图像边缘特征不明显、灰度不均的问题。
目前,基于形变模型分割方法的研究已取得一定进展,分割质量较佳,且分割时间较传统方法有一定缩短,在超声图像分割中应用比较多。但上述方法结合了先验形状信息来针对图像噪声和伪影的鲁棒分割,由于不同器官或组织的特异性,上述方法在某些情况下不能准确描绘边界,存在边界模糊或缺失等问题,今后应针对如何实现高质量、高效率的分割进一步研究。
深度学习是在超声图像分割中非常实用的方法,与传统的具有手工特征的机器学习方法相比,深层神经网络的主要优点是能够生成由丰富语义和细微信息组成的多层次特征。近年来,卷积神经网络(CNN)、全卷积网络(FCN)及对称分割网络(U-Net)在医学图像分割中的效果突出。CNN通过对下采样的低维特征图进行特征提取,再经上采样将其特征映射到高维空间,以此输出分割掩模;FCN将CNN中的全连接层改为卷积层,并在上采样加入反卷积以恢复图像,最后输出分割掩模;U-Net则是在下采样过程中加入了多次卷积,再在上采样中与对应的下采样层建立连接层进行特征融合,最后输出分割掩模。目前主流的深度学习超声分割方法多基于此3 种网络进行优化和改进,深度学习的超声分割在乳腺、前列腺、甲状腺、颈动脉超声诊断中已有广泛研究,但由于不同组织间超声成像的差异,对不同部位超声图像的分割往往需要对网络做出相应的调整和优化。
乳腺中有大量的脂肪组织,对比度低,阴影较多,故病灶边界较模糊,易出现过分割现象。Xu 等[20]使用CNN 在三维超声图像上将乳腺超声图像分割成皮肤、纤维腺组织、肿块和脂肪组织4个部分,使用3个正交面提取图像块,加入了基于距离的评估指标修正豪斯多夫距离,较单一平面效果更好,仅在小部分边缘脂肪组织上出现过分割现象,准确率和回归率均达80%以上,可作为乳腺肿瘤评估的参考依据。Hu 等[21]将扩展的FCN 与基于相位的活动轮廓模型相结合,进一步提高了分割结果,DSC 为88.971±0.010。Fang 等[22]设计了基于FCN 和主动轮廓模型的超声图像二维乳腺肿瘤自动分割方法,将基于FCN 的M-Net 结合基于相位的活动轮廓模型进行乳腺肿瘤二维超声图像自动分割,加快了训练过程,性能优于U-Net 和V-Net 分割,其DSC 为0.9689,豪斯多夫距离为6.96 个像素点。之后,Lee 等[23]提出了一个多尺度网格平均池化的通道注意模块,用于超声图像中乳腺癌区域的精确分割,该模块的加入使网络能同时使用全局和局部空间信息进行精确分割。由于CNN 中的卷积运算往往聚焦于局部区域,导致目标部位病灶分割精度下降,Xue 等[24]开发了一种带有全局引导块和乳腺病灶边界检测模块的深度CNN,用于增强乳腺超声病灶分割,能有效提高分割结果的边界质量,DSC为0.821±0.011,准确率为(96.9±0.5)%。
前列腺超声图像自动分割对于超声引导的前列腺干预和治疗计划至关重要。但因经直肠超声中前列腺边界缺失或模糊、回声强度分布不均匀,以及前列腺病灶形态的不确定性,自动分割仍具有挑战性。Lei 等[25]提出基于多方向深度监督V-Net 的前列腺超声图像分割,DSC 达0.92±0.03,V-Net 各阶段引入了三维监督机制,解决了在训练数据有限时深度网络训练优化困难的问题,可能成为前列腺癌诊断和治疗的有效工具。Karimi 等[26]提出两种策略来提高困难图像的分割精度:一是采用自适应采样策略对CNN进行训练,鼓励训练过程中更多地关注图像中难以分割的部分;二是训练一个CNN 模型集成,利用集成之间的差异性来识别不确定的分割图,降低出现误分割的可能性,DSC 达0.939±0.035,豪斯多夫距离为(2.7±2.3)mm。Wang 等[27]利用CNN 不同层次编码的互补信息,开发了一种新型三维深度神经网络,该网络配备了注意模块,能使用不同层的多层次特征,并细化每一个体层的特征,在CNN 的浅层抑制非前列腺噪声,并在深层特征中增加更多的前列腺细节,提高了分割的准确性。
甲状腺超声图像存在强度不一的斑点噪声,且周边组织复杂,有时会出现多个结节,难以准确定性诊断,因此对自动分割的精度要求较高。Buda 等[28]对比使用基于卡尺生成近似结节掩模和手工标注与卡尺自动导引相结合的分割方法,发现加入卡尺自动引导后的分割性能更好,DSC 从0.851 提升到0.904。Yang 等[29]提出了一种基于先验水平集与深度CNN 相结合的甲状腺滤泡肿瘤分割分类方法,采用Res-U-net 框架和基于先验的水平集方法进行增强互补,获得了更准确的分割结果。Webb等[30]使用基于递归FCN的深度学习语义分割甲状腺及其内部囊肿和结节,有效提高了甲状腺特征的分割效果,但由于数据集较少等原因,对甲状腺内部囊肿和结节的分割结果仅可用于辅助参考。
颈动脉斑块的定量研究对评估和监测颈动脉粥样硬化的进展具有重要意义,自动分割技术有助于更清晰地监测病灶。Zhou 等[31]提出了一种基于深度学习的颈动脉三维超声图像中中外膜和内腔内膜的半自动分割方法,将分割问题转化为像素分类问题,能更高效地进行分割,DSC 为0.9284±0.0446。蔡梦媛等[32]基于二维超声提出一种深度学习的颈动脉斑块自动分割方法,改进了U-Net 网络结构,并融合了残差网络和PReLU激活函数,对颈动脉斑块分割的效率和精度有一定提高,DSC为0.8945±0.0345,但在其训练和验证过程中缺乏足够的数据集,存在一定局限性。Jain 等[33]使用单个深度学习和混合深度学习模型实现了颈内动脉斑块的自动分割,DSC 为0.900,在分割精度和速度方面均有很好的性能。
深度学习算法一般需要大量的训练数据集,但在超声图像中准备大量的标记数据集非常困难。为解决这一问题,Behboodi 和Rivaz[34]提出模拟超声图像训练U-Net 深度学习分割架构,并测试超声设备收集的组织模拟影像数据,阐述了模拟数据上的训练体系结构转换为真实数据的可行性,但仍需通过真实试验来验证并完善。总之,基于深度学习的超声分割具有分割速度快、质量高等优点,但其所需的样本标签有一定的获取难度,在无足够数据的情况下分割效果可能与传统方法相近。另外,由于不同组织超声成像的差异性,不同部位的分割网络往往不能通用。
超声图像因其成像原理等问题分割困难,但其具有无创、价格低等优势,在临床诊断及放疗靶区勾画等方面仍有重要作用。阈值分割法、区域生长法等传统方法原理简单,处理单帧清晰的超声图像时分割效果较好,但分割速度慢且区域生长法的分割质量还受种子点影响;活动轮廓模型收敛速度较快且稳定性好,但其分割结果依赖于初始轮廓,不能实现自动分割;基于深度学习的方法是目前超声图像分割领域的研究热门,其分割质量高、速度快,但训练过程需大量标签数据,广泛应用具有局限,且不同组织的图像往往需要重新训练或使用其他网络。
总之,图像分割的研究对提高后期医学图像分析具有积极意义,为提高超声图像分割的质量,可以将深度学习算法与传统分割方法结合,以实现优势互补来提高分割质量,同时使用数据增强等方法来扩充数据集。此外,无监督网络也可用于超声图像分割,以解决数据稀少和推广性不高的问题。总之,虽然目前超声图像分割方法均有一定局限,但随着传统方法的不断改进和深度学习算法的广泛应用,其具有良好的应用前景。