徐京瑶,刘晓民,张新峰,郭伟,王飞,李相生*
乳腺癌是女性全球范围内发病率最高的恶性肿瘤,死亡率位居女性恶性肿瘤第4位。根据世界卫生组织国际癌症研究机构2020年的预估数据[1],全球新发癌症病例1929 万例,其中中国新发癌症457 万人,占全球23.7%,全球乳腺癌新发病例高达226万例,取代肺癌成为全球最常见的癌症。因此,对乳腺癌的精准化诊治具有重要的临床意义。近期研究认为,肿瘤体积是影响乳腺癌预后的重要参数,治疗前后肿瘤体积动态变化是准确判断乳腺新辅助化疗疗效的敏感指标和重要依据之一[2]。目前,MRI 检查是显示肿瘤边界的最佳技术,也是新辅助化疗疗效评估的一个敏感手段,但是基于MRI动态增强的肿瘤体积精确测量还是一个技术难点,这对于提高乳腺癌疗效评估的准确性和精度具有重要意义。因此,本综述主要关注人工智能手段在乳腺癌肿瘤三维容积测量中的应用现状,旨在为临床医生深入了解人工智能技术在乳腺肿瘤自动化高精度测量方面的应用提供详细资料,并为信息技术人员提供将人工智能技术应用于乳腺肿瘤测量的思路。
乳腺肿瘤影像学检查技术主要包括钼靶X 线检查、超声检查、CT检查和MRI,肿瘤大小的影像学测量主要依据这四种检查方法。钼靶X 线检查是目前乳腺肿瘤最便捷、经济的测量方法,该方法能够清晰显示肿块形态及大小,并可以显示钙化形态及范围,尤其对微小钙化病灶敏感。但对于致密性乳腺,会掩盖病灶的显示,无法确定肿瘤边缘,尤其对于非肿块型乳腺癌,会出现漏诊。另外,钼靶X 线检查一般采用内侧斜位或头足位进行拍摄,二维成像,信息量太少,无法进行三维重建,无法准确测量肿块体积。
超声检查技术也是目前乳腺疾病的主要检查手段之一。其优点是无创、无辐射和快捷方便,可以显示乳腺内各种形态的肿块或结节,测量任意方向的肿瘤直径。通过超声图像确定肿瘤的长、宽和高三个方向的尺寸,通过椭球体积计算公式计算出肿瘤体积。但是,乳腺超声对于触诊阴性的小肿瘤的检出敏感性较低[3-4],且受操作者技术水平、探头选择等影响较大,可重复性较低。
CT 扫描检查为断层成像,可以避免乳腺组织与肿瘤的重叠干扰,具有较高的软组织分辨能力,可以检出致密乳腺中的部分病灶。此检查技术对显示乳腺内钙化和腋窝淋巴结转移具有一定优势[5],为乳腺癌分期和治疗方法选择可以提供指导。但是,CT 检查在显示乳腺病灶中价值有限,其原因在于乳腺病变与乳腺正常组织的密度往往差异较小。CT 检查对乳腺肿瘤形态、大小和位置的显示敏感性较低。此外,CT 扫描的辐射剂量较高,是普通X 线检查的10 倍以上[6]。随着CT 技术的快速发展,锥光束CT 检查从多角度进行三维成像,拥有较高的空间分辨率,且能够提供较为清晰的血管造影图像。未来有望在乳腺肿瘤体积测量及病程判断中有更高的应用价值。
MRI 检查是另一种常用乳腺疾病检查技术,可以非常敏感地显示出肿瘤形态、信号特点和位置,尤其动态增强MRI脂肪抑制序列,可以非常清晰地显示病变区域的形态特点和边界,从不同方向测量肿瘤的大小。研究[7-9]指出,MRI检查对乳腺肿瘤大小的测量准确度可以达到95%以上,对乳腺癌新辅助化疗疗效评价以及保乳术术前评估有重要意义。综上所述,临床中常用的肿瘤测量方法为二维测量方法,一般测量肿瘤的直径或半径,或者测量肿瘤的最大径和最小径,但是,这些测量方法具有一定的技术局限性,由于肿瘤大多数为不规则形,不同方位和不同层面的测量结果可重复性较差;另外,不同测量者的测量结果可重复性较低[10]。
与肿瘤大小的二维测量方法相比,肿瘤体积测量更能准确反映肿瘤大小,在监测化疗后病灶的动态变化方面价值更高。对其他部位的肿瘤,体积测量一般依赖于CT螺旋扫描技术,由于CT螺旋扫描技术为容积扫描,可以达到各向同性[11],从而实现精准化测量。但是,对于乳腺肿瘤,CT 检查对乳腺肿瘤的显示较差,MRI 动态增强扫描可以非常敏感地检出乳腺肿瘤[12]。使用CT和MRI进行乳腺肿瘤体积测量的方法类似,都是通过对原始图像分割出病灶区域,然后计算体积的。综上,基于MRI增强图像,进行图像分割和三维重建,计算肿瘤体积,是一个非常有应用前景的测量方法。
随着人工智能技术的快速发展,肿瘤体积智能化测量已经用于临床实践[13]。但是,基于MRI 增强图像的乳腺肿瘤体积重建一直是一个技术难点,重建流程包括病灶区域分割、三维重建和体积测量。其中,图像分割非常重要,因为其精准度决定着后续三维重建效果和最终体积测量的准确性。
目前,图像分割方法分为手动分割方法、传统分割方法及人工智能的分割方法。
2.1.1 手动分割方法
目前乳腺肿瘤大小的测量主要使用手动方法进行分割,由医生手动选取病灶区域,然后使用软件测量其直径等参数,此方法需要耗费人力和时间,并且准确性较低,在不同图像层面测量存在较大差异,不同医生对同一图像的肿瘤边缘判断也存在一定差异,可重复性较低。
2.1.2 传统分割方法
传统分割方法是根据乳腺癌的表现形状,如类圆形,分叶状等,使用计算机图像处理的方法对可疑的病灶区域进行提取分割。一般还会使用图像预处理的方法来去除噪声及伪影,并强化乳腺癌的特征[14-15],使后续分割结果更加准确。常用的传统分割方法包括:基于阈值的图像分割法、基于区域生长的图像分割法、基于轮廓模型的图像分割法和聚类方法等[16-18]。
基于阈值的分割方法[19]适用于灰度特征明显的医学图像,其原理是根据选定阈值对图像灰度进行分类,选取出目标区域。此分割方法需要选取合适阈值,是准确进行图像分割的关键。TWELLMANN 等[20]使用基于Otsu阈值的方法,识别出乳房轮廓线,从而分割出目标区域。阈值法的优点是计算量较小、分割速度快。但是它仅考虑图像灰度信息特征,单独使用错误率较高,与其他方法组合使用可以达到更好的分割效果。SRIDHAR[21]使用阈值联合分水岭算法有效抑制过分割。张玲等[22]使用阈值联合改进的分水岭算法,通过引入前景和背景标记,基于标记进行分水岭变换得到分割界面。该方法在一定程度上避免了过度分割的问题,但是在引入标记的过程中容易产生过度标记或漏标记,从而影响分割效果。CONTE等[23]使用阈值法并结合乳腺癌肿瘤的形状特征,排除血管等其他组织的影响,有效的减少了假阳性案例。
基于区域生长的分割方法是根据预先设定好的生长规则,从初始种子点出发,将邻域像素中与种子点性质相似的不断添加到种子点上,不断扩大选区,在满足区域生长终止条件后停止生长,确定分割区域。初始种子点以及生长阈值的选取对结果影响明显[24]。AL-FARIS等[25]使用自动种子区域生长的分割方法对乳腺肿瘤进行分割,该方法基于图像聚类以及粒子群优化的方法,准确度有一定提高。ABASPOOR等[26]使用区域生长的方法对乳腺MRI进行分割,对比了人工方法和基于全卷积网络的遗传算法在该问题中的表现,结果显示在种子点选择中遗传函数方法优于手工选择。但是,区域生长分割方法受图像质量的影响较大,对于存在噪声的图像分割结果较差,且需要多次对邻域像素重复进行计算,计算效率较低。
基于活动轮廓模型的分割方法是根据最小化能量泛函,使边缘曲线逐步运动到分割区域的边界,完成分割任务。JAGLAN 等[27]使用活动轮廓模型对乳腺MRI 病灶区域进行提取,但是由于不同类型的乳腺癌肿瘤形态多变,有些边缘梯度变化不明显,分割效果并不理想。该方法可以结合形状、灰度分布等先验知识构造合适的能量最小化框架,从而增快收敛速度,得到更准确的分割结果[28]。但是该方法受噪声影响较大,并且对于边界模糊的肿块分割效果较差,无法去除血管等组织的影响,假阳性案例较多。
综上,传统分割方法是基于肿瘤形状,位置或其他临床先验知识进行分割,可解释性较强,并且不需要大量数据进行训练即可达到分割效果。但是传统分割方法往往受噪声、图片质量等影响较大,对于边界模糊的片状强化图像及一些与周围组织灰度相似的病灶分割准确性较低,还需要医生手动选取阈值或对其计算结果进行进一步的修正。
2.1.3 人工智能分割方法
针对部分传统分割方法无法满足的需求,采用人工智能的方法可以获得更优的结果。随着深度学习技术的不断发展,基于深度学习的方法进行医学图像分割使得自动分割成为可能,基于深度学习的图像分割分为语义分割、实例分割及全景分割三级(表1)。
表1 深度学习图像分割级别Tab.1 Deep learning image segmentation level
医学图像分割主要应用于病灶分割,语义分割即可满足要求。深度学习需要数据集进行预先的训练及测试,因此,需要提前收集一定的病例图像用于学习,然后通过算法对病灶特征进行学习,从而实现病灶区域的自动提取[29-30]。基于深度学习的乳腺癌检测分割方法主要有:基于全卷积网络(fully convolutional network, FCN)的检测分割方法、基于注意力机制的检测分割方法和基于弱监督的检测分割方法等,并且根据不同部位的不同影像及病灶特征,在现有网络的基础上,许多优化后的网络模型也不断被提出,并应用于全身各个部位的病灶图像分割[31]。
全卷积网络通过对图像中每一个像素点进行分类预测来达到分割的目的。U-Net 是在全卷积网络的基础上改进而来的添加了跃层连接的一种编码-解码器分割网络。近年来,U-Net 网络在医学图像中表现突出,由于其结构原因,该网络可以在样本量较少的情况下达到拟合状态,获得良好的分割结果,适用于各类医学图像。WANG等[32]使用3D-Unet网络搭建了乳腺肿瘤注意力模块,从而抑制非肿瘤组织的影响,在包含422 例DCE-MRI 的数据集中,Dice系数最高可达0.78。ZHANG 等[33]使用3 级U-Net 网络对乳腺MRI中病灶进行分割,并提出了一种基于掩膜引导的多阶段学习框架,将乳腺区域掩膜、对比后图像以及差分图融合成三通道图像输入进U-Net网络,在包含272例病例的数据集中,Dice系数达到0.72。
注意力机制是在计算能力有限的情况下,将计算资源分配给更重要的任务,引入这种机制可以降低深度学习网络对无关信息的关注度,解决信息过载问题并提高任务的处理效率及准确性。QIAO 等[34]使用基于注意力引导的联合学习网络对MRI 增强图像中的乳腺和肿瘤进行分割,该网络还添加了基于全局特征的自我注意力模块以强调乳房区域,抑制不相关的非乳房组织特征。在144个训练集中,乳腺和肿瘤的分割平均Dice 系数达到0.92 和0.86,并在扩展的包含59 例数据的独立数据集中取得0.83 的Dice 系数,在该数据集中表现良好,但还需在更多的数据集中验证其鲁棒性。
以上网络都属于监督学习,依赖前期积累大量的标注数据集,数据样本越多,分割结果越准确。然而在医学图像领域,很难建立高质量的大型数据集,因为这要耗费大量的人工成本,需要经验丰富的医生花费大量时间进行标注。所以为了克服数据标注成本过大的难题,引入弱监督学习方法,这种方法不需要对图像进行准确标注,而是使用图像集标签或边界框标签等弱标签对病灶区域进行分割。ZHOU 等[35]搭建了一个基于DenseNet 的3D 乳腺癌分类网络,使用弱标签数据集检测出肿瘤的模糊位置,再结合传统图像处理方法确定肿瘤边缘。在包含1537例病例的数据集中达到准确率83.7%。
随着技术的发展,近年来三维分割成为研究热点。三维分割不再是对每一帧图像进行单独分割,而是将图像序列看作一个整体,增强了图像间的上下文联系,对病灶刚刚出现和结束处的小病灶能够更好地进行分割。乳腺MRI为断层图像,本身包含有三维信息,AYATOLLAHI 等[36]将Retina Net 应用到3D乳腺MRI 序列上,在考虑了三维形态和动态信息后,分割敏感度和准确率进一步提升。
基于人工智能的分割方法可以完全脱离人工参与,去除人的主观因素,可重复性更高。但是,需要大量数据让计算机进行“学习”,才能够准确对病灶区域进行勾画。而迁移学习方式可以让网络事先学习部分特征,为分割网络参数初始化提供便利,从而使用更少的数据集达到更优的分割结果。LU 等[37]将迁移学习应用到分割问题中,使用预训练的ImageNet模型进行训练,在U-Net网络框架模型中完成训练,最终在67 例数据的小数据集中准确率达到0.942,显著提升了分割准确率。
三维重建可以让医生更直观地观察肿瘤的形态学特征,在术前模拟定位、疗效评判等方面都有着广阔的应用前景。三维重建的原始数据为断层影像,而重建就是将每张影像中的每个像素还原到对应的空间中去,以此将多张图像还原为三维体。早期,由于医学断层扫描图像的间距较大,因此,医学图像的三维重建主要是使用轮廓连接和平面轮廓重建三维体[38]的方法。此方法的原理就是将相邻两层的轮廓线顶点,按照某种规则连接起来,构成重建物体表面的多面体近似。但是此方法精度较差,并且容易产生空洞,导致错误的形态。
随着医学影像技术的迅速发展,现在断层扫描的层间距已经很小,最薄可小于5 mm,可以使用基于体素的重建方法。医学图像的三维重建算法主要分为以下三类:面绘制算法、体绘制算法和混合绘制方法。
面绘制的基本原理是由三维空间数据场构造出曲面,再由计算机进行绘制展示,根据切片分割出感兴趣区域,根据等值面的拼接拟合物体表面,来进行重建[39]。面绘制的速度较快,适用于需要交互操作的系统或其他对实时性要求较高的项目。LORENSEN等[40]提出的移动立方体(Marching Cube, MC)算法是目前应用最广的面绘制算法。GNONNOU 等[41]使用MC 算法根据乳腺MRI 中的乳腺轮廓线对整个乳房进行重建。朱益苗[42]使用改进的MC 算法对乳腺MRI 中的肿块进行重建,提出基于帧间相关性的等值面提取方法和一种基于加权的二次度量误差量的三角形简化模型,从而提升了重建精度以及绘制效率。面绘制法主要关注物体的表面信息,并不对其内部进行重建,所以更适用于对肿瘤等单一目标的重建,不适用于对于多种不同特质物体的重建。
体绘制算法是指依据三维立体数据,将所有体细节同时展现在二维图片上的技术,称之为体绘制技术。在体绘制算法中,三维重建无须生成中间几何图元,而是以体素作为基本单元,直接使用离散的三维体素数据,生成三维显示效果图。与面绘制方法相比,体绘制对于物体表面及其内部结构都可以进行建构,应用范围更广。利用体绘制技术,可以在一幅图像中显示多种物质的综合分布情况,并且可以通过不透明度的控制,反映等值面的情况。常用方法有光线投射法,最大密度投影法等。ALLISON 等[43]对分割后的乳腺MRI采用光线投影法进行重建,并将重建后的模型放入混合现实系统中进行显示,帮助医生分离乳腺中腺体、脂肪及肿瘤等不同组织。刘雨倩等[44]运用改进的光线投射体绘制对乳腺MRI进行三维重建,为医生提供更加形象的立体视觉效果,对于病变程度的判断及保乳手术开刀位置均有积极影响。体绘制可以满足各种复杂图像的重建,并且对物体内部信息也会进行重建。但是,此算法较为复杂,计算量大,显示时需要对每个体素进行渲染,无法满足交互需求。
混合绘制算法分为透明体素绘制法[45]以及体数据几何单元投影法。透明体素绘制法是将感兴趣的表面提取出来,然后赋予其所在体素对应的光强及不透明度,然后按照体绘制的方法进行显示。体数据几何单元投影法往往被用于不规则网格体数据的三维显示,它将长方体的面扫描转换到像素空间中,然后在两个面之间做体绘制积分,计算出每个像素点的颜色和不透明度,再合成图像[46]。混合绘制方法可以被认为是对于面绘制和体绘制的一种折中算法,可以看作使用体绘制方法来绘制表面或者是以几何造型作为显示单元来反映数据整体信息,在计算量和重建效果中进行平衡。
乳腺癌肿瘤的重建是为了医生更好地观测其形态,医生能够与系统交互,自由地选择观测角度更利于诊断,且乳腺癌肿瘤的重建是对单一物体的重建,其内部信息作用不大,所以使用面绘制方法在保证重建效果的同时能够更好地让医生与其交互。
对于乳腺癌患者,不仅仅要达到治愈的目的,同时需要兼顾保持乳腺外形的美观,以及恢复机体功能。乳腺癌治疗的整体趋势及目标是在保证疗效的基础上,提高患者的生活质量,尽量减少创伤。因此,病灶乳腺体积的估计也是辅助治疗系统中非常重要的环节之一。
传统方法中,根据MRI是断层截面图像的特点,采用轴位层面图像,如公式(1)通过标记肿瘤面积乘以层厚得到单层体积值,单个轴位层面中全部单层体积值的总和即为总体积数。或如公式(2)采用体积积分的方式,对面积函数p(x)进行积分,得到体积数。
邵志红等[47]对56 例前列腺癌的多参数MRI 使用手工勾画的方法选取病灶区域,利用简单的面积×层厚的方式计算病灶体积,结果显示,体积测量值均低于病理体积测量值,但是与病理体积相关性高。朱龙飞等[48]对86例乳腺癌患者进行MRI检查,通过半自动方式手动勾画肿瘤区域和乳腺大小,证明测量肿瘤体积可以帮助临床选择更合适的手术类型。
目前,基于重建结果测量肿瘤大小的标准是体素计数[49-50],即体积由分割结果中所有体素的数量乘以它们的体积得出。所以重建结果与体积密切相关,选择合适的重建方法可以更好地得到其体积参数。
综上所述,图像分割中的手动勾画需要耗费大量人力,且人工长时间对大量图像进行勾画容易因为疲惫而产生误差,可重复性较低。因此,利用人工智能手段对乳腺MRI自动分割出病灶区域,再对其进行三维重建及体积测量,并描述其形态特征和新辅助化疗后肿瘤体积的动态变化,对于乳腺癌的疗效评价有着重要的指导意义。然而,如今对于乳腺肿瘤的MRI病灶分割及三维体积测量研究刚刚起步,未来需要解决的关键问题如下:(1)人工智能技术发展方向。目前还没有一个稳定的算法或模型可以准确分割MRI中的乳腺肿瘤,随着深度学习算法的进一步发展的改进,有助于提高乳腺肿瘤MRI 的分割精度,并且可以根据乳腺肿瘤的类型和病程阶段,开发专门的网络结构,以适应不同场景的需求。(2)缺乏乳腺MRI 数据集。目前乳腺癌MRI 数据匮乏,缺少大型公开的数据集,无法进行标准化的研究,未来应建立乳腺癌MRI 标准数据库,更好地评估不同模型的效果。(3)缺乏乳腺肿瘤三维评价指标。目前,乳腺癌肿瘤大小的测量均是针对二维图像的,而三维参数包含更多信息,如体积、横纵比等,以及更加丰富的形态学信息,未来需建立一套完善的乳腺肿瘤三维评价指标,更好地评价病程阶段及治疗效果。(4)临床实践与应用。未来研究可以关注人工智能在乳腺MRI 体积测量方面的临床应用,可以将三维测量技术与其他临床信息(患者信息、病理结果等)相结合,为乳腺癌的个体化治疗提供更有力的支持。
我们相信,随着人工智能算法技术的迅速发展和研究的深入,乳腺癌肿瘤的三维测量技术会更快捷、更准确地获取肿瘤的三维信息,更敏感地监测乳腺癌肿瘤的病程阶段,为疗效评估提供更全面准确的信息。为乳腺癌的诊断和后续治疗提供重要依据。
作者利益冲突声明:全体作者均声明无利益冲突。
作者贡献声明:李相生对文章的知识性内容做批判性审阅,对稿件重要内容进行了修改;徐京瑶起草和撰写稿件,收集文献并进行总结;刘晓民对文章内容及写作进行指导,对稿件重要内容进行了修改;张新峰对文章内容及写作进行指导;郭伟对文章内容及写作进行指导;王飞对文章内容及写作进行指导。全体作者都同意发表最后的修改稿,同意对本研究的所有方面负责,确保本研究的准确性和诚信。