薛 亮,姚光宇
(复旦大学附属中山医院,上海 200032)
医学图像分割作为机器人辅助诊疗肺部疾病的关键技术之一,该技术的发展对于病症的识别诊断意义重大。近年来随着人工智能技术在医学图像分割领域的广泛应用,使得诸如眼底视网膜疾病识别、胰腺分割识别等领域获得了极大的发展。虽然基于深度学习的方法在上述领域获得了一定的成功,但是该类模型也存在一定的不足例如模型的训练需要大量人工标注好的数据集,人工标注的过程不仅枯燥繁复,而且模型大大的限制了在缺乏大量原始图像的领域的应用和推广。
针对上述问题本文提出了基于视觉显著性检测的器官分割模型,该模型首先利用视觉显著性检测算法对医学图像进行显著性检测,然后将检测结果进行正负样本划分,最后将划分结果输入到分类器中对分类器进行训练。该模型克服了深度学习模型需要大量人工标注数据的问题,简化了模型训练的过程。模型的框架如图1所示。
图1 算法框架
在医学领域中,由于深度学习模型缺少具有特定图像特征的图像数量,因此我们为了获取足够多的数据对分类器进行训练,需要根据现有图像特征进行图像增强与图像变换。图像变换的方法采用的是基于非刚性变换的方法生成,具体方法参考文献[1]。
显著性检测模型主要分为三步:1)初始显著性检测结果的获取;2)在多源初始显著性检测结果中提取前景和背景区域,并计算区域特征差异性和连通性;3)显著性优化策略。算法具体的流程描述如图2所示;
图2 显著性检测框架图
显著对象具有多个显著属性,在不同图像中发挥显著作用的属性不同,因此基于单一属性的显著性检测方法往往不能检测出完整的显著对象,为了克服这个问题,本文采用基于局部稀有性、全局稀有性以及背景稀有性的方法分别计算图像的显著性分布,然后根据这三个初始显著性检测结果获得本文缩放模型的起始区域开始执行缩放过程。在进行显著性检测之前首先对利用图割方法对图像进行区域分割,这样不仅能将图像中具有相同特征的区域进行合并同时还能提高算法的检测效率,然后提取图像特征构建超像素的特征描述。三种初始显著性检测的方法描述如下:
1)局部稀有性
局部稀有性定义为中心区域与周围区域在特征空间的欧氏距离,针对区域ri其局部稀有性形式化描述为:
其中dist(ri,rj)定义为区域在特征空间的欧式距离。
根据人的视觉注意力机制,位于图像中心位置区域的显著性要高于其他区域,因此局部显著性更新为:
其中Xc表示图像的中心坐标,xi表示区域内部像素i 的坐标,ωi为区域ri内部像素的数量。
2)全局稀有性
全局稀有性是在局部稀有性的基础上将对比范围扩大到整张图像获得的,针对区域ri,其全局稀有性形式化描述为
其中φ(ri)表示ri,rj之间像素数量之比。
3)背景先验
构建图像的图表达G=(V,E),其中V 为图的顶点本文中由图像分割后的区域表示,E 为图的边定义两个区域之间的连接(本文定义相邻区域之间存在边连接),图的权值矩阵表达为W,Wi,j定义为:
然后参考文献[2]采用流形排序算法对图像区域进行显著性排序,流形排序的目标函数定义为:
为权重参数为查询种子参考文献[2]。求解上述函数获得最优解:
在多个初始显著性检测结果中,存在同一区域在多个显著性检测结果中同时是显著区域、同时是背景区域以及即是背景也是显著区域的情况。提取同时为显著区域的区域作为前景种子F、同时是背景区域的区域为背景种子B,剩余区域定义为显著扩散区域。在显著扩散区域内部,一个区域可扩散为显著区域或者背景区域是由该区域的差异性和连通性决定的,下面将详细对这两方面的特征进行阐述。
1)差异性
扩散区中的区域与前景种子的相似性以及与背景种子的差异性,决定了该区域属于显著对象的可能性,本文中区域的差异性定义SD(ri)。
其中FDb(ri)表示区域与背景之间的差异,FDf(ri)表示区域ri与前景区域的相似性。FDb(ri),FDf(ri)形式化为:
其中dgeo(ri,rj)=min∑(p,q)∈path(i,j)wp,q表示区域ri,rj之间的最短测地线距离。
2)连通性
显著性检测中,距离越近的区域对待测区域的影响越大。根据这一观察,本文通过计算待测区域与前景背景之间的连通性,从另一个角度计算待测区域的显著程度。区域之间的联通性定义为:
其中Sbc(ri),Sfc(ri)分别表示区域ri与背景前景之间的连通性。L(ri)表示区域ri的周长,α为控制参数。待测区域与前景区域之间的连通性反映了其属于前景的可能,与背景之间的连通性反映了区域与背景之间的相似性。因此基于连通性的区域显著性计算形式化为:
区域连通性和差异性从两个角度反映了其是否为显著区域的可能,在显著性扩散区域内,上述两个指标决定了一个区域是否被重新定义为显著区域。由于从单一角度上对扩散区域进行考量,都无法鲁棒性的获得更好的显著检测结果,因此本文区域被扩散的可能扩散率定义为:
当扩散区域内区域的扩散率超过整幅图像平均扩散率2倍的情况下,执行扩散过程。此时该区域的显著性定义为:
显著对象是一个完整的整体,以此显著对象内部各分部之间应该具有相同的显著值,然而大部分显著性检测算法往往只注重算法的准确率和错误率,忽视了显著对象的一致性表达,为了克服这个问题本文采用元胞自动机理论对显著性检测结果进行优化。基于元元胞自动机理论的优化策略形式化描述为:
其中adj(ri)表示ri的邻接区域。
其中F*,C*,分别表示为影响矩阵和一致性矩阵。当目标函数收敛时系统停止更新。
医学图像处理的器官识别分割中,分类器的选择是一个至关重要的因素。在这里,本文利用支持向量机分类器从众多图像特征中获取器官的分类。在支持向量机模型中如果特征向量在高维空间是非线性可分的,那么支持向量机有助于使它们线性可分。对于支持向量机模型,每个数据点都表示为一个m维向量,通过将数据点放在一个超平面内实现特征分类。对于分类,将每个输入转化为n维空间中的一个点,每个属性的值被描述为单个超平面坐标的值。分类通过优化最能区分正负样本的超平面来建立的。本文中显著性检测的结果为分类器提供正负样本数据。分类器的分割结果如图3所示。
图3 器官分割结果
为了测试本文中所提模型的有效性,我们选择精确度和召回率评价指标:
精度(P:Precision):该指标反映分割的正确性。
召回率(R:Recall):该指标反映模型的敏感度。
同时选择ETIS-Larib database作为公共数据集为模型的评价提供数据支撑。
从表1可以看出本文提出的算法相对于对比算法来说,无论在精确度还是召回率方面都具有比较好的表现。同时由于本文提出的模型采用了显著性检测的方法来标记正负样本,使得模型不仅克服了需要人工标记数据集的过程,同时使得模型能提取到更利于器官分割的特征。
表1 各模型在评价数据集上的实际分割结果
本文研究了基于视觉显著性检测的医学图像分割模型,该模型利用显著性检测算法自动区分正负样本的能力,克服了机器学习分类模型需要大量人工标注数据的问题,简化了模型训练的过程。最后通过大量实验证明,本文提出模型在精确度、召回率以及平均错误率方面都具有较好的表现。