基于深度学习的医疗图像分割

2019-03-15 01:30李昊轩
电子制作 2019年4期
关键词:池化灰度阈值

李昊轩

(山东省龙口第一中学,山东烟台,264000)

1 研究背景与意义

1.1 深度学习背景与意义

深度学习是近十年兴起并飞速发展的一种仿生学技术。关于深度学习,其起源是人工神经网络,但由于其的诸多弊端,渐渐没落。直到2006年,随着科技的进一步发展和完善,一位学者提出深度学习这一思想,进而受到更多学者专家重视,深度学习开始兴起,慢慢的深度学习被广泛应用到包含计算机计算处理、部分商业等众多领域且皆获得可观成绩。深度学习相对传统浅层学习会更加的复杂,因为其层次结构会更深一些,也正是因此,有利于其更好的对某些特征有重点进行学习。将大量的数据输入,使计算机进行深度学习的训练,进而便可提取获得这些数据中相同特征。由深度学习完成这一任务,相较于传统方法将会更容易。由于屡次立下大功,深度学习已成为业内学者关注热点,前景明亮广阔,这将会再为机器学习领域翻开一页新篇章。

1.2 图像分割背景与意义

图像分割是把图像内容作分类、作描述、作识别等作为任务的图像分析的最重要基础,所有的特征提取、目标识别、图像识别和场景解析等图像有关工作都需要先保证好它们上一步图像分割的质量。此项技术从从20世界70年代左右就引起领域学者们的高度重视,发展至今,阈值分割法[1]、边缘检测法、区域提取分割法和结合特定理论工具4大类型的图像分割方式是最为当代学者所熟知和常用的。但该课题还是拥有一定难度和深度。

图像处理往往是离不开图像分割的。近年来涌现出一大批新的不同的分割方法,但是始终没有找到一个既通用又足够便捷方法,学界也没能有明确的判断分割结果好坏的合理标准[2]。

1.3 医学图像分割方法意义

一张医学图像所包含的信息量是十分巨大的,但是当医生做诊断的时候,只需要其中一小部分组织或某一片特点区域的数据,进行分析和断定病变情况。然而由于检测设备和设备工作原理的不同,医学图像上难免会出现噪点,如果噪点过多,将会对做诊断的医生造成极大的阻碍,且增大的误诊几率,误诊的后果于医于患都是难以承担的[3]。于是将图像分割应用到医学领域引起计算机界和医学界学者们的高度关注。以下列出医学图像分割几点优势:

(1)将人体内器官,组织,病变部位等从医学图像中分割出来,并对其进行尺寸距离进行精准测量,将对医生准确确诊进行病状分析,为患者高效准确作出治疗方案提供技术支持。

(2)为人体内的三维重建提供材料素材,进而在手术过程中为医生提供辅助,可大大减少手术风险,为医生手术时减轻负担。

(3)医学图像分割还可去除图像中大量无用信息,只将有需求部分分割出来。这可以在不压缩图像的基础上,减少图片的数据数量,提高了效率和医疗水平。

2 传统图像分割方法

2.1 阈值图像分割法

阈值分割法是最早、最简单的一种分割方法。这里主要有两种方法:其一、图像中要识别物与背景在灰度值上差异悬殊,这时就该采用全局阈值分割的方法[4]。其二,当图像各个部分灰度差异并不明显或图像多处灰度值相当的时候,就该用局部的阈值分割取代全局的阈值分割。

对于阈值分割来说,其优点是计算过程避免了其他方式的冗杂,进行运算工作的速度大大提高;但凡事皆有两面性,其缺点也很明显,主要表现为灰度值差异不明显时分割不当,抗噪性能差。

2.2 基于边缘检测的图像分割法

边缘检测分割法是通过检测边界的方法来进行的图像分割[5]。由于一张图片中灰度突变最明显的地方在不同区域的边缘,利用这一点便可进行图像分割。利用边缘检测分割法的要点在于协调好检测精度和抗噪性能的相互作用。

2.3 基于区域的图像分割方法

基于区域的图像分割的操作原理是通过连接输入原图像中大量相似像素点,通过后续处理生成分割结果。其优点是分割后的图像在空间上是可以保证连续的,分割空间大。为人熟知的主要有区域生长和区域合并与分离的分割方法。该方法也有缺点,对大区域分割速度慢,抗噪性能差,可能过度分割。

3 基于深度学习的医疗图像分割法

综合上文所述,这些传统的方法进行的图像分割虽各有优点,但是这些图像分割方法的弊端也不容小觑,但是基于深度学习的图像分割方法却可以将优点最大化,相对于传统方法大大缩小了其局限性影响。

3.1 全卷积神经网络(FCN)诞生背景

2015年UC Berkeley的Jonathan Long等人提出了全卷积神经网络(FCN)[1]应用到图像分割领域。FCN由此诞生。

3.2 全卷积神经网络(FCN)原理

全卷积神经网络(FCN)与卷积神经网络(CNN)差别之处就在于全卷积神经网络(FCN)将卷积神经网络经过卷积、池化的全连接层转化成一个个卷积层。

我们可以知道,在卷积神经网络过程中,第1层到第5层皆为我们熟悉的卷积层,后面的第6层和第7层是拥有一定长度的一维向量,到了第8层时,则转变为一较短的一维向量,进而通过全联接层+softmax输出结果。而FCN则是把最后3层皆转为卷积层,这就意味着该方法是由卷积层组成的,而不存在CNN中一维向量,全卷积神经网络网络(FCN)的名称也就由此而来。

根据图像,我们不难发现,多次的卷积和池化是会牺牲图像大小、图像分辨率的。那么FCN应该怎样在这种情况下继续完成图像中各个像素点相关的分类呢?为了解决这个重大问题,FCN又使用了upsample(上采样)的方法。简单来说,即池化的逆过程,所以池化也可以说为下采样。既然池化的结果是数据的数量变少,那么不难理解上采样起到的效果就是让数据的数量变大,以起到解决问题的目的。

图1为上采样示意图。

作者在原论文中首先尝试将第五层输出反卷积到原图的大小(所进行的是32倍放大),但是该输出结果是不够达到高度精确这一标准的,细节也有损失之处。面对这一问题,作者将反卷积过程又扩展到了第四层和第三层,最终结果不够精准精细的问题也大大减轻了。

图1 上采样示意图

请看下图有关 32倍,16倍,8倍,三个上采样过程如图2所示。图3为不同上采样的FCN结果。

图2 FCN中的上采样

图3 不同上采样的结果

首先输入的原图像再进行多次卷积操作和池化的操作(通过池化的过程可以使图像缩小为原大小的一半)。图中的nx为特征图进行放大n倍,而不是代指其有n个特征图。

图4中第一行代表FCN-32s;第二行代表FCN-16s;第三行代表FCN-8s。

图4 FCN示意图

现在通过第一行,我们介绍上采样具体过程,只需关注第一行即可。这里有5个池化层,卷积7的特征图为原图像的1/32,在FCN的卷积中图像大小不会受到影响而改变,像素难免会有损失,但是特征图基本上是不会受到太大影响的。再通过32x的下采样,图像大小重新变回32x32。在这里加入一卷积将其大小进行扩大。若此卷积核的大小也恰好是为32,那需要反馈训练1024(32x32)个权重便可以完成一个32x的上采样,也就是反卷积。

类似的,我们也就能了解到16倍和8倍操作的具体过程,原理同32倍是大同小异的。

通过三种上采样结果的对比,我们不难发现得到的结果不再过度模糊,慢慢条理清晰,便于分辨。

3.3 全卷积神经网络(FCN)优点及缺陷

将FCN与传统的CNN方法对比,我们可以发现FCN的优点:一是其对输入的图片的尺寸大小没有要求,在训练时,可以放入不同尺寸的照片,可以大大增加选择要训练的对象,更加便捷。二是FCN更加高效,避免了CNN对相似像素点计算卷积过程的大量重复。

万物皆有缺陷,FCN并不完美,一是其结果还是达不到我们追求的高度精准,虽然FCN-8s对比于FCN-32s有了很大提高,然而其结果仍略有模糊和平滑,对其中种种细节无法达到高度敏感。二是缺乏一定的空间一致性。

3.4 基于深度学习的医疗图像分割

根据上文的描述,我们将利用全卷积网络对人体内拍摄到的图片进行语义分割。我们可以对人体内的器官逐一进行分割,从而可以让机器了解人体内部的结构。然而特别之处在于我们会在语义分割的过程中,将疾病检测的信息融入到图像分割中,进而疾病产生的部分单独地在图像中以单独的语义标注出来,这样的做法可以利于医生在后续的检查中清晰的看到疾病的位置,节约了医生大量的精力和时间且大大减少误诊误判造成的损失和影响。由此看来,基于深度学习的图像分割定能在医学领域再次大放光彩!

4 展望与总结

本文将深度学习用于医学图像分割,理论上来讲这可以极大地减轻医生的人力和物力方面的支出。本文没有做出完整的系统,只是做了理论上的设计。后续的工作应该去实际设计一套系统。

猜你喜欢
池化灰度阈值
基于高斯函数的池化算法
航空滤光片阵列多光谱图像条带灰度调整算法
采用改进导重法的拓扑结构灰度单元过滤技术
卷积神经网络中的自适应加权池化
改进的软硬阈值法及其在地震数据降噪中的研究
土石坝坝体失稳破坏降水阈值的确定方法
基于小波变换阈值去噪算法的改进
天津港智慧工作平台灰度发布系统和流程设计
改进小波阈值对热泵电机振动信号的去噪研究
Arduino小车巡线程序的灰度阈值优化方案