一种改进U-Net的眼底血管分割方法

2021-10-29 12:18薛文渲刘建霞
电子设计工程 2021年20期
关键词:金字塔空洞视网膜

薛文渲,刘建霞

(太原理工大学信息与计算机学院,山西晋中 030600)

眼底RGB 图像是眼睛内表面的投影,由于其不同的形状、分叉、延伸程度的结构特征,可以用于分析判断视网膜上的血管分布[1-10]。其中,血管树是医学图像中最稳定的特征,可用于生物识别。眼科医生可以通过眼底图像中呈现的血管形态进行有效的筛选和判断,以确定糖尿病视网膜病变、青光眼和微动脉瘤的眼科状况[11-14]。传统的非监督学习方法有匹配滤波方法[15]、形态学处理方法[16]、形变模型方法[14]等,虽然无需专家手工标注的金标准图,但由于不同眼底图像形态的特征复杂度差别极大,传统方法编码[1]较为简单,对血管特征提取程度差,分割效果不佳,无法满足实际临床辅助的需求。为满足实际临床辅助视网膜分割的需要,实现更好的视网膜图像分割水平,文中提出基于U-Net[2]的视网膜眼底图像分割混合算法,用以克服原始U-Net 网络层数过深导致的网络计算量过大和细小血管信息丢失的问题[3]。文中方法通过学习眼底金标准图像对复杂多变的眼底血管像素点进行预测,提供更为精准的视网膜血管形态、尺度场景等信息,具有分割精度高、抗干扰性强、计算效率快等优势。文中提出的模型方法使用TensorFlow 框架进行实验,实验表明文中方法有助于解决分割结果在细微血管分叉处不连续、复杂曲度形态血管丢失的问题,从而可以达到更好的分割性能,具有一定的临床应用的价值。

1 网络结构与基本算法

由于眼底视网膜图像中血管与背景之间的明暗特征不全,视盘区域亮度过高,图像分割干扰较强,视网膜血管直径、分叉特征差别大等问题,文中提出了一种基于改进U-Net的网络模型算法,如图1 所示。该网络由编码器、金字塔型空洞卷积[4]与解码器组成,将网络中的原始卷积层改为Inception 模块[5],使用多个不同尺度的卷积增强网络的泛化能力和神经网络的学习能力,并引入金字塔型空洞卷积,在保证网络参数不过度增大的情况下极大地保留了视网膜图像特征映射的感受野,从而减小分割结果中细小血管的丢失程度。

图1 文中网络模型算法

1.1 改进的U-Net网络架构

在实际网络学习过程中,眼底视网膜图像经过预处理后输入编码器。在编码部分,文中算法将一个3×3的原始普通卷积层作为第一层,其后为4 个Inception 模块,该模块为1×1、3×3 和5×5 卷积层并联连接,用以提取尺度不同的视网膜血管特征进行融合,并接入1×1 卷积,减少输入信息尺度,防止运算体量过大;然后经过2×2的池化层接入金字塔空洞卷积,其通道数为512。在解码部分,反卷积层仍使用Inception 模块,并通过SoftMax 激活函数针对视网膜血管有效像素点与背景噪声像素点进行分类,随后输出其分割结果。

1.2 Inception 模块

原始U-Net 网络中卷积层在视网膜血管分割任务中存在着细节丢失,特征信息提取不全面的问题。为增加卷积性能,众多学者运用改进卷积层深度与宽度的方式,但这种改进方式会使参数剧增,在实际训练过程中很易产生过拟合现象,使计算量过载。因此,文中算法将U-Net 中的传统卷积层改进为Inception 模块,使用不同多尺度的卷积核,提高非线性结构表达力与网络泛化能力,提高神经网络学习视网膜血管学习水平。该算法使用的Inception 模块结构如图2 所示。

图2 Inception模块结构

如图2 所示,模块中原始的卷积层变为1×1、3×3、5×5 3 种不同尺度特征的卷积核进行特征提取,并在卷积后使用3×3 最大池化层进行眼底视网膜血管特征信息融合。经过池化层融合后的特征信息输入到1×1 卷积层进行尺度压缩,解决了不同尺度信息提取过程中网络参数和特征量冗余的问题。

1.3 金字塔型空洞卷积

为解决原始U-Net 网络在视网膜血管分割任务中池化层存在信息损失,在分割结果中细小血管无法分离清楚的问题,文中算法增大了视网膜血管有效位置与噪声区域特征映射的感受野,将原始U-Net 网络底部的池化层改为金字塔型空洞卷积,以提升算法敏感度与准确性。为防止U-Net 卷积层编码器中网络参数复杂度过大,文中算法未改动下采样过程中的池化层,有助于减少编码过程中的网络特征复杂程度,使视网膜血管特征具有更好的线性不变性。金字塔型空洞卷积模块结构如图3所示。

图3 金字塔型空洞卷积模块结构

空洞卷积又名扩张卷积,定义为将普通卷积层内插零,从而增加网络中的扩张率r,在未增加网络参数的条件下增大了特征提取的感受野。图3(a)为r=1的普通3×3 卷积;图3(b)为r=2的3×3 空洞卷积(实际为5×5 卷积);图3(c)为r=3的3×3 空洞卷积(实际为7×7 卷积)。

在视网膜血管分割任务中,设输出特征值为y,像素点值为i,则空洞卷积的定义为:

式中,ω为卷积运算,k为原始卷积的尺寸,x为卷积输入特征值,r为空洞卷积扩张率。上述算法有效解决了原始卷积层对特征提取水平过低的问题,但在网络训练过程中,采用过大的扩张率会使上采样过程中特征向量过于稀疏,导致无法进行特征采样,分割结果信息不连续[6]。因此文中算法采用金字塔型空洞卷积结构,将扩张率限制在中等的阈值之中。其扩张率设置公式[7]为:

式中,Ml为第l层的最大扩张率,rl为第l层的扩张率。改进后的金字塔空洞卷积使用小扩张率的卷积层提升视网膜血管细节的检测能力,使用大扩张率的卷积层增大特征映射的感受野,改善因图像对比度低导致准确率低的问题,解决原始空洞卷积中扩张率选择不当导致分割效果差的情况。

2 实验与分析

2.1 实验简介

文中实验模型基于TensorFlow 框架,实验环境配置为Intel Core i7-6850K 处理器,显卡为NVIDIA GeForce GTX 1080Ti,内存为11 GB。

文中实验数据库采用眼底视网膜分割研究常用的数据库:DRIVE 数据库[8]。该数据库包含40 张分辨率为565×584的视网膜眼底图像,由官方划分为20 张训练集和20 张数据集,自带两张金标准图像和掩膜。

2.2 数据预处理

为提高分割结果水平与训练学习能力,在网络训练前对该数据库中的训练集首先进行绿色通道[9]提取预处理,再进行数据扩充。数据扩充的过程为:以0°、45°、90°、135°、180°为旋转轴旋转,再进行水平、垂直和镜像翻转扩充到原来的15 倍,将原始DRIVE 训练集图像变为300 张;将图像随机裁剪为48×48的训练集图像块,抽取180 000 块进行下一步实验。测试集不进行数据预处理。

2.3 实验结果分析与对比

为验证分析文中方法对眼底视网膜血管的分割性能,确定其算法水平,除了使用准确率(AC)、敏感性(SE)、特异性(SP)3 个最常用的参数进行评估,还用了F1 值评估分割水平[2]。F1 值越高,表示该算法对眼底视网膜的分割结果与金标准图越相似。其公式如下:

其中,TP、FP、TN、FN分别表示真阳率、假阳率、真阴率和假阴率,实验结果如表1 所示。通过与金标准图像结果进行比较,可以验证文中算法基本可以完成眼底视网膜血管分割任务。

表1 算法分割性能结果

DRIVE 数据库部分图像分割结果,如图4 所示。由图可知,文中算法在血管分叉处分割出更详尽的细小血管形态,在粗细血管交替处中也有较好的连通性,分割血管处较完整,较原始U-Net 算法信息完整度与敏感性都有较大提升。

图4 DRIVE数据库部分图像分割结果

为更好地说明文中所提算法在视网膜血管分割方法领域的水平,使用上述的评价指标将文中算法与当前文献进行了比较,结果如表2 所示。基于DRIVE 数据库进行对比,文中方法的准确率AC达到 了0.953 9,SE为0.784 2,SP为0.980 4,F1 值 为0.821 3,与文献[2]中原始U-Net 分割结果相比,准确率、敏感度有明显的提升,说明文中算法具有先进的血管分割能力,在一定程度上提升了原始算法的综合性能。

表2 算法分割性能结果比较

3 结论

文中改进了原始U-Net 视网膜血管分割算法,将编码器与解码器中的原始卷积层改为Inception 模块结构,在不扩大网络学习参数的同时增大了提取信息特征向量的感受野;将原始U-Net的底部池化层改为金字塔型的空洞卷积,提取多尺度血管特征,有效解决了细小血管能力较差、背景混乱导致的分割结果误差,更好地捕捉了目标的形态结构。在未来的工作中,可以研究由于图像存在不同病灶、眼底血管复杂多变条件下的分割方法,对现实临床医学工作有着重要的意义。

猜你喜欢
金字塔空洞视网膜
“金字塔”
深度学习在糖尿病视网膜病变诊疗中的应用
家族性渗出性玻璃体视网膜病变合并孔源性视网膜脱离1例
高度近视视网膜微循环改变研究进展
锻造过程中大截面塑料模具钢中空洞缺陷的闭合行为
Great Vacation Places
海上有座“金字塔”
神秘金字塔
空洞的眼神
复明片治疗糖尿病视网膜病变视网膜光凝术后临床观察