李丰卓
(中南民族大学生物医学工程学院 湖北·武汉 430074)
各类眼科疾病会引起视网膜血管发生形变。对眼底图像的定量分析,可以提前通过视网膜血管的异常结构实现心血管疾病的预测、诊断和治疗。近年来,深度学习方法在医学图像分割领域应用广泛,相关学者针对相关问题研究了许多自动分割的算法。早期,许多计算机视觉算法基于血管的先验知识等信息,从图像预处理的角度来处理这个问题。然而,随着深度学习方法的提出,可以通过自动特征学习来获取更多的图像特征信息。尤其是卷积神经网络(Convolutional Neural Networks,CNN)的提出使其可以通过权值共享来实现复杂图像的快速高效处理,在图像分类、分割、重建等方面得到了广泛的应用。一些研究已经证明,CNN在视网膜血管分割方面取得了更好的性能。例如,Liskowsk等人[1]利用CNN设计一个二分类器,将血管分割任务看成逐像素的分类任务,实现了较为准确的分割效果,与传统方法相比性能有所提升,对血管的细微结构也有较好的效果。然而,由于视网膜血管结构复杂多变,这些方法分割的血管依旧比较模糊。
针对视网膜血管结构复杂多变,精细血管结构分割不精确等问题,本文在U-net基础上引入U-net++[2]来进一步提高视网膜血管图像的分割精度和精确率,通过实验证明方法可以有效提升视网膜血管分割的准确率和精度。
深度学习模拟人工神经网络,能够实现从输入提取复杂的深层次特征。与传统的机器学习算法不同,无须使用过多的人工特征,由于其自学特征的能力给图像处理技术带来了巨大突破。近年来,随着GPU性能的提升,深度学习在生物信息学,医学图像处理,自然语言处理等各个领域得到了广泛的应用。
基于编码器-解码器网络在医学图像分割领域应用广泛,其通过跳跃连接的特征融合方式更是将低级特征和高级特征紧密结合,即使在复杂背景下也能有效地实现图像的准确分割。根据这些特点,在原始U-net上,高效集成多种深度的U-net来共享编码器;重新设计跳跃连接,聚合多尺度语义特征;设计剪枝方案,变化U-net++结构使得特征融合更加灵活,加快网络的学习速度,所用的U-net++结构如图1所示。
整个网络首先融合了多种不同深度的U-net,避免了U-net的最佳深度的未知先验设计,无须广泛的架构探索。同时,这些U-net还可以设计融入残差块,密集连接块等减少网络参数,提升网络分割性能;重新设计的跳跃连接避免了不必要的特征强制融合方式,无须在编码解码子网上来强制融合相同比例的特征图,可以聚合多尺度的特征信息,实现更为灵活的特征融合;还能通过剪枝来快速探寻最优的分割分支。网络的连通计算如下:
式中xi,j表示神经元Xi,j的输出,其中i代表沿编码器方向索引下采样层,j代表沿着跳跃连接密集块的卷积层。函数H()表示卷积运算,卷积完之后再用激活函数激活,D()和U()分别表示下采样层和上采样层,[]表示串联层。如图1所示,j=0的节点接受的仅仅是上一个编码器层的一个输入,级别j=1的节点接受两部分连续层的输入,一部分输入来自连续层的跳跃连接,另一部分输入来自连续层的上采样,j>1接受j+1个节点的输入,其中j个输入是同级别的路径中之前j个节点的跳跃连接,另外一个输入是从低层级的相邻节点的上采样的输出。最后,全部之前的特征图都会叠加在当前节点,这是因为在每个跳跃连接都使用了密集卷积块。
图1:U-net++
DRIVE Dataset是用于视网膜病变研究的数据集,其中包含有40张彩色视网膜血管图像。在网络训练之前,通过标准化对数据进行预处理,同时利用随机翻转,高斯噪声等来进行数据增强,扩充数据集,避免网络过拟合。
在视网膜分割任务中,血管分割可以看作是一个图像翻译任务,对每一个像素进行二分类,判断每个像素是否属于视网膜血管。为了衡量分割网络的效果,引入了Dice相似系数来衡量分割结果与手工掩膜之间的相似性。以及使用ROC曲线及AUC值等来评价网络的分割性能。
实验结果如表1所示,对比了不同方法下模型的性能。
模型 Dice ROC AUC u-net 0.751 0.9648 0.8754 u-net++ 0.796 0.9700 0.8831
从表中可以看出,我们的方法在Dice系数上提高了0.045,ROC曲线提高了0.0052,AUC值提高了0.0077,证明了引入该方法有效提升了视网膜血管的分割结果。
经过数据预处理送入到网络之后的分割结果如上图所示:最左侧是原始视网膜图像,标签是医生手工分割的,最右侧是网络的分割结果。通过标签与网络预测结果对比可知,我们的网络可以实现准确清晰地分割血管。