基于PL-EfficientNet 的糖尿病视网膜病变检测研究

2022-11-05 08:31白杰李艳萍
电子设计工程 2022年21期
关键词:视网膜卷积标签

白杰,张 赛,李艳萍

(太原理工大学信息与计算机学院,山西榆次 030600)

糖尿病视网膜病变(DR)是导致人类失明的主要因素之一。在目前临床诊断中,该疾病主要依赖眼科医生对彩色眼底图像进行详查后对患者的病情进行评估[1]。大量的DR 患者受限于糖尿病患者数量庞大、地区医疗资源匮乏,无法得到及时的诊断与治疗,从而错过了最佳的治疗机会,最终造成不可逆转的视力损伤乃至失明的严重后果。此外,人工诊断的效果极度依赖临床医生的诊治经验,部分医生经验不足等原因造成的误诊、漏诊时有发生[2]。因此,提出一种利用图像处理、模式识别以及机器学习等技术对彩色眼底图像进行自动、准确处理与分析的算法,是一项十分迫切的任务[3]。

现有DR 检测诊断算法大致分为两类,第一类是基于传统图像特征提取方法,如文献[4]利用形态学方法提取眼底图像的病变特征,结合机器学习中SVM 分类器进行分类;第二类是基于卷积神经网络的方法,如文献[5],通过迁移学习引入ResNet 与Inception-ResNet-v2 网络模型自动诊断DR 病变程度,在Diabetic Retinopathy Detection 竞赛数据集上验证得到二次加权(Kappa)值为0.76。文献[6]利用不同卷积神经网络做对比实验,同样在Diabetic Retinopathy Detection 竞赛数据集上验证,二次加权(Kappa)值达到了0.786。

针对高质量无标签眼底图像利用率较低及DR不同病变等级之间特征差异小、模型难以捕捉所有分类微细节而造成诊断效率欠佳的问题,文中提出了PL-EfficientNet(Pseudo-Label EfficientNet) DR 检测算法,引入高效网络模型[7],通过半监督伪标签技术[8],将无标签眼底图像数据加入训练数据集,既有效防止过拟合的发生,又提高了模型的检测及诊断效率,同时也避免了高质量眼底图像数据的浪费。

1 算法原理

1.1 高效网络

为了提高DR 分类模型的诊断效率,文中将迁移学习技术引入高效模型,由于实验使用的眼底图像数据集与ImageNet 数据集特征差异较大,因此对模型重新初始化训练。使用高效模型系统地研究了模型缩放,通过使用简单而高效的复合系数平衡网络深度、宽度和分辨率,以实现更好的性能。与以往卷积神经网络相比,高效模型效率更佳[9]。

一个卷积网络层i可以定义为一个函数Yi=Fi(Xi),其中Fi是运算函数,Yi是输出张量,Xi是输入张量;张量维度为其中Hi和Wi是空间维度(分辨率),Ci是通道维度(宽度)。一个卷积网络层N用组合表示为:

在实际应用中,卷积网络层通常被划分为多个阶段,每个阶段的所有层共享相同的架构。例如,ResNet 有五个阶段,每个阶段的所有层都具有相同的卷积类型,但第一层执行向下采样。因此,可以将卷积神经网络定义为:

式(2)中,表示在阶段i中Fi被重复Li次,表示第i层输入张量的类型,卷积空间维度逐渐缩小,但通道维度是扩展的。设计卷积网络层主要用于寻找最佳的层架构Fi,模型缩放试图扩展网络长度Li、宽度Ci和分辨率Wi、Hi,但不更改基线网络中预定义的Fi。通过固定Fi,模型缩放简化了新的资源约束的设计问题,但它仍然有一个大的设计空间,以探索不同的Li、Ci、Hi、Wi的每一层。为了进一步缩小设计空间,使用复合系数φ统一扩展网络宽度、深度和分辨率,如式(3)-(5)所示:

其中,α、β、γ是常量,由一个小网格搜索,分别代表深度、长度和宽度,φ为规定的系数,用来扩展网络大小。约束如式(6)、(7)所示:

1.2 伪标签

当前DR 检测算法中,多数学者采用监督学习进行研究,利用改进的深度卷积网络实现较优的DR 检测分类结果,而半监督学习训练数据时,同时存在标签数据和无标签数据。伪标签技术则是使用无标签数据提高泛化性能。聚类假设指出,决策边界应位于低密度区域以提高泛化性能,而概率较高的数据点相同类别的可能性较大,因此伪标签具有较高的可信度[8]。伪标签流程如图1 所示。

图1 伪标签流程图

为了提高算法的普遍适用性,实验使用53 576 幅高质量无标签眼底图像,其标签由完成预训练的EfficientNet-b4 及EfficientNet-b5 模型按不同权重预测得到。不同病变等级眼底图像数量及采样后各病变等级眼底图像数量如表1 所示。

表1 预测无标签数据病变等级

由表1 可知,预测得到的眼底图像各病变等级图像数量分布极不平衡,针对这一问题,实验采用欠采样抽样方式平衡各病变等级图像数量。

2 实验过程及结果分析

2.1 数据集

实验使用Kaggle国际竞赛中的Diabetic Retinopathy Detection(DR 2015)、Aptos 2019 Blindness Detection(DR 2019)竞赛数据集,其中DR 2015 数据集来自于免费视网膜筛选平台EyePacs,包括88 702 幅高分辨率彩色眼底图像[10]。DR 2019 数据集来自于印度Aravind 眼科医院,含有高质量彩色眼底图像5 580幅[11]。根据DR 不同病变类型,眼底图像分为非增殖性糖尿病视网膜病(NPDR),如图2(a)-(d)所示,以及增殖性糖尿病视网膜病(PDR),图2(e)所示。

图2 糖尿病视网膜病变图像

为了解决眼底图像中存在的伪影、失焦以及曝光不足或曝光过度等影响图像像素强度值和引起误差变化等情况,对原始数据集所有彩色眼底图像进行预处理[12]。

2.2 归一化预处理

眼底图像归一化预处理过程:首先剔除损坏图像,去除无信息黑色背景边缘,对亮度不一的图像进行亮度均衡、对比度均衡处理[12]。实验将图像输入尺寸设置为256×256 像素。DR 图像归一化预处理前后对比图如图3 所示。

图3 归一化预处理前后DR图像对比图

针对数据集中各病变等级标签眼底图像数量分布不平衡(如图4 所示)的问题,采用数据增强方法扩充数据,从而提高模型的泛化性能。将图像随机旋转(-180°,180°),同时进行水平、垂直翻转及移动,增加图像数量少的样本数量,解决数据不平衡的问题[13]。

图4 DR不平衡数据分布图

2.3 评价指标

Kappa 值是评价判断一致性程度指标,同时也是描述诊断一致性较为理想的指标,在临床试验中得到广泛应用[14]。在国际性竞赛中,平方加权值是评估模型的主要指标,它将线性加权的权值平方,放大距离大的两个类别的判断不一致程度:

其中,i、j代表类别编号,其差值代表两个类别的距离。N为类别总数,Wi,j代表放大的平方差值,Oi,j代表将第i类判别为第j类的个数,Ei,j代表真实列表,由公式计算可得到平方加权Kappa 值(k),实验采用k值作为模型参考指标。

2.4 实验流程及设置

为了使模型更加充分学习到眼底图像深层次细节信息,实验对眼底图像进行预处理后通过数据增强扩充数据,重新初始化训练EfficientNet-b4 及EfficientNet-b5 模型,并使用DR 2019 标签数据进行微调,利用模型较优性能预测DR 2015 测试集中53 576 幅无标签眼底图像所对应的标签,之后结合标签数据二次训练得到最优模型及参数。

实验 在Win10系统、GeForce GT-X 1080 Ti显卡、Pytorch-GPU上进行。采用CrossEntropyLoss 损失函数、SGD 优化器,初始学习率设置为0.001,K 折交叉验证设置为3 折,Epoch 设置为150。

2.5 实验结果对比分析

1)高效模型与其他模型对比

为了验证高效模型效率优于其他先进模型以及进一步得出伪标签技术可以有效提高模型诊断效率的结论,设置多组对比实验,各模型所得k值如表2所示。由表中数据可知,在相同实验环境下,各实验模型均取得较优性能,但是EfficientNet 系列模型整体优于RegNetY1_6GF 及其他模型,因此采用EfficientNet 系列模型进行后续实验。与此同时,证实了伪标签技术可有效优化EfficientNet 系列模型性能,既提高了眼底图像使用效率,又提升了检测算法诊断准确性。

表2 高效模型与其他模型k 值对比

2)与其他先进算法对比

为了证实所提算法在糖尿病视网膜病变检测中的先进性与有效性,使用k值作为评估指标,将所提算法与文献[5-6,11,15-16]进行比较,结果如表3 所示。所有算法均建立在Kaggle 公开竞赛数据集上进行验证,所提算法k值达到0.918,优于其他先进算法,并优于DR 2015、DR 2019 竞赛中的部分模型,证实该算法在DR 检测中,可以得到更高的诊断准确率。

表3 文中模型与其他先进模型k 值对比

3 结论

文中提出PL-EfficientNet糖尿病视网膜病变检测算法,基于高效网络与伪标签技术,为了克服DR不同病变等级之间特征差异小,模型难以捕捉分类微细节而造成效率欠佳以及高质量无标签眼底图像利用率低的问题,选用重新初始化权重的高效网络模型,更容易提取眼底图像病灶特征。利用伪标签技术融合无标签数据,有效抑制模型过拟合,优化模型性能。与其他先进算法相比,该算法k值更优,模型鲁棒性更佳,因此文中所提算法在实际临床诊断应用中比其他方法更具潜力。在后续工作中,将继续改进及完善该算法,实现更高的检测诊断效率,并扩展其使用领域。

猜你喜欢
视网膜卷积标签
基于全卷积神经网络的猪背膘厚快速准确测定
深度学习在糖尿病视网膜病变诊疗中的应用
如何防治裂孔性视网膜脱离
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
视网膜脱离相关知识,你了解多少?
视网膜脱离能治好吗
不害怕撕掉标签的人,都活出了真正的漂亮
让衣柜摆脱“杂乱无章”的标签