基于人工智能ResNeXt的高度近视诊断方法

2022-04-01 07:25万程陈柏兵沈建新陈志强
实用老年医学 2022年3期
关键词:集上分类预测

万程 陈柏兵 沈建新 陈志强

近视是全世界范围内发病率最高、年龄跨度最大和涉及面最广的视觉健康问题。虽然近视在老年人群中常被忽视,但随着年龄的增长,近视的风险也在增加,需要引起更多的关注和重视。成人高度近视易并发白内障、青光眼、视网膜脱离和近视性黄斑变性,这些并发症都可以造成视功能的不可逆损伤。高度近视的发病机制复杂,目前普遍认为环境因素和遗传因素共同参与了其发生和发展[1-2]。随着年龄的增长以及用眼不健康,近视可渐进发展。延缓高度近视的进一步发展,对提高老年高度近视病人的生活质量具有重大意义。

眼底图像病症分析需要关注眼底的某些特定部位,比如视盘、黄斑和血管等区域,这些区域对疾病诊断有决定性的作用。高度近视经常会出现豹纹状眼底、近视弧形斑和黄斑区域的白色萎缩斑,本研究尝试使用深度学习方法提取高度近视特征,提出了一种基于ResNeXt的高度近视诊断方法,现将应用效果报道如下。

1 资料与方法

1.1 数据集来源与划分 本研究使用的眼底图片数据来自江苏省省级机关医院,图片分辨率大小和格式有3种,分别为2592×1944的PNG格式的彩色图片、2544×1696的JPG格式的彩色图片、2196×1958的JPG格式的彩色图片。数据集由江苏省省级机关医院的专业眼科医生进行标注,包括6571张高度近视眼底图片,6212张正常眼底图片。其中,男性3482例(5962张图片),女性3916例(6821张图片),病人年龄60~81岁,平均 (67.6±3.21)岁。本文将数据集划分为训练集、验证集和测试集。将眼底图片按照3∶1∶1的近似比例随机划分。最终数据集划分结果如表1所示。

1.2 方法 基于深度学习的高度近视诊断总体流程为:眼底图像→数据预处理→模型训练→测试评估。眼底图像在进入网络训练之前首先经过数据预处理模块,然后进行不同网络的模型训练,保存在验证集上AUC值最大的网络模型,模型训练结束后进行不同网络模型的测试,比较本文使用的改进的ResNeXt-50和5种经典的卷积神经网络(CNN)(VGG-16、 VGG-19、Inception-V3、EfficientNet-B0和ResNet-50)的高度近视诊断结果。

1.2.2 ResNeXt-50网络:本文使用CNN进行高度近视眼底图像分类任务。采用的网络结构为ResNeXt-50网络,该网络结构在图像分类任务中性能优越。

ResNeXt的模块主要是将残差模块复制了C次,C=32,用多个1×1卷积核降维从而减少网络的参数,1×1卷积核后面为3×3卷积核,用于特征提取,进行了非线性映射,增强了网络的表达能力。ResNeXt网络使用全局平均池化代替了全连接层,大大降低了网络的复杂度,减少了网络参数,将最终的SoftMax分类层设置为本实验任务所需的分类类别数。

1.2.3 模型训练:本文使用在ImageNet数据集上训练出来的参数作为预训练参数对ResNeXt-50网络进行初始化,这样可以极大程度地节省训练网络模型的时间,使网络更快地收敛。本文所有网络模型使用的都是随机梯度下降(SGD)优化算法,动量设置为0.9,损失函数为交叉熵损失函数,初始学习率都设置为0.0005,每训练20轮学习率减小为原来的1/5,考虑到工作站显卡内存的限制,每批样本设置为8张图片,每轮迭代959次,总共训练100轮,保存在验证集上AUC值最高的模型,训练结束后将保存的模型应用于测试集上得到分类准确度、特异度、灵敏度、AUC等评价指标。

本实验使用的图像处理工具是OpenCV,使用的编程语言为Python,深度学习框架为PyTorch,在Inter(R)Core(TM)i7-6700 CPU、3.4GHz主频、16GB内存、GTX1080显卡、8GB显卡内存的工作站运行。

1.2.4 评价指标:本实验使用分类准确度、特异度、灵敏度、AUC作为评价指标,并测试了每张图片的平均诊断时间。

2 结果

2.1 ResNeXt-50诊断高度近视的价值 ResNeXt-50网络对于高度近视诊断分类准确度为94.1%,特异度为95.94%,敏感度为92.33%,对于高度近视较为敏感,AUC为0.9861,单张图片的平均诊断时间为0.035 s,实时性能够满足实际的辅助诊断需要。本实验提出的深度学习方法和手工设计的传统方法的准确度、特异度和灵敏度显示:ResNeXt-50无论是在高度近视图像的识别还是正常眼底的识别,都远远超过了完全局部二值模式(Complete Local Binary Patterns, CLBP)+梯度提升决策树(Gradient Boosting Decision Tree, GBDT)、K近邻算法(k-Nearest Neighbor, KNN)、随机森林(Random Forest, RF)和支持向量机(Support Vector Machine, SVM)。见表2。

表2 ResNeXt-50与传统方法分类结果比较

2.2 ResNeXt-50诊断高度近视举例 从高度近视诊断任务取出不同的分类结果情况,如图2所示。图2(a)表示这张图片真实标签为患有高度近视,通过ResNeXt模型后预测为高度近视,预测正确;图2(b)表示这张图片的真实标签为患有高度近视,通过模型测试后预测为正常,主要原因是视盘区域的近视弧不明显,同时其他眼底区域也没有明显病变,模型训练这种病变特征不明显(对人类来说)的高度近视图片很难学习有效参数,因为模型训练是分批次进行的,每一批次有多张图片,模型训练的方向要求这批数据的平均损失最小,此类图片也偏少,因此训练出来的模型将其预测为正常图像,导致预测出错;图2(c)表示这张图片的真实标签为正常,通过模型测试后被预测为高度近视,主要原因是视盘周围有一层灰白色造影,模型预测时误将其当成近视弧特征,预测分类时被分为高度近视,在训练的模型看来,这张图片提取到的特征向量更加接近高度近视的特征,最终被误分类为高度近视;图2(d)表示这张图片的真实标签为正常,通过模型测试后被预测为正常,预测正确。

图2 高度近视和正常眼底预测结果

3 讨论

近些年来,深度学习发展迅速,CNN凭借强大的特征提取能力在医学影像方面应用非常广泛,比如糖尿病视网膜病变的分级[3]、青光眼以及白内障的诊断[4-5]、病灶点的检测[6]和眼底图像质量评估[7]等。此外,Shin等[8]采用迁移学习完成了间质性肺病(ILD)的分类。Lam等[9]利用GoogLeNet模型迁移学习,在Kaggle数据集上对糖尿病视网膜病变进行分类,敏感度达到了95%,特异度达到了96%。Zago等[10]通过微调CNN模型,在DRIMDB数据集上实现了0.9998的AUC。深度学习可以自动提取图像的特征,并且将低维特征转化为高维特征,而传统的特征提取方法需要手工设计特征,比如几何特征、灰度特征和纹理特征等, 深度学习提取的特征往往比传统的手工设计的特征描述图像信息更为准确。

本研究使用了深度学习网络ResNeXt-50,实现了高度近视眼底的自动诊断,取得了较好的分类结果,具有较高的实时性,满足了计算机辅助诊断的要求,同时可以大幅提高诊断效率,在临床上具有重要意义。特别是在一些大型体检中心,进行大规模体检时,只要有眼底相机和接受过简单培训的工作人员,借助此技术,即使缺乏专业眼科医生,也能快速诊断出高度近视,节省大量人力。总之,使用深度学习来研究高度近视病变的研究较为少见,本研究提出的方法可以用于高度近视眼底的筛查,提高诊断效率,减轻医生的负担,辅助医生进行诊断,同时也在高度近视眼底图像分类方向的工作中做了一点新的尝试。

猜你喜欢
集上分类预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
关于短文本匹配的泛化性和迁移性的研究分析
基于互信息的多级特征选择算法
按需分类
教你一招:数的分类
说说分类那些事
师如明灯,清凉温润