摘 要:针对临床医师在诊断新型冠状病毒感染CT影像时会受主观因素产生误差而影响诊断准确率,提出了一种基于ResNet18改进的HDCN-ResNet18网络模型。首先在ResNet18中添加HAM混合注意力机制模块,提升网络的特征提取能力和关键特征的挖掘能力;其次改进ResBlock模块,引入可变形卷积替代模型中的普通卷积,增强感受野,提高整个模型的鲁棒性;在训练过程中使用迁移学习和数据增强扩充样本集避免造成过拟合现象,试验结果表明,提出的模型的分类准确率相比原模型提升约6%,达到93%。
关键词:新型冠状病毒感染;深度学习;卷积神经网络;混合注意力机制
中图分类号:TP391.4;TP18 文獻标识码:A 文章编号:2096-4706(2023)20-0105-07
COVID-19 Recognition of Improved HDCN-ResNet18 Based on Artificial Intelligence Algorithm
JU Weixin
(1.Accounting Department, Qingdao Vocational and Technical College of Hotel Management, Qingdao 266100, China)
Abstract: An Improved HDCN ResNet18 network model based on ResNet18 is proposed to improve the diagnostic accuracy of clinicians when they diagnose COVID-19 CT images due to subjective factors. Firstly, this paper adds the HAM hybrid attention mechanism module in ResNet18 to improve the network's feature extraction ability and key feature mining ability.Secondly, the ResBlock module is improved. Deformable convolution is introduced to replace the ordinary convolution in the model to enhance the receptive field and improve the robustness of the whole model. It uses transfer learning and data enhancement to expand the sample set during training to avoid over-fitting. The experimental results show that the classification accuracy of the proposed model is about 6% higher than the original model, reaching about 93%.
Keywords: COVID-19; deep learning; convolution Neural Networks; mixed attention mechanism
0 引 言
2019年新冠感染(COVID-19)在全世界爆发流行,各个国家的人民健康和经济发展都受到了巨大的波及,并且已经形成全球性的公共卫生危机[1]。医疗物资短缺和医疗资源供应不足已经使得各地医院超负荷工作,截止到2022年7月,全球新冠患者累计已经达到5.5亿人次和超过600多万的死亡病例,并且其感染的累计人数不断上升[2]。该病毒会主动攻击人类呼吸系统,导致发烧咳嗽,并在一定概率造成新冠感染,并且至今该病毒没有相应的特效药,与细菌引起的肺炎对症治疗有着很大的差别[3],因此高效快捷准确的识别具有重要的意义和价值。目前筛查该疾病的主要手段为胸部计算机断层(Computed Tomography, CT)[4],根据新冠感染小斑片影、两侧肺部磨玻璃样影、浸润影等特征来人工判断。目前越来越多的医学疾病都在积极应用计算机辅助诊断(Computer Aided Diagnosis, CAD)提供客观决策支撑,而基于深度学习的计算成像技术在识别新冠感染方面有很大的发展空间[5],通过该技术可以将细菌性感染的肺炎和新冠感染进行区分,对于医师对病人的诊治提供客观的感染管理控制和治疗决策方案。
肺炎是一种呼吸道疾病,会引起患者的咳嗽、发烧、呼吸困难等症状[6],细菌、真菌和病毒都能引发肺炎的产生,但普通型肺炎的发病症状与新冠感染有着较多的相似之处,主治医师在诊断时需要借助于其他的医学检测手段,因此一个功能完善且识别率高的人工智能算法模型(Artificial Intelligence, AI)是重要且必要的[7]。通过该算法模型自动对新冠感染和其他类型肺炎进行区分,便于医师做出客观有效的诊断。
目前医学上检测的肺部疾病常用的医学技术为括磁共振成像(Magnetic Resonance Imaging, MRI)、胸部X光(Chest X Ray, CXR)和CT,而目前MRI和CT扫描是诊断肺部疾病较为有效和常用的,但目前磁共振成像成本较高且检测时间较长[8],因此CT是目前在医院内最常用的检测手段,但目前呼吸道患者较多,各地医院都在超负荷工作,而人工阅片是一种劳动密集型工作,耗时耗力且存在人为主观误差,造成一定概率的误判,通过人工智能辅助系统可以为医师做出临床决策,辅助该疾病的检测、诊断和预后,提高了工作效率,降低了主观因素的误差,并且极大地减轻了医护人员和医疗资源的供给压力[9]。
1 相关研究
近年来,深度学习网络模型正在广泛地应用到医疗领域,其较好的性能也取得了不错的效果[10-12],很多研究者也在使用卷积神经网络(Convolutional Neural Networks, CNN)对COVID-19阳性患者进行CT影像的识别和分类,SHI等[13]从CT疑似肺部病变区域通过ROI方法提取感兴趣区,根据提取的区域的纹理特征和灰度特征,利用Adboost算法分类器,取得了较好的识别效果。KHAN等[14]人使用了基于Xception的深度卷积神经网络模型——CoroNet,并通过迁移学习在ImageNet数据集的预训练,然后再通过参数微调应用到COVID-19的肺部影像识别中。OZTURK等[15]提出一种轻量级网络模型,基于DarkNet层的DarkCovidNet,在COVID-19影像识别中也取得较好的性能。YANG[16]等使用改进的DenseNet进行新冠感染识别的二分类识别检测,即阳性肺炎和非阳性,在没有使用分割的情形下识别率为79.5%,通过联合分割方法可以达到83.3%。SUN等[17]人使用了一种特征选择方法,利用深度森林模型作为分类器,对新冠感染CT影像和非新冠感染进行分类识别,其实验结果相比较于其他广泛的机器学习方法,具有更好的性能。综上,目前对与新冠感染的识别分类仍是当下研究的热点技术,利用深度学习和CNN卷积神经网络模型在胸部CT影像图片的分类任务中取得了较好的成绩,其最终的目的都是辅助临床医师进行诊断,提供客观决策,但其精度需要不断的优化和提升。因此,本文提出了一种基于ResNet18改进的HDCN-ResNet18深度学习网络模型,对COVID-19和非阳性肺炎的CT影像进行二分类识别。
2 CNN概述
CNN作为深度学习中的网络模型不仅仅应用于图像分类识别,还包括目标检测和语义分割等。KRIZHEVSKY等[18]设计的AlexNet模型获得了2012年ImageNet竞赛冠军,SIMONYAN等[19]通过重复交替使用小卷积核层和最大池化层,构建了16~19层的牛津大学计算机视觉几何群(Visual Geometry Group, VGG)网络模型,其性能明显提升,但其模型参数较大。
早期的CNN一般通过叠加模型广度或者模型深度提升其性能,但也会造成过拟合现象、梯度消融以及计算开销过大的问题,SZEGEDY等[20]提出的GoogLeNet模型,通过Inception模块平衡网络模型的宽度和深度,将空间结构简化,同时把空间信息转化为高阶抽象的特征信息。HUANG等[21]提出基于密集连接的DenseNet模型,通过特征重用减少了参数量与计算量,同时能有效地缓解梯度消融的问题。
为了能够更好地将CNN模型部署在移动端,很多学者致力研究于轻量级卷积神經网络,利用其模型参数少,模型小和较高的性能等特点能够更好应用于嵌入式硬件领域。IANDOLA等[22]提出基于Fire模块的SqueezeNet模型,其结构参数较少且与主流CNN模型有着相等甚至更高的识别率。卷积神经网络结构如图1所示。
3 模型结构
3.1 混合注意力机制
引入注意力机制能够自动的关注图像重要区域特征提高模型性能,目前也得到了广泛的使用[23,24],但现有的注意力机制在性能和复杂性上难以做到平衡,通过混合注意力机制模块HAM[25],能够使用一维卷积能够减轻通道注意机制的运算参数,并引入通道分离技术自适应强调重要特征,该机制既能够兼顾性能又能轻量且高效,其主要有两个模块构成:通道注意力模块和空间注意力模块。
3.1.1 通道注意力模块
通道以注意力模块挤压激励网络中的SENet模块为基础,通过学习不同通道的特征权重信息,提取相关特征并抑制无关特征,从而增强特征专注度,同时加强通道间的特征提取,进一步提升性能。
其结构如图2所示,W×H为输入特征的空间维度大小,C为其特征通道数,通道注意力模块对输入的特征采用多尺度池化,分别使用全局最大池化和全局平均池化,分别得到特征F1和特征F2,得到的特征再输入模块的自适应机制,通过两个步长为1的卷积层进行卷积后得到X1和X2,和相加并通过sigmoid函数合并映射,与原始特征图F按照点乘的方式得到新的注意力特征图。
3.1.2 空间注意力模块
空间注意力模块如图3所示,对得到的特征F同样进行多尺度池化,分别进行最大池化和平均池化,得到两个特征S1和S2,将两个池化后的特征沿着通道维度方向进行拼接后,再进行步长为7的共享卷积层进行卷积,通过sigmoid函数激活,再与先前的两个特征S1和S2相乘,并将其元素叠加成为最终细化特征。
3.1.3 混合注意力机制
该混合注意力机制使用ResBlock的整体架构,将通道注意力模块和空间注意力模块嵌入其中,输入特征首先经过通道注意力模块得到通道细化特征F′,然后经过空间注意力模块,利用通道分离技术将F′切分成两组不同的特征 和 ,然后对两组特征应用空间注意力机制得到空间注意力张量,再将其作用于输入特征获得空间细化特征 和 ,再将两组融合得到最终细化特征F′′′最终输出。其结构如图4所示。
3.2 可变形卷积
常规卷积以固定的卷积区域进行特征提取,在过程中感受野难以应对变形区域和不规则区域,导致提取的特征受限或不完整,容易导致目标关键信息丢失,从而网络结构模型性能不足。为提高卷积神经网络应对不规则区域的应对能力,引入可变形卷积来替代模型中原先的普通卷积,通过带可偏移的卷积采样取代固定卷积采样,通过可变的卷积采样,可使模型感受野能够更好地使用肺部CT纹理的条纹,以此捕获各种肺部CT影像中各种玻璃样影和小斑片影。
3.3 改进的HDCN-ResNet18网络模型
本文提出改进了ResNet18的模型,引入混合注意力机制,将通道注意力模块和空间注意力模块按照残差结构构建,兼顾了两者特性,增强了关键特征的提取能力。同时将ResNet18的第一层卷积和残差块中的卷积全部替换成可变形卷积,以此增强模型中的感受野,更好的捕获不规则区域和肺部影像中的纹理特征。在训练过程中,使用迁移学习先在ImageNet进行预训练,并将训练后的参数保留,再将模型放到肺部CT影像训练。
该模型由4个ResBlock模块作为主框架,输入的样本大小统一调整为224×224×3,模型第一层为可变形卷积,其中卷积核大小3×3,步长为3,再经过池化,得到的特征图像进入混合注意力模块,得到224×224×64特征图像,模型的模块1-3中,DeformConv1中卷积核大小3×3,步长设置为2,模块4中步长设置为1;残差模块中的DeformConv2卷积核大小都为3×3,步长都为1。在本模型中,通过Adam作为模型训练优化器,该优化器结合了Momentum和Adaptive动量算法,将SGD的一阶动量和AdaDelta的二阶动量相加使用。
β1和β2为矩估计的指数衰减率,并初始化m0 = 0,V0 = 0,而在梯度运算的初期mt和Vt会向0逼近,为解决这个问题,通过如下公式进行修正:
通过上述公式在运算过程中可以动态的调整一阶动量和二阶动量的运算,以此达到自适应性学习率,使其快速收敛并完成对整个网络模型的优化。改进的HDCN-ResNet18网络模型如图5所示。
4 实验结果分析
4.1 数据集构成
本文的样本集来源分为两部分,一部分肺部CT影像来自Kaggle挑战赛网站的公共数据集,另一部分样本集来自青岛市中心医院,并采用数据增强方法共获得阳性新冠感染(COVID-19)CT共1 215张,非阳性CT共1 813张(包含普通型新冠感染和正常肺部CT影像),均为jpg格式,如图6和图7所示,其中,新冠感染的CT影像中有明显的斑片状影和磨玻璃影。为了能够更好地全面的验证阳性病理,将数据集分为三部分,如表1所示。
4.2 实验环境
1)硬件环境:CPU为Core(TM)i7-11400H,32 GB内存,RTX 3070(8 GB)独显。
2)软件环境:PyCharm集成了丰富神经网络模块和各种灵活版本的虚拟环境,因此本文使用 PyCharm 2021.1.1专业版;因PyTorch框架的延伸性和拓展性较强,因此采用PyTorch 1.9;其余为CUDA 11.2,Python 3.8.12,操作系统Win 10(64位)。
4.3 评价指标
實验初始的学习率设置0.001,输入样本批大小为16,迭代次数设置为100,在对比中,以模型识别率为主要参考指标,其公式如下:
xi为正确样本类数量,yj为j个样本,模型的正确率由正确分类数量和总样本量的比值得出。
4.4 实验结果分析
4.4.1 模型参数量对比
本文对比了主流的识别性能较高且使用较多的算法模型,如表2所示。本文算法相比较于其他算法模型,其参数量明显较小,从而在运行效率上性能较高,部署也更加便捷,而较少的参数模型在样本集有限的情况下更加便于训练,一定程度避免了过拟合现象,而参数过多的模型如VGG,在样本集有限时会因为参数训练不够充分而导致整体识别率整体性能较差。
4 本文方法 0.98×108
4.4.2 改进的HDCN-ResNet18网络模型与ResNet18对比
本文算法是基于ResNet18基础改进的模型,因此与其分别在三个数据集上做了识别率的比对,如表3所示,可以得到方法1是Resnet18结合了混合注意力机制,在识别性能上均有一定的提升,而方法2是Resnet18中的普通卷积全部替换成可变形卷积,其识别率有提升,但效果不明显,而结合了本文的改进方法在整体性能中较原先的ResNet18提升较为明显,整体评价提高了6%的识别率。
4.4.3 对比其他模型识别率
本文算法比较了目前较为主流的识别模型,同样使用了迁移学习,并都使用了数据增强后的样本集,为了更好对比性能,模型的初始学习率、迭代次数和样本输入批次都设置一样,并在三个数据集进行了验证,其结果如表4和图8、图9所示,VGG的识别率整体较低,因本文的肺部的样本集有限,且该模型参数较大,因此相比于其他模型性能较低,而Resnet18的模型参数较少,识别率相比较于其他模型较高,而通过本文改进的HDCN-ResNet18网络模型进一步提高了原有模型的性能,达到了较高的水平。
4.4.4 对比不同的优化器
优化器在模型训练过程中起到了重要作用,合适的优化器能使得模型快速收敛并且达到一个较优的区间从而提升整个性能,本文在数据集1中对比了三种常用的优化器,如表5所示,随机梯度下降(Stochastic Gradient Descent, SGD),作为一种常用的优化器,采用小批量训练数据迭代,但每次更新可能并不会按照正确的方向进行,并在最优解两边持续震荡导致形成局部最优。均方根传播梯度下降法(root mean square Propagation, RMSProp)也是常见的优化器,但训练过程中在每次的迭代学习率会逐渐缩小,导致优化完全停止并且过于依赖全局学习率。采用自适应矩估计(Adaptive Moment Estimation)优化器在本文改进的算法更为适用,虽然该优化器具有不稳定性,会错过最优解,但其自适应能力和快速收敛更加适合改进后的HDCN-ResNet18模型。
5 結 论
本文提出的改进后的HDCN-ResNet18网络模型对阳性新冠感染(COVID-19)有着较好的识别性能,在融入了残差结构的混合注意力机制和可变形卷积,使得模型具有更好的感受野和特征提取能力,提高了整体的性能,并且在不同的数据集进行了验证,识别率高于其他主流的网络模型,在模型大小上,也具有更少的参数和更小的体积,便于在有限的样本集下能够更好地训练,从而得到较好的性能便于部署,也避免了过拟合现象,在接下来的工作中,将和transfomer相结合,进一步研究改善模型性能。
参考文献:
[1] GREENSPAN H,ESTEPAR R S J,NIESSEN W J,et al. Position paper on COVID-19 imaging and AI:From the clinical needs and technological challenges to initial AI solutions at the lab and national level towards a new era for AI in healthcare [J].Medical image analysis,2020,66:1-11.
[2] 凌胜利.新冠感染疫情与非传统安全治理 [J].新华月报,2022(19):121-124.
[3] SONG C Y,XU J,HE J Q,et al. Immune dysfunction following COVID-19,especially in severe patients [J].Scientific reports,2020,10(1):1-11.
[4] 李明磊.基于CT影像的新冠肺炎辅助诊断方法研究 [D].哈尔滨:哈尔滨工业大学,2021.
[5] 冉智强.基于深度学习的新冠肺炎CT图像辅助诊断研究 [D].重庆:重庆理工大学,2022.
[6] MAMALAKIS M,SWIFT A J,VORSELAARS B,et al. DenResCov-19:A deep transfer learning network for robust automatic classification of COVID-19, pneumonia, and tuberculosis from X-rays [J/OL].arXiv:2104.04006 [eess.IV].[2023-03-16].https://arxiv.org/abs/2104.04006.
[7] YASSINE H M,SHAH Z. How could artificial intelligence aid in the fight against coronavirus? An interview with Dr Hadi M Yassine and Dr Zubair Shah by Felicity Poole,Commissioning Editor [J].Expert review of anti-infective therapy,2020,18(6):493-497.
[8] 周舒畅,王玉锦,胡琼洁,等.RSNA2016胸部影像学 [J].放射学实践,2017,32(1)8-15.
[9] SHI F,WANG J,SHI J,et al. Review of artificial intelligence techniques in imaging data acquisition,segmentation and di agnosis for COVID-19 [J].IEEE Reviews in Biomedical Engi neering,2021,14:4-15.
[10] WANG W,HU Y Y,ZOU T,et al. A new image classification ap proach via improved MobileNet models with local receptive field expansion in shallow layers [J].Computational Intelli gence and Neuroscience,2020:8817849.
[11] 韩丽,朴京钰,兰鹏燕,等.结构感知深度学习的三维形状分类方法 [J].计算机辅助设计与图形学学报,2021,33(1):29-38.
[12] 高翔,李春庚,安居白.基于注意力和多标签分类的图像实时语义分割 [J].计算机辅助设计与图形学学报,2021,33(1):59-67
[13] SHI F,XIA L M,SHAN F,et al. Large-Scale Screening of COVID-19 from Community Acquired Pneumonia using Infection Size-Aware Classification [J/OL].arXiv:2003.09860 [eess.IV].[2023-03-18].https://arxiv.org/abs/2003.09860.
[14] KHAN A I,SHAH J L,BHAT M M. CoroNet:A Deep Neural Network for Detection and Diagnosis of COVID-19 from Chest X-ray Images [J].Computer Methods and Programs in Biomedicine,2020,196:105581.
[15] TULIN O,MUHAMMED T,AZRA Y E,et al.Automated detection of COVID-19 cases using deep neural networks with X-ray images [J].Computers in Biology and Medicine,2020(1):1-11.
[16] YANG X Y,HE X H,ZHAO J Y,et al. COVID-CT-Dataset:A CT Scan Dataset about COVID-19 [J/OL].arXiv:2003.13865 [cs.LG].[2023-03-18].https://arxiv.org/abs/2003.13865v3.
[17] SUN L,MO Z H,YAN F H,et al. Adaptive Feature Selection Guided Deep Forest for COVID-19 Classification with Chest CT [EB/OL].[2023-03-18].https://arxiv.org/pdf/2005.03264v1.pdf.
[18] KRIZHEVSKY A,SUTSKEVER I,HINTON G E. ImageNet classification with deep convolutional neural networks [J].Communications of the ACM,2017,60(6):84-90.
[19] SIMONYAN K,ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [J/OL].arXiv:1409.1556 [cs.CV].[2020-11-22].https://arxiv.org/abs/1409.1556.
[20] SZEGEDY C,LIU W,JIA Y Q,et al. Going deeper with convolu tions [EB/OL].[2023-03-18].https://www.modb.pro/doc/58709.
[21] HUANG G,LIU Z,VAN DER MAATEN L,et al. Densely connected convolutional networks [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Honolulu:IEEE,2017:2261-2269.
[22] LANDOLA F N,HAN S,MOSKEWICA M W,et al. SqueezeNet:AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size [J/OL].arXiv:1602.07360 [cs.CV].[2023-03-18].https://arxiv.org/abs/1602.07360v4.
[23] 余浩帥,汤宝平,张楷,等.小样本下混合自注意力原型网络的风电齿轮箱故障诊断方法 [J].中国机械工程,2021,32(20):2475-2481.
24] 郑作武,邵斯绮,高晓沨,等.基于社交圈层和注意力机制的信息热度预测 [J].计算机学报,2021,44(5):921-936.
[25] LI G,FANG Q,ZHA L,et al. HAM:Hybrid attention module in deep convolutional neural networks for image classification [J].Pattern Recognition,2022,129:1-5.
作者简介:鞠维欣(1991—),男,汉族,山东青岛人,助教,硕士研究生,研究方向:人工智能算法、大数据、智能金融。
收稿日期:2023-08-07