陈智超 汪国强 李飞 杨昭
摘要:番茄叶片病害的精准识别对农业领域未来的发展至关重要,农业研究人员逐渐使用深度学习的方法进行植物病害的精准检测。然而对比以往的神经网络可以发现,它们普遍缺少上下文信息的连续性以及全文信息的完整性。对此本研究提出了一种Bi-LSTM和多尺度卷积神经网络相结合的模型,采用双向长短期记忆网络,可以更好地捕捉双向信息的反馈,使上下文的信息更具有连续性,而所提出的多尺度卷积神经网络既保证了全局信息的完整性,同时减少了细节信息的丢失,为了提高模型对病害特征的识别能力引入注意力模块,从而使模型重点关注疾病的特征部分。从公开的PlantVillage数据集中选取番茄的9类疾病和健康的叶片作为研究对象,试验结果在验证集上得到最高分类准确率为98.16%,与其他几个经典的CNN模型相比较,该模型的识别准确率优于其他的基础模型,并且具有较好的稳定性。经过试验验证,该模型可以为番茄病害识别提供一种有效的解决方法。
关键词:双向长短期记忆网络;多尺度;番茄;病害识别;注意力;Bi-LSTM
中图分类号:S126;TP391.41 文献标志码:A
文章编号:1002-1302(2023)15-0194-09
基金项目:国家自然科学基金(编号:51607059)。
作者简介:陈智超(1997—),男,黑龙江哈尔滨人,硕士,主要从事数字图像处理研究。E-mail:1298664186@qq.com。
通信作者:汪国强,博士,教授,主要从事数字图像处理研究。E-mail:wangguoqiang@hlju.edu.cn。
番茄作为世界上最受欢迎的蔬菜之一,它富含人们日常所需的微量元素,它的年产量高居世界首位,被许多国家广泛种值,种植过程中的病害严重影响番茄的产量和收益[1]。最近一些科学研究表明,番茄产量正在逐步下降,主要原因就是没有及时发现番茄叶片部位的病害并及时进行治疗,例如早期叶片部位的病变并没有充分引起大家的注意,随着病害从叶片延伸到植物的根部,导致番茄年产量逐年下降,给农民造成严重的经济损失[2]。因此及时且精准地识别番茄病害类型,并进行有效预防,有助于农户种植番茄。在这个不断变化的生态环境中,精确地检测疾病并进行病害的有效识别对避免生态环境可能面临的植物病害问题非常重要[3]。人类早期通过肉眼诊断植物病害,长期以来也是一项艰苦而徒劳的工作。采用传统的机器学习算法如支持向量机、主成分分析方法,通过手工特征提取和分类器进行图像的分类,但复杂的特征工程很大程度上影响了工作效率,他们往往局限于使用的数据集太小,并且分类器需要大量参数进行调整,得到的结果通常单一化,不具有代表性[4-5]。
近年来,研究人员针对植物分类任务提出了一系列方法。Albogamy等提出了一种利用带有最大池化的批量归一化层和Dropout层,并且开发了一种自动诊断辅助系统,批量归一化有助于将神经网络的输入标准化[6],最大池化层有助于减少空间卷积特征的大小,而Dropout层可以缓解模型训练阶段的过拟合问题,该模型在一个包含15种植物病害的公共数据集上进行了试验,通过试验得知模型在验证集上的准确率为96.4%[6]。Abbas等提出了基于深度学习的番茄叶片检测方法,利用条件生成对抗网络生成番茄叶片的合成图像,然后利用迁移学习在合成图像和真实图像上训练DenseNet121模型,该模型同样也在公共的PlantVillage数据集中选取番茄叶片进行了训练,其10类的识别准确率达到了97.11%[7]。胡玲艳等对SqueezeNet结构进行改进,精简其中的fire模块,对Expend层的卷积核、网络层数以及通道数进行调整,模型识别准确率达到97.29%[8]。马宇等提出了基于ResNetXt50残差网络,将注意力机制嵌入残差网路模块提取特征,采用迁移学习预训练参数的方式训练网络,其识别准确率达到98.4%[9]。谢圣桥等提出了一种基于迁移学习的技术,实现了葡萄叶部病害的精准分类,对葡萄病害识别达到了96%以上[10]。刘君等提出一种基于YOLO网络番茄识别算法模型,对8类番茄疾病的平均识别准确率达到了85.09%[11]。熊梦园等基于ResNet模型与CBAM注意力模块结合对4种玉米病害类型进行检测与识别,其平均识别精度达到了97.5%[12]。
因此,在与以往的番茄病害识别工作中可以发现,研究者们往往考虑模型识别的准确率、模型参数大小与计算速度等特性,但却忽略了对特征信息捕捉的重要性[13]。针对神经网络在训练过程中忽略了番茄叶片病害的坐标信息和全局的上下文信息,造成模型识别精度低的问题,采用Bi-LSTM与多尺度卷积神经网络相结合的方法,同时引入CBAM注意力模块,Bi-LSTM对病害特征进行双向特征提取,多尺度神经网络是将传统神经网络中前向输出层与后向输出层连接起来形成一个新的全连接层,可以有效地防止在卷积和池化操作期间造成的信息丢失,在保证全局信息完整性的同时记忆番茄病害的位置信息,减少上下文信息细节丢失的情况。
1 材料与方法
1.1 数据来源
本研究使用来自开源数据库中PlantVillage的番茄数据集[14]。如图1显示,PlantVillage数据集中包含9个病害的类别和1个健康的类别。PlantVillage数據集中番茄叶片的类别分布如表1所示,同时为了加快收敛速度,将番茄叶片的所有图像大小调整为128×128,按照80 ∶20的比例将番茄数据集划分为训练集与验证集,其中训练集用于模型的训练,验证集则用于模型的性能评估。
1.2 LSTM-MCNN模型搭建
本研究提出了名为LSTM-MCNN的一种端到端的深度学习网络模型用于番茄叶片病害识别,它由Bi-LSTM、MCNN和CBAM三大模块集成到一个统一的神经网络中。在第1阶段先对数据集进行灰度化预处理,灰度化图像相比较RGB图像可降低图像处理计算量,改善运算效率,既保留了叶片的全局信息,也使叶片的健康部位与病害部位特征对比显著[15]。提出了一种基于双向长短期记忆网络的模型,引入注意力机制捕捉病害特征信息,最后对灰度特征进行分类,Bi-LSTM模型可以更好地学习上下文的特征信息并记忆番茄病害的位置信息。第2部分提出了多尺度卷积神经网络模型,采用浅卷积层和深卷积层相结合的方式进行分类,这是一种防止在卷积和池化操作期间丢失特征信息更好的处理方法[16]。将Bi-LSTM模型中的最后一个全连接层与所提出的多尺度卷积神经网络中的最后一个全连接层结合,组合成一个新的全连接层,最后与softmax输出函数结合,完整的框架如图2所示。
1.2.1 Bi-LSTM作为提取灰度特征分类模型 众所周知,RNN模型通常被用来处理序列数据,它可以在不同时间步的神经元之间进行周期性连接,由于它具有连接上下文信息的特性,已经被成功应用于序列分类[17]。但由于训练传统的RNN模型会产生长期依赖性的问题,通俗来说就是在反向传播阶段趋于消失和爆炸。而所采用的双向长短期记忆网络不仅可以缓解这个问题,同时能更好地捕捉双向的信息依赖。如图3所示,本研究采用的 Bi-LSTM 网络,它是由前后2个LSTM构成,每个LSTM都引入了几个门控结构来控制信息的记忆和遗忘,网络的输出是由2个LSTM隐藏层的状态所决定[18]。双向长短期记忆网络既能记忆以往时间的特征信息,还可以捕获未来时间的特征信息,因此它不仅可用于提取相邻信息的上下文特征,还可以捕捉疾病的位置信息[19]。同时,在全连接层与输出层中间添加了Dropout层以便减轻模型在训练过程中产生的过拟合问题[20]。
对番茄病害图像进行灰度化,同时得到输入为128×128的图片,在试验中将时间步长和输入维度都设置为128,将番茄病害图片作为序列放入循环卷积神经网络模块,记忆番茄叶片病害位置信息,获取病害区域内的上下文联系信息。
当双向长短期记忆网络进行番茄病害特征序列分类任务时,前后向传播的LSTM单元中的隐藏层计算过程如下所示。
引入Dropout层后在t时刻输出结果如公式(3)所示。
式中:Bernl(q)为随机删除q比例神经元的概率。
1.2.2 多尺度卷积网络提取RGB特征网络模型 卷积层、池化层和全连接层是CNN的主要构成部分,组成的模型用来提取RGB特征进行训练[21]。在先前的卷积神经网络中,后一层神经元的输出作为前一层神经元的输入,并且与全连接层顺次连接。然而,由于训练集上包含了大量的数据,导致网络的收敛速度非常缓慢,同时,由于传统卷积神经网络的池化层会使卷积特征对输入的平移更具有不变性,随着层的加深,特征空间极具减小,卷积层和池化层在训练过程中会造成一定量的信息丢失,导致特征细节丢失。在实际的模型训练中,需要花费很长的时间才能完成,并且训练模型的泛化能力并不是很强。考虑到每张图片的疾病往往有不同的侧重点,它的特征可大可小,所以要尽可能地保证信息的完整性,对此本研究提出了一种新的神经网络模型,与传统首尾顺次连接的神经网络相比,所提出的多尺度卷积神经网络模型如图4所示,它结合多个卷积层-池化层的通道,在每个具有相同数量神经元的池化层之后加一个全连接层,再将几个分散的全连接层融合到新的全连接层后,该模型在分类过程中保留了多个特征信息,使模型具有全局性。在此网络中使用了非线性的ReLU函數,可以更好地学习数据中的复杂关系,让网络更容易训练[22]。同时,在多尺度卷积神经网络模型中采用了最大池化层,它可以缩减网络中的特征信息和参数量,缓解了由于卷积层参数误差造成的估计均值的偏移问题,使更多特征信息得到保留。经过几个卷积层和池化层后,所提出的模型使用softmax函数进行分类预测。
1.2.3 注意力机制以及CBAM模型 注意力模型更多地应用于语音识别[23]、图像识别[24]、自然语言处理[25]等,最近被广泛应用在图像识别的领域,也是识别中一个重要的手段,番茄叶片病害通常形状各异,有的很明显也有的细微,通过使用注意力机制可以着重提取作物病害的特征,是提高神经网络识别性能的常见手段[26]。本研究所采用的2种注意力机制算法,第1种提出的注意力机制算法应用到Bi-LSTM模型中,所提出的注意力机制,它是聚集于局部信息的手段,例如,图片的局部信息,随着需求的改变,注意力所关注的领域就会发生变化,注意力机制的作用就是定位这些重点信息并抑制无用信息,其结果通常以概率或特征向量的形式分布,通俗的说就是让神经网络在做特定的任务时注意到它应该注意的地方。由于神经网络是特征向量的传递,为了提高识别疾病的性能,实质就是改变不同番茄部位疾病的权重,相应地提高对应疾病的特征权重。将数据集进行灰度变换处理后,将一组图片当成一个序列传入到Bi-LSTM模型中,可以获得时间步长和lstm units的输出,将它当作每个特征节点,经过permute操作将其翻转后其维度发生变换,再经过全连接层和softmax层。它的核心是通过全连接层计算每个时间步长的权值,通过permute操作翻转其维度,它代表每个步长中每个特征的权重,最后结果与输入相乘,相当于将每个步长的权重乘以它们的特征。
第2种在多尺度卷积神经网络模型中引入CBAM模块,如图5所示,它的一个优势就是灵活性很强,即插即用,着重于突出卷积网络生成的重要特征,可以有效地提高农作物病害的识别准确率,直接应用在现有的网络架构。CBAM主要用于神经网络的输出特征图,它包含2个子模块:通道注意力模块和空间注意力模块[27]。
如图6所示,设输入特征图F的大小为h×w×c,其中w为特征图的宽度,h为特征图高度,c为特征图通道数,通道注意力机制表示为
式中:σ代表Sigmoid函数;W1、W0分别代表2个卷积操作;Fcavg、Fcmax分别代表平均池化和最大池化。
通道注意力机制优势在于利用了最大池化层和平均池化层,得到了2组相同的特征向量,通过池化后的特征图由共享连接层进行变换,得到新的特征,最后,根据新特征将对应的元素相乘,得到空间注意力权重,最大池化考虑的是网络训练过程中哪一个像素反响最强烈,平均池化充分考虑了目标对象在特征图上的程度信息。
如图7所示,空间注意力机制重点关注空间部分的有用信息,并且抑制特征图中的其他区域信息,它表示为
将通道结合在一起,其中f7×7代表7×7的卷积核,它是目标的空间特征提取器,对先前通道注意加权后的特征图进行平均池化和最大池化,同时空间注意力模块采用sigmoid激活函数将特征图中的每个像素反映到0~1概率值上,最后,对2个池化操作的结果进行结合和卷积操作,将维数简化为一个只有通道的空间注意力权重。一般来说,生成的特征图中的不同位置将得到不同的权重,以增强目标信息。
2 结果与分析
2.1 试验设施和评价指标
试验的操作平台是PyCharm,操作系统为Windows,所有试验都是在Intel i7-11700K CPU和NVIDIA GTX-3060 GPU完成的,使用Python3.6编程语言,训练环境为Anaconda3,使用Keras框架,tensorflow 2.5.0作为后端进行训练。使用混淆矩阵、F1分数、准确率、召回率、精确性等评价指标评估本试验深度学习模型的性能。
式中:TP代表真阳性;TN代表真阴性;FP代表假陽性;FN代表假阴性。
2.2 消融试验
采用Adam优化器[28],批量大小设置为64,对提出的模型进行3组消融试验,分别验证了LSTM-MCNN网络中不同模块以及添加注意力模块的有效性,下面对这几组消融试验的结果进行分析[29]。
由于设置不同超参数会对模型的训练速度及泛化能力产生一定的影响,为了确定模型的最佳学习率,一方面,第1组和第2组消融试验分别使用0.001、0.000 1、0.000 05等3种不同的学习率进行了多次试验,主要目的是分别验证在有无注意力模块的条件下,比较组成LSTM-MCNN各个模型的性能并且确定试验的最优学习率。CNN模型代表原始的卷积神经网络,MCNN模型代表在传统的卷积神经网络基础上进行全连接层的多尺度变换,Bi-LSTM为双向长短期记忆网络,而LSTM-MCNN网络模型由MCNN、Bi-LSTM、注意力模块组成并统一到一个大的神经网络框架。
第1组的消融试验结果如表2所示,虽然从表2中可以得到Bi-LSTM在学习率为0.001的条件下识别精度要高于其他2组,但是从图8中可以清楚地看到,在学习率为0.000 1时,其稳定性相比其他2组表现更好,收敛性优于其他2组学习率。第2组消融试验在添加注意力模块后结果如表3所示,CNN模型在学习率为0.001时识别准确率比其他2组学习率要高,虽然通过试验可以发现CNN模型在学习率为0.000 1的识别精度略低于0.001,但同样从图8中可以清楚地看到学习率为0.000 1的模型收敛性明显要高于其他2组,所以通过综合比较消融试验中各个模型的准确率,选择将0.000 1作为本试验的学习率。在2组消融试验中,对大部分模型来说,从试验准确率的角度来看,经过添加注意力模块后,分类效果都有一定的提升,所设计的LSTM-MCNN模型引入注意力模块后准确率提升了0.44百分点。第3次消融试验,将试验迭代次数提升至100次,在将学习率设置为0.000 1,同样再一次验证了LSTM-MCNN不同模块的分类精度。由表4可以看出LSTM-MCNN在引入注意力模块后,其准确率最终提高到了98.16%,LSTM-MCNN模型的验证精度和损失值比较曲线如图9所示。所提出的LSTM-MCNN模型在10分类的番茄数据集的分类性能如表5所示。图10显示使用了LSTM-MCNN模型的9种番茄叶片疾病和健康叶片的混淆矩阵。
2.3 与经典卷积神经网络模型的可视化比较
在本次试验中,比较了几种经典的CNN模型,VGG16[30]、VGG19、 Alexnet[31]与笔者所在课题组所提出的模型进行比较。不同模型的分类结果如表6所示,试验结果表明,与几种CNN模型相比,所提出的LSTM-MCNN模型在识别番茄疾病方面表现最佳。Grad CAM用于显示不同CNN模型的可视化结果[32]。番茄病害的识别结果如图11所示,AlexNet模型的热力图对识别番茄叶片的疾病部分整体效果并不是特别突出,VGG16和VGG19的热力图大部分对于疾病部分的识别效果有一定的提升,但对细小的疾病和边缘部分识别效果相对一般,而所提出的LSTM-MCNN模型不仅聚焦于叶片整体的特征,同时对细小、边缘的病害部位也进行了关注,比其他CNN模型具有更高的识别精度。
3 讨论
为了实现番茄病害的准确识别 在基于现有的农作物病害识别研究的基础上,提出一种基于Bi-LSTM模型与多尺度神经网络相结合的方法,将CBAM注意力模块引入所提出的LSTM-MCNN网络中,提高对番茄叶片病害的识别准确率。与AlexNet、VGG16、VGG19等3种经典的卷积神经网络进行试验比较,并对比评估了神经网络模型在番茄病害识别中的性能。在以前的文献中,马宇等使用一个残差模型来识别番茄病害,模型的识别准确率为96.4%[9],残差网络的引入,缓解了神经网络中深度增加带来的梯度消失问题,但该模型忽略了双向上下文信息反馈的重要性,本研究提出的模型相比马宇等所设计的模型准确率提高了1.76百分点。谢圣桥等提出使用迁移学习[10],虽然该模型的识别准确率比笔者所在课题组提出的模型高2%左右,但本研究中的一些疾病特征并不十分明显,因此深度学习的模型应从头开始训练,给它主动适应和调整的空间,以保证模型的泛化能力。Abbas等使用C-GAN模型进行数据扩充,使模型的泛化能力得到保证,但是网络的收敛性和稳定性却很难保证[7],从图9中不难看出,LSTM-MCNN模型的收敛性和稳定性表现较好。熊梦园等提出的残差网络与CBAM模块结合,虽然识别精度达到了97.5%,但其训练网络的迭代次数达到了500次[12],而本研究仅仅迭代了100次就达到了相对较高的识别精度。本研究提出将CBAM注意力模块、Bi-LSTM和MCNN模型整合到一个统一的网络中,可以同时训练网络中的所有信息,确保病害区域内的上下文信息和全局信息的完整性。在此次比较分析中,发现所提出的LSTM-MCNN模型的最高识别准确率为98.16%,并且分别达到了97%的精确率、97%的召回率和97%的F1分数。
4 结论
番茄叶片病害的种类较多并且病害特征十分复杂,研究人员及时准确地检测和分类番茄疾病对农业未来发展显得至关重要,利用深度学习的方法可以帮助农业专家早期预防番茄叶片病害以免遭受进一步的损失。本研究提出了一种基于双向长短期记忆网络与多尺度卷积神经网络相结合的模型,用于分类和识别番茄叶片部位的病害,根据番茄叶片的病害特点,第1部分,采用双向长短期记忆网络,挖掘番茄叶片病害区域内的上下文信息,同时记忆叶片病害的位置信息,第2部分,将卷积神经网络中的浅卷积层和深卷积层相结合组成的多尺度卷积神经网络使网络在训练过程中减少病害的细节信息丢失,保证全局信息的完整性,此外,该模型引入CBAM注意力模块可以使模型更好地关注疾病特征,提高番茄病害的识别准确率。总体试验结果表明,LSTM-MCNN模型在10分类任务上的识别准确率为98.16%,与其他的CNN模型相比较具有更高的识别准确率。植物病害的早期检测是预防病害的关键,将深度学习与农作物病害相结合,可以打破传统诊断方法的劣势,是未来的主要发展方向,在农作物病害预防领域具有重要的应用价值,也为智慧农业检测病害的发展提供了可靠的理论依据。与此同时,在未来工作中,神经网络模型进行病害识别的重点不能仅局限于叶片部位的病害,还应该扩展到果实、茎、根部。此外,我们还应该扩大数据集的疾病种类,以此验证该模型真实的准确性,建立更完善的模型。
参考文献:
[1]Tm P,Pranathi A,Saiashritha K,et al. Tomato leaf disease detection using convolutional neural networks [C]//2018 Eleventh International Conference on Contemporary Computing (IC3). India:IEEE Computer Society,2018:1-5.
[2]谭海文,潘玲华,吴永琼,等. 2019年桂林番茄病害发生情况调查初报[J]. 蔬菜,2021(12):37-40.
[3]Savary S,Ficke A,Aubertot J-N,et al. Crop losses due to diseases and their implications for global food production losses and food security [J]. Food Security,2012,4(4):519-537.
[4]阎园园,陈 华,姜 波. 基于群智能算法分类模型的番茄病害识别 [J]. 江苏农业科学,2020,48(1):219-224.
[5]Ioffe S,Szegedy C. Batch normalization:accelerating deep network training by reducing internal covariate shift[C]//Proceedings of the 32nd International Conference on Internarional Conference on Machine Learning. France:JMLR.org,2015:448-456.
[6]Albogamy R F. A deep convolutional neural network with batch normalization approach for plant disease detection [J]. International Journal of Computer Science and Network Security,2021,21(9):51-62.
[7]Abbas A,Jain S,Gour M,et al. Tomato plant disease detection using transfer learning with c-gan synthetic images [J]. Computers and Electronics in Agriculture,2021,187:106279.
[8]胡玲艷,周 婷,许 巍,等. 面向番茄病害识别的改进型SqueezeNet轻量级模型 [J]. 郑州大学学报(理学版),2022,54(4):71-77.
[9]马 宇,单玉刚,袁 杰. 基于三通道注意力网络的番茄叶部病害识别 [J]. 科学技术与工程,2021,21(25):10789-10795.
[10]谢圣桥,宋 健,汤修映,等. 基于迁移学习和残差网络的葡萄叶部病害识别 [J]. 农机化研究,2023,45(8):18-23,28.
[11]刘 君,王学伟. 基于YOLO的番茄病虫害识别算法[J]. 中国瓜菜,2020,33(9):18-22,38.
[12]熊梦园,詹 炜,桂连友,等. 基于ResNet模型的玉米叶片病害检测与识别 [J]. 江苏农业科学,2023,51(8):164-170.
[13]林建吾,张 欣,陈孝玉龙,等. 基于轻量化卷积神经网络的番茄病害图像识别 [J]. 无线电工程,2022,52 (8):1347-1353.
[14]Hughes D P,Salathe M. An open access repository of images on plant health to enable the development of mobile disease diagnostics [J]. Computer Science,2015:11897587.
[15]Gonzalez R C. Digital image processing [M]. 阮秋琦,译. 3版. 北京:电子工业出版社,2013:154-173.
[16]Xu Y H,Zhang L P,Du B,et al. Spectral-spatial unified networks for hyperspectral image classification [J]. IEEE Transactions on Geoscience and Remote Sensing,2018,56(10):5893-5909.
[17]Rumelhart D E,Hinton G E,Willialms R J. Learning representations by back-propagating errors [J]. Nature,1986,323(6088):533-536.
[18]Hochreiter S,Schmidhuber J. Long short-term memory [J]. Neural Computation,1997,9(8):1735-1780.
[19]孙文杰. 基于深度学习的桃树叶部病害图像识别研究 [D]. 泰安:山东农业大学,2022:20-28.
[20]Hinton G E,Srivastava N,Krizhevsky A,et al. Improving neural networks by preventing co-adaptation of feature detectors [J]. arXiv,2012:1207.0580.
[21]Jameel S M,Gilal A R,Rizvi S S H,et al. Practical implications and challenges of multispectral image analysis[C]//3rd International Conference on Computing,Mathematics and Engineering Technologies (iCoMET). Pakistan:IEEE,2020:1-5.
[22]Agarap A. Deep learning using rectified linear units (relu) [J]. arXiv,2018:1803.08375.
[23]甘 宏. 一种基于注意力机制的语音情感识别算法研究 [J]. 江西科学,2022,40(4):758-761.
[24]黃乾峰,董 琴,韦 静. 改进MobileNetV2算法的番茄叶片病害种类识别 [J]. 计算机系统应用,2023,32(1):385-391.
[25]冯志伟,丁晓梅. 自然语言处理中的神经网络模型 [J]. 当代外语研究,2022(4):98-110.
[26]张 宁,吴华瑞,韩 笑,等. 基于多尺度和注意力机制的番茄病害识别方法 [J]. 浙江农业学报,2021,33(7):1329-1338.
[27]Woo S,Park J,Lee J-Y,et al. CBAM:convolutional block attention module [C]//Proceedings of the Europeean conference on computer vision (ECCV). Germany:Springer,2018:3-19.
[28]Kingma D,Ba J. Adam:a method for stochastic optimization [J]. arXiv,2014:1412.6980.
[29]Kyeong-Beom P,Yeol L J. SwinE-net:hybrid deep learning approach to novel polyp segmentation using convolutional neural network and swin transformer [J]. Journal of Computational Design and Engineering,2022,9(2):616-632.
[30]Simonyan K,Zisserman A. Very deep convolutional networks for large-scale image recognition [J]. arXiv,2014:1409.1556.
[31]Krizhevsky A,Sutskever I,Hinton G. Imagenet classification with deep convolutional neural networks [J]. Communications of the ACM,2017,60(6):84-90.
[32]Selvaraju R R,Cogswell M,Das A,et al. Grad-cam:visual explanations from deep networks via gradient-based localization [C]//2017 IEEE International Conference on Computer Vision. Italy:IEEE,2017:618-626.