林汉斌
摘 要:基于深度学习的计算机视觉研究都是基于大量图片数据样本,由于有时在工业上收集目标样本的成本很高,因此这大大限制了深度学习在计算机视觉中的应用。针对少量样本下的图片分类任务,本文提出一种新型的网络模型。并跟目前主流的深度学习网络比较。证明了我们的模型在少量样本下仍然具有很好分类精度。
中图分类号:TP391文献标识码:A文章编号:1003-9082(2020)02-000-01
一、卷积神经网络模型
卷积神经网络是一类特殊的人工神经網络,其主要特点是卷积运
算操作。理论上卷积神经网络的深度越深,模型的拟合能力越强。但研究发现,当随着卷积神经网络深度的加深,模型的拟合性能不升反降,这主要是因为如果网络的深度过深,卷积神经网络在反向传播时容易出现梯度消失或梯度爆炸。因此一些研究人员设计出了一种残差网络可以有效防止网络在反向传播时出现梯度消失或梯度爆炸。残差网络的核心创新点是将前面的输入也与后面的网络层连接。
二、少量样本下卷积神经网络模型的设计
由于少量样本下,样本的数据有限,因此应当设计一个网络使得网
络能有效的提取图片的深层次特征。为此,鉴于对残差网络,我们设计了一个基于残差块的注意力卷积神经网络(Res-attention)模型。结构如图1所示。
与传统卷积神经网络对残差块进行简单堆叠所不同的是,我们还加入了如虚线所示的结构。该结构先对前置网络输出的特征图先进行下采样,以获得更深层次的特征,接着进行上采样,将特征图缩放至原特征图一样大小。接着经过sigmoid函数将,特征图中的值缩放至0-1之,值越大代表着特征图区域所对应的图像为我们的目标区域,使我们的网络更能关注到目标区域的图像值。
三、模型验证
1.数据集获取
为了验证我们的模型在小样本下具有很好的分类效果,我们使用爬虫技术从网上下载213种观赏鱼的图片,每种鱼的图片数量大约在5-40个,图2是一些示例图片。
2.数据增强
这里我们通过水平翻转和改变亮度对比度增强数据,图3是一些示例图片。
3. 实验对比
我们将上面通过数据增强的图像数据集应用在几个经典的神经网络模型上,比较它们的分类准确率。得到的结果见表1所示:
从表中可以看出,在少量样本我们的Res-attention网络较其他的网络结构拥有更高的准确率。
四、结束语
本文基于在少量数据样本的条件下,提出了Res-atttention网络模型。该模型基于残差网络,多加一个注意力模块,使得模型更能关注到目标区域,而忽视图片的背景区域。实验结果显示本文模型在小样本下仍然具有很好的分类效果。
参考文献
[1] Krizhevsky A, Sutskever I, Hinton G E. Imagenet Classification with Deep Convolutional Neural Networks[C]//International Conference on Neural Information Processing Systems, Curran Associations Inc. 2012: 1097-1105.
[2]李亚飞,董红斌.基于卷积神经网络的遥感图像分类研究[J].智能系统学报,2018(4):550-556.
[3] Christian Szegedy, Wei Liu, Yang qing. Going Deeper with Convolution[C]. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2015:1-9.