浅谈卷积神经网络

2018-06-04 03:41索琰琰吴昊李娆冯成孟令凯苑海朝通讯作者河北农业大学理工学院
数码世界 2018年5期
关键词:权值图像处理局部

索琰琰 吴昊 李娆 冯成 孟令凯 苑海朝*(通讯作者) 河北农业大学理工学院

1 引言

卷积神经网络是一种新型的由深度学习和人工神经网络相结合的学习方法,有较强的自学习能力以及较好的自适应性、容错性、权值共享等优点。

在前期,大多数卷积神经网络的结构是相对简单的。但随着技术的进步,出现了一些典型的模型,比如:应用在图像分类、手写识别等相对于简单计算机应用领域的LeNet-5模型[1];应用最新技术人脸识别的卷积神经网络与深信度网络(Deep Belief Network,DBN)[2]结合出的卷积深信度网络 (Convolutional Deep Belief Network);在大量图像分类领域取得显著成就的AlexNet模型等等,它们都推动了卷积神经网络的研究进程。

近几年,卷积神经网络仍处于火热的研究中,一些优化的网络结构也在不断的被提出,使得卷积神经网络得到更深层次的研究。

2 卷积神经网络的基本结构

卷积神经网络主要由输入层、池化层、卷积层、全连接层和输出层五部分组成。将原始图像输入到卷积神经网络的输入层中,然后对图像的特征图层进行卷积操作,再通过非线性激励函数计算得到特征图。将特征图经过下采样层和卷积层的不断相互传递处理后传送到全连接层进行特征图像的分辨,从而映射到数学特征模型上,如式1:

最后,通过对过拟合问题和损失函数的计算,得到输出层的图像。

3 卷积神经网络的特点

3.1 局部感知方法

局部感知法是卷积神经网络减少数据参数数量的一种方法。从局部认知到全局认知是一般人对外界的认识的一种方法,在图像处理领域也同样适用,图像的空间联系也是和局部像素的联系较为紧密相关的,但是如果间隔相距较远,则和空间像素的联系较弱。

所以,卷积神经网络上的每个神经元只要对其进行局部感知就可以,之后全连接层将局部感知的参数信息进行综合分析汇总,从而得到全局的信息参数。

3.2 权值共享

相比较于局部感知方法,权值共享就有了较大的优势。权值共享网络是由LeNet5模型提出来,原因是由于参数数量过多。

权值共享网络首先将网络的结构进行了简化,进而降低了训练参数的数目,从而有了更多应用空间。例如:一个神经有一个神经元需要100个信息参数,那么这100个信息参数就相当于是一种提取方式,并且和位置无关。卷积神经网络便可以在这100个参数中提取相应的特征,进而应用到图像的其他部分。通俗的讲,就是从大尺寸图像中随机提取一小部分,然后提取的这一小部分便可以通过学习,成为一个特征探测器,进而将其应用到图像的任意地方,再通过和原始的图像作卷积学习处理,从而获得原始图像的不同位置的不同特性值,大大提升了图像的辨别率。

3.3 多卷积核

权值共享网络中,通过观察提取到的局部特征是不能满足图像处理要求的,所以还需要卷积核的帮助。每一个共享权值参数就是一个卷积核,多个卷积核协同处理便可以解决这一问题。

每一个卷积核在局部特征提取和权值共享后都会生成一幅图像,多个卷积核就会形成多幅图像,多幅图像又可以看作是多个不同的通道[3]。如图一所示,展示了4个卷积核也就是四个通道进行卷积操作的过程。在该过程中,4个通道上(i,j)处的卷积结果先进行相加,随后再取函数值得到的值便是W1和W2位置(i,j)处的值。

图一 4个卷积核的操作过程

3.4 迁移学习

简单来说,迁移学习就是卷积神经网络进行学习来提取特征,再经过卷积核的卷积学习训练,把训练好的特定数据成功运用其他领域上[4]。

其大致过程为先对收集好的实验数据集合进行初始化,再通过卷积神经网络的训练和其他领域相关数据或者图像特征进行提取,从而训练成特定的卷积神经网络或者分类器。

4 复用层训练

复用层训练中卷积神经网络利用BP算法进行监督学习[5]。在训练前,一般使用随机的“小随机数”对权值进行初始化,然后通过信息的正向传播和反向传播2个阶段,从而完成整个复用层训练过程。

在现实应用中,通常先使用多层卷积,随后再使用全连接层进行多次训练。通过一层层的卷积便可以让卷积层数越来越大,进而学到的特征也会增多,从而使局部问题全局化,提高处理结果的真实性以及准确性。

5 卷积神经网络的应用

新的学习模型、训练方式以及学习理论的提出,使卷积神经网络的应用更为广阔[6]。比如,在图像处理上,准确的提高了图像分类的准确度(GoogLeNet);在连续的语音识别上,可以运用马尔切夫模型,来压缩模型的尺寸,深入透彻的分析卷积神经网络的性能和体系结构,使其识别能力得到进一步的加强。

6 结论

本文对卷积神经网络的概念、特点、复用层训练和应用领域进行了简介,可以看出卷积神经网络在语音识别、图像处理、人脸识别等方面拥有广阔的发展潜力。

当然,在本文的研究基础之上仍存在一些问题需要进一步探究,例如如何实现卷积神经网络系统结构的最佳优化以及最优样本数量的选取,是进行卷积神经网络更深入研究过程中无法避免的难题。这些问题在今后研究中将进行继续探索。

[1] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.

[2] HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006,18(7): 1527-1554.

[3] 刘海龙,李宝安,吕学强.等. 基于深度卷积神经网络的图像检索算法研究[J]. 计算机应用研究. 2017, 34(12):3816-3819.

[4] 庄福振,罗平,何清,等. 迁移学习研究进展[J]. 软件学报, 2015,26(1): 26-39.

[5] 常亮,邓小明,周明全,等. 图像理解中的卷积神经网络[J]. 自动化学报, 2016, 42(9):1300-1312.

[6] 李彦冬,郝宗波,雷航. 卷积神经网络研究综述[J]. 计算机应用,2016, 36(9):2508-2515+2565.

猜你喜欢
权值图像处理局部
一种融合时间权值和用户行为序列的电影推荐模型
海战场侦察图像处理技术图谱及应用展望
人工智能辅助冠状动脉CTA图像处理和诊断的研究进展
爨体兰亭集序(局部)
基于5G MR实现Massive MIMO权值智能寻优的技术方案研究
凡·高《夜晚露天咖啡座》局部[荷兰]
一种基于互连测试的综合优化算法∗
基于ARM嵌入式的关于图像处理的交通信号灯识别
基于图像处理的废有色金属自动分选算法研究
程序属性的检测与程序属性的分类