冯贺平(河北软件技术学院 智能工程系,河北 保定 071000)
深度信念网在人脸检测技术中的应用研究
冯贺平
(河北软件技术学院智能工程系,河北保定071000)
摘要:在一个国家发展中,高度重视信息安全,一旦信息安全中出现漏洞,一些不法分子就会趁虚而入,人脸检测技术的出现,能够详细的把握住每个人的信息,在处理一些工作中会带来很大的帮助,因此,文章通过下文对深度信念网在人脸检测技术中的应用进行了分析与阐述。
关键词:深度信念;人脸检测;应用研究
深度信念网为当前一种非常先进的技术方式,其具备非常强大的函数表现能力,将从少数样本中学习数据本质竖向的优点能够充分的展示出来,因此,将这种技术理念和技术措施应用到人脸检测技术中意义将非常重大。
深度学习中包含着深度信念网络这个常用的模型。有可见层存在于该模型中,并且还具备输出层和隐层两部分,其中由多层的受限波尔兹曼机构成了其中的隐层,没有连接起来层内的神经,但是,能够互相连接起层间的神经元,隐层的功能对可见层中的有关数据进行捕捉训练。
并且,能够将模型权重生成出来,通过大量的实践证明这是一种非常有效的方式。在应用的时候,原始输入的特征向量能够通过可见层展示出来,利用现有的输入特征向量,在经过神经元向着隐层中映射,这样隐层的特征向量就能够被有效的获取出来,之后利用隐层在向着输入层中映射,进而将传统的特征向量就能够重新构建起来,对于完成的特征向量再向着隐层中映射,如此一来,隐层单元的特征向量就能够再次的被获取出来,吉布斯采样即为上述所阐述的过程,在更新权值的过程中,输入单元和隐层单元之间的差别即为其中的重要依据。
H inton等人将深度学习概念提了出来,将多层神经网络具备的优秀特征学习能力充分的展现了出来,存在于其中的特征能够更加深刻有效的刻画出其中的数据,进而在可视化和分类的过程中都发挥着巨大的作用。通过将大量的训练数据和多隐层的神经网络构建起来出来,来对更加本质的特征进行学习,进而将分类的准确性有效的提升上来。有多个受限波尔兹曼基层一同构成了DBN,从上一层的隐单元中就能够获取到每一层中的关联数据,图1即为一个比较突出的DBN结构图形。
图1
(1)人脸识别算法的分析。基于瞳孔区域及视觉系统同大脑皮层神经元的相关性探究,在人脸识别的过程中,多通道特征在其中发挥着非常重要的作用,在这种思想的基础上,结合起DBN模型和降维模型,进而在DBN多通道人脸识别方法的基础上,还能够获取出两种不同降维结构。
结合起来DBN和降维模型,将Gabor滤波器组卷和局部人脸图像块有效的结合起来,在拟合数据的过程中在应用相应的RBM模块,进而将图像块中的相似信息就能够进一步降低下来,进而将更加本质的特征就能够提取出来,在训练DBN网络的过程中,在积极的应用降维后的特征向量。
在建立人脸识别模型的过程中,还是将DBN模型同降维模型有效的结合起来,将Cabor小波核函数卷积和划分图像块的人脸图像有效的结合起来,进而能够将频率不同方向不同的特征向量准确的获取出来,这样将其作为DBN的可视层单元对网络完成训练化处理。
这样在完成了所生成的模型之后,将一个逻辑回归层加设到顶层中,然后向着类别信息上映射图像特征。这种计算方式解决了图像利用Gabor小波获得信息后,图片特性过高维数的不足之处,并且,对RBM对本质特征的提取和对数据的拟合可以更好的进行应用。
(2)算法的具体学习和训练过程分析。在训练深度信念网络的过程中,利用所获取到的降维特征向量,如上图所示,将RBM隐层的输入利用底层图像的特征来进行训练,输入数据在训练下一个RBM时主要是应用每个底层的RBM,对CD算法进行使用,进而将权值生成出来,当将一组堆叠的RBM逐层的学习完成之后,在微调整个网络的过程中,会应用到顶层的带标签数据。其中详细的过程主要有这样几部:1)预先训练。对基于CD-K的快速学习算法所构建起来的RBM模型进行参照,进而将各个RBM逐层的训练出来,进而将隐层节点和可视层节点间的权值能够有效的获取出来;2)微观的训练。在完成了预训练之后,为了确保有更好的表现能力存在于模型中,这样用误差反向传播算法来进行一步的优化和调整DBN模型。将一层逻辑的回归层加设到模型的顶层上面,这样在对应的类别信息上能够将所有的图像特征反射上去,因此,就能够利用一个辨别的模型将DBN模型映射出来,针对这样一个回归过程而言,在全局化微调优化整个模型的连接权值过程中可以应用经典的BP算法。详细过程为:在监督训练模型的过程中,可以应用数据的标签值,进而对各个层次间的连接权值进行微观的调整,从而可以将小模型的具体标签值和目标预测值的误差有效的降低下来。在应用BP算法微调模型的时候,这样就会向着一个误差非常小的状态中将模型收敛进去,这是由于预先贪婪的训练了DBN的模型,对于以前的BR算法,参数收敛在训练模型中表现的非常缓慢。随着位置的改变,人脸的Gabor的特征相位也会发生一定的改变,这样在匹配识别阶段的信息中就会非常的困难,而图像的局部能量谱就能够通过幅值信息展现出来。并且有良好的光滑性会存在于边缘附近,在位置发生变化后它也不会改变。这样在匹配识别中就会发挥巨大的作用。因此,在进行信息识别时,就可以应用特征幅值的方式。
综上所述,深度学习,可通过学习一种深层非线性网络结构,实现复杂函数逼近,该算法克服了因姿态变换等因素引入的非线性干扰,具备一定的抗干扰能力,并且能够保证一定的实时性,从而克服了视频检测中遇到的难题,使该系统识别率更高,且自主识别,自主学习、自主更替模型的功能。
参考文献:
[1]柴瑞敏,曹振基.基于Gabor小波与深度信念网络的人脸识别方法[J].计算机应用,2011(08).
[2]吴小俊.图象特征抽取与识别理论及其在人脸识别中的应用[D].南京:南京理工大学,2002.
[3]周昕.基于 BP 神经网络的人脸识别技术的研究[D].南京:南京理工大学,2007.
[4]陈伏兵,杨静宇等.基于模块2DPCA的人脸识别方法[J].中国图象图形学报,2006(04).
课题名称:深度信念网在人脸检测技术中的应用研究保定科技局厅级自然科学指导性课题,课题编号14ZG 041。
作者简介:冯贺平,研究方向:智能检测、智能控制