收稿日期:2023-07-18
基金项目:中南林业科技大学涉外学院2021年度院级科研项目(SYKY202121)
DOI:10.19850/j.cnki.2096-4706.2024.04.023
摘 要:文章对人脸识别技术进行了调查,对比分析了传统识别技术以及基于深度学习识别技术的不同,指出由于深度学习的网络结构较为复杂,在人脸识别过程中容易出现算法过拟合的现象。针对上述过拟合问题,文章对基于权函数神经网络的人脸识别算法进行了研究,此类神经网络结构简单,仅有输入、输出两层结构,将人脸图片作为输入信息,网络训练目标为计算三次样条权函数,仿真实验证明该类网络具有较好的识别准确度和识别效率。
关键词:人脸识别;三次样条权函数;神经网络
中图分类号:TP183;TP391.4 文献标识码:A 文章编号:2096-4706(2024)04-0109-04
Research on Face Recognition Based on Cubic Spline Weight Function Neural Network
LIU Min
(Swan College, Central South University of Forestry and Technology, Changsha 410211, China)
Abstract: This paper investigates face recognition technology, compares and analyzes the differences between traditional recognition technology and recognition technology based on Deep Learning. It is pointed out that due to the complex network structure of Deep Learning, the phenomenon of algorithm overfitting is prone to occur in the face recognition process. In response to the overfitting problem mentioned above, this paper studies the face recognition algorithm based on weight function neural network. This type of neural network has a simple structure with only two layers of input and output, and takes face images as input information. The training objective of the network is to calculate the cubic spline weight function. The simulation experiments show that this type of network has good recognition accuracy and efficiency.
Keywords: face recognition; cubic spline weight function; neural network
0 引 言
人臉识别技术在计算机视觉和生物识别领域是研究最多的课题之一,其使用的识别技术包含传统的模式识别方法以及目前流行正盛的深度学习方法。传统方法是通过算法来分析人脸五官的特征,将这些信息作为特征点与数据库里的信息进行比对,寻找配对的人脸信息。但这种方式容易受到拍摄角度、光线等的影响,导致特征匹配存在较大的误差,从而整体识别率较低。而基于深度学习的人脸识别方法采用大数据采集的人脸信息作为训练样本,通过复杂的学习算法计算出人脸识别模型,进而使得信息实时处理、人脸精准识别得到实现。深度学习技术多数采用卷积神经网络进行模型训练,由于卷积神经网络主要由输入层、卷积层、ReLU层、池化层、全连接层层叠构成,导致数据前向传输过程中存在训练速度相对较慢的问题,而对于人脸识别的应用往往对识别速度要求较高,并且这种神经网络难以反映样本的信息[1]。
针对以上问题,本文将一种新型的神经网络即三次样条权函数神经网络应用于人脸识别场景中。该算法仅采用三层的网络结构,网络识别速度快,并且训练后的神经网络的权值是输入样本的三次样条函数,通过仿真实验训练后的权函数可以更好地反映输入样本的信息。在人脸识别领域,权函数神经网络可以更好地提取和表达人脸图像中的特征,达到更准确的识别效果。
1 人脸识别
人脸识别是分析比较人脸特征从而进行身份认证的一种计算机技术。识别过程就是利用摄像头或摄像机拍摄人脸信息,自动在人脸图像中进行读取并检测人脸信息,进而对检测到的信息进行识别验证的一系列相关活动[2]。人脸识别在安全领域、身份验证、无人机监测、社交媒体等多个领域有广泛的应用。人脸识别过程通常要求具备准确性和实时性,识别结果应尽可能匹配输入图像的人脸,这就要求算法应具备高度的准确度和精度;同时要求在短时间内完成对人脸的识别,尤其在人脸门禁、人脸支付等场景下,需要迅速识别人脸并做出响应。
人脸识别技术一般包括如下几个步骤:
1)人脸检测:首先通过计算机视觉技术来自动识别和定位图像或视频中的人脸。
2)特征提取:将人脸图像转化为一组数值特征表示,通常是计算脸部的关键点、纹理、颜色等特征。
3)特征匹配:将提取到的人脸特征与已有的特征进行比对,以判断两者之间的相似度或匹配程度。
4)人脸决策:通过模式匹配方法或者机器学习方法进行选择和设计,确定该图像属于哪个人或哪个类别。
2 样条权函数神经网络
近年来,权函数神经网络已被广泛用于人脸识别中的特征提取和分类任务。权函数神经网络能够通过学习权重和激活函数的方式来自动地提取和表示人脸图像中的特征信息。这种网络结构具有高效、准确的特征提取和分类能力,能够应用于人脸识别的各个环节。相比传统神经网络,权函数神经网络可以在更细微的特征辨别上取得更好的效果。
2.1 网络结构
传统的神经网络是由输入层、隐含层和输出层组成,每一层都包含输入信息、神经元和输出信息,输入信息为上一层的输出信息[3]。网络结构采用Singmoid、ReLU等作为激励函数,构成较为复杂的前馈神经网络,通过梯度下降法求得网络需要的系列参数,目前正流行的卷积神经网络正是应用了这种网络结构。但这种结构在进行网络训练时由于结构复杂,会导致训练时间较长、收敛速度慢的问题。
权函数神经网络则对传统的神经网络结构进行了改造,输入层与输入样本相连接,输入层经过神经元进行简单的加法操作后直接输出运算结果。与传统神经网络的权值取常数不同,权函数神经网络的权值不再是固定的标量值,而是变成了以输入样本作为变量的三次样条函数,故在网络训练中只需要训练与输入端连接的权值即可。权函数神经网络使用函数对权值进行建模,使得不同神经元之间的权值可以根据输入数据的不同动态进行灵活调整,能够更好地处理多样性和复杂性的数据。该类网络结构如图1所示[4]。
在图1中,xi是输入层的第i个输入结点,fj是第j个神经元,wij是第j个神经元连接第i个输入结点的权值,yj是第j个神经元对应的输出值。神经元fj将与之相连的所有输入节点的输入量做加法运算,就可得到对应输出量yj。
图1 权函数神经网络拓扑图
2.2 三次样条函数
三次样条函数是一种被广泛应用于插值和曲线拟合的数学函数。它在给定一些数据点的情况下,可以通过插值生成一条光滑的曲线。而插值通常取曲线的起始点和终止点,以及这两个点之间的控制点,对应曲线由一系列分段三次多项式组成[5-7]。
三次样条函数的优点在于它可以提供平滑的、连续的曲线,而不会在数据点之间产生突变。这是通过要求样条函数在每个数据点处满足一些条件来实现的,这些条件确保了曲线在数据点之间的平滑过渡。
2.3 样条权函数的建立
如前所述,在图1所示的权函数神经网络中,输入结点对应的输入样本序列是作为已知条件存在的,如果想要獲得每个神经元的输出量只需知道其输入量即可,即输入结点到神经元的权值wij(i = 1,2,…,m)。下面我们以第j个神经元fj为例来介绍权值的计算过程。单个神经元的拓扑结构如图2所示。
图2 单个神经元网络拓扑结构
在该类网络拓扑结构中,假设输入端有PN个输入样本,x (i, p)是第p( p = 1,2,…,PN)个输入样本中第i个输入结点对应的样本值,y( j, p)是神经元j在第p个输入样本映射下的实际输出值,t( j, p)是目标输出值,wi (x (i, p))是神经元j连接的第i个输入结点对应的权值。由于神经元fj具有加法器的作用,存在如下关系:
即:
其中:
如果把wi (x (i, p))看作x (i, p)的样条函数,那么寻求样条权函数wi (x (i, p))即是该类神经网络的训练目的。
根据已知的输入样本p,选取合适的激励函数就可以得到目标输出t ( j, p),再通过调整每个权函数对应的参数?i,即可快速得到每一个输入样本x (i, p)对应的输出分量ti ( j, p)。由此,根据输入端提供的PN组输入样本可知,((x (i, 1), ti ( j, 1)),((x (i, 2),ti ( j, 2)),…,(x (i, PN),ti ( j, PN)))即为样条权函数wi (x (i, p))的插值点,那么网络训练的任务也就转换为求样条权函数wi (x (i, p)),wi (x (i, p))能够通过以上的插值点。很明显,此类神经网络的权值是输入样本的函数,而不是传统神经网络的常数。
本文采用三次样条函数来计算权函数。为了方便表达,对以上的符号做如下约定,输入端第i个结点的输入样本向量为(x (i, 1),(x (i, 2),…,(x (i, PN)),输入样本对应的权函数wi (x (i, p))的指派值序列为(y0, y1, …, yN) (N = PN - 1)。权函数wi (x)的三次样条函数表达式可以表示如下:
其中 。其中Mk可通过下式得到:
记:
其中 ,,,上述方程组可以通过追赶法求解。
3 计算机仿真
本实验以计算机拍摄的32位人脸图片为研究对象,采用样条权函数神经网络对人脸图片进行训练,获取对应的三次样条权函数。选择两种实验场景:
1)分别选取不同的人脸图片作为测试样本进行测试训练,比较训练误差情况。
2)选取同一人脸的不同数量的样本比较检测效果。
本实验均在Anaconda的Spyder开发环境下实现,Python版本为3.9。
输入样本获取方法如下:计算机通过调用CV2相关函数打开摄像头采集人脸信息图片,选择一部分作为训练图片,另一部分为测试图片。利用CV2图片处理函数将图片信息转化为一维数组,假设该数组有n个数组元素,则第i个数组元素即为输入端第i个输入结点值。目标输出样本通过激励函数z = sin (x1 + x2 + … + xn) / (x1 + x2 + … + xn)得到。
实验1:图片像素为32×32大小,共获取到50张同一人的人脸信息,分别选取10、20、30、40、50张图片进行模型训练,那么本实验需要创建5个样条权函数神经网络,同样也需要创建5组对应的三次样条权函数。在对创建的神经网络模型进行测试时,我们选择1张同一人的人脸图片和1张其他人的人脸图片作为测试图片输入到每组训练模型中进行验证。选取的训练图片和测试图片如图3、图4所示。
图3 同一人的50张训练图片
图4 1张同一人测试图片和1张其他人测试图片
针对两张不同的测试图片,经过5种权函数神经网络的模型训练后,可以分别计算出两张测试图片对应的网络实际输出和目标输出之间的误差绝对值,误差绝对值越小说明人脸识别越准确,人脸匹配度越高。图5为误差绝对值折线图,可以发现,同一人的测试误差值远远低于其他人的测试误差值,说明经过三次样条权函数训练得到网络模型对于同一人的人脸识别准确性更高。
图5 不同图片误差折线图
实验2:图片像素为32×32大小,设置步长为10,依次选择图片个数从10按照步长递增至100的10组人脸图片进行模型训练,再以同一张人脸图片进行模型测试,观察输出误差绝对值的变化。发现当训练图片数量较少时误差相对较大,检测效果较差;随着训练图片数量增多误差逐渐减小,实际输出值接近目标值。说明该类三次样条权函数神经网络的训练图片越多,网络模型的人脸识别误差绝对值越小,人脸识别精度就越高。测试结果如图6所示。
图6 10组训练模型误差绝对值
4 结 论
本文研究的是三次样条权函数神经网络在人脸图片检测中的应用,该类算法与传统的深度学习人脸识别算法相比,网络结构简单,网络训练目的仅是计算与输入样本相关的权函数,且该类权函数是数学计算中常用到的非线性三次样条函数,同样可以避免深度学习中常見的过拟合现象,从而可以达到快速精准识别图片的目的。通过计算机仿真实验验证得到,在同一网络训练模型中,同一人脸的输出误差远低于其他人人脸的输出误差,说明经过训练的网络模型识别效率较高;当训练的图片较多时误差值会急剧下降,说明此类神经网络的识别精度随着训练样本数量的增加而不断增加。此类网络可以应用于小型设备快速身份识别等场景。作为进一步的研究方向,后续将在该类神经网络中结合不同的激励函数继续对人脸识别结果进行比较,选择更精准的网络模型,提升网络的识别精度和算法识别效率。
参考文献:
[1] 杜雪,王浩然,王欣悦.深度卷积神经网络的发展及其在计算机视觉领域的应用 [J].电子元器件与信息技术,2021,5(10):244-245.
[2] 秦鸿,李泰峰,郭亨艺,等.人脸识别技术在图书馆的应用研究 [J].大学图书馆学报,2018,36(6):49-54.
[3] 刘青,倪骁骅,郭祥东.样条权函数神经网络在机械手逆运动学中的应用 [J].中国农机化学报,2015,36(3):282-285.
[4] 张代远.样条权函数神经网络的一种新型算法 [J].系统工程与电子技术,2006(9):1434-1437+1446.
[5] LIU K L,LI H,Yan H,et al. An Improved Algorithm of Neural Networks with Cubic Spline Weight Function [C]//2010 Chinese Control and Decision Conference.Xuzhou:IEEE,2010:2674-2678.
[6] 卢辉斌,王倩.基于样条权函数神经网络的入侵检测 [J].计算机应用研究,2009,26(2):448-450.
[7] 曹锋. 有理样条权函数神经网络研究及其在文本分类中的应用 [D]. 南京:南京邮电大学,2010.
作者简介:刘敏(1984—),女,汉族,山东济宁人,中级讲师,硕士研究生,研究方向:计算机神经网络及应用。