基于AlexNet卷积神经网络的人脸情绪识别技术研究

2022-05-30 07:37:51姜冰王慧莹陈晨钟幸丽王显龙

电脑知识与技术 2022年27期

姜冰王慧莹陈晨钟幸丽王显龙

摘要：随着我国科学与技术的高速发展，人脸情绪识别技术拥有广阔的应用前景，但传统神经网络模型的人脸情绪识别效果不佳。文章将对基于AlexNet卷积神经网络的人脸情绪识别技术进行分析，并对基于AlexNet卷积神经网络的人脸情绪识别技术未来发展前景进行探讨。

关键词：卷积神经网络；人脸情绪识别；AlexNet

中图分类号：TP18 文献标识码：A

文章编号：1009-3044（2022）27-0024-03

开放科学（资源服务）标识码（OSID）：

1 引言

人脸情绪识别技术很好地将计算机技术与生物学融合在一起，此技术通过网络模型提取和识别采集人脸情绪面部特征图像，根据人类习惯性的面部变化，判断图像所表达的情绪[1]。人脸情绪一直是人行为分析的重点，人脸情绪识别技术在各领域都有着广泛的应用。在心理学领域，情绪识别技术和其他行为分析技术能够帮助研究人员获取多方面、更加准确的数据。在儿童教育领域，利用情绪识别技术可以对教学成果进行评估，并针对儿童的不同反应，选择适合他们的教育方式；在医疗领域，可以通过人脸情绪识别评估患者的疼痛程度或抑郁程度。除此之外，情绪识别还可应用于护理领域、交通驾驶领域等。现有技术中，因为情绪识别设备的复杂，应用不够广泛，使用也不够方便。因此，提供一种使用方便、适用范围广、识别准确率高的基于图像识别的情绪识别判定方法是非常有必要的。下文将从AlexNet卷积神经网络的角度出发，进行人脸情绪识别的技术分析与研究。

2 人脸情绪识别的主要技术

人脸情绪识别技术是在基于人脸情绪生物特征识别基础上，运用计算机技术参考对照加以分类认证情绪类别，进而完成对人脸情绪识别的过程。此技术同时涉及计算机科学、生物学、心理学等众多学科[2]。一般的情绪识别受背景环境等非人为干扰因素影响较大，通常识别效果不佳。AlexNet模型是卷积神经网络（CNN）的重要模型之一，AlexNet的高性能更适用于当今飞速发展的信息时代。此外，区域特征分析算法近几年也在人脸识别技术中被人们广泛应用，与计算机图像学相融合，将情绪识别的图像处理相关技术与生物统计学相关原理结合，采用图像处理技术提取视频中的人像特征点，另外使用统计学有关原理进行一系列分析建模。人脸情绪捕获与跟踪功能也起到了关键作用，即从图像或视频流的某一帧中检测出人像并且使人像能够单独分离出来，并自动将其保存。人像跟踪是指利用上述人像捕获技术，当出现人脸情绪时自动地对其进行追踪。通常来说，实现人脸情绪识别最关键的一步是提取表情特征，依照图像中的脸部特征以及表情细节变化等相关特征数据化的表现，即可得出精确的提取以及分析，其次将图片导入建立的系统数据库中做对比，最后得到相应结论。理论分析看起来简单易懂，不过实际应用起来却困难重重，此过程极易受到光线强度及其他因素的干扰，人脸情绪本身复杂的表情以及化妆等因素更增加了难度。因此本文研究分析了基于AlexNet的情绪识别技术，包括图片预处理、卷积神经网络以及情绪识别算法，以便更好地改善这一问题。

2.1 人脸情绪图片预处理技术

在人脸识别过程，人脸图片预处理是一个重要环节。图片在输入时，由于图片采集环境的不相同，比如光照的明暗程度和设备性能的优劣等，会存在对比度不够、有噪声等缺点。另外，人脸在整幅图片中间的大小和位置会因为距离远近、焦距大小等而不确定，从而影响人脸算法的识别准确率。因此，为了确保人脸图片中人脸的大小，位置以及人脸图片质量的一致性，必须对图片采用预处理技术。

人脸图片预处理技术的方法主要包括人脸的扶正、人脸图片的增强以及归一化等。人脸的扶正需要通过人脸关键点对人脸做对齐校准，从而得到人脸位置端正的人脸图片；图片增强就是指在人脸图像清晰度逐步提高的过程中，使得计算机处理和识别图片更加方便有利。而归一化工作则是使得到的灰度取值范围以及尺寸达到高度相似。通过人脸图片的预处理，将采集到的人脸图片进行过滤、旋转、移动、调节灰度、等比例放大缩小、归一化姿态等几个基本处理步骤，得到在尺寸大小、距离长短、光线强度标准化的人脸图片，以此提高人脸算法的识别准确率。

2.2 卷积神经网络技术

在神经网络理论中比较关键的组成部分就是卷积神经网络模型，该模型可以实现对人类大脑结构及其功能做出一系列数据化的模拟反应[3]。卷积神经网络需要通过多层的神经网络组合起来运用。卷积神经网络使得全连接层上的参数明显减少，提高整体的网络训练速度，避免出现过拟合问题。在图像识别的过程中，神经元仅需要辨识该图像的局部特征，而非整体特征，即可使得图像识别的精准程度和图像识别的速度得到提升。一般情况下，卷积神经网络通常由输入层、卷积层、池化层、全连接层组成，如图1所示。

3 情绪识别算法

情绪识别算法比较复杂，但基本步骤大致如下：首先獲取若干人脸情绪表情图像，可使用摄像头采集对象面部表情图像；接下来对表情图像进行预处理，对获得的表情图像进行剪切处理，去除头发、背景、轮廓等区域，而后对表情图像进行尺度归一化和灰度归一化处理，获得纯人脸情绪图像；接着进行表情特征提取，提取面部关键特征点的位置作为特征区域，关键特征点包括眉毛、眼睑、嘴唇、下巴等，并对关键特征点进行强度分级，生成表情特征图像；最后进行情绪识别判定，用提取的表情特征图像与数据库中的标准表情图像进行对比分析，并识别判定。本文在进行相关面部图像表情采集的过程中运用了网络爬虫数据采集技术，此方法只需要使用互联网爬虫技术便可以自动进行图像获取，再使用图像数据爬取技术即可把爬取到的数据存储下来，极大地提高了数据采集效率。

3.1数据预处理

在进行相关原始数据处理之前，将收集的正面且无任何遮挡的人脸情绪图像，进行剔除多余背景信息的操作，再存入数据库中。对已存入数据库中并且已经处理过的图像进行统一修改，使其尺寸相同、格式一致。另外，人脸情绪表情数据信息采集后需要统一改为JPG格式，以便后续算法对其的处理。

3.2 利用AlexNet模型进行情绪识别

首先，对原始图片做一定比例的缩放，之后裁剪滑动框里移动的图片，并进行相应的预处理，随后将预处理后的图片传输到训练好的卷积神经网络中进行下一步的判断，根据得到的判定矩阵，反向寻找此滑动框在原始图片中对应的坐标，最后截取到的图片即为所需要的人脸情绪图像，AlexNet网络结构如图2所示。

4 情绪识别的流程

情绪识别采用特征脸法，将一部分图集转换为一个特征向量集，运用投影点在此空间内相应的方向和长度判断位置，用PCA技术做空间变化，进而得到不同的特征向量。通过此方法可以准确定位人脸情绪特征，显著提高人脸情绪识别的效率。特征脸方法的实现过程如下：

首先，获取集合S，其中包含M张人脸图像。将每张图像转换成一个N维的向量排成一行，把这M个向量放到一个集合S里，如式（1）所示：

S = {Γ1，Γ2，Γ3，...，[ΓM]} （1）[5]

然后根据获取到的人脸情绪向量集合S，计算平均图像Ψ ，如公式（2）所示：

Ψ = [1Mn=1MΓn] （2）[5]

再通过S集合里的每个元素减去Ψ，来计算每张图像和平均图像的差值Φ，如公式（3）所示：

Φi = [Γ]i-Ψ （3）[5]

通过M个正交的单位向量un ，来描述Φ（步骤三中的差值）分布。通过下式（4）计算un里面的第k（k=1，2，3...M）个向量uk，如下所示：

λk = [1Mn=1M（uTkΦn）]2 （4）[5]

uk 在特征值λk取到最小的值时就可以基本确定了。当这M个向量是单位长度的而且是相互正交时，uk 需要满足公式（5），如下所示：

[uTluk] = [δlk] = [1 if l=k 0 otherwise] （5）[5]

接下来，计算协方差矩阵的特征向量（特征脸），如公式（6）所示：

C = [1Mn=1MΦnΦTn] = AAT （6）[5]

其中A=｛Φ1，Φ2，Φ3，... ，[Φ]n｝。如果训练图像的数量比图像的维数小时，比如（M

再将训练集图像和测试集图像都投影到特征向量空间中，对于获得的新的人脸情绪，我们用特征脸对其进行表示，如公式（7）所示：

[ωk]=[uTk（Γ-Ψ）] （7）[5]

其中k=1，2...M，上式可以计算第k个特征脸uk对应的权重，M个权重就可以组成一个向量，即[ΩT] = [ω1，ω2，... ，ωM]，以此得到特征脸对人脸情绪的表示。

最后进行人脸情绪识别，如公式（8）所示：

[εk] = ‖Ω-[Ωk]‖2 （8）[5]

其中Ω代表要識别的人脸情绪，Ωk代表训练集内的其中一个人脸情绪，两者都是使用特征脸的权重来表示的。[εk]是为了计算两者之间的欧氏距离，如果距离比阈值小，则表明要判别的脸和训练集内的第k个脸的情绪是一样的。当遍历所有训练集都比阈值大时，可以通过比较距离值的大小，分成是新的人脸情绪和不是同一个人脸情绪两种情况。因为训练集的不同，所以设定的阈值是需要改变的。

5 基于AlexNet卷积神经网络的人脸情绪识别技术发展前景

如今，我国计算机技术不断取得新的进步，人脸情绪识别这一技术也在不断向前更新发展。但不可否认的是在信息快速更新迭代的时代下，此技术仍含有不可忽视的缺点，例如人脸情绪信息的多样化、社会需求的多元化等，还未达到市场的需求。接下来应大力宣扬发展基于AlexNet卷积神经网络的人脸情绪识别技术，摒弃传统、不健全的人脸情绪识别技术，有侧重点地提高此类技术。

面部识别和虹膜识别存在着不同程度的可复制性问题，人脸每天都暴露在外面，通过拍照完全可以获得一个人的脸部特征，并进行复制。另一个风险是不稳定性，比如脸部画上浓妆，面部过敏、受伤、整容，都会导致脸部特征发生很大变化，从而降低人脸情绪识别的准确率，甚至无法识别。人脸情绪识别的关键在于是否拥有良好的核心算法，并且能够使识别的结果具有很好的识别效率和识别速度；另外，人脸情绪识别系统还需要结合信息处理的理论与实践，以及其生物特征识别的最新应用，从而充分展现当今科技社会由弱人工智能向强人工智能的转化。

作为一个新兴的技术领域，人脸情绪识别也同以往服务于安全领域的技术一样，会面对很多来自不法分子的恶意攻击，需要在不断的攻防战中提升自身的技术水平和防护能力。就像查杀计算机病毒一样，攻击和防守将是一个长期博弈的过程，从而促使技术往更好的方向发展。有需求就会有市场，社会应高度重视高精尖行业所需要的技术，以便更好地带动科技和经济的发展，做到取之于民，用之于民。通过提高科技人员福利，调动科技人员的工作热情和积极性，重视对人脸情绪识别的科研力度，从而推进相关科研水平。相信在国家政府有关部门积极有力的带动下，我国人脸情绪识别技术会有前所未有的提升，科学技术的发展前景将会一片光明。

6 结束语

综上所述，人脸情绪识别已经成为计算机领域的一个重要的研究方向，其包含了图像处理、人工智能、神经网络以及模式识别等领域的知识，是一门非常综合的学科。本系统的实现有助于人工智能技术的进一步发展与完善，相信能够为人脸情绪识别进一步的研究提供参考依据。虽然现有的人脸情绪识别技术已经得到了很大提升与进步，但其识别效果仍然不能完全满足市场需求。本文通过对基于AlexNet卷积神经网络人脸情绪识别技术未来发展前景做深度学习和简要分析，以便人脸情绪识别技术更好地在市场中普遍应用，让人脸情绪识别应用到更多的领域中，从而推动我国相关情绪识别技术的快速发展。

参考文献：

[1] 王玉琪.基于深度学习的人脸情绪识别研究[J].电子制作，2020（14）：36-37，63.

[2] 魏建军.基于深度卷及神经网络的人脸表情识别技术研究[D].西安：西安科技大学，2020.

[3] 王遥，金玲，林紫雯，等.基于改进卷积神经网络的人脸情绪识别研究[J].科学技术创新，2021（1）：116-118.

[4] 周锦荣，徐张伟，段梦芳，等.基于卷积神经网络人脸情绪识别的RGB LED混合调光方法研究[J].照明工程学报，2021，32（4）：83-91.

[5] 肖小梅，杨红云，易文龙，等.改进的Alexnet模型在水稻害虫图像识别中的应用[J].科学技术与工程，2021，21（22）：9447-9454.

【通聯编辑：唐一东】