于浩文
(英国南安普顿大学,英格兰,So173sh)
人脸表情识别技术其实是一种将计算机技术与生物学联系在一起的技术。这项技术的出现与创新,标志着人类未来的生活将会出现多种多样的交叉型学科研究,这也意味着人类未来的计算机技术发展会有更多的可能性,但需要注意的是,想要使得人脸表情识别技术变得更加智能化、更加精准,仍然需要进行更加贴合实际人类需求趋向的技术改进,文章将从卷积神经网络的角度出发,进行人脸表情识别技术的研究。
想要对基于卷积神经网络的人脸表情识别进行深入的研究与探讨,就需要对神经网络理论以及人脸表情识别技术有一个更加深入的认知。
所谓的神经网络理论中,神经网络模型是较为重要的组成部分,该模型能够对人脑的结构以及功能进行一个数据化的模拟反应。而神经网络中最基本的单位是神经元,因此要进行神经网络模型的构建,必须要对神经元的信息传递方式以及连接方式有一个深刻的认知。相关技术研究人员发现,使用神经网络训练的过程中要进行前向传播以及反向传播的训练。相关技术研究人员通过对人体神经网络日常信息反馈和分析的方式与方法研究,进行数字化模拟的神经网络模型搭建。
卷积神经网络是人工神经网络的重要组成部分,它是一种十分高效的网络,需要通过多层的神经网络组合起来才能够进行运用。卷积神经网络有较为漫长的发展历史,随着人工智能技术的逐渐发展和创新,卷积神经网络的技术也逐渐达到了新的高度。在传统的神经网络工作原理中,仅仅只能够满足两层神经元之间的相互连接,但是在日常的计算机运算过程中,全链接层上的参数过多,因此这种传统神经网络的工作方式可能会导致整体的网络训练速度变得十分缓慢,甚至出现过拟合问题。而卷积神经网络则完美的规避了这些缺点,能够使得全链接层上的参数在计算机运行过程中有明显的减少,这样一来整个网络训练的速度就能够得到提升与稳定[1-2]。在使用卷积神经网络进行图像认知识别的过程中,每个神经元只需要对图像的局部特征进行辨识,而不需要每个神经元都对整个图像的特征进行辨识,这不仅能够使得图像识别的精准程度得到提升,还能够使得图像识别的速度得到提升。因此相比较传统的神经网络在人脸表情识别方面的使用,卷积神经网络的使用会变得更加方便、快捷。
想要成功地进行人脸表情识别,要经历3个阶段,第1个阶段是人脸检测阶段,第2个阶段是人脸表情特征的提取阶段,第3个阶段是人脸表情的识别阶段。这3个阶段缺一不可,共同完成一次人脸表情的精准识别。所谓的人脸检测指的是在图像中精准的找出人脸的位置,因此不论是第二阶段还是第三阶段的应用,都需要经历第一阶段,如果相关神经网络技术的应用,无法在图像中进行人脸位置的准确提取,那么第二阶段与第三阶段也就无从谈起。能够用来进行人脸检测的方式有很多。在第一阶段完成之后,到了第二阶段,就需要进行人脸表情的特征提取,所谓人脸表情的特征,指的是面部肌肉以及纹理变化的相关特征数据化,通过数据化的呈现来进行准确地提取和分析。相关人脸表情识别技术不仅要运用到静态图像上,而且需要运用到动态图像上。而运用到静态图像上的技术与运用到动态图像上的技术有些微小的差别,因此相关技术人员必须要对不同图像类型的人脸表情特征提取进行不同的基础研究。到了第三阶段之后,由于已经有了提取出的人脸表情特征信息,因此该步骤只需要判断提取出来的特征属于哪一类别,便算是完成了整体的人脸表情识别。这一步骤的完成也可以通过几种不同的算法来进行。总而言之,人脸表情识别方式以及技术手段仍然有不断改进的可能,在卷积网络神经技术使用基础上进行人脸识别技术的使用,更能够保证其准确性。
为了使未来的人脸精准识别能够变得更加高效准确,许多技术研究人员开始通过数据库的建立来进行人脸表情的搜索与整理。现有的人脸表情数据库在数据存储量上并不符合使用军机神经网络来帮助进行高效表情识别的期待,因此为了使得研究变得更加精准合理,应当建立能够使用卷积神经网络技术进行人脸表情识别研究的人脸表情图像数据集。下文将对数据库集的建立进行深入的分析与研究。
想要使得相关人脸精准识别数据库更具典型性与代表性,在相关数据的收集过程中,就应当以认真负责的态度来确保相关数据的真实性。具体到人脸精准识别数据库的建立上,则表现为相关技术研究人员需要对人脸最具代表性的5大类表情:面无表情、微笑、哭泣、惊讶以及生气进行最为精准性的收集。其中微笑表情的面部特征是面部肌肉强有力的收缩,面颊向上,眼角下的皮肤略微有些松弛,眼角的鱼尾纹会皱起。而哭泣表情则是嘴巴张大,整个面部表情向下,眼睛紧闭或是上下眼皮靠拢。而到了生气这一表情,相关技术人员所需要进行关注的面部特征是眼睛睁大,瞳孔变小,以及上下牙齿咬合在一起。而所谓的面无表情就是从表情分析上看不出人类想要表达的情绪[1]。惊讶表情则是嘴唇张大,眼睛张大,瞳孔放大,拥有这一类表情特征的图片则会被标记为惊讶。当然技术研究在进行相关面部图像表情采集的过程中,所需要运用到的采集技术有两种:一种是爬虫采集,另一种是手动采集。手工采集是一种较为原始和传统的信息采集方式,需要靠技术人员在互联网上进行手动的信息获取。在进行人脸表情数据库建立过程中所需要使用到的爬虫技术是图像数据爬取。准确无误的使用该技术,可以更加真实的进行相关人员数据的获取和整理,这对进行相应数据库的建立是能够起到助力的。
倘若相关人脸表情识别的数据收集较为真实且高质量,那么在进行下一步的相应人脸表情数据识别过程中,相关识别效率就能够得到有效的提升。因此在进行数据库的建立过程中,进行人脸表情识别准确性的提升是很有必要的。在数据的预处理工作完成后,还要对已经处理过的数据信息进行统一的尺寸修改以及格式修改和命名修改,通常情况下,人脸表情数据信息采集在进行了预处理过程后,都需要统一为JPG格式,并且相关的分辨率,通常情况下分辨率需要统一为227×27的模式,才能够被当作原始的参照图像资料存入库中[2]。在这一流程完毕后,相关的数据库建立便宣告完成。
虽然相比较传统的卷积神经网络模型而言,AlexNet具有无可比拟的优势,并且能够使得相关的人脸表情识别效率质量大大提升,但是在人工智能技术不断发展与改进的过程中,相关技术人员仍然发现AlexNet网络结构存在着一定的缺陷。例如使用该网络结构对人脸表情进行识别实验,最终的精准程度是74.91%。就是说它能够识别大部分的人类面部表情,但仍然存在误差,这意味着相关网络结构在卷积操作的特征提取过程中所使用的卷积操作卷积核尺寸并不具备多样性[3]。想要在未来的卷积神经网络基础上进行人类面部表情识别,并且使得相关面部表情识别变得更加精准和高质量,就需要对现阶段所使用的AlexNet网络结构进行进一步的改进与完善。
总而言之,在人工智能技术不断发展与完善的过程中,想要使用卷积神经网络来进行面部表情的识别与抓取,并且使得相关识别质量与速率能够得到明显的改进,就需要不断结合人工智能技术的发展趋向来进行相关识别技术的完善,这项技术的改进能够对人类的面部表情进行更好地解读,也会在一定程度上促进人与人之间的良好沟通,使得人类日常的生活和工作变得更加方便快捷。