傅栩雨 叶健东 王鹏 曾颖森
(北京邮电大学,北京海淀 100876)
人脸面部表情识别
傅栩雨 叶健东 王鹏 曾颖森
(北京邮电大学,北京海淀 100876)
近年来交互,智能成为了大家很关注的问题,人脸表情识别是人工智能中有重大意义的一部分,通过面部情绪的识别,增进人机交往的友好性和智能性。本文讲述了情绪识别的完整过程,从摄像头的实时影像中开始到最后实现情绪识别,显示识别结果。不单一地侧重某一部分内容,而进行整体过程的勾画。同时将涉及到的多方面内容从原理到应用讲逐个讲解,点明使用的具体方法,结合实际应用过程对功能相近的模块进行选择和对比。
表情识别;主动形状模型;局部二值特征;级联分类器;主动表观模型
指纹,虹膜,人脸等人与生俱来的信息越来越多的应用到身份认证的过程中。由于计算机的工作能力,早期这些信息只是小部分的被使用。人工智能的发展,对这类信息的处理利用提出了更高的要求。
计算机以人为服务对象而被广泛使用,随着计算机技术的发展,操作越来越复杂,功能越来越多样,但在取得这些进步的同时牺牲了用户使用的舒适度和友好性,人机交互成为一个重要课题。在人机交互的过程中,人们不再满足于通过鼠标键盘等物理介质实现对计算机的控制和交流,希望计算机可以对人的语言、肢体动作、表情作出自然地反应。要实现这样的需求就需要计算机可以更好的理解用户的行为,最好能够赋予计算机人的情感和判断,因此人脸情绪是别对人机的良好交互有着重要意义。
情绪是一种重要的心理活动,情在绪的表达中语言占有7%,语音占38%,面部表情占55%,因此对表情的分析可以使计算机更好地揣度人的情绪,作出期望的反应。识别表情对计算机来说不是一件容易的事情,表情是通过面部肌肉的运动实现的,由几十块肌肉共同作用产生产生。同一个人在不同的情景下,同一种表情的表达方式也会有差别,不同的人的表情更是千差万别,很难以统一的标准来判断。同时,人眼的识别能力远远高于计算机,计算机能否在短时间中捕捉到特征,以什么为特征,又是一大问题。
表情识别又是一个结合心理学、生理学、计算机视觉、模式识别的交叉课题。研究意义重大,应用广阔。
(1)haar-like特征的计算
如下图所示的就是haar-理科特征,由黑白的矩形区域构成。Haar-like分为以下四种,边缘特征、线性特征、中心特征和对角线特征,选取下面的两到三种特征构成一个模板,规定这个模板的特征值为白色区域像素和减去黑色区域像素和。这样的一个模板就将图片信息转化为数字信息,其实质上体现出来的是在一定区域类图片灰度值变话的情况。改变模板的大小与位置,在子窗口中与目标图像对应,每种组合(由模板的种类,大小,位置构成)方式都可以得到一种haar-like特征。图(1)显示了基连的原理。
图1 级联原理
(2)强分类器级联
通过模板的简单组合构成弱分类器,再通过改变每种模板的权值生成强分类器。强分类器级联,各个强分类器之间存在与的关系,并具有树状结构。比如得到的强分类器的的识别率为98%,拒绝率(可以通过非人脸的概率)为50%,在10个强分类器级联的情况下能够得到P(通过)=(0.98)^10=0.87,P (拒绝率)=0.0009766。在实际运用过程中识别的最主要问题是将非人脸的部分判断为人脸,在使用级联的情况下可以很大程度上,可以很大程度上降低拒绝率。
(3)加快人脸检测速度
在实验过程中,为了加快检测到人脸的的速度,并且考虑到在动态的过程中,人脸不可能在屏幕上产生瞬时的长距离移动,我们采用了保存上一步检测人脸区域的方法。第一次检测到人脸的区域如图(2)绿色方框所示,第二次扩大上一方框在图(3)所示的方框内检测人脸,免除了一些重复的步骤。
图2 第一次检测
图3 第二次检测
(1)模式识别主要两类分类原理
第一种主要方法是主成分分析法,我们平时收集到的信息,是一种混叠状态的信息,各个特征模式的分量都具有相关性,这样进行数据处理就会重复进行很多无意义的计算。通过主成分析法分析法将变量分为多个因子,通常处理对所有因子都进行操作,主成分分析法将因子对的特征根直接(可以用spss对因子特征根进行计算)按照大小排列,取影响大的提高权,是一种降维的方法。LBP部分提到的旋转LBP算子和LBP等价模型在一定程度上来说也是一种降维的处理方法。
第二类也就是SVM采用的分类原理,升维的分类方法。低维无法进行分类的情况,换到高维空间就可以找到更好的边界。
(2)SVM分类器
SVM是功能强大的分类器,可以解决分类问题和回归问题,使用了kernel trick进行数据转换。SVM在输入(得到的LBP特征)间找到最好的区分边界,再将它找到的边界与输入的标签对比,最后确定边界的可靠性,我们主要运用到的是分类问题,在opencv中可以使用其自带的SVM库。
视觉是信息在人的交往过程中占的比重非常大,人的语言在一些情况下误导性很高,表情是人情绪的一种直观表示,在世界范围都具有很高的共性人脸情绪识别在人工智能,人机交互方面有很广阔的运用前景。
参阅文献
[1]Robert laganiere.opencv2计算机视觉[M].北京:科学出版社,2013.
[2]毛峡.人机情感交互[M].北京:科学出版社,2011.
[3]李树娟.基于LBP特征的人脸表情分析[M].
[4]July.支持向量机通俗导论[M].
Facial Expression Recognition
FU Xu-yu,YE Jian-dong,WANG Peng,ZENG Ying-sen
(Beijing University of Posts and Telecommunications,Beijing 100876,China)
In recent years,interaction and intelligence are issues attracting more and more attention.Facial expression recognition,as a significant part of artificial intelligence,enhances the friendly and intelligent human-machine interaction through facial emotion recognition.The paper describes the complete process of emotion recognition from the real-time images of camera to the final realization of emotion recognition and result display.The paper outlines the whole process instead of solely focusing on a part of the content.And the multiple aspects of content involved are introduced one by one,from theory to application.The specific methods of use are pointed out,and the modules with similar functions are selected and compared based on the practical application process.
facial expression recognition;active shape model;local binary characteristic;cascade classifier;active appearance model
TN971
A
1008-1739(2015)10-70-2
定稿日期:2015-04-26
北京邮电大学大学生创新基金资助