基于Gabor滤波器的面部表情识别系统

2016-04-07 16:05宋小双
电脑知识与技术 2016年3期

宋小双

摘要:由于缺乏有效的面部表情识别技术,面部表情识别在日常生活中的潜在应用没有得到重视。随着计算机化的盛行,运用计算机的面部识别也逐渐开始盛行。该文以MATLAB为开发工具,对面部表情进行研究。该文选择亚采样和归一化对表情图像原图进行预处理,找到面部特征的位置。然后再使用Gabor小波对预处理图像进行滤波,接着对滤波后的图像算欧式距离,最后使用最近邻方法找出最近的类,识别出表情图像所对应的情绪类型。

关键词: 面部表情识别系统;MATLAB;Gabor滤波器;欧式距离;最近邻方法

中图分类号:TP393.08 文献标识码:A 文章编号:1009-3044(2016)03-0199-02

1 概述

一直以来,表情是人类引以为傲的东西,这是我们和机器的一种本质上的区别。随着计算机的发展,我们更期盼人机之间的沟通交流,尤其是一种带有感情的沟通交流。在物联网技术发展的今天,面部识别已经不是什么太大的技术性问题,而对于人类表情识别来说,仍旧是一片空白。

实验表明[1],人脸部不同部位具有不同的表情作用。例如,表达忧伤眼睛最重要,表达快乐与厌恶口部最重要,而前额部分能提供惊奇的信号,眼睛、嘴巴和前额对表达愤怒情绪相当重要。还有实验数据表明:表达怨恨、喜悦等口部肌肉比眼部肌肉重要;而表达忧愁、惊骇等情绪眼部肌肉比口部肌肉重要。面部表情识别技术[2-3]是计算机科学研究的内容之一,是心理学、生理学、模式识别、图像处理和机器视觉等领域的一个极具挑战性的交叉性课题。

2 系统分析与设计

2.1 表情分析

情绪随着面部表情的变化,一些变化是极其微小的。据估计,人的脸上有80块肌肉,可以复合产生7000多种不同的表情。汤姆金斯假定存在8种基本的情绪:欢乐、兴趣、痛苦、惊讶、恐惧、愤怒、羞愧、轻蔑。一个实际的面部表情识别系统如下图1所展示的。这个识别过程开始于用一个类似于摄像头的图像采集设备采集图像,然后被采集的图像需要进行预处理,使不同图像里的环境和其他变量最小化。

2.2 面部表情图像预处理

由于各种原因例如光照、光线等不均匀会造成图像灰度过于集中,因此,图片的像素质量会下降,好一点的会出现图像不清晰,很难看出细节等问题;差一点的就会表现出图像严重模糊不清,连大概的图片原貌都不看不出来。所以在进行图像处理之前就非常有必要对图形质量进行改善进行预处理。预处理过程一般有数字化,几何变换,归一化,平滑,复原和增强等步骤。图2为进行预处理后的各表情图。

2.3 Gabor小波

Gabor小波[4]就相当于人的视觉机制中的简单细胞响应。它在处理目标的局部空间和频率域方面具有良好的特性。在图像边缘敏感的这个问题上,Gabor小波能够表现出对光照变化的良好适应性,对光照不敏感,而且还能提供良好的尺度选择特性以及良好的方向选择特性。基于上面的特性,Gabor小波在视觉空间信息方面应用很广。图3为经过Gabor滤波器滤波后的图像展示。

2.4 欧氏距离图与最近邻方法

欧式距离[5]是一种易于理解的距离算法,源自空间两点距离公式。二维平面上两点a(x1,x2)和b(y1,y2)间的欧式距离为:[d1,2=(x1-x2)2+(y1-y2)2]。对于n维空间点a(x1,x2,x3,...,xn)和b(y1,y2,y3,...,yn)两点之间的欧式距为:[d=k=1n(xk-yk)2]。

最近邻方法是一种经典的机器学习方法,主要用来解决分类问题[6-8]。1-NN和k-NN是最近邻方法常见的两种形式。k-NN又称k-means算法,分类流程如下:首先,在包含了n个数据集的集合中,随机选择k个对象,每个对象表示一个簇的最初的均值,也就是簇的形心。对其余的每个对象,分别计算它们到这k个对象的欧式距离,将它们分配到距离最近的那个形心代表的簇中。然后,重新计算每个簇内对象的均值,产生簇新的形心。利用新生成的簇的形心,重新分配数据集中的对象。重复这个过程,直到不再发生变化,即新一轮的簇的形心和前一轮的相同为止。

3 实验结果分析

本文实验所使用的图像是由国外10名志愿者的7*6*10,6种表情,每种表情7种不同的程度共420张图片,其中每个表情均是由中性情绪即正常开始逐渐加重程度。每位实验者脸部的头发等军被处理掉以便更好的识别。

从表1中可以很直观的看出来,最近邻方法对中性表情的分辨识别率最高,相对应的对恐惧和悲伤着两类表情分辨正确率相对较低。对另外的生气、厌恶、高兴等的识别率也取得了相对不错的结果。之所以会呈现这样的结果主要是因为,中性表情与其他表情的差异比较大,而恐惧和悲伤的分类正确率地是因为这两类表情与其他类型的面部表情差异较小,而且面部表情本身特征不明显。

4 结论

本文基于Gabor滤波器给出了面部表情识别方法。基于Gabor滤波器的面部表情识别系统预先将表情图像的面部以外的其他物体都处理掉,例如头发耳朵等,只露出能够透露面部表情特征的五官。再进行欧式距离的计算,并基于最近邻方法进行分类。对于本系统最后运行的最后实验结果,中性表情由于和其他表情特征差距大而识别正确率大,相对的恐惧和悲伤由于和其他表情的差异比较小而识别率比较低,识别率有待进一步提高。在今后的工作中还需要对最近邻算法进行改进,以便对面部特征相似的表情进行更准确的识别,提高整体识别率。

参考文献:

[1] Ekman P, Friesen W V, Hager J C. Facial Action Coding System.Research Nexus, a subsidiary of Network Information Research Corporation,Made in the United States of America, 2002.

[2] Wang Y, Ai H, Wu B. Real time facial expression recognition with Adaboost[C]. ICPR 2004, Proceedings of the 17th International Conference on Pattern Recognition,2004, 3: 926-929.

[3] Zhou X, Zheng W, Zou C. Facial expression recognition based on fuzzy-LDA/CCA[J]. Journal of Southeast University, 2008,24(4):428-432.

[4] Daugman JG. Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters[J]. J. Optical Soc. Amer., 1985, 2 (7): 1160-1169.

[5] Bajcsy R, Lovacic S. Multiresolution elastic mathing[J]. Computer Vision,Graphics,and Image Processing, 1989, 46: 1-21.

[6] Na S, Xumin L, Yong G. Research on k-means clustering algorithm: An improved k-means clustering algorithm//Intelligent Information Technology and Security Informatics (IITSI)[C]. 2010 Third International Symposium on. IEEE, 2010:63-67.

[7] Birant D, Kut A. ST-DBSCAN: An algorithm for clustering spatial–temporal data[J]. Data & Knowledge Engineering, 2007, 60(1): 208-221

[8] Celebi M E, Kingravi H A, Vela P A. A comparative study of efficient initialization methods for the k-means clustering algorithm[J]. Expert Systems with Applications, 2013, 40(1): 200-210