基于C5.0算法的人脸表情识别研究

2015-12-03 02:10秦喜文李洋董小刚高中华
中国科技纵横 2015年3期
关键词:决策树人脸规则

秦喜文 李洋 董小刚* 高中华

(1.长春工业大学基础科学学院,吉林长春 130012;2.长春工业大学汽车工程研究院,吉林长春 130012)

基于C5.0算法的人脸表情识别研究

秦喜文1,2李洋1董小刚1*高中华1

(1.长春工业大学基础科学学院,吉林长春130012;2.长春工业大学汽车工程研究院,吉林长春130012)

本文通过对人脸表情图像进行预处理,对预处理后的待测图像进行特征点标定,统计出这些特征点之间的几何特征,建立表情属性表,构建基于决策树C5.0算法的人脸表情识别模型,获取分类规则,得到较好的识别精度,为人脸表情识别提供了一条有效途径。

表情识别ASM决策树C5.0

现代社会计算机与我们生活联系的越来越紧密,如何让计算机理解人类的意图,受到了人类的重视。人脸表情识别研究在心理学、智能机器人、智能监控、虚拟现实等领域具有应用价值。人脸表情识别中最重要的两个部分就是人脸表情特征提取和人脸表情规则提取,本文通过ASM算法得到特征点,并且根据这些特征点提取几何特征属性,建立表情特征属性表,然后构建基于决策树C5.0算法的人脸表情识别模型,给出了人脸表情识别规则,得到较好的识别精度。人脸表情识别技术领域仍然存在人脸识别与人脸表情识别异同性,人脸表情特征提取的针对性与准确性,人脸表情识别的可靠性、准确率不高的问题等。为了解决其他方法存在的问题,本文提出了基于决策树C5.0的人脸识别研究,丰富了人脸表情识别方法。

1 C5.0算法介绍

决策树算法的基本思路是通过对给定数据集进行训练来构造一棵决策树,从树根到叶子的每一个路径都是一条蕴含在数据中的规则。

C5.0模型的工作原理是根据提供最大信息增益的字段分割样本。然后通常会根据不同字段再次分割由第一次分割定义的每个子样本,且此过程会重复下去直到无法继续分割子样本。最后,将重新检查最底层分割,并删除或修剪对模型值没有显著贡献的分割。

C5.0具体步骤如下:

(1)设S是一个样本集合,目标变量C有k个分类,freq(iC,S)表示S中属于iC类的样本数,|S|表示样本集合S的样本数。则集合S的信息熵定义为:

(2)如果某属性变量T,有n个分类,则属性变量T引入后的条件熵定义为:

通过计算不同T带来的信息增益率,并选择信息增益率最大的输入变量T作为最佳分组变量,这样得到的分组组内取值趋同程度最高,对决策树的分类具有显著的指导意义。同时,C5.0使用信息增益率作为决策标准,能够消除类别数量的不同对分类结果的影响。

2 基于C5.0的人脸表情识别

本文通过C5.0来寻找一种精确、高效的基于人脸图像提取特征的方法,从而构建出一套完备的人脸表情识别模型。

表1 训练集与测试集的分类总体精度

2.1人脸表情图像预处理与特征提取

本文采用表情库是日本Kyushu大学ATR媒体信息科学实验室Lyons博士提供的JAFFE人脸库。这个数据库包含10名日本女性的213幅表情图像,其中每人提供7种基本表情。分别为中性、高兴、伤心、惊讶、生气、厌恶和害怕。

电子设备对人脸进行拍照时,会受到各种条件限制和随机干扰,这种人脸图像不能直接用,需要对拍摄的原始表情图像进行尺度归一化、灰度归一化。然后要获取图像表情的特征点,对特征点定位,这里将采用ASM的特征点定位方法,进行asm特征点提取及几何特征计算,得到表情特征属性表,进行规则提取,最后得到识别结果。

我们通过ASM算法得到了76个特征点,并且根据这些特征点提取了嘴的高宽比,右眼宽高比,左眼宽高比等33个几何特征属性,建立表情特征属性表,从而为下一步的表情识别规则提取提供了数据基础。

2.2表情识别规则提取

决策树分类模型及分类规则:通过上述模型构建功能对数据进行训练,就可以得到半速率门限值最优化模型。该模型能够以规则集或决策树的形式展示模型内容。表1给出了对表情分类结果的统计,主要包括训练样本和测试样本的正确与错误百分比。

从表1我们可以看出,训练集的总体精度高于测试集的分类精度,除分类规则的影响外,还包括测试集的样本数偏少,导致总体精度不如训练集。不同表情测试图像的识别率高低并不相同,在表情分类中,高兴的识别率最高,其次是惊讶、愤怒表情,它们的识别率都超过85%,厌恶、害怕、悲伤和中性这几种表情相对来说要低一些。这是因为惊讶、愤怒和高兴这些表情人脸特征区域的变化较大,表情的相关性比较小,从而比较容易识别。

3 结语

本文对人脸表情识别方法分析,并对它们各自适用性、优缺点进行阐述。针对人脸表情图像进行人脸尺寸与灰度归一化处理和特征点标定等预处理,进而提取出人脸表情的几何特征,提出的方法实现表情特征属性约简,筛选出最优特征组合,利用C5.0算法充分挖掘人脸表情识别规则,丰富人脸表情识别方法。本文算法方面还需要在广泛性上继续改进,提高对不同的人,难分辨表情,不同面部装饰表情的识别率。在后续的工作中,将进一步寻找人脸表情的特征,进而提高表情识别精度,使其识别速度更快且具有较高的准确性,建立一套完整、高效与精确的人脸表情识别。

[1]周晓旭,黄向生,徐斌,王阳生.基于Boost改进的嵌入式隐马尔可夫模型的实时表情识别[J].计算机科学,2005.1 1.

[2]潘丽敏,谢尔曼,罗森林.基于Haar特征的Turbo-Boost表情识别算法[J].计算机辅助设计与图形学学报,2011.08.

董小刚(1961—),男,汉族,博士,教授,从事应用统计的研究。吉教科合字2012(第119号)。

猜你喜欢
决策树人脸规则
有特点的人脸
数独的规则和演变
一种针对不均衡数据集的SVM决策树算法
三国漫——人脸解锁
决策树和随机森林方法在管理决策中的应用
让规则不规则
TPP反腐败规则对我国的启示
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用
马面部与人脸相似度惊人