李昆仑 兰长明
摘要:该文研究了几种解决大型规划问题的常用方法以及采用支持向量机进行多分类的方法;并在此基础上提出使用决策二叉树的方法来实现人脸图像质量的分类。基于支付向量机的人脸图像质量分类算法,对于无参考图像质量评价具有很好的指导意义,也为今后的研究打下了良好的基础。
关键词:支持向量机;多分类;二叉树;人脸图像
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2015)06-0175-02
Research of Face Image Quality Classification Algorithm Based on Support Vector Machine
LI Kun-Lun, LAN Chang-Ming
(Science and Technology College of NanChang University, Nanchang 330029, China)
Abstract:This paper analyzes several common methods to solve the problem of large scale planning and support vector machine. Based on this, we propose a method to realize the classification of face image quality using by two fork trees. This method that used for face image quality classification has a good guide on the no reference image quality assessment, at the same time, which also lays a good foundation for further research.
Key words:support vector machine; multi classification; two fork tree; face image
人脸图像质量分类是近几年刚兴起的研究领域,该领域的研究成果相对来说还比较有限。但对人脸图像质量分类的研究具有重大意义:首先,人脸图像质量分类对一些人脸识别相关领域的研究起到基础性的作用,比如在某些人脸图像识别系统中,如果输的人脸图像质量较好,将能提高系统的人脸识别性能[1]。其次,目前都是采用人工方式来检查各种证件照中的人脸图像质量,人工检查时往往带有较多主观性,且率不高,不能在实时场所的应用。如果可以将人脸图像质量的实时分类融入到某些人脸图像的采集系统中,就能实现在采集人脸图像时对图像质量进行实时的监控,从而提高图像识别系统的效率,间接地降低系统的成本[2]。另外,人脸图像质量分类涉及人眼视觉识别系统,目前这方面的研究还比较少,如果能从人脸图像质量分类的研究中寻求相应人眼视觉机制的原理,则对视觉领域的进一步研究起到极大的促进作用[3]。当然,目前对图像质量分类的研究还处于原始阶段,本文提出采用基于支持向量机的人脸图像质量分类算法,希望能够为以后人脸图像质量评价系统的研究提供重要启示。
1 支持向量机
支持向量機是一种典型的机器学习方法,该方法是在统计学习理论的基础上发展起来,具有较好的推广性和较强的分类性能[4]。起初,支持向量机是为了两类分类而设计的,随着识别需求的发展,支持向量机的分类功能扩展到多种类识别领域,目前,怎样更有效的用支持向量机来解决多分类问题还是支持向量机的研究热点[5]。
支持向量机的多分类问题可以用数学公式如下描述:
假设有训练集S,[S=(X1,y1),(X2,y2)...(Xn,yn)],其中,[Xn∈RM],[yn∈1,2...k]。怎样计算[RM]上的决策函数[g(X):X=RM→yn]。
就目前来说,使用较多的基于支持向量机的多分类方法有以下几种:一对一方法、一对多方法、导向非循环图方法、决策树方法等[6]。
1.1 一对一方法
这种方法指的是从支持向量机的总训练集[S]中任取两类样本点[Si]和[Sj],然后将选取的这两类样本点组成训练集[Sij],然后在此组合后的训练集上用支持向量机求解两分类的问题。
这种方法需要构造支持向量机分类器的数量为[k(k-1)2]。用分类器分别去测试某个测试样本[X]属于[k]类样本中的第几类,统计所有分类器对该样本的分类结果。如果其中某个分类器判定测试样本[X]属于第[i]个类别,那么就将该类别的得票数加一。最后综合统计各个测试样本的得票情况,得到票数最高的那个类别就是测试样本的最终划定的类别。一对一方法有个明显的缺陷,就是如果某个测试样本存在多个类别得票相同的情况,也即是同时属于多个类别的时候,可能将无法正确判定该样本属于哪个类别。另外就是该方法在分类过程中需要构造较多数目的分类器,也使得在训练分类器的过程非常耗时。
1.2 一对多方法
该方法是先指定某个样本为负类,其余样本作为正类,然后去构造一个两类的支持向量机分类器。该方法在具体的应用过程中需要构造的分类器的个数为[k]。就一个3分类问题来说,如果将第一类样本作为负类,其余样本作为正类,构造第一个决策函数[g1(X)];然后依次构造出其余两个决策函数[g2(X)]和[g3(X)]。在使用这些决策函数进行类别判别时,当有一个而且只有一个决策函数的判别结果是负值,那么这个判别函数所得到的结果就是这个测试样本所属的分类。
和一对一方法相比,该种方法在应用过程构造分类器的数量明显减少,所以在训练过程中其速度也相应加快。但这种方法可能会存在某些测试样本不属于任何一种类别的情况。
1.3 决策导向非循环图方法(Decision Directed Acyclic Graph, DDAG)
在训练阶段该方法与一对一方法比较相似,训练过程中需要构造[k(k-1)2]个分类器,但测试阶段可以使用导向循环图。该图具有[k(k-1)2]内部结点,每个内部结点即为一个两类分类器,还具有[k]个叶子结点,也即是最终的分类结果。在对导向循环图进行遍历时,先从根结点开始,根据根节点分类器的输出结果来决定下一步是遍历左侧结点还是右侧结点,直至某个叶子节点结束,得到该样本最终的分类结果。这种方法的主要优势就是在测试阶段比上述的两种方法都要快得多。
1.4 决策树方法
该方法是用决策树的形式来表示处理逻辑的一种方法。由于该方法能够直观地表述所需的逻辑要求,比较适用于逻辑关系简单和判断条件少的情况[7]。传统的支持向量机多用于两分类情况,所以,也可以将决策树方法与支持向量机方法相结合生成一种新的基于支持向量机的多分类方法。
假设要构造一个[k]类样本的二叉树,其叶子结点分别对应一种类别,非叶子结点(度数为2)对应一个支持向量机分类器。整个决策二叉树共有[k]个叶子节点, [2k-1]个非叶子结点,需要构造的支持向量机两类分类器的个数为[k-1]。
另外,由二叉樹的性质知道想要构造一棵有[k]个叶子结点的二叉树,实际上可以有多种方案。下面以一个4分类问题为例,列举构造二叉树的两种方案。分别如图1和图2所示。
总结该方法具有两大特点:第一,由于决策树具有层次结构,在每一层次上都可以采用不同的训练样本来训练分类器,由于样本的差异性,分类器的重要级别也有所差异;另外,由于测试阶段也需按层次来完成测试,所以对测试样本来说,用到的分类器数目可能介于1和决策树的深度之间。
2 人脸图像质量分类算法实例分析
若采用决策树的方式进行人脸图像质量的多分类实验,假设需要进行分类的图像质量等级有5个,那么则需构造的4个支持向量机两类分类器,在实际构造时可以采用很多不同的组合方式,即能产生多种类型的决策二叉树。五类人脸图像质量分类决策二叉树模型如图3所示。
图3 五类人脸图像质量分类决策二叉树模型
构造人脸图像质量分类决策二叉树的具体做法是:先将人脸图像质量为第一等级的样本作为负类,其余的图像样本作为正类,通过训练得到第一个支持向量机分类器;然后,将人脸图像质量为第二等级的样本作为负类,把剩下的图像样本作为正类,通过训练得到第二个支持向量机分类器;依次类推去构造另外两个支持向量机分类器。在对图像样本进行测试时,如果其被第一个分类器判为负类,那该样本就属于第一等级,否则转到第二个分类器上进行判别,如果被判别为负类,则该样本被认定为第二等级。依此往下,直至进行到二叉树的某一叶子节点。
3 总结和展望
本文深入研究了支持向量算法的相关知识,分析了几种常用的支持向量机多分类方法;提出使用决策二叉树的方式实现对人脸图像质量的多分类。无参考图像质量评价是近年来兴起的比较前沿的研究方向,但整体来看视觉识别的研究目前还处于相当有限的水平,所以该领域的突出成果相对还较少[8]。无参考人脸图像质量评价的研究还要继续深入,本文以后的研究将围绕以下方面来开展:尝试将支持向量机算法和遗传算法相融合,在训练过程中通过遗传算法选取较优的核函数参数。
参考文献:
[1] Hamid Rahim Sheikh, Alan C.bovik. Image Information and Visual Quality [J]. IEEE Transactions on Image Processing, 2006(15):430-444.
[2] 安平.基于线性SVM的级联检测器的构造及其在目标检测中的应用[D].长沙:国防科学技术大学,2007.
[3] Venkatesh R, Babu S. Sureshb, rew Perkis. No-reference JPEG-image quality assessment using GAP-RBF [J]. Signal Processing, 2007(12):1493-1503.
[4] Chih-Wei Hsu, Chih-Jen Lin. a comparison of methods for multi class support vector machines. IEEE Transactions on neural networks,2002,13(2):415-425.
[5] Platt J C, Cristianini N, Shawe-Taylor J. large margin dags for multiclass classification[J]. Advances in Neural Information Processing Systems. MIT Press,2000(12):547-553.
[6] Weston J, Watkins C. Multi-class support vector machines. M. Verleysen, editor, Proceedings of ESANN99, Brussels, 1999. D. Facto Press.
[7] Gastaldo P, Parodi G. No-Reference Quality Assessment of JPEG Images by Using CBP Neural Networks[C], International Symposium on Circuits and Systems, 2004(5):772-775.
[8] Huitao Luo. A training-based no-reference image quality assessment algorithm [C]. Singapore: International Conference on Image Processing, 2004(5):2973-2976.