郎方年,田丽媛,刘莉莉,董恺凌
(1.成都大学信息科学与技术学院,四川成都 610054;2.江苏大学附属医院信息科,江苏镇江 212013;3.营口职业技术学院成人教育分院,辽宁营口 115000;4.西南交通大学交通运输与物流学院,四川成都 610031)
基于四元数的彩色人脸检测
郎方年1,田丽媛2,刘莉莉3,董恺凌4
(1.成都大学信息科学与技术学院,四川成都 610054;2.江苏大学附属医院信息科,江苏镇江 212013;3.营口职业技术学院成人教育分院,辽宁营口 115000;4.西南交通大学交通运输与物流学院,四川成都 610031)
针对彩色图像提出基于四元数的人脸检测算法,从数学上解决传统方法将肤色检测与人脸最后确定分开进行而导致检测率较低、程序复杂度高的弱点,将人脸肤色信息与反映轮廓形状的灰度信息进行融合同时作计算处理,提高了检测速度,且增强了算法的鲁棒性.首先简单概述作者提出的检测系统,然后按算法流程分块说明系统每部分的主要内容,其中包括:定义于实数域的广义瑞利商以及Fisher鉴别分析法在四元数体上的推广;基于四元数的Fisher鉴别分析法在人脸检测中的应用原理;彩色人脸样本集的收集与预处理;彩色非人脸样本的收集及其分类的原因和分类原理;多尺度检测中的融合问题;多组检测结果的综合判断问题.数学上严密的推导表明,基于四元数的检测算法合理可行,满足实时性要求.大量实验测试结果显示,此算法快速有效,具有较强的鲁棒性.
特征融合;特征抽取;四元数体;自共轭矩阵;模式分类;人脸检测
人脸检测技术起源于上世纪70年代[1],目前,关于人脸检测的诸多技术问题已经得到广泛的研究,特别是基于运动、颜色等信息的检测技术日渐成熟[2-3],而基于统计的检测方法的出现,也使得复杂背景下的人脸检测成为可能[4].另外,能够精确跟踪和定位人脸特征的变形模板、活动轮廓模板等特征抽取技术也取得很大的进展[5],对这些检测技术而言,一个共同的特征是,都需要使用有关人脸的先验信息.根据使用人脸图像先验信息的不同可将人脸检测方法分为2类:其一是仅仅采用灰度信息的模板匹配方法,其包括PCA方法(Eigenface)、神经网络方法(ANN)以及支持向量基方法(SVM)等[6-10],这类方法一般都具有较好的通用性及较强的鲁棒性,但是缺点也很明显,比如计算量大、检测速度较慢等;其二是针对彩色图像的基于肤色的检测算法,即根据人脸表面的肤色信息以及启发式信息确定人脸位置.
目前,科研人员提出了许多关于彩色人脸检测的方法[11-14].尽管这些算法具体实施策略各异,但都遵循着一种共同的原则,即对颜色信息的利用与对人脸灰度信息的利用分开进行,先进行肤色检测,确定出可能的人脸区域,然后再在这些区域中利用人脸的某些轮廓形状等先验信息来确定该区域是否存在人脸.同时,这些算法虽然都取得了某种程度的成功,却也存在许多难以克服的缺点:①颜色模型对肤色聚类的影响,现有的颜色模型空间很多,如常用的RGB颜色空间,CIE的 Luv、Lab颜色空间,以及YUV、VHS、HIS彩色空间.但是,对于应用来说,一个基本的问题是人脸肤色在颜色空间中是否真的具有良好的聚类特性?如果具有好的聚集特性,则在哪一种颜色空间中肤色聚类效果最好?②类肤色区域的融合、归并.如果待检测图像背景复杂,则肤色检测结果有可能出现类肤色区域较多的情况,而对待检测图像而言,人脸存在的情况未知,即是否存在人脸,以及如果存在则其可能的位置、尺度如何,均不得而知.因此,需要根据经验对这些分散的类肤色区域做预先的归并处理,如形态学处理、小区域合并等.③训练样本的大量需求.如基于Adaboost技术的检测算法需要以数目巨大的训练样本作为基础,该算法误检现象相对突出.④时间复杂度.要想得到稳定性好、检测率高、适应性强的算法,大量时间的耗费则成为必然.⑤算法鲁棒性.算法复杂度越高,检测过程越曲折,则算法鲁棒性成为必须考虑的问题.
针对上述彩色人脸检测方法中存在的各种问题,本研究对正面端正人脸图像以及旋转角度较小的正面人脸图像的检测提出一种基于四元数的检测方法,该方法从数学上有机融合了人脸表面的肤色信息以及反映轮廓形状的灰度信息,检测时对2种信息同时加以利用,从而避免出现传统方法中将2种信息分开处理而出现的各种弊病.同时,以大量样本的统计训练为依据,方法具有较好的准确性和较强的鲁棒性.实验结果表明,该方法具有良好的效果,为目前彩色人脸检测方法中问题的解决提供了一种新的思路.
1.1.1 四元数的定义及其与本研究有关的命题.
设q=a+ib+jc+kd,其中a,b,c,d∈R,i,j,k满足关系,i2=j2=k2=-1,ij=-ji=k,jk=-kj=i,ki=-ik=j,则称q为四元数.
令q1=a1+ib1+jc1+kd1,q2=a2+ib2+jc2+kd2,则四元数的基本运算法则定义如下:
本研究中,需要用到的有关四元数矩阵的概念有:令Q表示四元数集合,①设矩阵A∈Qn×n,若AH=A,则称A为自共轭四元数矩阵,n阶四元数自共轭矩阵的全体记为SCn(Q),实对称矩阵和复Hermite矩阵都是特殊的自共轭矩阵;②设矩阵A∈Qn×n,当存在B∈Qn×n,使得AB=BA=I,则称四元数矩阵A是可逆的,且称B为A的逆阵,记为A-1;③设矩阵A∈Qn×n,若存在 λ ∈Q及0 ≠a∈Qn×1,使得Aa=aλ(或Aa=λa),则称λ为矩阵A的右(或左)特征值,而a为A的属于右(或左)特征值的特征向量.
有关命题:①(AB)H=BHAH;②设A∈SCn(Q),对任意X=(X1,X2,…,Xn)T∈Qn×1,XHAX必为实数;③设A∈SCn(Q),则对任意非零X=(X1,X2,…,Xn)T∈Qn×1,有XHAX>0(≥0),则称A为四元数(半)正定矩阵,并分别记为SC>(Q)(n(Q));④设A∈SCn(Q),若A可逆,则A-1∈SCn(Q);⑤设A∈SCn(Q),则四元数自共轭矩阵的行列式为实数;⑥设A∈SCn>(Q),则A的特征值为实数.
1.1.2 Fisher线性鉴别分析法在四元数中的推广.
1)广义Rayleigh商在四元数中的推广.
四元数体上的Rayleigh商定义为,
设A∈SCn(Q),记 φA(α)=αHAα/αHα,其中,满足0≠a∈Qn×1,它是Qn{0}到R的映射,称为矩阵A的Rayleigh商.如λ1≥λ2≥…≥λn是A的特征值[15],则,
鉴于Fisher模式分类准则函数的需要,作者给出四元数广义Rayleigh商的定义:设A∈(Q),B∈S(Q),且X∈Qn×1≠ 0,则称,φ(X)=XHAX/XHBX为四元数矩阵A相对于四元数矩阵B的广义Rayleigh商.
在计算过程中,会涉及到求解该式极值的问题.证明可知,求解该式极值的问题可转换为求解方程AX=λBX的广义特征值及广义特征向量的问题[17].
结论1 设A∈SCn(Q),B∈SCn>(Q),则方程AX=λBX存在n个关于B共轭正交的特征向量和n个对应的实数特征值 λ1,λ2,…,λn,且满足如下的条件,
结论2 设矩阵AH=A∈SCn(Q),BH=B∈SCn>(Q),满足AX=λBX,则B的共轭向量系,X1,X2,…,Xn,具有性质:①Xi≠ 0,其中i=1,2,…,n;②X1,X2,…,Xn右线性无关;③λi与Xi满足方程,AXi=λiBXi,i=1,2…,n;④ 令,Q=(X1,X2,…,Xn),则QHBQ=E,且QHAQ=diag(λ1,λ2,…,λn).
2)四元数中的Fisher鉴别分析法.
设q=α+iβ+jγ+kη为四元数矢量,其中α、β、γ、η为实数矢量.Fisher判别分析法的基本思想是投影,使得投影后类与类之间的样本投影尽量分开,而类内的样本投影尽量靠近,本研究定义的相应矩阵为,
①类间散布矩阵,
②类内散布矩阵,
③总体散布矩阵,
由矩阵的以上构造方式可知,Sb、Sw、St均为自共轭四元数矩阵.
本研究采用的Fisher准则函数为,
按上式表述可知,如果(SbX-λmaxStX)=0,则同样满足求解的要求.而由前述推导可知,该式能够很方便求解,即该方程最大特征值所对应的特征向量即为本研究需要求解的最佳投影矢量.
1.1.3 基于四元数的彩色人脸检测.
四元数的定义为q=a+bi+cj+dk,其中a,b,c,d∈R,如果将彩色图像像素的R、G、B3个分量作为四元数的3个虚数部分,则数学上彩色图像可表示为,
其中,(m,n)为彩色像素的位置坐标.将图像按行展开成四元数列矢量,然后按照前述的方式构造相关矩阵,从而一切计算问题的出发点就可以从这里开始.本研究方法的核心在于将非人脸类分为8个不同的类别,判别的时候使用Fisher鉴别分析法在每个非人脸类与人脸类之间对待检测输入图像子区域做归属性判决.
图1给出基于四元数的彩色人脸检测方法的流程图.
图1 彩色人脸检测方法流程图
图1所示的流程图中,标号为⑥的椭圆表示彩色人脸样本集,而8个标号为0的小矩形方框则表示8类非人脸样本集,本研究以四元数空间中的欧氏距离为测度将非人脸样本集分为8个类别.左上角的重叠矩形方框代表对原始图像进行缩放处理的步骤,本研究采用多尺度检测方式,即将待检测输入图则上式的求解等价为如下模型的求解,像按1∶1.2的比例分级缩放,力求使得不同尺度的人脸都能得到检测.标号为④的方框表示多尺度、多位置检测中的融合处理步骤.标号为⑤的椭圆框表示对单检测位置的8个判断结果的综合判定.标号为①的方框代表对待检测输入图像进行全彩色均衡化处理的步骤.本研究基于四元数的人脸检测方法的核心部分由图中标号为③的方框所示,其中的内容涉及到待检测图片中局部模式的匹配算法以及定义于实数域的相关定理在四元数中的推广.
图2给出本研究使用的部分样本采集原始图像的示例,其由200张标准身份证照片,经过镜向、旋
图2 人脸样本收集来源图例
转等处理办法,总共获取了200×6=1 200张彩色图片源,旋转角度分别±5°、±10°.收集样本的时候,选用20×20像素的矩形框在每张图片中从左到右、从下到上逐像素移动,保存所有20×20的子图像,然后依靠主观视觉判断,在这些图像中手工挑选合适的标准人脸样本,如图3(b)中间的图像所示,而偏离人脸中心过多的半边脸图像则被认为是非人脸图像,如图3(a)所示.按这种采集办法,本研究人脸库共收集有1 200×3=3 600张标准彩色人脸样本图像.
图3 人脸样本图像源的处理方式
为获取统一的标准样本图像,同时避免4个角落背景颜色的干扰,本研究将20×20子图像的4个角落作删除处理,如图3(b)所示.同样,在做检测的时候,输入图像中的待检测子区域也按该方式进行预处理,以便获得更为准确的匹配.
2.2.1 彩色非人脸样本的收集.
为获取在人脸与非人脸之间具有较好区分效果的彩色非人脸样本,本研究选用了80多张彩色图像作为非人脸样本收集的图片源,在这些图片中有大部分颜色为类似于肤色的彩色风景照片,也有颜色跟肤色差异很大的图像,然而更多的却是尺度远大于20×20的亚洲人脸面部图像,部分图例如图4(a)所示,按该方式收集的部分非人脸样本如图4(b)所示.最终,本研究共收集了20 982张非人脸图像.
图4 非人脸样本及其收集来源图例
人脸作为具有弹性的自然形体,由于受到个体外貌差异、表情变化以及图像在采集时光照、设备等因素的影响,而使得人脸图像千差万别、形态各异.但人脸的眼睛、鼻子、嘴巴等器官在空间位置上的分布大致相同,因此人脸又具有很强的共性.一般来讲,基于统计的人脸检测方法对样本的处理都是将图像像素按行排列成属于高维空间的矢量.因此,人脸的共性在实际应用中体现为在高维矢量空间中人脸分布的类聚性.针对本研究提出的方法来说,这种共性则体现得更加具体,其原因为:①肤色信息对人脸类聚性的影响,因为本研究方法是将人脸的肤色信息与灰度信息从数学上融合在一起同时加以考虑,因此考虑人脸分布聚集性的时候必须考虑肤色对分布的影响.针对某一类人脸来说,如本研究采用的亚洲人脸,肤色基本上一致,因此四元数空间中肤色对人脸分布聚集性的影响是加强聚集效果,而不是令其发散;②灰度信息对人脸类聚性的影响,由于人脸形状基本相似,因此在高维空间中代表人脸的点具有相当程度的类聚性,也就是说,这些点分布在一定空间范围之内.
但是,对非人脸样本来讲,情况则要复杂得多.首先,就其在高维矢量空间中的分布来讲,非人脸应该定义为,除人脸分布范围之外的所有点都代表非人脸;其次,在人脸分布范围之中,同样存在许多人类视觉很容易辨别但是计算机硬件却很难加以区分的属于非人脸的点,如木偶、彩色漫画人脸等类似于人脸,但是并不是真正的自然人脸图像.因此,高维矢量空间中,代表非人脸的点集和代表人脸的点集属于高维空间中的稠密子集.要在这样的分布情形之下,找到一种能够准确区分人脸与非人脸的算法,的确显得很困难.本研究采用的判别待检测子区域到底属于人脸还是属于非人脸的方法为Fisher鉴别分析法,但是常规的Fisher判别方法是针对2类问题而提出的.此外,由前述分析可知,彩色人脸在空间中的分布具有一定程度的聚集特性,然而非人脸的分布情况却要复杂得多.但是,如果以欧氏距离作为测度标准,按照空间分布区域的不同将非人脸分为许多不同的类别,使得每类非人脸与人脸集之间形成Fisher方法能够进行鉴别分析的分布情形,则该问题就可以很容易得到解决.
2.2.3 彩色非人脸样本的分类策略.
本研究采用K-Means聚类算法对非人脸样本集进行分类,其中关于距离的度量则采用四元数空间中的欧氏距离.对本研究收集的20 982张非人脸样本图像进行分类,最终获取的8类非人脸样本集的数目 为 3 839、919、909、2 885、2 768、4 672、1 811、3 179.通常,对于成熟的检测方法而言,训练集的样本数量应该非常充分,因此,由目前的这些数据可知,仍然需要进行大量的工作去完善本研究的检测方法.
图5表示单尺度检测时,同位置人脸被多次标定的情况.方法实现的时候,采用C(m,n)记录判决结果,其中,坐标(m,n)表示外接矩形框左下角点的坐标,C值表示该次检测的图片尺度.如果单人脸检测结果 存 在,C(m1,n1)、C(m2,n2)、…、C(mr,nr),显然,这些记录结果仅仅代表单张人脸,因此需要通过某种方式将这些记录合并成一个正确结果.
图5 单尺度、多位置融合示例
检测时,采用25×25的矩形框由图像左下角开始,从左到右、从下到上逐像素扫描,记录该框内所包含的被检测到人脸的次数,并用V(m,n)表示,其中,坐标(m,n)表示该矩形框的扫描位置,V则表示统计次数.当整张图片扫描结束以后,得到一数据表,表中每个位置都包含一非负整数.如果表中某位置的数为0,则表示该位置不可能存在人脸;反之,则按数字的大小表示可能存在人脸的程度.显然,该数据表中存在局部最大值的地方即为人脸存在的准确位置.本研究用R(m,n)记录这些点的坐标以及本次扫描图像相对于原始待检测图像的尺度,并利用坐标(m,n)以及R计算将该尺度转换到原始待检测图像时,被检测人脸的正确位置及其实际大小.单尺度检测的最终结果用return(x,y)表示,(x,y)为位置坐标,而return则表示包含该人脸的外接矩形框的大小.
返回值return(x,y)表明某尺度下,图像中人脸存在的位置及其大小.然而,不可避免的是同一张人脸在几种尺度下都可能得到检测,因此,返回结果为return1(x1,y1)、return2(x2,y2)、…、returnr(xr,yr),
环境检测模块采集的数据经处理后传送到主端,再由Processing编写的上位机系统在PC机上显示。系统节点环境数据监测显示如图6所示。
如图6所示,对此需要对最后的结果进行融合处理,以获取较为准确、简洁的检测结果.
图6 单位置、多尺度融合示例
同单尺度、多位置融合算法类似,单位置多尺度融合采用15×15的矩形框从原始图像的左下角开始,从左向右、从下到上逐像素扫描,在每个扫描位置,用V(x,y)记录此时矩形框中被检测到人脸的次数,坐标(x,y)表示矩形框所处的位置.扫描结束后,寻找数据表中的局部极大值点,记录以该点为中心的15×15矩形框内检测到的所有人脸的平均大小.最后,用finalposition(m,n)表示该点位置及平均脸大小,并利用该数据绘制人脸外接矩形框.
设X为某类非人脸样本集与人脸样本集之间的最优鉴别矢量,fi为人脸样本,f0i为该样本在最优鉴别矢量上的投影,f为人脸样本集的中心,而f0为该中心在同一鉴别矢量上的投影.同样,设mi为某类非人脸样本集中的样本,m0i为该样本在最优鉴别矢量上的投影,m为该类非人脸样本集的中心,而m0为该中心在该鉴别矢量X上的投影,则人脸样本集和非人脸样本集的离散度可以表示为,
通过两类样本集的离散度,则可以按如下方式获取在两类之间作归属性判别时所需要的判决阈值,
设Y表示待判决局部子区域的矢量表示,y=YTX为该矢量在最佳鉴别矢量上的投影,则最终的判决准则可以采用如下方式,
其中,F表示人脸集合,M表示非人脸集合.
可见,在实际判决过程中,对任意待判决局部子区域而言,将其投影到8个最优鉴别矢量上作8次判决,因此会出现8种判决结果.本研究对这8个结果的最终决策办法是,如果被判断为属于人脸的次数多于或者等于被判为非人脸的次数,则将该子区域图像判决为人脸,否则为非人脸.
实验结果表明,如果图片背景颜色单一,同时人脸肤色分布与样本人脸肤色相差较小的时候,本方法检测效果最佳.测试过程中,本研究将样本收集源中的照片作为测试对象,检测率高达100%,而对特意选取的同样本收集源图像拍摄条件完全一致的20张照片所进行的检测结果表明,与预期的理想结果基本一致(见图7),这表明本研究方法是可行性的.
图7 拍摄环境与样本完全一致的图像检测结果
此外,如图7所示,令人意外的是检测中有2张照片的人脸都附带有额外的小方框,该矩形框包含以眉中间位置为中心的小块区域.对于这样的检测结果,在本研究所做的测试中并不是个别现象,绝大多数图片的结果中,在人脸图像的该位置都出现了类似的小矩形框.之所以出现这种情况,可能是因为:本方法的核心是将待检测子图像矢量向最优鉴别矢量作投影,然后根据该投影是偏向人脸类还是非人脸类而做出最后的归属性判决.因此,将理想的人脸外接矩形区域与额外附属区域经归一化处理成维数相同的矢量,并向鉴别矢量作投影,如果得到的2个投影值基本相同的话,就会出现这种情况.
图8 简单背景下数码相机拍摄照片的检测结果
图8给出作者对自己拍摄的简单背景人脸图像进行检测的结果示例,其中图(a)所包含的人脸其肤色跟人脸样本库中的人脸肤色相似,而图(b)中人脸肤色跟样本库中的人脸肤色存在一定的差异.检测结果表明,图(a)中人脸外接矩形的位置与理想情况差不多,但是由于融合算法还不是很理想,因此,检测结果中出现多个矩形并存的情形,另外前述的额外矩形仍然存在.图(b)的测试效果则不是很好,外接矩形所包含的区域跟理想的情况存在一定的偏差,即矩形框的中心位置上移.
图9为本检测系统对简单背景网络照片的测试结果,其中图(a)所包含的人脸肤色与样本集人脸肤色相似,而图(b)中的人脸肤色与样本集人脸肤色存在差异,并且包含2张欧洲人脸照片.由图(a)中各人脸外接矩形的位置可知,如果待检测图片中人脸肤色与样本库中人脸肤色类似,本算法能够得到较好的检测效果,在人脸旋转角度不是很大的情况下,同样能够得到理想的检测效果,如图(a)中第4张照片.同时,如果人脸附属物不是很明显的话,对本方法检测性能的影响并不严重.
图9 简单背景网络照片的检测结果
但是,如果网络照片所包含人脸的肤色与样本集人脸肤色存在一定差异,则不能得到满意的检测结果.图10、图11给出复杂背景下本检测方法对不同光照环境下所拍摄图像的检测结果.这些图像背景相对而言较为复杂,且色彩变化较大,同时与所包含人脸的肤色仍有一定的差距.
图10中的照片由作者自己拍摄并剪辑,其中图(a)中人脸肤色同样本集人脸肤色比较接近,而图(b)中的人脸肤色与样本人脸肤色相比则存在一定差异.就检测效果而言,图(a)的检测结果与预计较为吻合,但是对于图(b)而言则检测效果较差,不但人脸不能被准确定位,而且误检现象较为突出.第1张图像不能得到准确的检测却在预料之中,首先人脸样本库中没有采集小孩子的照片,同时该图片中小孩面部与样本库中人脸肤色相差很大.第2张照片所包含的人物略带淡状,同时照片有轻微的处理痕迹,因此,本检测系统难以对其进行准确的定位,同时存在误检.
图11中的照片来源于Internet网络,其中的照片是通过剪辑获取的包含单人脸的图像.测试结果表明,由于肤色与样本人脸相似的,因此检测效果较为理想,除开额外矩形框仍旧存在以外,包含眼睛、鼻子、嘴巴的人脸外接矩形定位较为准确.
图11 复杂背景网络照片的检测结果
表1所包含的数据为本研究方法对作者分类收集的图像进行测试的统计结果.由表1中数据可知,简单背景下本研究方法的检测效果要远好于复杂背景下的检测效果,而肤色与样本集人脸相近的图像,其检测结果好于颜色存在差异的图像.
表1 本研究算法实验测试结果数据统计
此外,为与优秀的算法进行性能对比分析,以便于对作者提出的方法进行改进,在本研究测试集中,作者采用基于adaboost算法的检测方法进行测试,检测结果数据如表2所示.
表2 adaboost算法实验测试结果数据统计
由表1、表2的统计结果可知,除开某些特殊情况外,基于adaboost算法的检测方法其性能要好于本检测方法.
利用四元数及其矩阵的相关知识,本研究将定义于实数域的广义Rayleigh商向四元数体做了合理的推广,以此为基础得到四元数体上的Fisher鉴别分析法,并在模式识别领域采用该策略,得到一种新颖的彩色人脸检测算法,从数学上融合彩色像素的R、G、B3分量,使得彩色人脸的肤色信息和反映人脸形状结构的灰度信息能够同时得到利用.测试结果表明,本研究关于四元数体的各种推广结论成立,同时可以应用于实际问题的解决,提出的关于彩色人脸的检测算法符合具体问题的应用要求,为高效人脸检测算法的寻找提供了一种新的思路.
相对于传统的许多方法而言,基于四元数的彩色人脸检测算法有其天然的优势,尽管与基于adaboost算法的检测能力相比较而言,本研究的检测方法的性能还没有达到相当理想的效果,但是,由前述相关内容的分析可知,这并不完全是算法本身的缺陷,而是由其他可以避免和改进的原因所造成,这需要在以后的研究工作中继续进行探索.
:
[1]Hjelmas E,Low B K.Face detection:a survey[J].Computer Vision and Image Understanding,2001,83(3):236-274.
[2]De Silva L C,Aizawa K,Hatori M.Detection and tracking of facial features[C]//'95Proceedings of Machine Vision Conference.New York:SPIE Digital Library,1995:1195-1207.
[3]Hsu R L,Abdel-Mottaleb M.Face detection in color images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,24(5):696-706.
[4]Jain A K,Duin R P W,Mao J C.Statistical pattern recognition:a review[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2000,22(1):4-37.
[5]Cootes T F,Taylor C J.Active shape models-‘smart snakes’[C]//Proceedings of British Machine Vision Conference.London:Springer-verlag,1992:266-275.
[6]Moghaddam B,Pentland A.Probabilistic visual learning for object representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):696-710.
[7]Moghaddam B,Pentland A.Beyond linear eigensp-aces:Bayesian matching for face recognition[C]//Face Recognition from Theory to Application.New York:Springer-Verlag,230-243.
[8]Sung K,Poggio T.Example-Based learning for view-based human face detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(1):39-51.
[9]Rowley H A,Baluja S,Kanade T.Neural network-based face detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(1):23-38.
[10]Osuna E,Freund R.Girosi F.Training support vector machines:an application to face detection[C]//Proccedings of the CVPR.Puerto Rico,IEEE Press,1997:130-136.
[11]Lee C H,Kim J S,Park K H.Automatic human face location in a complex background using motion and color information[J].Pattern Recognition,1996,29(11):1877-1889.
[12]Kafer M,Benois-Pineau J.Detection of human faces in color image sequences with arbitrary motions for very low bitrate videophone coding[J].Pattern Recognition Letters,1997,18(14):1503-1518.
[13]Garcia C,Tziritas G.Face detection using quantized skin color regions merging and wavelet packet analysis[J].IEEE Transactions on Multimedia,1999,1(3):264-277.
[14]Hsu R L,Abdel-Mottaleb M,Jain A K.Face detection in color images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(5):696-706.
[15]Li W L.Quaternion Matrix[M].ChangSha:National Univercity of Defense Technology Press,2002.
[16]Ai H Z,Liang L H,Xu G Y.Skin color and template based face detection[J].Jounal of Software,2001,12(12):1784-1792.
[17]郎方年,周激流,宋恩彬,等.广义Rayleigh商在四元数上的推广及其在图像信息融合中的应用[J].激光杂志,2006,27(3):39-40.
Quaternion Based Color Face Detection
LANG Fangnian1,TIAN Liyuan2,LIU Lili3,DONG Kailing4
(1.School of Information Science and Technology,Chengdu University,Chengdu 610106,China;2.Information Section of Affiliated Hospital,Jiangsu University,Zhenjiang 212013,China;3.Adult Education Branch,Yingkou Vocational and Technical College,Yingkou 115000,China;4.School of Transportation and Logistics,Southwest Jiaotong University,Chengdu 610031,China)
A novel color face detection algorithm based on quaternion is proposed in this paper.Compared with conventional face detection method,which has relatively low detection speed based on the separation of face color detection and face confirming,our method improves the detection speed and advances the stability through simultaneously making use of face color information and gray information which reflects the contour of face.In this paper,the simple introduction of the detection system is given firstly,then every part of our detection system is presented in detail according to the flow-chart,which includes:the generalization of general Rayleigh-quotien and Fisher discriminant algorithm defined in real field;the application principle of Fisher discriminant algorithm based on quaternion in color face detection method;the collection and pre-processing of color face sample set;the collection of color nonface sample set and the principle and reason of its classifying;the fusing problem of multi-scale detection.The detailed mathematical demonstration indicates that our detection algorithm based on quaternion is rational and feasible,and it satisfies real time demand.The tests based on a large amount of samples show that our method has high detection speed,high correct detection rate,and is very robust.
feature fusion;feature extraction;quaternion;self-conjugate matrix;classification;face detection
TP391
A
1004-5422(2013)03-0254-09
2013-06-15.
国家自然科学基金(61173121)、中国博士后基金(20100471665)资助项目.
郎方年(1974—),男,博士,副教授,从事数字图像处理、生物特征识别及人工智能等研究.