唐云龙 何麒 陈平
摘要:论文通过对目前国内外主流人脸检测的算法进行比较研究,探讨如何提高人脸识别算法的精确度和检测速度,为国内开发各类人脸识别系统提供参考,主要是通过分析以肤色特征为主的人脸检测法,了解其计算过程和原理,对其拥有的色彩空间、预处理人脸图像检测技术以及依据人脸特点建立相应的肤色模型等算法、检测技术进行深度分析。通过研究,笔者认为在社会经济发展中,人脸检测应用比较广泛,相较之其他识别人体生物的系统,人脸识别方式更加直接与友好,已成为未来识别认证身份的一种重要发展趋势。以肤色特征为主的人脸检测法,不仅色彩空间广,且运用了综合检测技术,提高了检测精确度,检测速度也更加快捷,主流人脸检测算法均有各自的特性,但总体而言,建立在脸部肤色特点基础上的人脸检测技术与综合检测技术相结合,不仅能够有效提高肤色检测技术的准确率,还可以极大地提高Adaboost算法的检测速度与效率,使用比较广泛。
关键词:人脸检测;算法;色彩
中图分类号: TP18 文献标识码:A
文章编号:1009-3044(2019)19-0198-03
随着现代化科技水平的快速发展,信息技术的安全性日益凸显。在国家安全部门、公安系统、司法部门、电子商务及政务系统、甚至安全检查等相关领域,都需要准确的识别个人身份,而识别与鉴定身份的基础则是系统的安全性,而传统身份鉴别系统已难以满足社会发展需求。众所周知,人脸识别,就是依据个体相貌特点来确定其身份的一种手段,在日常生活与生产活动身份鉴别中,应用比较广泛。作为生物特征的表现,人脸具有显著的稳定性,不易伪造及丢失性,相较之其他人体识别系统如视网膜、指纹、基因及虹膜等,人脸识别技术更加直接与友好,也是未来识别认证身份技术的重要发展趋势。
对于人脸检测技术的研究最早始于人脸识别,在人脸识别系统中,人脸检测技术是非常关键的一种环节。在20世纪60年代,一些学者开始探究人脸检测技术,并对该检测算法做出了一些研究分析。但是由于传统人脸识别系统受人脸图像的约束,因此该技术发展比较慢。直到20世纪90年代,随着电子商务技术的发展应用,传统的人脸识别系统已无法满足社会发展需求。此外,随着高性能计算机技术的发展,这也成为人脸检测的技术保障。在良好发展形势下,研究学者开始重视人脸检测技术,推动该技术发展壮大。
在人脸识别系统中,其主要技术内容覆盖了数学、数字图像处理、心理学、生理学、神经网络、模式识别及计算机视觉等不同领域,应用非常广泛。近些年,计算机图像处理技术快速发展并取得了显著成果,现代化图像采集设备得到普及推广,在开关保险柜、楼宇门禁及开关计算机手机等系统中也开始应用人脸检测识别技术,开锁的唯一“标志”即为人脸。
在安全验证、海关、交通、银行、视频会议及数字娱乐等领域,人脸检测技术应用前景也比较广阔。该身份识别技术适用于认证身份、检索数据库图像、见识公共场合个体、甚至提高人机交互能力等。随着社会经济的快速发展,人口流动量、速度及区域日益提高,在管理与统计流动人口方面人脸检测技术也有非常重要的作用。在许多如保安系统、确认信用卡、过境海关检查及识别罪犯等重要场合,都需要对个体实施无限制,没有伤害而又可靠的人脸检测识别技术,因此快速发展的信息时代,推动了人脸检测技术的快速发展与研究。
在研究人脸检测算法的发展与现状,将该检测技术主流算法划分为三种形式逐一进行分析阐述,具体表现为:以肤色特征为主的人脸检测法、启发式模型的检测法以及统计理论检测法。下面将对以肤色特征为主的人脸检测法做重点介绍。
1 概述人脸检测技术拥有的色彩空间
只有在分析个体肤色特征基础上,选用合理的色彩空间构建规范的个体脸部肤色模型,才能实施以肤色特征为主的人脸检测法,实现预期分割肤色的目标。其中“色彩空间”又可以称之为“色域”(ColorSPace)。根据色彩学相关理论,某种颜色的表达模型不同,可以通過一、二、三或四维空间坐标表示,因此这种根据坐标系统做出界定的色彩范围即为色彩空间。现阶段,RGB、HSV及YCbCr等色彩空间是常用颜色空间形式。
2 预处理人脸图像检测技术
选取好相应的色彩空间后,就要采取相应措施预处理人脸图像。根据相关研究证明,在获得待测个体脸部图像时,其变动性比较强,特别是受外部光照条件作用,不同技术参数、获得设备、地点及时间等因素的变化,都会导致光照强度与色度出现相应变化,也会干扰到图像中个体脸部信息的识别。在日常摄影录像时常会出现饱和度不足或者过大以及偏色等问题,这都是差异光照干扰的实际表现。基于此,为了有效清除不确定因素光照等对图像个体肤色造成的影响,在人脸检测前必须要进行色彩平衡及补偿光照等操作处理。下图为针对图像出现偏色而通过色彩平衡与补偿光照等技术操作处理后的实际效果图:
3 依据人脸特点建立相应的肤色模型
依照人脸特点建立相应的肤色模型就是肤色建模,首先介绍并讨论人脸肤色的主要特征表现:
1)如果光照条件确定时,个体脸部肤色分布类似于高斯分布;
2)在选定的色彩空间中,个体脸部肤色分布范围小而集中;
3)光照一定,个体脸部肤色分布类似于高斯分布。
直方图、简单高斯及混合高斯等模型是目前人脸检测技术研究中,常用肤色模型。其中直方图模型,就是通过直方图肤色统计分布来进行个体脸部特征描述的一种模型。其主要优势在于效果好,特别是通过三维直方图做出的统计;而需要训练很多样本才能建成该模型,样本训练周期长工作量大是其最大的缺点。相比之下,简单与混合高斯模型属于在概率统计基础上建立的肤色模型,其对于能够更加准确的描述肤色分布,针对该肤色模型的个体脸部拥有较高的检测效率。与混合高斯模型相比较,简单高斯模型估测、计算参数更容易,而且建模与检测速度比较快,因而能够较快地确定肤色区域。
3.1 个体脸部肤色分割
基于上文讨论分析的肤色聚类特点与模型,就能够对彩色人脸图像实施肤色分割技术。在肤色模型基础上对个体脸部肤色进行分割,就是根据已经构建的肤色模型二值化处理图像的过程。
其中選择分割阈值是非常关键的,也就是要明确界定肤色与非肤色区域。根据上文提出的肤色模型,一般采用以下算法:选择一个近似肤色的数值作为最有效的分割阈值,将此数值与图像中所有像素点的肤色相似值进行比较,超过该数值的则被划定为皮肤区域并分割为白色;相反低于该数值则被化为非皮肤区域并被分割为黑色。对于如何确定最有效的分割阈值,本文则选用otsu自适应阈值分割计算法,也就是依照图像类似直方图自动选择闭值。试验研究表明,该计算方法效果显著,针对不同图像的不同亮度与色度,分割阈值范围在【0.45,0.55】之间。系统根据肤色模型计算所有输入系统图像的肤色近似度,并构建相应的相似度直方图,再依照自适应闭值分割计算法得出最合理的阈值,再二值化处理图像,并将相应肤色与非肤色区域分别分割为白色与黑色。
3.2 用形态学处理粗检图像
在分割肤色后,必须采取形态学原理处理检测到的粗检区域图像,主要包含计算检测区域的膨胀与腐蚀值,并对相应图像作平滑处理,才能获得更加清晰、干净而且连续的个体脸部肤色区域。
膨胀操作,具体而言就是对二值化图形进行形态学运算,它属于将物体背景边缘化像素集中到物体区域内的运算过程,也是物体图形边缘不断多外延伸的一个过程,其主要用于填补图形中出现的空洞。腐蚀操作则是运用形态学原理对已知图像进行运算,其属于将物体自身边缘图形像素向内消除的过程,也是物体图像边缘向内收缩的一个运算过程,主要用于清理图像中的杂质。在处理图像时要将二者结合应用,其级联方式主要有:1)开运算的先腐蚀后膨胀;2)闭运算的先膨胀后腐蚀。其中前者能够有效清理分散的孤点与图像“毛刺”,后者则是将两个相邻目标区域连接起来。联合应用膨胀与腐蚀,不但能够消除噪音,还能够确保图像信息的完整。因此,在本文选用的肤色检测技术中,膨胀、腐蚀及两者级联而成的开、闭运算操作是非常关键的环节。
3.3 选定候选个体脸部区域
经过肤色分割与形态学处理操作,可以得到原肤色图像的二值化图像,其中白色为肤色区域,这样就能够选定候选个体脸部区域。
4 基于Adaboost算法的人脸检测过程
4.1 放大检测窗口
脸部肤色特点基础上的人脸检测技术与综合检测技术相结合,不但能够有效提高肤色检测技术的准确率,还可以极大地提高Adaboost算法的检测速度与效率。
AdaBoost算法的主要特点是将一种新的图像表示方式:积分图像,引入面部检测,可以用于快速计算面部样本图像的Haar-like样特征值。选择适当的Haar-like特征作为AdaBoost训练过程的输入,AdaBoost算法用于为每轮训练选择最佳弱分类器,这些弱分类器叠加为强分类器。最后,这些强分类器被串联成级联结构的层叠级联分类器用于面部检测。
传统的面部检测机制是使用图像缩放的方法来检测人脸。检测的基本原理是按照一定的比例减小要检测的图像的大小,形成金字塔状结构,称为“图像金字塔”,保持检测窗口的尺寸不变,用该窗口穷举图像金字塔中待检测的子窗口,将要测量的子窗口输入到分类器进行判断,并最终检测出包含脸部的子窗口。其主要特征是图像逐层变窄,检测子窗口的大小保持相同的大小,这些特征也会造成一个缺点,当图像被检测到较大时 ,图像逐层减少转换将需要很多时间,这将大大降低检测速度。
为了提高系统的检测速度,可以使用多尺度的方法来检测人脸。检测的基本原理是按照一定比例放大检测窗口,保持要检测的图像的大小,检测窗口遍历要检测的整个图像,根据检测窗口的位置和大小从图像中提取子图像,然后将捕获的子图像发送到级联分类器进行检测,并输出检测结果。通过将检测窗口的长度和宽度值乘以放大因子来扩大检测窗口,该放大因子比图像的缩小更有效并且具有更高的检测速度。
所选的检测窗口实际上是类似Haar-like的特点。 检测窗口的放大本质上是矩形特征的扩大,对于任何Haar-like的特征,其特征的计算价值是相同的,它也是矩形特征作为弱的选择分类器的优点。检测窗的放大系数不能太大,如果太大可能会导致大量漏检,实验证明放大系数设定为1.2或1.25时更合理,然后漏检较少,检测速度较快。当检测窗口被放大时,弱分类器的阈值,即Haar-like特征的特征值将改变。为了保持不变,Haar-like特征特征值的计算方法需要稍微改变,定义如下:
4.2 区域合并
采用上述方法放大后检测窗口图像,在不同的尺度和邻近位置上会多次检测到相同的脸部,所以最终需要组合检测到的矩形以获得独特的脸部位置和脸部尺度。合并处理是将原始的多个检测框的进行平均,将所有检测到的面部区域的坐标平均值作为最后组合面部区域的坐标位置,并且将所有检测到的脸部区域的平均值作为最后合并获得的脸部面积的尺寸。 合并过程分为两个步骤:
(1)检测到的面部区域以相同的尺度合并
当以相同的比例扫描输入图像时,可以在相同的脸部位置附近检测到脸部数次,这些相同的脸部区域必须被合并。由于相应的窗口大小在相同的比例尺度上相同,所以仅需要合并位置。定义邻域半径R和阈值M。如果某窗口的中心坐标为[x0,y0],半径为R的邻域[x-x02+y-y02≤R2]内人脸窗口中心数为T,当T (2)合并不同尺度条件下检测到的面部区域 把每个尺度上检测到的面部区域的大小和位置恢复到原始比例图像。当两个面部区域的重叠区域大于设定阈值时,两个面部区域被认为是相同的面部,并且将它们的位置和尺寸的平均值作为合并面部区域的位置和大小。当两个面的重叠面小于设定的阈值时,它们被认为代表两个不同的面部区域。 综上所述,检测过程实际上就是发送被检测的子窗口到级联分类器的强分类器层进行检测,当检测结果小于当前层的强分类器阈值时,就认定不是人脸,否则就是。将检测到面部的窗口到下一层强分类器进行检测。级联分类器最初的强分类器比较简单,因此可以排除大部分非人脸的窗口,大大减少了后续处理窗口的数量,提高了检测速度。 参考文献: [1] 郭磊,王秋光.Adaboost人脸检测算法研究及OpenCV实现[J].哈尔滨理工大学学报,2009(5):124-126. [2] 肖南峰.基于RBF神经网络的人脸识别算法[J].重庆理工大学学报,2010(10):56-57. [3] LIENHARTR , MAYDTJ. An Extended Set of Haar like Features for Rapid Object Detection[J].IEIE ICIP 2002, 2002(1): 900-903. [4] 汪洋.基于差空间的双向2DPCA和SVM人脸识别算法[J].计算机科学,2012(10):269-270. [5] 田启川,张重生.刷脸背后[M].北京:清华大学出版社,2017. [6] 郑峰,杨新.基于Adaboost算法的人脸检测[J].计算机仿真,2005(09):39-41. [7] 高旭升,张学智,姬春英.彩色图像中人脸检测的研究[J].自动化技术与应用,2005(10):156-157. [8] 田巍,庄镇泉.基于HSV色彩空间的自适应肤色检测[J].计算机工程与应用,2004(14):87-88. [9] 刘剑.一种基于改进高斯过程隐变量模型的多角度人脸识别算法[J].电子与信息学报,2013(9):2034-2035. [10] 姜文涛.一种基于曲量场空间的人脸识别算法[J].计算机学报,2013(9):1740-1741. 【通联编辑:唐一东】