基于整体特征差异度参数的人脸相似度检测

2018-03-19 16:39史豫坤张大秀
电脑知识与技术 2018年4期
关键词:散度降维特征提取

史豫坤 张大秀

摘要:通过加入差异度参数优化了PAC,IDA,LBP等算法,采用汉明距离选取特征,并对样本进行分析,得出类内矩阵和类间矩阵,利用算法把一个人的两个图像向量的差降维,取二范数来加以区分并计算正确率,然后淘汰正确率低的差距参数,从而得到更高的正确率。主要步骤是:以二进制方式将图片以多阶灰度图表示,然后进行像素点运算,统计有效像素点,运用优化的算法,得出相似指数并分析出判定是否为不同时期同一人。提出的方法对一个人在理想状态下不同时期的两张照片的相似度高达95%以上,即对人脸相似度检测具有显著效果。

关键词:差异度参数;散度;汉明距离;降维;特征提取

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)04-0153-03

1 概述

人脸识别是从二十世纪中后期一直研究讨论的问题,人脸识别的基础是人眼对于人脸储存与识别的生物理论,是基于人的面部特征信息进行身份识别的一种生物识别技术。目前,基础的研究方法都是基于统计学的研究方法,即采集大量的信息,对这些信息进行分类,用某一种类中“共有”的统计特征来判断某一信息是哪一个种类[1]。但判断的标准不同,结果也就不同,比如定义一个特征为红色特征,先观察到一个信息中有红色,但红色只有20%,那么该不该判断它就属于红色种类呢?这时可以采用机器学习的方法,把这个判别特征的差异度量化。通常,定义红色比例大于30%是红色种类,然后与定义红色比例大于40%是红色种类的差异度进行比较舍弃正确率低的差异度。但在识别时,真正把图片向量化,可能每一个维度都有一个差异度,或者采用一些变换会增加计算速度和准确率,那么每次变换时的系数也是一种差异度;故本文设置一个约束条件,只对标准光照情况下(即理想状态下)的人脸进行识别提取计算相似度。即两个向量的差的二范数,首先本文把两个组所有图片打乱进行重组,每组两张照片,记为一个pair(不进行交叉打乱,即原来组还是原来组,只是进行重组成pairs 时,每一个pair中两个照片不一定是一个人的),一个pair中两个图像向量的差就是一个样本,全体样本中一共有两类,一类是“是同一个人”样本,一类是“不是同一个人样本”[2]。

假设人脸在这些低维线性空间的散布矩阵投影具有可分性,所以它可以对图像光照条件引起的灰度变化判断两张不同时期阶段的人脸是否为同一个人[3]。若人脸的特征为D维空间的特征,且本文需要从更高的维度空间(2D)中计算出协方差矩阵,在大量独立样本测试训练数据中,判断是否能得到更高效率的运行结果[4]。

PCA算法可以将图像的随机变量认为是分布规律的,从而得到人脸图像分布的主要成分的方向;LBP算法可以较好的分析图像的纹理特征;低频傅里叶变换可以通过时空域和频率域对图像的信息提取分析;Gabor小波变换可以保持着人脸固有的形态、面部表情以及遮盖物体的某些特性[5]。LDA算法可以大大降低原来图片模式的维数,从而很好的解决了子类内散布矩阵奇异问题[6],子空间算法的产生,对求解矩阵的逆有了新的改进。

2 特征提取

由于只能比较两者是不是一个人,前提为确定的两张图片皆为固定姿态及光线情况下人脸,故不用考虑人脸定位。本文每一个人的的面部图片只有两张,通过一张图片的信息与另一张图片对比判断是否为同一个人。设 是关于特征向量 X(这里 “是同一个”, 为“不是同一个”)的散度定义如下:

P 为 ,的先验概率,即为关于事件 的古典条件概率。由统计学知识得: 1)不同特征相关性越低越好;2)特征选择使散度越来越大。其中散度也可以简单认为与 和 的差距成正比,故定义为:

使得 R 越大的特征 X 越具区分性,对于不同的 X 进行实验(比如灰度分布,人脸轮廓,眼脸比例,特征值特征向量,奇异值,等密度线等等)然后选出最佳的 m 个特征 做参数化处理即作参数 作为衡量对应特征的差距度,即 。

3 算法实现

3.1 整体的低频傅立叶变换

二维离散傅里叶变换(DFT):

其中x,y为M*N像素中(x,y)点的像素值,取低频向量 为维向量,判断一个pair

其中为参数,这里的也可以通过,求得,可以减少参数的维数。

3.2 子空间算法

3.2.1 PCA算法优化

先将本文的样本按之前的分成两类,即“是同一人类”与“不是同一人”类。由于PCA与LDA算法可以把中每一个样本看作是一对图像,故本文將这两个图像向量“相减”,即对应像素的灰度做差,形成一个图像,这时可以区分与的特征不会变化很大。这样中每个样本都只是一个图像(M*N像素)。

PCA算法的具体流程为:

① 假设中有个样本,每个样本为M*N图像,可视为一个M*N维向量。

② 可以计算的均值

与散布矩阵

③ 计算出的特征值与特征向量,将特征向量,按大小顺序排列。当小的特征值对应的“空白区域 ”去掉后,脸将变大,即脸的轮廓更接近边界。只取前m个特征值与对应的特征值向量,则原样本图像在m维空间上的前m个投影坐标表示如下:(i=1,2)。

故PCA可以起到更好的降维效果,此时特征取:,则该样本为类。其中,分子中的是在基下的前m个坐标,分母中的是在基下的前m个坐标。

3.2.2 LDA算法优化

在PCA中可以通过改变基的选取来改变投影方向,不同的投影方向决定不同的特征,由前面散度的定义知,这些特征对于区分样本类别具有强弱之分。那么通过LDA找到最佳区分特征,即最佳投影与最佳散度。

定义:样本类内散布矩阵

样本类间散布矩阵:

其中,为样本,为类均值,为所有样本均值。若样本足够大,使得为非奇异矩阵,则投影矩阵P满足,即

令推倒出特征X,即,为参数。

3.3 局部算法

3.3.1 LBP算法优化

LBP算法是一种局部算法,即它考虑的不再是整个人脸的特征,而是对每一点附近的灰度与自身进行比较。如果把整体特征看做频率变化后的低频段,局部的特征就是高频段。对于区分像素高的pair图效果更好,虽然在原问题中不考虑拍照光线与旋转但在进行敏感度分析中,随着拍照光线与照片角度的加入,会使其他算法效率降低,近而LBP算法的权重增加。由于LBP算法与整体灰度、旋转都无关。

LBP算法步骤如下:

a. 将M×N的图像分为不重叠的C块,每块P个点,在一般操作中,多分为3*3的小块,每一块的中心点为C,其余共有p-1个点。

b. g是除中心外第p个点的灰度,为中心处的灰度定义:

其中,就为LBP变化后的图像,这时每个非中心点的灰点只为0或1。a中可以用圆形区域代替3*3块,可以得到半径为R的圆形域中P个点的LBP变换,即

LBP优化的具体做法为:将上述圆形域进行旋转得到的中心点和灰度的最小值,即为优化后的LBP变换。这时,LBP的旋转就不变了,进行完LBP变换后,再进行PAC或者LDA都简化了,且受光线影响变小了。

3.3.2 Gabor 小波变换

Fourier变换是对图像进行空间点,到频点的整体变换,受拍照光强影响较大,故考虑光强,利用局部受影响较小的Cabor小波变换

其中,为中心频率与方向,这里应选取多个进行变换,,都为参数,当越大时,越可以体现局部性质,即波的高频越突显。

一般取。

设为图像点(x,y)的灰度,则关于的Gabor特征为:,则Gabor与选取小块(局部),不同取值相互独立,即这个特征为一个,不妨,就为一个10的四次方数量级的向量,维度过高便直接计算,且本文假设先忽略光照,故只利用整体算法即可。

4 实验数据分析

4.1 部分数据

本文采用10张明星照片对本文提出的整体特征进行对比检测的400组数据如图1所示:

4.2 实验数据分析

通过分析实验数据表明,在标准位置和标准光照环境下,如果两张照片的相似度指数大于64.54122%,则可认定为这两张照片就是同一人的照片。在理想状态下的实验数据表明,同一个人的不同时期的两张照片,它们的相似度高達98.229834%。不同人的两张照片,其相似度不超过61.63846%。在这10张照片中,利用本文提出的整体特征对比发现,其中T1o的原图与整体特征提取图如图2与T1y的原图与整体特征提取图如图3所示的对比,从图1中可以清楚地看出同一个人不同时期的对比检测相似指数是98.22%。

5 总结

本文主要采用汉明距离选取特征,并对样本进行分析,得出类内矩阵和类间矩阵,利用算法把一个pairs的两个图像向量的差降维,然后取二范数‘0,‘1来加以区分并计算正确率,然后淘汰正确率低的差距参数,从而得到更高的正确率。运用优化过的算法用Java编程进行实践,得出相似指数进行分析判定是否为不同时期同一人。实验表明:该方法可以准确地判定在理想状态下同一个人不同时期的相似度,但是对于其他光照面部不清晰的图片的判断不是很准确,所以该方法还要继续研究完善。

参考文献:

[1] 陈奇毅. 浅析人脸识别技术的现状和发展趋势[J]. 通讯世界,2015(13).

[2] 汪亚菲,张迎献.试析人脸识别技术的方法与应用[J]. 电脑编程技巧与维护,2014(15)

[3] 刘笃晋,孙淑霞,李思明.人脸识别中光照处理方法的分析[J]. 计算机系统应用,2011(1).

[4] 黄敏.常见人脸识别技术及其设备应用[J]. 电子世界,2014(12).

[5] 方程.人脸识别技术研究[J].信息技术与信息化,2014(11).

[6] 刘小军,王东峰,张丽飞. 一种基于奇异值分解和隐马尔可夫模型的人脸识别方法[J].计算机学报,2003(13).

猜你喜欢
散度降维特征提取
混动成为降维打击的实力 东风风神皓极
带势加权散度形式的Grushin型退化椭圆算子的Dirichlet特征值的上下界
降维打击
具有部分BMO系数的非散度型抛物方程的Lorentz估计
基于Daubechies(dbN)的飞行器音频特征提取
H型群上一类散度形算子的特征值估计
Bagging RCSP脑电特征提取算法
Hörmander 向量场上散度型抛物方程弱解的Orlicz估计
基于MED和循环域解调的多故障特征提取
抛物化Navier-Stokes方程的降维仿真模型