曹 伟,殷守林
(1.郑州工业应用技术学院图书馆,郑州451150;2.哈尔滨工业大学电子与信息工程学院,哈尔滨150001)
生物识别技术是一种利用人类的物理或行为特征来验证个人身份的技术。近10年来,人脸识别成为一种常见的生物特征识别方法技术。这不是一个简单的任务,通常被认为这是一个数据分析问题。任何人脸识别系统的第一个预处理步骤都是从原始图像中提取相关的面部特征。为了提取这些特征,近年来发展了许多技术[1-3]。其中,小波变换[4-5]是一种非常强大和实用的人脸识别技术。该变换的目的是提取出光照条件不佳或被遮挡的鲁棒人脸特征。为此,小波变换将人脸图像分解为子图像,根据子图像的方向和频率进行局部定位。
主成分分析(PCA)[6-7]是一种传统的基于L2范式的降维方法。最近,李勇等[8]提出了一种基于L1范式的新算法PCA-L1,该算法对噪声和异常值具有更强的鲁棒性。然而,PCA-L1范数需要大量的时间来计算投影基。为了解决这一局限性,本文提出了一种称为WTPCA-L1的新技术,它利用Daubechies变换的三层小波分解和PCA-L1进行特征提取。
近10年来,离散小波变换(DWT)[9-11]已成为图像处理领域的一种实用处理方法。小波变换的主要目的是将图像分解成子带。这些不同的子图像主要用于图像压缩和特征提取。然而,图像LL1是原始图像的较粗近似值。在这项工作中,使用Db2将人脸图像转换成三层小波。图1很好地说明了分解层次。
图1 三级小波分解
更进一步的不是使用原始图像。只利用LL3波段,使用PCA-L1范数算法生成主成分。对于分类步骤,采用欧几里德距离的最近邻算法。图2示出了所提出方法的示意图。
图2 提出方法的流程图
本文提出并讨论了基于ORL[12]和GTFD[13]人脸数据库的WTPCA-L1方法的识别性能和鲁棒性。
ORL数据库包含40个个体,如图3所示,每个个体由10个固定大小的不同面部图像表示。
图3 ORL数据库样本
然而,这些面部图像是在不同的时间拍摄的,改变了光照条件和面部表情。此数据库中的所有图像都被重新调整为56×46和量化灰度。然后,我们为每个个体随机选择5幅面部图像进行训练,并利用其他图像进行测试。
GTFD包含50个个体,如图4所示。对于每个个体,由15张面部图像表示。这些面部图像的大小、面部表情、照明和旋转在图像的平面上和垂直于图像的平面上变化。
图4 GTFD数据样本
所有人脸图像的大小调整为50×50,并量化为256灰度。我们为每个人随机选择10张面部图像进行训练,并利用其他图像进行测试。
为了评估提出的方法,进行10次迭代实验,并取识别率、标准差(STD)和执行时间的平均值。
表1显示了L2-PCA、PCA-L1和WTPCA-L1三种方法的最佳平均识别率和标准差以及平均时间。从这些结果可以看出,该方法使PCA-L1的执行时间最小化,并且对两个数据库都有较好的识别率。ORL数据库和GTFD的识别率分别为96.7%和85%。为了检验WTPCA-L1方法的鲁棒性,在两个数据库的图像中加入了两种噪声,即高斯噪声和椒盐噪声。
表1 最佳平均识别率(RR)和相应的标准差(STD),以及算法的运行时间(以秒为单位)
图5显示了来自ORL数据库的一些有噪声和无噪声的样本。在这个例子中,我们用两种噪声破坏了原始图像。图5的第2行描述了一个椒盐噪声样本,而第3行显示的是高斯噪声图像。为此 ,引入 的噪 声 密度 随值 10-4,5.10-4,10-3,5.10-3,10-2,5.10-2和 10-1而 变 化 。最后将我们的方法与其他方法的平均执行次数进行了比较。
图5 ORL噪声图像的样本
第一行表示来自ORL数据库的一些未损坏的图像。
第二行是带有盐和胡椒噪声的相同图像。
第三行是带有高斯噪声样本的图像。
此外,高斯噪声和椒盐噪声对所提出的ORL数据库WTPCA-L1方法识别率的影响分别如图6和图7所示。结果表明,两种噪声的识别率都随着密度的增加而降低。此外,从图8和图9中,我们可以看到附加噪声对应用于GTFD图像数据库的WTPCA-L1算法的识别率的影响。从这些结果可以看出,随着噪声密度的增加,L2-PCA和PCA-L1的识别率都在下降。然而,所提出的WTPCA-L1方法的识别率仍然是最高的,这表明了所提出方法的有效性。
图6 椒盐噪声对ORL数据中WTPCA-L1、PCA和PCA-L1方法识别率的影响
图7 高斯噪声对ORL数据中WTPCA-L1、PCA和PCA-L1方法识别率的影响
图8 椒盐噪声对GTFD数据库中WTPCA-L1、PCA和PCA-L1方法识别率的影响
图9 高斯噪声对GTFD数据库中WTPCA-L1、PCA和PCA-L1方法识别率的影响
本文提出了一种新的鲁棒人脸识别方法WTPCA-L1。采用三级小波作为预处理步骤,使PCAL1提取过程的计算时间最小化。在GTFD和ORL人脸数据库上的实验结果表明,与经典PCA和PCA-L1相比,本文提出的WTPCA-L1具有更强的抗噪声能力,并且具有较高的识别率。