徐广飞
摘 要:近年来,稀疏表示分类(SRC)方法在图像识别中受到越来越多的关注。SRC方法将测试样本分在最小重构误差所对应的类别中,这种决策方法对SRC的稀疏原理不是最优的。为了从稀疏编码系数中得到鉴别性更强的信息,本文提出一种新的决策规则——“系数和”规则。在Yale数据库和MNIST数据库上的实验结果表明本文提出的方法要优于原始SRC方法。
关键词:稀疏表示分类;图像识别;系数和规则;MNIST数据库
1 引言
图像识别是计算机视觉和模式识别领域内广泛研究的分类问题之一,最近稀疏表示分类[1](SRC)方法在人脸识别中得到应用并取得很好的识别效果。SRC利用了人脸图像的线性子空间结构并将人脸识别问题看做是一个稀疏表示问题。具体来说,给定一个测试样本,SRC首先得到该样本在所有训练样本构成的字典上的稀疏系数,然后利用稀疏系数和每类训练样本重构样本,最后将该测试样本分在最小重构误差对应的类别中。随后又有很多改进的SRC方法来提高其性能,并被应用到其它机器学习问题中。
2 稀疏表示分类算法
SRC算法的流程如下:
⑴输入:由C类训练样本组成的矩阵A=[A1,A2,…,Ac]∈Rm×n,测试样本y∈Rm;
⑵将y和A的列向量单位化;
⑶求解:
(或者求解 );
⑷计算残差 ;
⑸输出:测试样本的类别
3 系数和规则
在文献[2]中,提出通过稀疏系数可以反映数据间的相似性。因此我们提出使用系数和(sum of coefficient,SoC)进行决策:
4 实验验证及分析
本节中,我们通过实验来验证“系数和”(SoC)规则的性能,对比方法为原始SRC算法。使用的图像库为Yale人脸库和MNIST数据库。在对图像进行分类前,我们使用PCA对样本进行降维。SRC通过求解(2)式得到稀疏系数,然后进行分类,误差容忍度ε设为0.005。
4.1 Yale人脸库
Yale数据库由15个人,每人11张图像组成,分辨率为121×160,灰度级为256。实验中我们随机选择每个人的4幅图像组成训练样本,其余为测试样本。随机选择3次,取3次的正确识别率均值。不同特征维数下的识别率如表1所示。
4.2 MNIST手写体数据库
MNIST手写数字库中共有60,000个训练样本和10,000个测试样本,包含0-9这10个数字的不同手写体图像,图像大小为28 28。实验中我们选择每类的25幅图像作为训练样本,另外25幅图像为测试样本。不同特征维数下的识别率如表2所示。从表中数据可以看出使用SoC后算法的性能提高了1%-2%,这表明基于系数的决策可以更好地利用稀疏性。
4.3 实验结果及讨论
⑴在Yale人脸库和MNIST手写体数据库上我们提出的系数和决策规则的性能均优于原始算法的性能,这说明基于系数的决策规则对稀疏表示分类是较优的。
⑵实验结果也表明两个最大的系数和的比例要比两个最小的重构误差的比例要大,这解释了SoC识别率高的原因,因此SoC更具有鉴别性。
5 总结及展望
受稀疏系数可以反映样本间相似性的启发,本文中我们提出一种新的决策规则—“系数和”规则,它更具有鉴别性并能充分利用稀疏性来进行分类。在Yale人脸库和MNIST手写体数据库上的实验证明了“系数和”规则的有效性。
[参考文献]
[1]Wright J.et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence(ISSN: 0162-8828),2009,31(2):210-227.
[2]Elhamifar E.,Vidal R..Sparse subspace clustering[C]// Computer Vision and Pattern Recognition,2009.CVPR 2009.IEEE Conference on.IEEE,2009:2790-2797.