一种基于Grassmann流形的图像集分类算法研究

2015-08-02 03:58黄淼张国平

微型电脑应用 2015年1期

黄淼，张国平

黄淼，张国平

当前基于多模型的图像集分类方法通过对每个图像集进行单次聚类来提取局部模型，与其他图像集进行匹配时使用固定的聚类。然而，如果环境条件不佳，则可能导致两个最近邻聚类表示同一对象的不同特征。针对这一问题，首先，根据重建误差，在Grassmann流形上定义两个子空间间的Frobenius范数距离。然后，通过稀疏表示从画廊图像集中提取局部线性子空间。对每个局部线性子空间，通过联合稀疏表示，利用探测图像集的样本来自适应构建相应的最近邻子空间。基于Honda、ETH-80和Cambridge-Gesture数据集的实验结果表明，与基于仿射包的图像集距离（AHISD）、稀疏近似最近邻点（SANP）和流形判别分析（MDA）等其他算法相比，算法的性能更优。

图像集分类；聚类；Grassmann流形；稀疏表示；最近邻子空间

0 引言

目前流行的图像分类方法[1]大多是从局部特征中提取信息的。它们通常是采用聚类或者编码的方式先得到码本，例如k均值聚类、稀疏编码等；然后，采用基于最近邻指派或者稀疏编码的方式对每一个局部特征进行编码；最后，采用各种训练分类器（如SVM，Adaboost等）进行最终的图像类别预测。

图像分类方法总体来说可以分为两类：参数方法和非参数方法。前一种方法基于参数分布[2,3]。对参数分布，参数估计值间的相似性可用于衡量两个集合间的距离。然而，如果同一对象的训练和测试数据集的统计相关性较弱，则参数估计值可能不够相似。非参数方法[4,5]可生成多个局部线性模型，通过聚类来提升识别精度。文献[4]通过局部线性嵌入和K均值聚类来提取多个代表性样本。文献[5]使用最大线性补丁方法来提取局部线性模型。对于具有m个和n个局部模型的两个集合，它们局部模型间的最小距离决定了集合与集合间的距离，通过m×n次局部模型比较即可获得该距离。然而非参数方法的缺点在于，每个集合单独聚类一次，导致每个集合在分类时使用固定的聚类。因为，环境条件（比如光照和姿态变化）不够理想可能会导致两个最近邻聚类表示同一对象的不同特征，所以，这些聚类可能不是最优判别聚类。

假设每个聚类可用于表示对象的某一具体物理属性。例如，假设我们有同一名人员的两个脸部图像集合，且这两个集合可表示不同的状态。第一个集合中的聚类表示不同姿态，而第二个集合中的聚类表示不同的光照（此时的光照与上一集合的光照不同）。这两个聚类集合描述了不同的状态变化，因此，在基于聚类匹配来匹配两个图像集时，可能出现非正面脸部（比如旋转或倾斜）与正面脸部进行比较的情况。

针对这一问题，本文首先使用稀疏近似来从首个集合中提取局部线性子空间。然后，每个局部线性子空间表示为Grassmann流形[6]上的一个参考点。对每个参考点，我们利用第2个集合中的一组点来近似其在流形上的最近邻点。我们不是搜索所有点，而是利用联合稀疏近似来解决搜索问题。我们证明，通过使联合稀疏表示误差最小，我们可以逼近与Grassmann流形上的参考点距离最近的点。利用第2个集合中的最近邻点与第1个集合中的相应参考点间的平均距离

Research on Image Set Classification Algorithm Based on Grassmann Manifolds

Huang Miao, Zhang Guoping
(School of Software, Pingdingshan University, Pingdingshan 467002, China)

Existing multi-model approaches for image set classification extract local models by clustering each image set individually only once, with fixed clusters used for matching with other image sets. However, this may result in the two closest clusters to represent different characteristics of an object, due to different undesirable environmental conditions. In response to this problem, this paper first defines a Frobenius norm distance between subspaces over Grassmann manifolds based on reconstruction error. It then extracts local linear subspaces from a gallery image set via sparse representation. For each local linear subspace, the paper adaptively constructs the corresponding closest subspace from the samples of a probe image set by joint sparse representation. Experiments on Honda, ETH-80 and Cambridge-Gesture datasets show that the proposed method consistently outperforms several other recent techniques, such as Affine Hull based Image Set Distance (AHISD), Sparse Approximated Nearest Points (SANP) and Manifold Discriminant Analysis (MDA).

Image Set Classification; Clusters; Grassmann Manifolds; Sparse Representation; Closest Subspace

TP393

1007-757X(2015)01-0008-06

国家自然科学基金（NU1204611）

黄淼（1982-），女，汉族，河南社旗人，平顶山学院，软件学院，讲师，硕士，研究方向：图形图像处理，平顶山，467002

张国平（1980-），男，汉族，江西南昌人，平顶山学院，软件学院，讲师，硕士，研究方向：软件工程，嵌入式技术，平顶山，467002