周洪毅
摘要:传统的基于LDA的字符识别需要将图像向量化,这会造成协方差矩阵维数过大和奇异问题,而基于2D-LDA的识别算法能够克服上述传统算法的缺陷。首先介绍了2D-LDA算法的原理;然后,在车牌字符数据集上测试了算法的识别率;最后,与多层感知机神经网络做了对比,表明2D-LDA算法有较高的识别率。
关键词:字符识别;2D-PCA;2D-LDA;多层感知机神经网络
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2016)06-0000-00
Abstract: The traditional character recognition based on LDA requires the image vectorization processing, which will bring about a too large covariance matrix dimension and singular problems, but 2D-LDA based recognition algorithm can overcome the shortcomings of the traditional algorithm described above. First, this paper introduced the principle of 2D-LDA algorithm. Then it tested the recognition rate of the algorithm on the license plate character data set. At last, it gave a comparation between 2D-LDA algorithm and MLP neural networks. The comparation indicates 2D-LDA algorithm has a higher recognition rate.
Key words: character recognition; 2D-PCA; 2D-LDA; MLP neural networks
字符识别是计算机视觉中一个重要课题,有着广泛的应用前景。近年来,如何提取有鉴别性的特征以及如何对它进行降维,成为研究的热点。其中,主成分分析(Principal Component Analysis, PCA)和线性鉴别分析(Linear Discriminant Analysis, LDA)是两种最常用的线性降维方法。
PCA的意义是在重构样本数据时使其平方误差最小,也即PCA利用一组为数不多的特征去尽可能精确地表示模式样本。PCA计算向量样本的总体协方差矩阵,其最大的d个特征值对应的特征向量作为鉴别矢量集,然后样本在鉴别矢量集上投影,得到的d个系数就是抽取出的特征。LDA的基本思想是选择使得Fisher准则函数达到极值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散度[1-2]。由于LDA在降维过程中也考虑到了类别信息,所以在人脸识别的应用中识别率高于PCA[7],所以采用LDA的方法对车牌字符进行降维。另外,经典的PCA和LDA要求样本数据是一维的,但是一维方法在处理图像识别时存在固有弊病。比如,将字符图像向量化后维数常常高达上万维,这会造成计算负荷过大和矩阵奇异问题[3]。为解决这一问题,研究者提出了直接基于2D图像矩阵而无须矢量化的2D-PCA[4-5]和2D-LDA[6-9]法,有效降低了运算量和矩阵奇异问题。综上所述,采用2D-LDA算法。
1 2D-LDA算法
经典的数据降维方法主要有主成分分析(PCA)和线性鉴别分析(LDA)两类。PCA的目的是最大化所有类别样本之间总体分散程度,可以看作是一种无监督的学习方法。而LDA的主要思想是最大化类间分散程度,并且同时使类内散布最小。因此,LDA是一种监督学习算法。2D-LDA是一种直接基于二维图像矩阵的方法,分别计算二维图像投影的类内和类间散度矩阵,在一定最优化准则下确定最优的投影坐标系。2D-LDA方法运算量小,有效利用了图像的空间结构信息。
令训练图像为 ,图像数据共有K个类别,类别标号为C1,C2,…,CK,分别包含Ni个样本,因此共有 个训练数据。将二维图像Xj投影到一个一维列向量上得到投影后列向量yj:
4 结语
本文介绍了2D-LDA的算法,以及与传统LDA相比的优势。从理论上说明了2D-LDA可以有效避免矩阵奇异问题。最后,将2D-LDA应用于车牌字符识别中,给出了使用K最近邻分类器情况下的分类识别率,并与开源项目EasyPR中的识别方法对比,前者有着更高的识别率。
参考文献
[1]张生亮,杨静宇.2DPCA及2DLDA相关研究综述[J].世界科技研究与发展,2008,30(3):286-289.
[2]程正东,章毓晋,樊祥.基于图像抽样重组的2维线性鉴别分析[J].中国图象图形学报,2010,15(2):261-265.
[3]温福喜,刘宏伟.基于2D-PCA和2D-LDA的人脸识别方法[J].计算机应用研究,2007,24(8):201-203.
[4]王友钊,潘芬兰,黄静.基于2D-PCA的两级LDA人脸识别方法[J].计算机工程,2014(9):243-247.
[5]Li M, Yuan B. 2D-LDA: A statistical linear discriminant analysis for image matrix[J]. Pattern Recognition Letters,2005,26(5):527-532.
[6]Yang J, Zhang D, Yong X, et al. Two-dimensional discriminant transform for face recognition[J]. Pattern Recognition,2005,38(7):1125-1129.
[7]覃磊,李德华,周康.基于分块2DPCA与2DLDA的单训练样本人脸识别[J].微电子学与计算机,2015(11):105-110.
[8]李球球,杨恢先,奉俊鹏 等.2DPCA+2DLDA和改进的LPP相结合的人脸识别算法[J].计算机工程与应用,2015(21):199-204.