阿布都热衣木·热西丁
(和田师专 新疆和田 848000)
基于Gabor小波的维吾尔文笔迹的特征提取方法研究
阿布都热衣木·热西丁
(和田师专 新疆和田 848000)
本文提出使用Gabor小滤提取维吾尔文笔迹的纹理特征方法。首先,通过预处理形成维吾尔文纹理图像。按照维吾尔文笔迹的特点,对 Gabor滤波器进行改进。然后用一组Gabor滤波,过滤后获得图像的高维特征向量。最后,最邻近分类器(NN)分类器对不同17名人的维吾尔文笔迹样本进行分类实验,并获得79.8%的鉴别率。
笔迹鉴别;维吾尔文笔迹;Gabor小波NN
长期以来,手写体笔迹的识别是模式识别领域中的一个非常活跃的研究课题。[1]作为一种身份鉴别的手段,它有许多优点。手写笔迹容易获取,而且不同的人具有不同的笔迹。笔迹是书写者的影子,书写习惯的多样性决定了一个人的笔迹是独一无二的。另外,由于笔迹的本质是自我的再现,因此各类模仿、伪装的最终结果都是徒劳的。因此,按照每个人的手写体所包含的纹理特性,经过一系列相关处理,便可以识别一份手写体是否为某人所写,这正是本文所要研究的。
笔迹鉴别是根据人的手写笔迹判断书写人身份的一门科学与技术。[2]鉴别方法按照样本的输入方法分为两大类:在线(on-line)和离线(off-line)笔迹鉴别。[2][3][4]前者用连在计算机的转换设备,书写的运动过程转换成信号序列,然后把这些信息传送到计算机。而后者往往把书写样本扫描成二维图像后输入计算机再处理。
近几年来,在笔迹鉴别领域已出现一些新方法。Said等[3][4]把笔迹鉴别工作对待为纹理分析问题并使用多通道Gabor滤波器和灰度共生矩阵(Grey-scale co-occurrence matrix,GSCM)技术。Leedham等在文献[5]表示容易被提取的一组11个特征用于文挡中的手写数字的识别与验证。其他研究人员(Arora等,[6]Zuo等[7])对笔迹鉴别采用多种特征综合的方法。Z. yu He等[8]提出基于小波的GGD方法来代替传统的二维Gabor滤波器。Najoua和Gazzahl[9]对文本依存的阿拉伯文的笔迹鉴别提出全局特征特征和机构特征相结合的一种新方案。这些研究者都认为笔迹是跟包含一些特殊纹理的图像一样。关于笔迹鉴别的这些文献主要为基于拉丁文的、基于中文的,[7][8]甚至基于阿拉伯文的。但是,对维吾尔文笔迹鉴别[10][11]有关的只有两个文献,其中文献[10]研究预处理和用滤波Gabor特征提取。文献[11]也就是我们以前的研究表明 Gabor滤波和遗传算法(Genetic algorithm,GA)用于特征提取的初步研究结果,而且它的鉴别率需要提高。结合维吾尔文笔迹的特点,实现现有的算法或开发新的、有效的算法和方法具有很大的研究空间。
本文用Gabor小波来提取维吾尔文笔迹图像的特征,并用最邻近分类器对纹理进行分类的方法。首先,通过预处理,获得维吾尔文纹理图像。然后训练的样本从纹理图像中随即选定,于是使用Gabor小波变换,提取特征。最终选用欧氏距离的最邻近分类器来分组基于这些特征的试验图像。
输入到计算机的图像包含大小不同的维吾尔文字符、文本行之间的空间甚至噪声。因此,特征提取之前,原始图像首先要被处理。通常,预处理的步骤如下:第一,消除笔迹图像中的噪声;第二,定位文本行和用投影方法分割每一个单词;第三,每个字符的大小进行归一化;最后、文本的倾斜矫正并生成纹理图像。对文本独立的特征提取方法,我们设计能产生纹理图像的预处理方法。由于有些论文讨论预处理,[12][3]而且在本论文中预处理不是我们的重点问题,因此在这里不能详细地说明我们的预处理方法。预处理的一个例子如图1所示。
图1 预处理用例之一
许多纹理分析技术应用于特征提取比如,如基于行的频谱分辨法(Line-based spectrum resolution,LBSR),通道分解法(Multi channel decomposition,MCD),多通道Gabor小波,[2][5]灰度共生矩阵法,PS法[4]等。其中多通道Gabor小波被普遍使用与纹理分析,并且成功地应用在图像处理的宽广的范围。[13]
3.1 Gabor小波。在文献[1 3]、[13]中表达的二维Gabor滤波器数学公式为:
其中,f为中心频率,θ为方向参数,he(x,y)和 ho(x,y)分别表示偶、奇对成的Gabor滤波器。该二维Gabor滤波器的频率形式为:
其中He(u,v)和Ho(u,v) 偶、奇对成的Gabor滤波器,为虚单位,且H1(u,v) 及 H2(u,v)为:
其中f,及σ分别表示Gabor滤波器的中心频率、方向参数及空间常数。对给定的一个输入图像,Ho和He用不同的f,及σ值,提供并组合输入图像的不同通道的输出。
纹理特征提取要求中心频率和方向参数。文献[14]指出,尺寸为N×N(N是2的正数次幂)的图像的中心频率为≤N/4。因此对于维文笔迹图像N分别选取为64,因此、中心频率f选为2、4、8及16周/度。每一个中心频率f,方向参数θ选为0°、30°、60°、90°、120°及150°的滤波被完成,这样可以输出24个输出图像(每一种频率的为6个)。这些输出图像的均值和标准方差被选为纹理特征。这样,从给定的图像中提取48个特征。它们形成48维的特征向量。
3.2 欧氏距离。特征提取以后,笔迹鉴别的问题就是一个典型的模式匹配和识别问题。而这些问题往往通过选用适当的分类器来解决。分类器一般有其分类标准。
从相关文献中了找了10个与距离相关的分类标准,目的是通过实验从中找出适合于维文的分类器。这10个分类标准依次为欧氏距离、加权欧氏距离、普通距离、相似度、特征距离、向量间距离、Canberra距离、混合马氏距离、Jacquard系数、Dice系数。[15]而本文所使用的欧氏距离是与距离相关的分类标准常用的一种,其数学表达式分别如式(5)所示:
式子(5)中,ui和vi分别为特征向量,i=1,2,…n。
3.3 最邻近分类器。最近邻分类器(Nearst Neighbour Classifier,NN)是通过决策规则来进行笔迹的分类。对于最近邻决策规则,假设有c个类别ω1,ω2,…,ωc 的模式识别问题,每类又表明类别的样本有Ni个,i=1,2,…,c,可以规定类的判别函数为:
其中xik的角标 i 表示ωi类,k表示ωi类Ni个样本中的第k个。按照上式决策规则可写为,若[16]:
最近邻决规则一般解释是相当简单的,就是说对未知样本 x,我们只要比较x与个已知样本之间的欧式距离,并可以决策它最近的样本同类。
最近邻分类器本文由Matlab编程实现,在具体应用中图像的平均值和方差两组特征值变化幅度不一致,不同通道方差变化比平均值变化较大,因此在分类时对平均值放大近十倍。
考虑年龄、性别、文化程度等因素,选择17名维吾尔族参与者,并要求每一个参与者用自己的自然书法抄写两份某一文本。这手写的文档用HP扫描仪以300dpi分辨率输入计算机。后对这些文档进行预处理。每一位书写者的一个样本用于训练,另一个用于测试。
在我们的实验中,所有的手写笔迹扫描输入到计算机。选择每一个笔迹图像的尺寸为256×256像素。为了制作属于同一类的小图像,每一个256×256的图像被划分为不超过64×64的子图像,这样每个图像形成16个子图像(如图1[b])。来自第一个样本的 12个子图像用于训练数据,第二个样本的8个子图像用于测试数据。
从文本中提取的48个特征用NN分类器,在Gabor滤波提取的特征实验中获得79.8%的鉴别率。
本文讨论基于维吾尔文的离线、文本独立的笔迹鉴别。使用Gabor小波方法提取48个特征,用NN分类器完成分类实验。实验表明Gabor小波的特征提取及选择方法比已用其它特征选择方法获得更高的识别率。
让实验结果有更强的说服力,我们将尝试使用其它特征提取及选择方法。我们将计划使用其它新的、更有效的分类器比如贝叶斯分类器(Bayesian classifier),线性判别分类器(Linear discriminate classifier,LDC),支持向量机(Support vector machine,SVM)分类器,加权欧氏距离分类器(Weightd euclidean distance,WED)等。除此之外还要增多实验中的样本数。
[1]刘成林,戴汝为,刘迎建.简化的Wigner分布及其在笔迹鉴别中的应用[J].计算机学报,1997(11),P1018-1023.
[2]R. Plamondon,G. Lorette,“Automatic signature verification and writer identification-the state of the art”. Pattern Recognition,vol. 22,1989,P107-131.
[3]H.E.S. Said,T.N. Tan,and K.D. Baker,“Personal identification based on handwriting”. Pattern Recognition,vol 33,No. 1,2000,P149-160.
[4]A.AL-Dmour,R. A. Zitar,“Arabic writer identification based on hybrid spectral-statistical measures”. Journal of Experimental & Theoretical Artificial Intelligence,vol. 19, No. 4,2007,P307-332.
[5]G. Leedham and S. Chachra, “Writer identification using innovative binarised features of handwritten numerals”,In Proc. of 7th Int. Conf. on Document Analysis and Recognition,2003,P413-417.
[6]H. Arora,S. Cha,S. Lee,S. N. Srihari,“Individuality of handwriting”,J. Forensic. Sci.47,2002,P1-17.
[7]L. Zuo,T. N. Tan,Y. Wang,“Personal identification based on PCA”. In Proceeding of International Conference on Image and Graphics,2002 .
[8]Z. Y. He,B. Fang,J. W. Du,Y. Y. Tang and X. You,“A novel method for Off-line handwriting-based writer identification”. In Proc. of 8th Int. Con. on Document Analysis and Recognition,2005.
[9]E.B.A. Najoua and S. Gazzahl,“Neural networks and support vector machines for writer identification using Arabic scripts”,presented at International Conference on Machine Intelligence,2005.
[10]李媛,卡米力·毛依丁.维吾尔笔迹鉴别研究[J].计算机科学与发展,2008(5).
[11]K. Ubul,A. Hamdulla,A. Aysa,A. Raxidin,and R. Mahmut,“Research on Uyghur off-line handwriting-based writer identification”,In proc. of 9th Int. conf. of signal processing(ICSP2008),2008,P1656-1659.
[12]G.S. Peake,T.N. Tan,“Script and language identification from document images”,In Proc. of British Machine Vision Conference,Vol. 2,1997,P169-184.
[13]A.K. Jain and F. Farrokhnia,“Unsupervised texture segmentation using Gabor filters”,Pattern Recognition,vol. 3,1992,P607-610.
[14]T.N. Tan,“Texture feature extraction via visual cortical channel modeling”,Proc. of the 11th Int. Conf. on Pattern Recognition,vol. 3,1992,P607-610.
[15]苗晓峰. 基于纹理的文本依存的离线笔迹鉴别[D]. 河北工业大学,2006.
[16]Cover T. M.,Hart P. E. Nearest neighbour pattern classification. IEEE Trans. Information Theory,1967,P21-27.
This paper proposes a method for texture feature extraction by Gabor wavelet filters for Uyghur handwriting image. The texture image is firstly formed by pre-processing steps. Gabor filter improved according to the characteristics of Uyghur hand writing. Then higher dimensional feature vectors are constructed from the filtered texture images. Finally, experiments were performed using NN classifier to Uyghur handwriting samples from 17 different people and promising results of 79.8% correct identification rate were achieved.
writer identification; Uyghur handwriting; Gabor wavelet; NN
阿布都热依木·热西丁(1975-),男,维吾尔族,硕士,和田师专计算机专业讲师,研究方向:软件工程。
2010-08-16