肖春景 ,乔永卫 ,贺怀清 ,c
(中国民航大学 a.计算机科学与技术学院;b.工程技术训练中心;c.天津市智能信号与图像处理重点实验室,天津 300300)
由于手写体签名在信用卡身份检查、支票签名及机场登机身份验证等安全检查方面的应用,使手写体签名自动识别已成为模式识别重要的研究领域。离线手写体签名识别已丢失书写过程的动态信息,仅依靠签名图像的静态信息,可用信息较少,识别难度较大。
目前的离线签名识别有结构和统计两种方法。结构方法中利用空间分布特征、笔段特征、轮廓检测等方法提取字形结构[1-2],对结构特征较敏感,区分相似字的能力较强,但是结构特征难以抽取,不稳定;以自组织映射方法、神经网络、概率密度函数、支撑向量机等为主的统计方法[3-7],按一定的距离度量匹配准则,采用多维特征值累加的办法,把局部噪声和微小畸变淹没在最后的累加和里,具有良好的鲁棒性、较好的抗干扰抗噪声的能力,但是可以用来区分“敏感部位”的差异也随之消失。特征提取是这些方法中非常重要且必须的步骤,并且特征提取结果将影响分类器的设计和性能以及最后的识别结果。基于统计的特征提取方法主要有灰度值、梯度、方向分布和灰度密度等方法,基于结构的方法主要有签名图像宽高比、签名点面积和图像总面积比、连通域和网格个数等;基于伪动态特征的方法主要有笔锋特征、签名骨架方向的灰度特征、灰度面积等。这些特征提取方法基本都是基于复杂预处理和分割后二值图像,并且提取过程不可逆。但是复杂数据预处理、较大计算量、复杂的过程、连笔现象导致的复杂分割都使特征提取变得非常困难。这些将直接影响识别系统的效率和结果。
为了解决复杂预处理、签名分割和不可逆的特征提取等问题,本文提出了一种基于小波包的特征提取方法。首先,数据预处理过程只对签名图像进行了大小归一化而没有其他操作;其次,利用小波包对整个签名进行分解并表示成二维空间上点的集合并利用这些点来进行手写体签名识别。其数据预处理简单,不需要分割并且特征提取是完全可逆的,具有较好的抗噪性、鲁棒性和适应性。
很多特征提取方法都是基于复杂数据预处理和图像分割。数据预处理技术主要包括过滤、去噪、旋转、变换、标准化、平滑、二值化等,这些导致计算量非常大或在书写过程中要增加限制条件,并且因为连笔现象的存在使得图像分割变得异常困难,这些都影响着算法的应用和识别效率。本文方法的数据预处理简单,仅包含大小归一化,没有去噪、变换、旋转和其他过程,这将保持原始签名图像的特征,增加其鲁棒性和抗噪性,并且其特征提取是全局信息提取,不需复杂分割。因此,它可应用到含噪脱机手写体签名识别。本文共40类签名,每类15个真签名和10个伪签名,每个签名被归一化为32×64大小。图1和图2列举了40类签名的实例。
图1和图2表明真实签名和刻意模仿的伪签名之间的差别非常小。这就要求识别系统的特征提取方法能够提取它们之间的微小差别,以保证识别效果。
Coiffman等人提出的小波包理论将频带进行了多层次的划分,对小波变换没有细分的高频部分进一步分解(如图3所示),并能根据特征向量的特征自适应地选择频带,克服了正交小波变换的不足,是一种更为精细的分析方法,现已被广泛应用到了数字信号处理领域。
小波包分解算法为
从式(1)和图3可以看出,在每一层被分解对象都被分解成4个子序列。第1个子序列是低频部分描述被分解对象的主要特征,其他3个子序列是高频部分描述被分解对象的细节部分。一个n×2n的高维信号经过log2n层小波包分解可以表示成二维空间序列的形式。也即是高维空间的对象能够表示成低维空间的形式,这起到了降维的作用。因此,可以把Rn空间转换成多个二维空间的连接,也即是 Rn=R2◦R2◦…◦R2,这里R◦Q=({x,y)x∈R,y∈Q}。也就是说,2n 维空间上的点可分解成n个二维点。
小波包重构公式为
式(2)表明利用此公式重构4个子序列部分可以得到上一层的父节点,基于此方法经过n层重构可以得到最原始的信号。
签名图像可看成是高维空间的信号,经过若干层的小波包分解后可被表示成二维空间的点,这些点即为签名图像的特征值。因此经过n=log2m层小波包分解,m×2m大小的签名图像可以表示成m×m个二维空间的点的集合。原始签名数据在二维空间上都有其相应的分量,利用小波包重构算法对这些分量进行重构可得到原始的签名图像。本文中签名图像已被归一化成32×64,因此,这里m=32,n=5分解后的二维点的集合为⊂R2,i=1,2,…,L,k=1,2,…,Sf,其中 L 为样本的类别40,Sf为第5层小波包分解的频段数1024。图4为第9类签名“”分解后的二维点集合的例子。
图4(a)为签名图像完整的特征提取图。从图4(a)可以看出签名图像的能量主要集中在两部分,具有较大值的低频部分和特征值集中在0附近的高频部分。如果仅保留低频部分而忽略高频部分,签名图像的细节将丢失,这些细节对于识别结果将有至关重要的影响。图4(b)是高频部分的放大图。从图4(b)可以看出高频部分存在着一定的聚集性。在建立识别模型的过程中可以利用其聚集性,这样不但保留了高频的特征又没有过多的增加计算量,具体的应用过程可以参见文献[6~7]。
通过特征提取的整个过程可以看出,如果对小波包分解得到的二维点进行重构可以得到原始信号的完整图片而没有任何信息的丢失。但一般的特征提取是一个从Rn→(fx)Rm,n>m的降维过程并且该过程不可逆,即利用 (fx)把x1∈Rn映射成y1∈Rm后,几乎所有特征提取方法却不能利用(fx)-1把y1∈Rm完全映射到x1∈Rn,而利用小波包分解对签名数据进行特征提取是完全且可逆的过程。把经过小波包分解得到的二维向量集合进行小波包重构即可得到原始的签名图像数据,在整个分解与重构的过程中没有信息丢失,保证了对签名进行充分的特征提取。
本文利用Matlab 7.0进行数据仿真,共采集到40人签名,每人15个,其中10个作为训练样本、5个作为测试样本。伪签名共400个,每类10个,由6个人去模仿真实签名得到。试验过程中分别采用haar、db4、sym8、coif3、bior2.6 几种不同的小波基对图像进行了特征提取,试验结果如表1所示。
表1 不同小波基的识别结果Tab.1 Results of different wavelets
由试验结果可知,不同小波基对于识别结果影响很小,因而本文采用了最简单的haar小波基,动态聚类的范围NUM=2,并把本文方法与比较成熟的HMM方法进行了比较。HMM方法每个数据分成4段,每段3个状态,Viterbi算法估测最佳路径,试验结果如图5和图6所示。
由图5和图6可知,本文方法共识别184个测试样本,误识25个,识别率和误识率分别为92%和6.25%,而隐马尔可夫识别175个,误识34个,识别率和误识率分别为87.5%和8.5%,本文方法的识别率略高于HMM方法,误识率稍低于HMM方法,得到了比较满意的结果。本文方法数据预处理简单,原始图像的特征得到最大保留,这样增加了其鲁棒性和抗噪性;它能提取全局信息,避免了复杂分割;利用小波包特征提取是完全可逆的过程,而一般方法不但细节丢失而且不可逆。
本文提出了一种基于小波包的特征提取方法,其仅需简单的数据预处理,提取全局信息,避免复杂分割,特征提取过程完整可逆。试验结果表明:其识别率较高、误识率较低,并且具有很好的抗噪性和鲁棒性,是含噪脱机手写体签名识别的一种可行解决方案。
[1]PESSOA L F C,MARAGOS P.Neural networks with hybrid morphological/rank/Li-near nodes:a unifying framework with applications to handwritten character recognition[J].Pattern Recognition,2000,33:945-960.
[2]LV HAIRONG,WANG WENYUAN,WANG CHONG,et al.Offline Chinese signature verification based on support vectormachines[J].Pattern Recognition,2005,26:2390-2399.
[3]ALESSANDRO L KOERICH,ROBERT SABOURIN,CHING Y.Recognition and verification of unconstrained handwritten words[J].IEEE Transaction on Patten Analysis and Machine Intelligence,2005,27:1509-1522.
[4]MOHAMED M A,GADER P.Generalized hidden markov modelspartⅡ:application to handwritten word recognition[J].IEEE Trans Fuzzy Systems,2000,8(1):82-95.
[5]邓颖娜.手写体签名真伪鉴别技术的研究[D].西安:西安理工大学,2006.
[6]肖春景,李春利,乔永卫,等.用于手写体签名识别的小波包混合高斯模型[J].计算机工程与应用,2009,45(36):161-164.
[7]肖春景,李春利,张 敏.脱机手写体签名识别的小波包隐马尔可夫模型[J].计算机应用,2010,30(2):445-448.