一种基于笔划特征的笔迹鉴别方法

2013-10-08 03:03
中国科技信息 2013年17期
关键词:笔划笔迹离线

梁 方

南通大学现代教育技术中心,江苏 南通 226001

引言

笔迹鉴别就是通过笔迹特征来判断书写者的身份,它是利用书写的习惯特征来鉴别身份的一种生物学身份鉴定方法。它主要可以分为两大类:在线(online)方式和离线(offline)方式。在线方式需要特殊的输入设备这一条件限制了它的使用范围。离线方式获取方式灵活,应用范围更加广泛。离线笔迹识别在近几年获得了长足的进步,Bulacu等[1]提出了一系列用角度和微结构统计的统计特性鉴别笔迹的方法,Schlapbach等[2]提出用隐马尔可夫模型来提取笔迹特征,唐远炎等[3]将隐马尔可夫模型应用到中文字符上。

本文借鉴概论分布的思想,提取了笔划在一定范围内的分布概率,这些概率包含了一个人的书写习惯特征,从而能够有效识别笔迹的书写者。该方法简单易行,而且方便灵活,实验证明其在手写体汉字识别方面有较好的识别效果。

1 笔划特征提取

1.1 笔迹边缘提取

笔迹原图包含了很多有用的信息,同时也包含了较多的冗余信息,从笔迹鉴别角度看,提取出最能够代表笔迹的特征才能更好的进行鉴别。从笔迹的边缘可以完全恢复出笔迹的原有形态,而且边缘的提取相对是一件比较容易的任务,因此,本文预处理部分选择了提取笔迹边缘。如图1所示,(a)是原图的效果,(b)是从(a)的获得的边缘。

图1 文字轮廓

1.2 笔划特征矩阵的生成

笔划的方向、长短等特征是笔迹鉴别的重要依据。为了统计笔画的分布特性,在笔迹的边缘上截取一个小的窗口以获得局部的笔划方向、长短等信息(如图1(c))。为了尽可能去除不相关点的影响,在以当前像素为中心的窗口中,我们只取与当前像素连通的边缘像素。

遍历所有边缘点为中心得窗口,将所得到的窗口叠加,可以得到全局的笔划点的分布情况。在此时的特征矩阵中,中心点反映了边缘点的数目。若以中心点数目归一化,则得到特征矩阵的最终形式,它去除边缘点数目的影响,反映了周围点属于边缘的概率。因此特征矩阵反映的是当前笔划的一个趋势:从哪个方向过来,有多长,到哪个方向去。从这个意义上说整个矩阵反映了笔迹的笔划特征。假设取移动窗口为11×11,则得到的特征为一个11行11列的矩阵,它反映了笔划的统计特性,对于由笔划组成的汉字鉴别是比较合适的。由于只取了和当前点连通的边缘,在一定程度上消除了笔划粗细的影响。

1.3 时间性能分析

本文的方法在时间上消耗较小。如果图像中有M个边缘点,窗口大小为n×n,则运算复杂度为O(M×n2)。实际上,由于本文方法只是简单的累加,因此计算的开销较少。另外,本文的窗口大小的改变是比较容易的,只需要在原窗口的外围再添加一圈就可以。因此,提出的方法具有较好的时间效率和灵活性。

2 实验

本文使用了自建的笔迹鉴别数据库测试了提出方法的性能。我们取了3段内容不同的文本,让15人书写,因此数据库总共包含45幅图像的笔迹数据。其中15个人书写的相同内容的笔迹,其内容是高度相关的,而每个人所写的3幅笔迹,其内容是不相关的。我们最终得到表1的实验结果。

表1 不相关文本的笔迹鉴别结果

从结果中可以看出当使用一个参考样本时,提出的方法已经能够比较有效地辨别笔迹特征。另外,当参考样本增加时,可以极大提高识别正确率。从实验结果可以看到本文提出的鉴别方法还是比较有效的。

3 结语

本文的笔迹特征提取的是笔划的结构的统计特征,能够全面反映笔划的特征;另一方面提出的特征在统计时只是简单的累加,因此计算复杂度低。提出的方法不需要字符的切分和归一化操作,加快了运算的速度。对于字体和训练样本差距过大的检测图像,可以考虑对整体进行缩放操作,该操作的速度比较快;对于字符倾斜的图像,可以进行相应的校正操作。本文未对笔划分类统计,在一定程度上增加了距离度量的难度。在后继研究中可以考虑进一步细化该方法,获得更好的鉴别正确率。

[1]M. Bulacu, L. Schomaker. Text-independent writer identification and verification using textural and allographic features. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(4): 701-717.

[2]A. Schlapbach, H. Bunke. A writer identification and verification system using HMM based recognizers. Pattern Analysis and Applications, 2007, 10(1): 33-43.

[3]Z. Y. He, X. G. You, Y. Y. Tang. Writer identification of Chinese handwriting documents using hidden Markov tree model. Pattern Recognition, 2008, 41(4):1295-1307.

猜你喜欢
笔划笔迹离线
异步电机离线参数辨识方法
巧克力能否去除桌上的油性笔笔迹
浅谈ATC离线基础数据的准备
FTGS轨道电路离线测试平台开发
离线富集-HPLC法同时测定氨咖黄敏胶囊中5种合成色素
笔迹线条主动触觉在笔迹鉴定中的运用
加笔划成新字
KD357:模拟汉字笔划的汉字键盘输入法
“全国优秀科技工作者”名单
浅议摹仿签名笔迹鉴定