英文手写文字识别建模方法

2012-04-29 07:59:35黄弋石梁艳
电脑知识与技术 2012年20期

黄弋石 梁艳

摘要:为了解决书写较为工整的英文联机手写文字识别,定义了英文字母的有限组成字元,形成一套七组不同的基础字元系统。使用方格边比测量法,与简单的数学计算,可以确定字元的种类与性质。使用字元搭建,对大小写英文字母与阿拉伯数字实施具体定义,由于每个字符的具体定义组成,完全各不相同,所以可以在逻辑上判断,这种方法能够容易快捷地识别独立的较为工整的英文手写字母。这种定义方法,可以推广到连写的手写字母与各种字体。这种建模方法,如果移植到类似的中国少数民族文字与其它类似外国文字的手写识别,应该很乐观。

关键词:英文文字;手写识别;连笔输入;联机识别;联机手写

中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)20-4959-03

English Handwriting Character Recognition Modeling Method

HUANG Yi-shi1,LIANG Yan2

(1.Lab Center, School of Public Health, Nantong University, Nantong 226019,China; 2. Nantong LangChao General Software Limited Company, Nantong 226006,China)

Abstract: Defines limited compositional units to the English letters. Use grid side ratio measurement method to determine their properties. Make specific definitions to all sorts of letters. Then it is easy to recognize independent English handwritten letters quickly. This definition method can be extended to the connected handwritten letters and various fonts. This modeling method will be very optimistic, if transplant ed into the similar Chinas minority languages and some other foreign languages for recognition of handwriting.

Key words: English character; handwriting recognition; cursive input; online recognition; online handwriting

在中国市场,中文手写输入产品都很成熟,但在英文手写输入方面功能不强甚至很弱[1-3]。在英语国家,发展迅速,但有关技术方法的报道甚少。

该文提出一种建模方法,简捷的解决英文手写识别。其中用到,方格边比测量法。即,用方框将目标围住,四边缩小至无法缩小且包含的网格数为整数,以包含方格数与边比特征等一系列特征作为参数计算,可以快速简便的判断字的字元、笔画的起始端位置、曲度、角的角度、圆角的弧度、竖横斜线的倾斜程度。使用这个方法判断以下有限的基本定义,十分简便快速,绕过了复杂的图形计算。使用现有的成熟的二值图像学计算方法可以很容易实现。

1基本定义

竖与横。手写的竖与横,都有一定的摇摆幅度。但是竖与横,使用方格边比测量法,很容易区分。

角与圆角。接近与V与U,在手写特征下的区别是有拐点与无拐点。

圈与近圈。也就是,封闭的圆与接近封闭的圆。手写圆具有拓扑隔离性质,与其它基本定义明显不同。近圈的笔画两端距离较近,且没有拐点,这一点有别于角与圆角。使用方格边比测量法易识别。

短划与点。与竖与横的区别是方向性不强,在方格中,通过边比特征可以区分。

交叉与连续。交叉,是指基本定义的笔画相交叉,分T型交叉,和X型交叉,也可简化为一种交叉。连续,是指,基本定义的笔画从起点到终点(或笔画的两端)是连续的且无分叉,可平滑,也可转折。

相对位置与方向。基本定义的字元之间的关系,有上、下、左、右、上左、上右、下左、下右。

斜线。几何特征介于竖与横,但可赋予相对方向的特征为,左斜、右斜、下斜、上斜、(左上斜、左下斜、右上斜、右下斜)。用方格边比测量法,易与竖横区分。

用这些基本定义就可对每个不同的手写字母,加以分割定义。这一方法,也可以移植到汉字手写识别,经确定适合汉字的基本定义,可快速判断汉字的基本笔画或基本要素。

2建模方法

用基本定义对a到z和A到Z实施具体定义。显然,只要每个对象的定义各不相同,那就可简单区分。

2.1容易混淆的字母

这里先解决书写较为规整的字母,无论字母,右斜、左斜还是居中。

a u a圈或近圈+右下圆角或短划,笔画连续。u圆角+右下圆角或短划,笔画连续。o v手写中,o会出现近圈,v会出现圆角,易区分。

z 2 z的右上是角,角开口向左下,2的右上是圆角,笔画都连续。

C L在手写情况下,C是开口向右的圆角,L是开口向右或右上的角。

J T J的特征是横+竖+左下圆角,圆角开口向上。

K R手写的K是竖+右上斜+右下斜,右上斜在竖的右侧,右下斜在竖的右侧、右上斜的下或右下。在手写中竖与右上斜,可以笔画连续成为角,属于字母的变体。R是竖+开口向左的圆角+右下斜。在手写中笔画可以连续,这个问题,可以归类于下文的变体与字体库技术处理。

S 8规整手写S的两个圆角一般是不会闭合为圈。8的上部为圈或近圈或圆角,但下部必然是闭合圈。

2.2 a到z的基本定义

使用基本定义分解每个字母,解决书写较为规整的字母,无论字母右斜、左斜还是居中都适用。a圈或近圈+右下圆角或短划,笔画连续。b竖+左开口圆角,圆角在右。c右开口圆角。d右开口圆角+竖,竖在右。e圈或近圈+右开口圆角,笔画连续。f竖+横+圆角,竖横交叉,竖与圆角连续,圆角开口右下。g圈或近圈+竖+圆角,笔画连续,圆角开口向上,圈在圆角的上,圈在竖的左。h竖+圆角,竖在左,圆角开口向下。i短划或点+竖,竖在下,手写中书上下会有圆角特征,归类于下文的变体与字体库。j短划或点+竖+圆角,圆角开口左上。k竖+右上斜+右下斜,竖在左。l竖,借助下文的拼写法辅助可与数字1区分。m竖+圆角+圆角,圆角开口向下,竖在左。n竖+圆角。o圈或近圈,借助拼写法辅助可与数字0区分。p竖+圆角,圆角开口向左,竖在左。q竖+圆角,圆角开口向右,竖在右。r竖在左,圆角向右下,笔画连续。s圆角+圆角,开口一左一右,笔画连续。t横+竖+圆角,圆角开口右上。u圆角+竖,开口向上,竖在右,笔画连续。v角,开口向上。w角+角+角,两角开口向上,一角开口向下,这里列出三个角,目的是要为解决连笔写的方案打好铺垫。x角+角,角开口一向上一向下,角一上一下(也可定义为交叉的斜线,但易于与y混淆)。y右下斜+左下斜,左右关系。z左开口角+右开口角,一上一下,笔画连续,如此仔细定义,目的是为解决连笔写方案做好铺垫。

2.3 A到Z的基本定义

A左下斜+右下斜+横,笔画可不连续。B竖+左开口圆角+左开口圆角,竖在左,笔画可不连续。C右开口圆角。D竖+左开口圆角,竖在左。E竖横连续+横+横,两横在右。F竖+横+横,竖在左。G右开口圆角+横竖(或横+竖),圆角与竖连续,圆角在左。H竖+横+竖,不连续,竖在横左,竖在横右,不连续。I横+竖+横,横在竖上,横在竖下,不连续。J横+竖+上开口圆角,竖圆角连续。K竖+右上斜+右下斜,竖在左。L竖+横,竖在左,连续。M竖+开口上角+竖,角与右竖连续。N竖+开口上角,竖在左,不连续。O圈或近圈,与小写o区分基于包含的网格数有明显差异。P竖左开口圆角,竖在左。Q圈或近圈+短划,交叉。R竖+左开口圆角+右下斜,竖在左。S圆角+圆角,圆角一左上、一右下,笔画连续。T横+竖,竖在下,不连续。U圆角开口向上,用方格边比测量法包围的小方格数,可区分大小写U。V角开口向上,区分大小写易。W角+角+角,两角开口向上,一角开口向下,区分大小写易。X上开口角+下开口角,一上一下,区分大小写易。Y右斜+左斜+竖,竖在下,不连续。Z左开口角+右开口角,一上一下,笔画连续,区分大小写易。

延伸的,数字0到9的定义可类推。

3变化

3.1变体与字体库

每个英文字,在手写体上都有变体,但分类极其有限[4]。如,英美人士对t,有时写成类似中文的十。显然,因英文字母结构的简单与有限,其变体也是极其有限。

同时,英文字母也有极其有限的书法字体,都有很成熟的统一规范。建立不大的字体集后,根据字元关系,建立特征数据库,就很容易进行整字识别。这就类似于手写汉字的识别,只要建立体分类字库,再建立特征数据库,就能解决草体手写识别[5]。

英美人士,书写时可分为左倾、居中、右倾。在美国,长期有人收集各种手写字体,研究书写者的性格与倾向,并形成一个学科,这些资料都很成熟同时如果依照规范分类,量也不大。

另外,英文中的艺术体,在实际记录书写中并不多见,就如同有的中文书法家虽然有的精通篆书、隶书,但平时还是用行书记录。

3.2连写的分割与识别

每个英文字的手写连接部分的特征,都有有限的特征。根据这些特征可以将每个字分割。具体方法是,将a到z与A到Z进行组合,施加不同的变体与字体,得到有限的特征。工作量不大,难度也不大。经过手写实验,字母之间的连接有明显的角、圆角与圈等的连接间隔特征。

对于方框内独立的字母,可以采用平面重叠法,就是将每个独立的笔画储存为一个平面,然后叠加,这在算法上很简便,程序能写的很小。但对于连笔英文,使用连续点追踪为好,就是在输入框中找到一个黑像素,追踪连续的点至笔画的断点,然后再实施分割[6]。

由于手写字母间有明显的角、圆角与圈等的连接间隔特征,所以可实施字母穷举法实施字母分割。

拼写法辅助也是重要的[7-8]。可购现成的拼写软件,不贵且很成功。在市场上的代表有,手机上的智能英文输入软件,在美国常用的英文单词输入校正提示软件。拼写提示软件对错误的拼写,都可智能的判定并提示可能的正确拼法,准确率极高。基本原理是基于,常用的英文字是有限的,这些字母的组合不是无限的,这些组合都有有限的规律可循。由于英语的语言密码学早已很发达,所以促使这种软件十分成熟。

4结束语

这种建模方法结合汉字手写识别建模方法[9][10]的思想,如果机动灵活的加以移植,很可能能简捷的解决类似的中国少数民族文字与其它类似的外国文字的手写识别。希望有此意愿者,合作交流。

参考文献:

[1]邹明福,白洪亮,刘昌平,等.联机手写英文识别的解码算法[J].计算机工程,2005,31(21):19-21.

[2]赵道华,艾斯卡尔艾木都拉.基于过拆分和合并的联机手写英文单词分割技术[J].电脑知识与技术,2009,5(7):1693-1695.

[3]张豪杰,张红云,苗夺谦.基于主曲线的脱机手写英文字母结构特征分析及选取[J].计算机科学,2009,36(10):197-201.

[4]梁艳,黄弋石.英文连笔手写图形输入方法研究[J].科学研究月刊,2005,1(5):18,26.

[5]黄弋石,梁艳.手写文字识别的体分类模糊数学模型[EB/OL].中国科技论文在线(http://www.paper.edu.cn), 2005年6月.

[6] Casey R G, Lecolinet E. A Survey of Method and Strategies in Character Segmentation[J]. IEEE Trans PAMI,1996,18(7):690-706.

[7] Arica N, Yarman-Vural F T. Optical Character Recognition for Cursive Handwriting [J]. IEEE Transaction on Pattern Analysis and Ma chine Intelligence, 2002,24(6).

[8] Sin B K, Kim J H. Ligature Modeling for Online Cursive Script Recognition [J]. IEEE Transactions on Pattern Analysis and Machine Intel ligence, 1997.19(6).

[9]黄弋石.一种手写文字图形输入理论方法[J].广西民族学院学报:自然科学版,2003,9(2):40-43.

[10]梁艳,黄弋石.计算机汉字草体手写输入算法[J].计算机技术与发展,2005,15(10):14,15.