盲文自动识别方法研究

2010-09-19 07:59:52王丽荣
长春大学学报 2010年8期
关键词:字符串盲文汉语拼音

尹 佳,李 杰,王丽荣

(1.长春理工大学 研究生学院,吉林 长春 130022;2.长春大学 电子信息工程学院,吉林 长春 130022)

盲文自动识别方法研究

尹 佳1,李 杰2,王丽荣2

(1.长春理工大学 研究生学院,吉林 长春 130022;2.长春大学 电子信息工程学院,吉林 长春 130022)

本文研究的盲文点字自动识别技术,利用数字摄像机采集盲文图像,并利用图像处理技术,对盲文图像进行预处理,将盲文图像转换成二值图像,然后再利用盲文点字的特性来提取盲文点字特征,并定位、分组盲文点字单元,以二进制字符串的形式与盲文语料库进行匹配,识别出盲文点字信息。本论文中给出了盲文识别的总体方法,并详细介绍了具体的处理方法。实验证明,该方法能有效、准确的提取盲文点字,并转换成汉语拼音。

盲文识别;盲文图像采集;盲文图像分割;盲文特征提取

0 引言

根据我国的盲人数量以及受教育的盲人数量来看,我国视力残疾人群中有很大一部分不能顺利阅读盲文读物,这对盲人信息获取、融入社会极为不利。在盲人学校,任课教师大都视力正常且大多不懂盲文,大量的盲文试卷、作业等盲文材料需要任课教师阅读、批改,这对老师来说无疑是一项艰巨的工作,如何快速准确批阅盲生试卷作业等现实性事件已成为盲校教学中亟待解决的问题。

本文主要研究盲文点字的提取识别方法,主要包括盲文图像的获取方法及预处理、盲文点字信息的提取及识别技术等几个部分。研究的最终目的是要研发出一种方便快捷的盲文自动识别装置。盲文是通过点字机等在纸张上制作出的不同组合的凸点阵(3×2阵列),如图1所示为盲文的采集图片。

1 盲文图像的采集

盲文图像的采集部分由成像装置和镜头两部分组成,这也是组成识别系统的重要环节。本论文在研究阶段采用如图2所示的图像采集系统,该装置能完成一秒钟高速拍摄,分辨率达到2048×1536,可拍取30cm ×23cm大小纸张的材料,图像数据通过USB2.0接口传送到主机。

图1 盲文采集系统采集的盲文示意图

图2 盲文采集系统

2 盲文图像的增强

本文采用了有限对比自适应直方图均衡化的方法。该方法采用局部均衡的方法,就是把图像分割成若干小区域进行各个部分的局部均衡。该方法由于对每一小块都进行了直方图均衡,输出图像更加接近指定图像。同时该方法还可调整灰度图像的对比度,使图像像素均匀分布在图像的整个灰度范围内。此外,盲文图像在进行局部均衡化后产生的人为边界,通过双线性插值方法来组合相邻的区域予以消除。经过增强处理的盲文图像如图3所示。

3 盲文点字的检测

盲文点字检测也就是点字的特征提取,即把点字从图像中提取出来。本文主要包括以下两个部分:数学形态学处理和阈值分割数学形态学是一门新兴的图像处理分析工具,包括腐蚀、膨胀、开运算和闭运算[1]。根据盲文图像特点,我们最终选取半径为1的圆形结构元素对盲文图像进行腐蚀的方法,来检测相应盲文特征信息。图像的腐蚀可以消除图像的边界点,使图像边界向内部收缩,把小于结构元素的图像去除,消除图像边缘的尖峰和凸角及图像间的细小连通。之后采用阈值分割方法[2]对图像进行二值处理。

阈值分割的关键是阈值的选取方法,大津法是一种自适应计算阈值的分割方法。假设有大小为M×N图像I(x,y),记T为前景(目标)和背景的分割阈值,属于前景的像素点数占整幅图像的比例记为w0,其平均灰度v0;背景像素点数占w1,其平均灰度为v1。图像的总平均灰度记为v,类间方差记为g。图像中像素的灰度值小于阈值T的像素个数记作N0,像素灰度大于阈值T的像素个数记作N1,则有:

在实际应用中,我们直接用大津法计算量大,一般为了减少计算量,将式(1)代入式(2),得到等价公式:

采用遍历的方法,设灰度值t,然后从最小灰度值到最大灰度值遍历t,当t值使类间方差g最大时,t即为分割的最佳阈值T,使用该方法进行分割意味着错分概率最小。针对盲文图像特点,本文具体采用了局部阈值分割方法,先把盲文图像分成若干小块,再分别在每个图像小块内采用大津算法进行局部分割,并根据盲文排列的直线型特点,去除孤立点及杂点。提取出我们实验所需要的盲文点字,实验结果如图4所示。

图3 盲文增强图像

图4 盲文二值图像

4 盲文点字的识别

进行盲文图像处理的目的就是要把盲点与背景分开,也就是说盲点与背景的阈值要形成很大的差异,这样我们就可以在后面的处理中,根据盲点的阈值来定位该点,并分出盲文单元,与语料库进行匹配,输出识别结果。

4.1 盲文单元分组定位

如图5所示左上角的一个3×2阵列即为一个盲文单元,假设6点的位置按图5所示顺序(a,b,c,d,e,f)进行排列。研究发现,盲文字符所对应的点阵的排列是有一定规律的,而且每个盲文字符代码间的距离都是有一定标准的[3]。我们可以根据这一性质来进行盲文字符的提取。

根据纸介盲文的这些特点,我们通过盲点的阈值,以水平和垂直两个方向为目标,对盲文图像进行划线处理,则盲文点字落在直线上,如图5所示。然后以3×2矩阵形式依次进行分块划分,一个目标矩阵为一个盲文单元。在每个盲文单元里按先前规定的顺序检测直线交点处是否存在盲点,有点处用1表示,无点处用0表示[4],最终以一个二进制字符串的形式予以表示并保存该盲文字符。图5所示上半部的首个盲文单元以二进制字符串011110的形式保存。

图5 盲文识别示例图

4.2 盲文字符到汉语拼音的识别

由于汉语盲文是由拼音、数字、标点符号组成的。我们的任务是把识别出的盲文单元转换成他所代表的字母、数字或标点,这要求我们建立标准的盲文语料库。根据我们前文提到的方法,把所有汉语盲文字符的二进制字符串和所对应的字符一一对应的存入预料库中,建立专业的标准盲文语料库。识别过程是:提取出盲文单元,把盲文转换成二进制的字符串,和语料库中的字符串进行一一比对,匹配成功则输出该字符串所代表的汉语拼音、数字或者标点。未匹配则重新定位该盲文单元,进行再次细化分割,准确识别出盲文单元后再匹配输出结果。

5 结语

论文所提及的方法能有效提取纸介盲文图像中的盲文点字,并能准确的转换成汉语拼音,完成了盲文到汉语拼音的转换识别。我们下一步的实验任务,就是继续细化相关算法,进一步消除噪声污染,提高盲文点字提取和盲文识别的准确率;同时把汉语拼音转换成汉字并进行语音处理,最终以语音的形式输出。当前所遇到的困难在于,汉语拼音存在一音多字的现象,无论是有声调的盲文还是无声调的盲文,在识别成汉语拼音后都存在这种歧义性[5],我们的任务就是深化研究,尽可能的减少识别的歧义性,提高识别率。

[1] 张津,万振凯.基于数学形态学的图像二值化算法[J].仪器仪表用户,2008,115(2):1671-1041.

[2] R.Lienhat,A.Wernicke.Localizing and segmenting text in image,video and web pages[J].IEEE Transactions on Circuits and Systems for Video Technology,2002(12):256-268.

[3] Shanjun ZHANG,K.YOSHINO.A Braille Recognition System by the Mobile Phone with Embedded Camera[J].ICICIC 2007:1321-1324.

[4] H.R.Shahbazkia,T.T.Silva and R.M.Guerreiro.Automatic Braille Code Translation System[M].M.Lazo and A.Sanfeliu(Eds.):CIARP 2005,LNCS 3773,2005:233-241.

[5] 江铭虎,朱小燕,等.基于多种知识的盲文翻译的研究[J].清华大学学报(自然科学版),2000,40(9):69-73.

责任编辑:吴旭云

Research on braille automatic identification method

YIN Jia1,LI Jie2,WANG Li-rong2
(1.Graduate School,Changchun University of Science and Technology,Changchun 130022,China; 2.College of Electronic Information Engineering,Changchun University,Changchun 130022,China)

The braille automatic identification technology described in this paper captures braille images by digital camera,pretreats them by image processing technology,converts them into binary images,then extracts braille features by the fixed nature of braille,positions and groups braille cells to match corpora by the binary character string so as to identify information.This paper gives the general method of braille recognition and introduces concrete methods.The experiments show that the method is effective and accurate for braille extraction and convertion into Chinese spelling.

braille recognition;braille image acquisition;braille image segmentation;braille feature extraction

TP391.41

A

1009-3907(2010)08-0054-03

2010-06-07

长春市科技局国际科技合作项目[08GH07]

尹佳(1986-),男,陕西西安人,硕士研究生,主要从事检测技术与过程控制方向的研究。

猜你喜欢
字符串盲文汉语拼音
布莱叶:发明盲文,在黑暗中“看见”世界
制作盲文书籍,点亮黑暗世界
浅谈汉语拼音的教学方法
甘肃教育(2020年14期)2020-09-11 07:58:34
汉语拼音化的反思
汉语拼音之父 周有光:一个人的百年史
金色年华(2017年1期)2017-06-15 20:28:30
盲文纸质出版物与数字资源一体化研发初探
出版与印刷(2016年1期)2016-01-03 08:53:36
汉语拼音综合测试
一种新的基于对称性的字符串相似性处理算法
依据字符串匹配的中文分词模型研究
一种针对Java中字符串的内存管理方案