李强 万太昊 张超 王守志
【摘 要】图像处理和模式识别中我们最常用并最具有研究价值的就是手写数字体自动识别技术,本文主要是简述手写数字体自动识别技术的现状情况,对我们的手写数字体自动识别技术中的预处理中一些方法进行分析,将该技术服务中的重要特征和结构进行分开概述,并通过我们的分析,让读者可以更加了解手写数字体自动识别技术。
【关键词】手写数字体;自动识别;预处理;特征提取
引言
手写数字体自动识别其实就是我们手写出来的数字通过计算机优化自动识别出来,它也是我们光学字符识别技术中的一项。我们国内的大多学者其实已经对自动识别技术有一些较为深入的研究,由此可见,我们国内对手写数字识别技术非常的看重,且该技术具有非常重要的意义。现在市面上最多的是联机识别的服务,就是主要通过摄像或手写板,计算机联机在摄像或手写板进行书写,再通过书写出来的笔迹或落笔情况的像素空间的位置进行自动识别,这个技术是已經较为成熟的情况,那么我们现在主要是针对脱机手写数字体自动识别技术进行研究,它所涉及到的图像处理、统计、模式识别等等。现在这个技术是已经有非常广泛的应用了,比如是银行票据和文本信息处理等,这个技术还有很多的不足之处,因为数字的笔画和字型的不同,可能会导致识别错误。本文就以脱机手写数字体识别为主,对其所存在的问题和优点、缺点进行分别阐述。
一、预处理
预处理是我们的手写数字体识别的必不可少的一部分,它其实主要就是在字符图像中降噪、压缩多余信息,以此提高我们的自动识别率和系统的识别速度。首先:我们为了将图像中笔划进行清晰的展示,需要将我们的图像颜色进行灰度化处理,没有其他的颜色显示,只是调整亮度,通过常用的加权平均法,然后将图像的亮度进行处理。然后,将我们得到的图像进行二值化,二值化中我们不常用的是动态阀值法,因为它主要是根据像元的领域特征来自己适应的改变阀值,领域灰度变化太快,计算时间长,很麻烦。我们在图像的采集中,拍摄的时候光照情况和我们的拍摄环境是会影响到图像的展示,同时图像的本身可能也会存在有损坏的情况,图像的质量无法得到保证。为了得到高质量的图像保证,提高系统的识别率,我们就需要采取相应的措施,增强图像的主要方式是频率域法和空间域法。我们常用的是空间域法,因为它非常的简单易操作,速度快,同时处理效果也非常好;但不是频率域法效果不好,它主要是因为太麻烦,操作的效率低,所以是非常不实用。
我们的图像在采集时都是随机选择的,没有一个统一的角度,所以在获取的图像,它的倾斜角度是不确定的,即使是有倾斜角度校正的情况,但是识别出来的效果却是不一样的,倾斜校正也就是将图像的倾斜角度按照一定的角度、方向进行旋转,我们常常使用的倾斜校正算法是:投影法、近邻法,Hough变换法等等。我们一般现在使用的是基于小波变换与霍夫变换的图像倾斜校正的算法:先是我们的原始图像,进行灰度化得到灰度图像;然后使用动态阀值得到二值图像;通过小波变换,就有图像整体概貌的形态了;再通过边缘检测,得出边缘直线信息,最后再通过霍夫变换就有倾斜角度,最后的最后我们的图像就校正成功了。
二、特征提取
特征提取是非常关键的,我们的图像处理中需要保证有足够的信息量,以此来得到图像的较高识别率。我们的手写数字特征常见的是结构特征和统计特征的,结构特征顾名思义就是主要在数字的结构本质上的特点;常用的特征提取是主要有:首先是粗网格,通过数字书写的不同区域的黑色像素点的个数,计算出黑色像素占比。不管有没有降噪,它注重的是整体的分布情况,使用中会自动抑制噪声,图像的识别率高。然后是18维特征,主要是在粗网格的基础上二次改进,还有主元素分析法。
三、模式分类识别
模式分类识别是图像特征提取后,将特征空间来划分,脱机手写数字识别可以分成单分类和多分类集成。我们使用较多的还是多分类集成服务,也是现代社会的主流。我们的主流手写体数字分类器有:基于距离的分类器:相对来说它的概念简单,操作易上手,对小成本和低维等情况搓搓有余,但是缺点也很明显,就是太过绝对的代表点,容易出错;人工神经网络分类;支持向量机:它主要是针对的机器学习和模式识别问题;孪生支持向量机:还有待改进。
四、结束语
随着现代社会的信息技术发展,手写数字识别是已经广泛应用了,且在该领域已经有非常重大的成果。本文就手写数字识别服务中的预处理、特征提取、模式分类识别等,简述它们的优点和缺点情况,通过以上的分析情况来看,让读者对手写数字体自动识别技术有进一步的了解,希望有助于以后的手写数字体自动识别技术的更进一步的研究。
参考文献:
[1]郭晓永,王相军.一种基于SNMP的网络拓扑发现算法[J].重庆工商大学学报(自然科学版),2011,(1):59-62.doi:10.3969/j.issn.1672-058X.2011.01.015
[2]朱江,宣国荣.一种基于骨架特征顺序编码的脱机手写体数字识别方法[J].小型微型计算机系统,2001,(8):957-960.doi:10.3969/j.issn.1000-1220.2001.08.017.
[3]吴冰,秦志远.自动确定图像二值化最佳阈值的新方法[J].测绘学院学报,2001,(4):283-286.doi:10.3969/j.issn.1673-6338.2001.04.014.
[4]张伟,王克俭,秦臻.基于神经网络的数字识别的研究[J].微电子学与计算机,2006,(8):206-208.doi:10.3969/j.issn.1000-7180.2006.08.063.
作者简介:
李强,男,山东临沂人,临沂大学信息学院与工程学院;
万太昊,男,山东青岛人,临沂大学信息学院与工程学院;
张超,男,山东临沂人,临沂大学信息学院与工程学院
王守志,男,山东临沂人,临沂大学信息学院与工程学院,副教授
(作者单位:临沂大学信息学院与工程学院)