魏晋
(山西长治医学院计算机教学部,山西长治046000)
基于Hausdorff距离算法的数字图像识别技术在Android中的应用
魏晋
(山西长治医学院计算机教学部,山西长治046000)
通过Android系统手机从图像中获取信息已经成为现代人获取信息的一种方式.Hausdorff距离算法作为一种高效的数字图像识别算法,目前已被广泛地应用于Windows系统中.Android系统与Windows系统具有非常大的差异性,因此从Hausdorff算法的原理入手,经过对算法的改进和编程,并最终通过实验测试后表明采用Hausdorff距离算法的数字图像识别技术完全可以满足在Android系统中的实际要求,并且具有较高的识别准确率.
Android系统;图像识别;模板匹配
数字图像识别技术发展到今天,已经在各个行业开始了广泛的应用.数字图像识别技术就是对数字图像中的数字信息进行分析和提取的过程.当前大多数的数字图像识别技术算法是以Windows系统为基础来进行应用和研究的[1].
自从Android系统推出后,Android系统的手机用户数量逐年都在飞速地增长,手机已经成为了人们快速、便捷获取数据的一种设备和渠道[2],因此将Windows系统中的数字图像识别技术应用到Android系统中成为了一个必然的发展趋势.但是Android与Windows系统的硬件、软件环境都有非常大的差异性,所以能否将Windows系统中现有的数字图像识别技术算法应用到Android系统中,并能够满足实际的需求,是数字图像识别技术面临的一个新的任务和挑战.本文对将Windows系统中Hausdorff距离算法的数字图像识别技术应用到Android系统中,能否达到Android系统实际需求的过程进行了验证.
在使用Android系统的手机进行图像采集后,为了能够准确、方便地定位包含有数字部分的图像区域在整个图像中的位置,构造了一个选取框.选取框的作用就是只选取包含有数字部分的图像区域,裁剪掉不需要处理的图像部分.因为缩小了待处理图像的区域,所以提高了图像的处理速度和提取数字信息的准确度.实现过程如图1所示.
图1 选取框实现过程Fig.1 The selection realization process
2.1 数字图像灰度化
在数字图像中每个像素点的颜色值都不同,因此对像素点值进行采集就变得非常困难.为了能够解决这个问题,对数字图像进行了灰度化的预处理.图像灰度化预处理过程其实就是把三通道的图像转换为只有一个通道图像的过程,即将原有的彩色图像转化为灰度图[3],灰度化后的图像中每个像素只有一种颜色的像素值.转换的方法采用了RGB最大值的方法来完成,数学公式见式(1).
式(1)中R、G、B分别代表红色、绿色和黑色的颜色值.图像的灰度值为R、G、B三个分量值中的最大值.主要实现代码如下所示:
2.2数字图像的切分
数字图像的切分就是把数字图像中包含的数字一个个地切分出来,变成各自独立的数字图像,并且保证每个图像只包含一个数字值.切分的过程采用了现在使用较多的垂直投影法[4]来完成.垂直投影法数学公式见式(2).
式(2)中s(i,j)表示图像值,i表示图像在垂直方向上的列坐标值,j表示水平坐标值,Y(j)表示一个字符的左右边界限线值.
2.3 数字字符大小规范化
在经过数字图像切分处理过程后,会出现每个独立数字图像大小不一致的情况,因此要对每个独立的数字图像进行宽度和高度的规范化处理.规范化处理的过程采用双线性插值图像缩放法来完成.双线性插值图像缩放法数学公式见式(3).
设原图像为f(x,y),规范化后图像为g(x0,y0),其中x0和y0与f(x,y)中a和b点对应关系是
当a,b两点相邻的4点坐标分别为:(i,j)、(i+1,j)、(i,j+1)、(i+1,j+1)时
式(3)中widy、widg和depy、depg分别表示原图和规范化后图像的宽度和高度.主要实现代码如下所示:public void Image(InputStream is,OutputStream os,int size,String format)throws IOException{
数字字符的识别是数字图像识别技术中的核心和难点.目前使用较多的方法有遗传学法、支持向量机法、神经网络法和模板匹配法等[5].本文采用的数字字符识别算法是改进的Hausdorff距离算法.
Hausdorff距离算法是描述在2个点集合中寻找相同或是相似点距离的过程.设定分别有2个集合X={x1,…,xn},Y={y1,…,yn},当X集合中的每一个像素点在Y集合中都能搜索到与之相近的像素点时,且Y集合中每一个像素点在X集合中也能搜索到与之相近的像素点时,那么集合X与Y相似.它的定义形式和数学公式见式(4).
式(4)中,h(X,Y)和h(Y,X)分别表示从X集合到Y集合和从Y集合到X集合的Hausdorff单向距离值.
在实际使用Hausdorff距离算法中会发现,算法中的最大值与最小值的选取较为困难[6].为了能够解决这个问题,对Hausdorff距离算法进行了优化.优化后的算法中分别选取了不同方向中的最小距离平均值来分别代替算法中的最大值和最小值,见式(5)、式(6).
式(5)、式(6)中N为有效的像素点的数量值.主要实现代码如下所示:
分别选取3组具有相同的数字个数,但图像质量不同的数字图像进行了实验测试.图像质量高是指图像拍摄清晰、图像没有变形和旋转、没有曝光过度和噪声等.图像质量低是指图像存在图像变形、旋转、曝光过度等情况.实验测试结果见表1.
表1 实验测试结果Tab.1 The test results of experiment
由表1可以看出,在保证高质量图像的情况下完全可以正确地识别数字信息,且识别率较高完全可以达到实际的需求.但是当图像有变形、旋转、曝光过度等低质量图像时,识别率有所下降.因此可见对数字图像进行预处理、保证高质量的图像,是正确识别数字信息的重要基础.
随着Android系统的广泛使用,如何将Windows系统中已有的、运行效果优秀的算法移植应用到Android系统中,是现在研究的一个热点问题.但是算法的移植应用并不是简单的照搬,而是需要以移植后的系统特点为基础,对算法进行必要的优化后再进行移植和应用.本文对Hausdorff距离算法能否应用在Android系统中用于数字图像的数字信息识别这一问题,进行了详细的研究和实验测试.最后表明基于Hausdorff距离算法的数字图像识别技术在Android系统中的应用效果具有高效、识别率高的特点,完全可以满足Android系统的实际需求.
[1]刘莉.光学字符识别系统中关键算法的设计与研究[D].成都:电子科技大学,2011.
[2]曹海英,元元.基于Android系统的移动校园信息平台设计[J].赤峰学院学报:自然科学版,2014,30(11):11-12.
[3]陈军胜.组合结构特征的自由手写体数字识别算法研究[J].计算机工程与应用,2013,49(5):180-181.
[4]韩超,梁泉.Android系统原理及开发要点详解[M].北京:电子工业出版社,2010:109-127.
[5]文颖.数字字符识别及其应用研究[D].上海:上海交通大学,2009.
[6]谭建荣,岳小莉,陆国栋.图形相似的基本原理方法及其在结构模式识别中的应用[J].计算机学报,2002,25(9):22-26.
(责任编辑:卢奇)
The application of Hausdorff algorithm-based digital image recognition in the Android system
Wei Jin
(Department of Computer Teaching,Changzhi Medical College,Changzhi 046000,China)
Mobile phones acquire information intellectively from images through the Android system,which has become an important channel of information acquisition nowadays.As a high-performance digital image recognition algorithm,the Hausdorff distance algorithm has been widely applied in the Windows system.However,the Android system and the Windows system have great differences in nature.The current study aimed to apply the Hausdorff algorithm in Android by modifying and programming the algorithm based on its calculation principles.The applicability of the modified algorithm was tested.The results showed that the Hausdorff-based digital image recognition algorithm satisfied the actual requirements of Android with a high recognition accuracy rate.
Android system;image recognition;template matching
TP311.5
A
:1008-7516(2015)02-0046-05
10.3969/j.issn.1008-7516.2015.02.011
2015-03-09
魏晋(1975―),男,山西长治人,硕士,讲师.主要从事计算机软件工程研究.