童文超,舒小华,龙永红,肖习雨
(湖南工业大学 电气与信息工程学院,湖南 株洲 412007)
LED显示仪表的字符识别方法
童文超,舒小华,龙永红,肖习雨
(湖南工业大学 电气与信息工程学院,湖南 株洲 412007)
针对LED显示仪表,提出了一种字符识别方法。字符分割采用边缘检测、直线检测和灰度投影相结合的方法,可快速提取目标字符,将数字和小数点分开识别,并改进了基于数字笔画统计特征的自适应阈值数字识别方法。试验结果表明,本识别算法的识别率能达到95%以上,且算法耗时较低,说明此算法的准确率较高、实时性较好。
字符分割;几何特征;统计特征;字符识别
LED数字显示计量设备具有可靠性高、精度高、操作简单等特点,被广泛应用于自动化生产线、加油站、水质监测、化工生产以及环境监测等领域。LED数显设备的识别技术,是实现各种数显设备互联和集成,实现管控一体化,提高智能化管理水平的关键。如自动抄表系统[1-3]就是利用网络与供电局的营业收费系统相连,实现抄表收费一体化。
字符提取和识别模块是仪表自动校正和仪表数据自动录入系统的核心。目前,字符分割方法主要有:边缘检测、背景减法、颜色聚类、笔画聚类等。字符识别方法主要是基于字符的两类特征:几何特征和统计特征,如模板匹配、机器学习、基于模糊理论的识别方法、特征向量法、穿线法等。文献[4]提出了复杂彩色背景下的文字标题识别系统,该系统是针对字符颜色单一,与背景有明显差异的情况,采用颜色聚类、直线检测和自偏移矩形窗检测相结合的方法来提取字符。文献[5]设计了一种基于手机终端的LED字符识别系统,该系统利用数字笔画与背景的差异,采用基于封闭图形的笔画聚类方法来提取目标字符,采用机器学习机制来识别字符。文献[6]设计了自动识别数字测量仪器数据系统,利用Sobel边缘检测方法提取字符整体区域,再用三重卷积分割出字符的笔画,采用基于数字笔画几何特征的穿针法来识别数字字符。文献[7]提出了用扫描线的一阶差分来扫描每一行的纹理特征,根据LED区域的纹理特征(亮暗切换的变换特征)与其他区域的特征差异来定位LED区域。文献[8]提出了HSV空间的阈值分割方法,即从H, S, V三个通道得到3个阈值后,进行3次阈值分割,试验结果显示,该方法能消除部分噪声的干扰,分割效果也有明显改善。文献[9]提出利用Sobel垂直和水平边缘检测方法来提取LED区域。
当字符与背景的差异不太明显,有阴影或者光照不均,成像设备的分辨率较低时,容易导致图像的噪声点较多,数字笔画易丢失;还有当数字字符不是垂直显示时,字符投影覆盖了小数点,这都使得字符识别率较低。针对以上问题,本文提出一种LED显示仪表的识别方法。该方法分为3个部分: LED区域分割、字符分割和字符识别,LED区域分割采用基于亮度变化的边缘检测方法,字符分割采用边缘检测和区域扫描相结合的方法,字符识别是利用字符笔画的统计特征。该识别方法能有效提高识别准确率,降低算法耗时。
2.1 LED区域分割
LED区域分割的方法主要有:阈值分割、区域生长、纹理扫描、边缘检测等。由于LED区域位于整个设备的中部,周围的背景复杂,阈值分割难以满足分割的要求,纹理扫描在时间上消耗较长,因此,本文利用基于亮度变化的边缘检测方法来分割LED区域。文献[9]所提的Sobel边缘检测算法与本文算法分割LED区域的效果对比见图1。
图1 LED区域分割效果图Fig.1 The segmenting effect of LED region
由图1可以看出,Sobel边缘检测算法只能大概地检测出LED区域的边界,而本文的方法能精确地检测出LED区域的边界,这样利于提取LED区域。从上面的检测结果中,可以得到LED矩形区域的2对横纵坐标,根据这2对坐标将LED屏幕从原图中切割出来,LED区域的提取效果如图2所示。
图2 LED区域提取图Fig.2 Region extraction of LED
2.2 字符分割
在LED区域,目标数字与背景对比比较明显,因此,该图像的灰度直方图会出现明显的双峰。但现场采集的图像噪声较大,如采用最佳阈值分割算法来提取目标字符,它的分割效果不理想,因为该算法对噪声敏感,数字笔画二值化后,会出现部分信息丢失的情况,如图3所示。针对非均匀光照的字符图像,文献[10]采用局部均值分割图像的二值化方法,该方法能降低图像处理的耗时,但其对噪声较敏感。本文将边缘检测与区域扫描方法相结合的方法对数字笔画进行二值化处理。首先,在RGB空间内对图像进行梯度计算,根据计算得到的梯度图像,初步勾画出字符的边缘;其次,选择适当的窗宽扫描相应的笔画区域,删除噪声影响下的伪笔画边缘;最后,对已确定的有效笔画区域进行填充。试验结果表明,本文方法对噪声不太敏感,且在由于阴影、光照条件较差、噪声背景干扰等原因使得笔画图像不清晰的情况下,也能获得较好的分割效果。根据二值化后的图像特征,再利用水平投影和垂直投影来分割单个字符。二值化后的图像和垂直投影图像分别见图4和5。
图3 最佳阈值分割算法Fig.3 Optimal threshold segmentation
图4 本文算法效果图Fig.4 The result diagram of the proposed algorithm
图5 垂直投影图Fig.5 Vertical projection image
由图4和5可以看出,由于LED区域的数字是倾斜显示的,导致该图像的垂直投影会出现小数点被覆盖,或者数字投影和小数点投影相连,而无明显分界点的现象,因此,小数点无法被分割出来,使数字识别结果出现错误。
由于小数点所占的像素少,容易受到噪声的干扰。因此,小数点的确定和识别需要单独处理。针对上述问题,文献[9]提出了先计算出每个字符的宽度,再通过统计各个字符的宽度和字符间的距离来确定小数点的存在和所处的位置。故本文采用文献[9]的方法将小数点分割出来。
2.3 字符识别
字符特征主要分为两类:统计特征和结构特征。
1)小数点识别
小数点的识别是利用其统计特征和结构特征。将分割出来的小数点图像分别作水平和垂直投影,根据小数点水平和垂直投影形状相同的原则,排除噪声干扰。该方法能有效地检测出小数点,且抗噪能力较好。试验结果表明,该方法拒绝识别率和错误识别率都较低,说明了基于小数点的几何特征和统计特征的投影识别方法是可行的、有效的。小数点识别效果图见图6。
图6 小数点识别图Fig.6 Recognition of decimal point
2)数字识别
LED显示的数字字符的统计特征比较明显,利用字符笔画的统计特征可以将字符有效的笔画识别出来。统计笔画采用自适应的阈值判定所检测的笔画的有效性,该计算过程简单,只有计算笔画有效区域的面积和算数运算(减法运算),因此,该方法的鲁棒性和时效性较高。结合数字的统计特征和多线程思想,数字识别算法流程见图7。图中,n0为单个字符中部区域的白色像素点个数;nl为单个字符左半区域的白色像素点个数;nr为单个字符右半区域的白色像素点个数 ;nu为单个字符上半区域的白色像素点个数;nd为单个字符下半区域的白色像素点个数;n11/2为单个字符上半区域左半区的白色像素点个数;nr1/2为单个字符上半区域右半区的白色像素点个数;nu1/2为单个字符上半区域上半区的白色像素点个数;nd1/2为单个字符上半区域下半区的白色像素点个数;T为阈值,其数值为一笔的有效笔画所含的白色像素点个数。
图7 数字识别流程图Fig.7 Number recognition flow chart
该识别系统采用VC 6.0编程实现,系统识别界面如图6所示。试验图像集来源于工业现场,由63幅LED图像组成。试验结果见表1。
图8 识别模块界面Fig.8 Recognition module interface
表1 试验结果Table1 The result of experiment
由试验结果可知,数字字符和小数点的识别率在95%以上,且拒识别率不到4%,算法运行的平均时间为1300ms,这说明算法的识别率较高,整个系统耗时也较短。
随着机器视觉和数字图像处理技术的发展,自动智能抄表设备将会成为工业生产和日常生活的常用智能设备。因此,本文提出了一种LED显示仪表的字符识别方法。试验结果表明,该系统的识别率较高,能达到95%以上,且算法耗时也有一定改善。本方法主要用于识别LED显示的数字字符,有一定局限性。下一步的研究工作是提高识别算法的鲁棒性和实时性,同时将完善多种仪表区分、识别等功能,促进智能抄表技术适应更多的使用环境,提高仪表校正和仪表数据的录入效率。
[1]Ghugardare R P,Narote S P,Mukherji P,et al. Optical Character Recognition System for Seven Segment Display Image of Measuring Instruments[C]// 2009 IEEE Region 10 Conference. [S. l.]:IEEE,2009:1-6.
[2]Algeria F C,Serra A C.Automatic Calibration of Analog and Digital Measuring Instruments Using Computer Vision [J]. IEEE Transaction on Instrumentation and Measurement,2000,49(1):94-99.
[3] 谭 义. 机器视觉的数显仪表读数研究及应用[D]. 广东:广东工业大学,2007. Tan Yi. Number Instrument Reading Research and Application Based on Machine Vision[D]. Guangdong:Guangdong University of Technology,2007.
[4]Katsuyama Y,Minagawa A,Hotta Y,et al. A Study on Caption Recognition for Multi-Color Characters on Complex Background[C]//2012 IEEE International Symposium on Multimedia. [S. l.]:IEEE,2012:401-408.
[5]Shen Huiying,Coughlan J. Reading LCD/LED Displays with a Camera Cell Phone[C]//2006 Conference on Computer Vision and Pattern Recognition Workshop. [S. l.]:IEEE,2006:1-6.
[6]Liang Chao,Yang Wenming,Liao Qingmin. An Automatic Interpretation Method for LCD Images of Digital Measuring Instruments[C]//2011 4th International Congress on Image and Signal Processing. [S. l.]:IEEE,2011:1826-1829.
[7] 荆倩倩. 电表抄表中的识别算法研究[D]. 长春:吉林大学,2011. Jing Qianqian. The Research of Recognition Algorithm for Ammeter[D]. Changchun:Jilin University,2011.
[8] 李晓东,李志强,雷晓平,等. 彩色数字仪表图像二值化技术研究[J].计算机技术与发展,2010,20(4):120-123. Li Xiaodong,Li Zhiqiang,Lei Xiaoping,et al. A Research of Thresholding Technology for Color Image of Digital Instrument[J]. Computer Technology and Development,2010,20(4):120-123.
[9] 唐轶峻,申小阳,朱雯兰,等. 基于BP神经网络的数显仪表数字字符识别系统[J].电测与仪表,2005,42(477):42-45. Tang Yijun,Shen Xiaoyang,Zhu Wenlan,et al. Recognition System for Character of Numeral Instrument Dynamic Displayed Based on BP Neural Network[J]. Electrical Measurement & Instrumentation,2005,42(477):42-45.
[10]黄莅辰,张 剑,周 游,等.基于非均匀光照下文本图像二值化改进算法[J].湖南工业大学学报,2013,27 (6):40-45. Huang Licheng, Zhang Jian, Zhou You, et al. An Improved Image and Text Binarization Algorithm Based on Non-Uniform Illumination[J]. Journal of Hunan University of Technology,2013,27(6):40-45.
(责任编辑:邓 彬)
The Method of Character Recognition Displaying on LED
Tong Wenchao,Su Xiaohua,Long Yonghong, Xiao Xiyu
(School of Electrical and Information Engineering,Hunan University of Technology,Zhuzhou Hunan 412007,China)
Aiming at LED display meter, put forward a character recognition method. Its character segmentation applied edge detection, line detection and gray projection to rapidly extract target character. It recognized number and decimal point separately and improves the self-adaptive threshold number recognition based on the statistical feature of numerical strikes. Experimental result indicates that the accuracy of the proposed recognition algorithm reaches over 95% and the time-consuming is short, which demonstrates the algorithm of high accuracy and good real-time.
character segmentation;geometrical feature;statistical characteristic;character recognition
TP273
:A
:1673-9833(2014)01-0067-04
2013-11-30
童文超(1988-),男,江西上饶人,湖南工业大学硕士生,主要研究方向为数字图像处理,机器视觉,
E-mail:tongwenchao888@163.com
10.3969/j.issn.1673-9833.2014.01.014