基于结构特征与LLE算法的数字仪表校验系统

2018-12-14 09:05包玉树黄亚龙孙军胡永建吴剑
现代电子技术 2018年24期
关键词:结构特征降维图像处理

包玉树 黄亚龙 孙军 胡永建 吴剑

关键词: 数字仪表; 校验系统; 结构特征; LLE算法; 图像处理; 降维

中图分类号: TN873+.5?34; TP391                 文献标识码: A                 文章编号: 1004?373X(2018)24?0010?04

A digital meter calibration system based on structural features and LLE algorithm

BAO Yushu1,2, HUANG Yalong2, SUN Jun3, HU Yongjian2, WU Jian2

(1. School of Electrical Engineering, Southeast University, Nanjing 211189, China; 2. Jiangsu Frontier Electric Technology Co., Ltd., Nanjing 211102, China;

3. Wuhan Pandian Science & Technology Incorporated Company, Wuhan 430100, China)

Abstract: Since there exist errors in manual reading data during digital meter calibration, a digital meter calibration method based on the combination of multi?features and local linear embedding (LLE) algorithm is proposed. The character images are converted from RGB to HSI color space. Image segmentation is conducted in the I space. The single character is segmented by using the projection method. The structural features of character images are extracted. As the simple structural features cannot sufficiently describe the characters, the recognition accuracy is low. Therefore, the LLE algorithm is used in this paper to reduce the dimensionality of character binary images. The pixel features after dimensionality reduction and structural features are combined. The support vector machine (SVM) is used to recognize the character features. The experimental results show that the proposed method can improve the character recognition rate of the calibration system.

Keywords: digital meter; calibration system; structural feature; LLE algorithm; image processing; dimensionality reduction

0  引  言

儀表是进行测量和监视的计量设备,在使用过程中,由于各种因素的影响,导致测量误差增大,因此在使用过程中需要定期校验[1]。在校验过程中,由于仪表字符刷新频率高、人眼辨别能力和易疲劳等因素的影响,不能实时同步准确地读取并记录标准仪表与待测仪表读数。基于机器视觉的自动校验方法能够对仪表快速刷新的数字进行自动识别,记录并对比待测仪表与标准仪表的读数,从而达到仪表校验的目的[2]。仪表字符识别可以分为图像采集、字符图像分割和字符识别等过程[3]。在字符分割的研究中,研究者大多对字符图像进行形态学变换后,利用阈值分割直接对字符图像完成二值化处理[4?6]。刘丹等对二值化图像利用投影的方法进行字符区域的定位和单个字符的分割[4];该方法只是分割7位数码管,背景相对简单。洪涛等将图像经过中值滤波降噪后,采用阈值分割对字符图像进行二值化处理,并在二值化前对图像进行图像增强,弱化背景的同时突出字符信息[5]。在字符识别的研究中,刘自立等采用模板匹配法对分割后的仪表字符进行识别,达到了良好的识别效果[7];Gunasekaran M等利用BP神经网络对文字与字符进行识别,识别效果良好,但BP神经网络需要大量字符样本训练网络,不适合小样本的仪表字符训练[8];李智成等对字符提取改进的结构特征,然后利用K近邻分类器识别字符,K近邻算法在识别时需要反复计算测试字符与训练字符特征的距离,大量重复的计算降低了识别速度[9];KO D G等人利用深度学习算法识别字符,得到了较高的识别率,但同样需要大量样本进行训练学习[10]。本文提出在亮度空间对字符图像进行阈值分割,提高了字符图像的质量。在特征提取部分,文中利用LLE算法对字符二值图像降维,将降维后的像素特征与结构特征结合起来,并使用SVM对字符样本分类。实验结果表明,本文方法有助于提高字符样本的识别率。

1  字符图像分割

正确有效的字符图像分割是字符识别的重要基础。本文首先将原始字符图像二值化,然后从二值化的字符图像中提取出单个的字符。

1.1  字符图像二值化

仪表字符由屏幕发光显示,在对字符进行阈值分割时,目标区域即为亮度较高的区域。色彩模型HSI中的I向量为亮度空间,因此,在进行阈值分割之前将采集到的彩色字符图像从RGB色彩空间转换到HSI。在亮度空间向量I进行OTSU阈值分割得到字符的二值图像。分割结果如图1所示。由于复杂背景的影响,对灰度图像直接进行阈值分割时,字符图像模糊不清。对亮度空间I进行阈值分割时,能够分割出字符,经过形态学膨胀操作后字符清晰可见。因此,在I向量对仪表图像进行阈值分割时,能够有效提高分割效果,减少复杂背景的影响,从而提高字符识别率。

1.2  字符图像分割

二值化有效避免了字符粘连的情况,故在二值化图像的基础上,可以直接利用投影分割法对字符图像进行分割。字符图像的水平投影直方图如图2所示,利用水平投影分割后的字符图如图3a)所示;求图3a)的垂直投影直方图,如图4所示,利用垂直投影可以从字符图像中分割出单个字符,分割结果如图3b)所示。

2  字符特征提取

目前常用的字符特征有结构特征、粗网格特征以及笔划密度等特征[11],这些特征用来对字符做粗分类效果较好,当样本增加时,识别率会降低。为了有效提高仪表校验中字符识别率,本文提出一种结构特征与LLE算法结合的字符识别算法,具体流程如图5所示。

2.1  字符结构特征提取

本文将分割后的字符图像尺寸归一化到64×64,然后提取出字符图像的外围特征与穿透特征[12]。

2.1.1  外围特征

外围特征描述的是字符图像的外轮廓特征,其表示从图像边缘到第一个白像素点以及第二个白像素点的距离,即为像素数,具体步骤为:

1) 利用n条均分扫描线从二值化后的图像左边缘开始扫描;

2) 计算每一条扫描线从图像左边缘黑色像素点到第一次由黑变白的长度,得到一组一次外围特征F1i(i=1,2,…,n);

3) 再计算每一条扫描线从图像左边缘至第二次由黑变白的长度,得到一组二次外围特征F2i(i=1,2,…,n);

4) 重复上述步骤,可以得到右、上、下另外三个方向的外围特征。

以5条扫描线为例,即当n=5时,如图6和图7所示。一次外围特征维数为4×5=20维,二次外围特征维数为4×5=20维。

2.1.2  穿透特征

穿透特征描述的是字符笔划特征,其表示的是从图像的边缘开始,计算像素点由黑变白跳变的次数,具体步骤为:

1) 利用n条均分扫描线从二值化后的图像左边缘开始扫描;

2) 记录每一条扫描线上从图像左边缘出发,像素点由黑变白的跳变次数,即可得到一个n维的特征向量Ci(i=1,2,…,n);

3) 重复上述步骤,得到右、上、下另外三个方向的穿透特征。

同样以5条扫描线为例,如图8所示。此时,穿透特征为4×5=20维。

2.2  降维像素特征

针对结构特征对字符描述不够充分的问题,本文引入LLE降维算法。算法原理是将高维数据通过核函数映射低纬度空间,利用重构的局部对称性保持原始数据整体结构[13]。算法计算过程如下:

1) 将二维字符图像轉换成一列向量xi,N个字符组成的D维数据X,计算每个点与其他点的欧氏距离:

[dij=m=1D(xim-xjm)2]

从距离矩阵中为每个点xi选择离其距离最近的K个点组成近邻集合[Xki={xi1,xi2,…,xiK}]。

2) 每个点xi由K个近邻点对其进行线性表示:

[xi=j=1nwijxj]

式中:权重[wij]表示第j个样本点对第i个在重构的贡献值;且若xj不属于xi邻域时wij=0;若xj属于xi邻域时wij≠0。

3) 通过其近邻点重构每个样本局部几何形状。重构误差函数为所有数据点的距离和其重构之间距离的平方:

[εW=i=1nxi-j=1Kwijxj2]

式中:K表示邻近点个数;xj表示xi的第j个邻近点;权值矩阵W由wij构成,且其约束为[j=1kwij=1]。

4) 权重矩阵Wn×n是一个n×n的稀疏矩阵,定义对称矩阵M,M=(I-W)T(I-W)。

5) 求稀疏对称矩阵M的d+1个特征值。按升序排列,舍去第1个特征值,其余特征值对应的特征向量即为低维输出Y,d为降维后特征维度,将Y作为字符的低维特征进行识别。

利用LLE算法将64×64维的字符像素特征降低到50维。经过测试,得出当近邻点个数K=40时,特征识别率最高。

3  仪表校验系统设计

本系统针对各种类型的数字仪表进行校对,主要分为三部分:字符图像采集、字符识别和识别结果对比与误差分析。

系统包括两个工业CCD相机、电脑和校验软件,硬件系统如图9所示。相机用于标准表与被测表的图像采集,传输到计算机并对图像进行滤波等预处理,再通过图像分割与字符分割将图像分割成单个字符。然后输入到训练好的字符分类器模型,对字符进行识别。最后,将识别结果保存到数据报表中。软件界面见图10。

4  结果与分析

本文使用8条扫描线分别提取字符的一次、二次外围特征共64维,穿透特征32维以及经过LLE降维的字符像素特征50维,并将这些特征进行融合组成综合特征共146维。最后,采用LibSVM对字符进行识别。SVM类型选择C?SVC,核函数为径向基(RBF)。其主要参数惩罚因子C=8,核参数γ=0.015 6。

分别计算几种特征的识别率、特征提取时间和识别时间,实验结果如表1所示。结构特征的识别率为93.61%。而经LLE降维后的像素特征,识别率为89.37%,均不能满足仪表校验对精度的要求。将两者融合得到的综合特征对字符进行识别时,识别率得到有效提升,达到了98.56%,有效提高了仪表校验精度。同时,融合特征的提取与识别时间无明显增加,不影响仪表识别系统的准确性。

5  结  语

为了改善字符分割效果,本文在HSI中的亮度空间I进行OSTU阈值分割,最后使用投影法对二值图像进行字符分割;在字符识别的研究中,提取字符结构特征,并使用LLE算法对字符像素特征降维,将字符结构特征与降维纹理特征结合,以减少字符误识率;最后,使用LibSVM分类器训练得到的模型对特征进行识别。实验结果表明,本文提出的字符识别算法有效地降低了字符的误识率。同时,特征融合后的识别时间无明显增加,在数字仪表校验系统中具有良好的实用性。

参考文献

[1] 臧景茹,杨晓琰,刘晶.数字仪表自动校验系统开发[J].华北电力技术,2006(2):34?37.

ZANG Jingru, YANG Xiaoyan, LIU Jing. Development of automatic calibration system for digital meter [J]. North China electric power, 2006(2): 34?37.

[2] 郭爽.数码管数字仪表自动识别方法的研究[J].通信技术,2012,45(8):91?93.

GUO Shuang. Study on automatic identification method of digital tube [J]. Communications technology, 2012, 45(8): 91?93.

[3] 张海波,段会川,张曙光,等.一种数字仪表显示值快速识别方法[J].计算机工程与应用,2005,41(4):223?226.

ZHANG Haibo, DUAN Huichuan, ZHANG Shuguang, et al. A rapid recognition approach for the display value of digital meters [J]. Computer engineering and applications, 2005, 41(4): 223?226.

[4] 刘丹,穆林丽,余晓锷.一种七段数码管式医用仪表的自动识别方法[J].科学技术与工程,2010,10(16):4037?4039.

LIU Dan, MU Linli, YU Xiaoe. A new method of medical digital meter′s computer automatic reading [J]. Science technology and engineering, 2010, 10(16): 4037?4039.

[5] 洪涛,梁伟建,卢玉凤.标牌粘连字符自适应定位分割重建与识别[J].中国图象图形学报,2014,19(6):886?895.

HONG Tao, LIANG Weijian, LU Yufeng. Merged characters segmentation reconstruction and recognition of labels based on adaptive location [J]. Journal of image and graphics, 2014, 19(6): 886?895.

[6] 申小阳,唐轶峻,姜柏军,等.仪表的数字字符识别系统[J].仪表技术与传感器,2005(6):55?57.

SHEN Xiaoyang, TANG Yijun, JIANG Bojun, et al. Numeral characters recognition system of instrument [J]. Instrument technique and sensor, 2005(6): 55?57.

[7] 刘自立,周洪,余力,等.基于投影矩阵法的仪表字符实时识别系统[J].仪表技术与传感器,2008(8):98?100.

LIU Zili, ZHOU Hong, YU Li, et al. Real?time instrument character recognition system based on projective matrix method [J]. Instrument technique and sensor, 2008(8): 98?100.

[8] GUNASEKARAN M, GANESHMOORTHY S. OCR recognition system using feed forward and back propagation neural network [J]. SSRN electronic journal, 2013(10): 52?60.

[9] 李智成,李文婷,梅术正,等.基于机器视觉的高压计量数显表自动校对系统[J].电测与仪表,2017,54(20):105?109.

LI Zhicheng, LI Wenting, MEI Shuzheng, et al. Automatic calibration system of high voltage measuring digital display instrument based on machine vision [J]. Electrical measurement & instrumentation, 2017, 54(20): 105?109.

[10] KO D G, SONG S H, KANG K M, et al. Convolutional neural networks for character?level classification [J]. IEEE transactions on smart processing & computing, 2017, 6(1): 53?59.

[11] 杨芳,李红睿,田学东.基于RBF神经网络的汉字粗分类方法[J].计算机工程与应用,2009,45(6):170?172.

YANG Fang, LI Hongrui, TIAN Xuedong. Coarse classification scheme for Chinese character based on RBF neural network [J]. Computer engineering and applications, 2009, 45(6): 170?172.

[12] 张好好,吴游,于睿,等.一种基于压缩感知的数字图像水印算法[J].现代电子技术,2014,37(22):10?13.

ZHANG Haohao, WU You, YU Rui, et al. A digital image watermark algorithm based on compressive perception [J]. Modern electronics technique, 2014, 37(22): 10?13.

[13] 丁娇,梁栋,阎庆.基于D?LLE算法的多特征植物叶片图像识别方法[J].计算机工程与应用,2015,51(9):158?163.

DING Jiao, LIANG Dong, YAN Qing. Recognition method of multi?feature plant leaves based on D?LLE algorithm [J]. Computer engineering and applications, 2015, 51(9): 158?163.

猜你喜欢
结构特征降维图像处理
混动成为降维打击的实力 东风风神皓极
降维打击
基于图像处理的机器人精确抓取的设计与实现
机器学习在图像处理中的应用
结构特征的交互作用对注塑齿轮翘曲变形的影响
特殊环境下双驼峰的肺组织结构特征
基于图像处理的定位器坡度计算
2012年冬季南海西北部营养盐分布及结构特征
抛物化Navier-Stokes方程的降维仿真模型
基于特征联合和偏最小二乘降维的手势识别