基于PHOG特征的电路图中电气符号识别

2017-02-09 09:14侯晓荣
舰船电子工程 2017年1期
关键词:电路图直方图符号

肖 豆 侯晓荣

(电子科技大学能源科学与工程学院 成都 610054)

基于PHOG特征的电路图中电气符号识别

肖 豆 侯晓荣

(电子科技大学能源科学与工程学院 成都 610054)

针对电气符号的大小、图纸背景的模糊、电气符号的旋转角度等各种干扰因素对计算机识别电气图纸造成的误差问题,提出一种基于提取塔式梯度方向直方图(Pyramid Histogram of Oriented Gradients,PHOG)特征的电气符号识别方法。首先运用直方图分析和形态学处理的方法,分割出电路图中的电气符号。其次建立电气符号训练集,提取电气符号图像的PHOG特征。最后使用这些PHOG特征和分类信息对支持向量机进行训练,利用支持向量机进行识别。结果显示PHOG算法对电气符号具有较高的识别率,与已有的一些方法比较,识别效果更好。

电气符号; 形态学; PHOG特征; 支持向量机

Class Number TN60

1 引言

在实际应用中,工程师和建筑师经常会使用不同的图形符号来描述电路、机械零件、建筑等。这些图纸往往需要转换为电子形式用于进行有效的存储、检索和传输以及更新,并结合和生成新的图纸。对于存储和检索,矢量化是非常重要的一步。对于CAD/CAM系统生成图形,矢量化也是一个预处理步骤。所以电路图的识别,在许多实际应用中是必不可少的。

正因为在实际应用中的重要性,所以许多研究者[1~3]对此进行了许多研究。然而,到目前为止还没有一种有效的方法用于电气图纸的图形符号分割。因为符号的正确分割对于电路图的进一步处理包括识别是非常重要的,所以在这里不需要进一步阐述电子元件的符号分割的重要性。对文档中的电路图进行图形符号的分割和检测,并对分割出的电气符号提取塔式梯度方向直方图特征,运用支持向量机(Support Vector Machine,SVM)进行分类,实现了对电路图中的电气符号的识别。

2 系统描述

首先使用形态学运算的分割方法用来提取电路图中的电气符号。对于结构元素和阈值的选取,是基于图形组件空间形状的统计分析得到的。其次,对电气符号提取PHOG特征。最后,结合支持向量机训练分类器实现对电气符号的识别。电路图识别流程图如图1所示。

图1 电路图识别流程图

3 电路图的自动识别过程描述

3.1 图像二值化,去噪和字符去除

对输入图片的二值化采用大津算法(Otsu)[4]。其次,对于图片中噪音去除,如果图中某些组件的面积小于8个像素,就被认为是噪音并被去除。

在电路图中,字符和图形都存在,所以为了对电气符号进行合理的分割,对电路图中的字符进行去除是必要的。在文献[5]中提出了基于纹理的方法对文本进行提取,此方法利用普通文本的纹理不同于图形的纹理,并运用高斯滤波器进行文本提取。Tombre[6]提出运用连通域分析方法从文档图片中分割出文本和图形。在文献[7]中提出了运用全局阈值的方法从文档图片中去除文本。在这里,对电路图中的字符去除,使用[8]中所提出的文本分割方法进行文本去除。此方法通过把一些面积较小的不连通的元件组成一个整体,从而检测出小的图形元件。

图2 文本去除

3.2 电气符号的提取

3.2.1 水平线和垂直线的检测

对于水平线和垂直线的提取,采用文献[9]中提到的方法。通过采取从上到下,从左到右的扫描方式对图片进行扫描,来计算图片上笔画的宽度。而为了能够减少计算损失,采用10个像素的步长对图片进行扫描。对于每一条扫描线的长度,通过计算两个连续的白到黑、黑到白的转折点之间的距离而得到。与此同时,距离的直方图也可以得到。把直方图顶点的值当作直线宽度(w)。

使用形态学中的开运算得到水平或垂直线段,其中结构元素的选取采用如式(1)所示。LEN的选取为5w,DEG角度为0°或90°。得到的水平和垂直线段如图3所示。

SE=strel(′line′,LEN,DEG)

(1)

图3 水平和垂直线段

3.2.2 电气符号的提取

把文本去除图片I和H-space、V-space进行相减,所得到的图片保存在T-space(图4(a))中。由于一些电气符号是由水平和垂直线段组成,所以线段的去除可能会删除这些符号的某些部分。在图4(b)中,电源和放大器的某些部分被去除。因为这些线段的去除可能会把电气符号分成几个部分,所以对图片T-space采用闭运算来进行修复。其中结构元素SE的选取,使用一个平坦的圆形结构元素(disk),半径R的大小大于1/2×w。

在图片T-space中,一些内部空间较大的电气符号比其他符号面积大,所以很容易被分割出来。对于T-space中的每一个大的电气符号,如果在H/V space 里的任意条直线线段对应于这个大的电气符号,就认为是这个电气符号的一部分。现在,经过修复后,再把图片上的连接点去除掉。因为这些连接点比电气符号小,所以很容易去除。最后,通过分割的电气符号和图片(I)之间的与运算,得到了分割后的电气符号,如图4(e)所示。

图4 电气符号分割的结果

3.3 PHOG特征的提取

PHOG特征最初由Bosch等提出,是在HOG特征基础上的一种改进,其加入了空间尺度信息,在不同层次上统计边缘图像的梯度方向直方图分布情况,具有较强的形状描述能力,在场景分类、人脸表情识别以及图像检索等领域已广泛应用。电气符号的PHOG特征的具体提取算法如下:

1) 利用Canny算子提取图像的边缘信息,之后的PHOG特征将会在这些边缘处提取;

2) 将图像分层,第一层(记为L=0)为整幅图像,第二层(记为L=1)是将整幅图像(第一层)进行四均分,第三层(记为L=2)是将第二层中的每一块子区域进行四均分,依此类推;

3) 分层计算HOG特征,在每一层中,统计各块区域在K个方向上的梯度直方图特征并串联构成图像在该层下的特征;

4) 将图像在每一层下的HOG特征进行串联合并,构成最终的PHOG特征。

3.4 PHOG+SVM分类器判别

在提取PHOG特征以后,使用LIBSVM工具箱[11]来进行SVM分类。支持向量机(SVM)是一种基于结构风险最小化准则的学习方法,根据所采用核函数的不同,可分为“线性SVM”和“非线性SVM”,这两种SVM在处理不同的数据上,有着各自的优势。其核心思想是找到最优分类面,此分类面要使两类样本正确分开,而且分类间距最大。在进行SVM分类训练中,采用直方图交叉核(Histogram Intersection Kernel)进行分类。直方图交叉核又称Pyramid Match Kernel,该直方图交叉核是一种基于隐式对应关系的内核函数,解决了无序、可变长度的矢量集合的判别分类的问题。这个内核的基本思想是将特征集映射到多分辨率超平面中去,然后对这些超面进行比较。比较时采用一种加权的超面交集的比较方法,从而粗略的估计出特征集之间最好的局部匹配的相似度。

4 实验及结果分析

本研究根据上述算法利用Matlab编程,从电路图中分割出电气符号,并对电气符号进行识别。在实验中选取8种不同的电气符号,分别记为A,B,C,D,E,F,G,H,如图5所示。对于PHOG特征参数的选取,采用4层结构,并且K=8,所以算法的PHOG特征维数是680维。

图5 选取的8种电气符号

实验采用SVM作为识别工具,在学习过程中,对实验选取的同种电气符号,都选取50幅图像作为训练集,其中50幅图像中包括不同大小,不同旋转角度和异常(模糊背景)的电气符号图片。而对于测试集,选取40幅图像进行分类识别,实验结果如表1所示。为体现算法的优越性,将SIFT算法、HOG算法分别对实验选取的电气符号进行识别比较,得到的识别结果如表2所示。

表1 电气符号混合识别结果

实验结果表明,正常和异常的同种电气符号混合的平均准确率为93.75%。表明PHOG的识别方法,对符号形态的适应能力较强,基本克服了环境因素对识别的影响,使其对总体识别效果的影响不明显。而SIFT算法、HOG算法与PHOG算法比较结果显示,使用PHOG算法识别电气符号,其识别率要更加准确。

表2 SIFT算法、HOG算法与PHOG算法比较结果

5 结语

通过使用形态学运算的分割方法成功把电气符号从电路图中分割出来,并选取了常见的电气符号进行了识别。实验表明,PHOG特征能较好地用于电气符号识别问题,对符号的大小、旋转的适应能力比较强。所采用的SVM训练方法,对不同状态下的电气符号识别效果较为理想。文中,只对少数的电气符号组成的电路图进行了识别,在以后的工作中,将进一步识别由很多电气符号组成的电路图。

[1] Liao Shizhong, Duan Menghua. Sketch recognition via string kernel[C]//Natural Computation (ICNC), 2012 Eighth International Conference on. IEEE,2012:101-105.

[2] Alvarado C, Kearney A, Keizur A, et al. LogiSketch: A Free-Sketch Digital Circuit Design and Simulation System LogiSketch[M]. The Impact of Pen and Touch Technology on Education. Springer International Publishing,2015:83-90.

[3] Gul N, Tora H. Recognition of Hand-Sketched digital logic gates[C]//Signal Processing and Communications Applications Conference. IEEE,2015:1921-1924.

[4] Otsu N. A threshold selection method from gray-level histogram[J]. IEEE Transactions on Systems, Man, and Cybernetics,1979:62-66.

[5] Jain A K, Bhattacharjee S. Text segmentation using gabor filters for automatic document processing[J]. Machine Vision & Applications,1992,5(3):169-184.

[6] Tombre K, Tabbone S, Pélissier L, et al. Text/Graphics Separation Revisited[C]//International Workshop on Document Analysis Systems V. Springer-Verlag,2002:200-211.

[7] Sridar S, Subramanian K. Circuit recognition using netlist[C]//IEEE Second International Conference on Image Information Processing,2013:550-557.

[8] Chowdhury S P, Mandal S, Das A K, et al. Segmentation of Text and Graphics from Document Images[C]//Document Analysis and Recognition, 2007. ICDAR 2007. Ninth International Conference on. IEEE,2007:619-623.

[9] De P, Mandal S, Das A, et al. Detection of electrical circuit elements from documents images[J]. Proceedings of SPIE - The International Society for Optical Engineering,2015,9402:94020O-94020O-11.

[10] Bosch A, Zisserman A, Munoz X. Representing shape with a spatial pyramid kernel[C]//ACM International Conference on Image and Video Retrieval. ACM,2007:401-408.

Electrical Symbol Recognition in Circuit Diagram Based on PHOG Feature

XIAO Dou HOU Xiaorong

(School of Energy Science and Engineering, University of Electronic Science and Technology of China, Chengdu 610054)

According to the size of the symbol, electrical drawings, electrical background fuzzy symbols such as rotation of various interference factors on the computer recognition error caused by electrical drawings, a histogram extraction tower is presented based on gradient direction (Pyramid Histogram of Oriented Gradients, PHOG) electrical characteristics of symbol recognition method. Firstly, the method of histogram analysis and morphological processing is used to segment the electrical symbols in the circuit diagram. Secondly, it sets up the electrical symbol training set, and then extracts the PHOG features of the electrical symbol image. Finally, these PHOG features and classification information are used on the support vector machine training, it uses support vector machines to identify these symbols. The results show that the PHOG algorithm has a high recognition rate for electrical symbols, and the recognition effect is better than the existing methods.

electrical component, morphology, PHOG characteristic values, SVM

2016年7月12日,

2016年8月29日

肖豆,女,硕士研究生,研究方向:电气工程。侯晓荣,男,教授,博士生导师,研究方向:控制理论。

TN60

10.3969/j.issn.1672-9730.2017.01.023

猜你喜欢
电路图直方图符号
符合差分隐私的流数据统计直方图发布
“且”的真与假
学符号,比多少
基于FPGA的直方图均衡图像增强算法设计及实现
“+”“-”符号的由来
比亚迪E6纯电动汽车系统结构原理(四)
用直方图控制画面影调
2017款凯迪拉克2.8L/3.0L/3.2L/3.6L车型低电平参考电压总线电路图
中考频数分布直方图题型展示
东风雪铁龙C5各电控系统电路图解析(九)——ESP电控系统上篇