闫乐乐, 余宏杰
(安徽科技学院 机械工程学院,安徽 凤阳 233100)
远距离输电的主要方式是高压、超高压,保障输电线路安全运行,关系到下游千万人民的安居乐业[1]。目前输电线路巡检方式主要是人工巡检,但在偏远地区,人工巡检并不能及时巡查到故障点,那么巡检机器人应用到输电线路上,将会给巡检工作带来巨大便捷。巡检机器人在线路上工作时,对不同的金具采取不同的越障方式,那么金具的识别检测将会对巡检机器人[2]越障带来指导。同时,金具发生故障时,巡检机器人也会识别金具种类,可为后续工作人员更换设备带来指导,保证输电线路发生障碍时,及时排查故障,从而保证电力系统的安全稳定,减少因为大面积停电带来的重大经济损失[3]。因而针对输电线路金具识别检测有极大的经济实用价值。
目前,机器学习对金具的识别检测主要是从特征提取[4]方面着手。针对图像预处理阶段的改进研究相对来说较少,肖志云等[5]对输电线路金具检测研究主要是采用特征融合技术,将颜色特征与纹理特征相融合,进行识别检测,比单独进行颜色特征与纹理特征检测精确度提高10%以上。戴玉静等[6]针对金具表面腐蚀现象,将颜色特征和纹理特征相融合,识别腐蚀金具的正确率为93.10%。胡彩石等[7]利用传感器检测识别障碍物,对图像进行处理后,利用图像基元加以约束,实现障碍物的检测识别,该方法优势在于实现方式简单,但缺点也很明显,准确率不高。
本研究提出IHOG-SVM方法,即在图像预处理阶段提出改进办法与梯度方向直方图特征提取IHOG(Image preprocessing improved histogram of oriented gradients)和SVM(Support vector machine)相结合的输电线路金具识别的方法。通过灰度化处理、图像滤波、边缘检测[8]等3项预处理方法改进原有的图像特征提取办法,能够有效降低图像的噪声,提高图像的清晰度,使得提取出金具的信息能够更好地反应金具自身的特征。此外,SVM分类算法对于提取更好的数据集特征[9-10]具有更好的分类能力。为了更加有效地识别金具种类,增加金具的识别准确率,达到准确识别的效果,本研究将IHOG特征提取和SVM分类进行结合,以达到更好的分类效果。
金具特征提取前,需要对数据集图像进行预处理,去除噪声等因素对金具识别带来的影响。本研究采用灰度化处理将数据集的彩色图像转化为灰度图像[11],再用图像滤波技术对图像进行预处理。预处理后图像清晰度显著提高,噪声因素影响也降低了。图像预处理流程如图1所示。
图1 图像预处理流程Fig.1 Image preprocessing process
1.1.1 灰度化处理 彩色图像一般由三通道R/G/B组成[12],当3个通道值相等时,图像就由彩色转化成一种灰度颜色,此值称作灰度值。本研究采用MATLAB软件实现图像的灰度化转化。灰度图像对比彩色图像有如下几点优势:(1)RGB三通道值相等,可以降低运算时间,同时运算量也极大减少。(2)保持彩色图像的色素变化特征。图像灰度化处理方式有最大值法、平均值法、加权平均法(表1)。人眼在观察外部事物时,对于绿色的敏感度最高,对蓝色敏感最低,因此,在灰度化处理阶段采用权重进行处理效果最优[12],因此,本研究采用加权平均值法对RGB进行处理,能够得到较为合理的灰度图像。本研究采用的公式为:
表1 图像灰度化处理方式Table 1 Image graying processing methods
Gray(i,j)=0.299R(i,j)+0.587G(i,j)+0.114B(i,j)
(1)
其中,Gray(i,j)为像素点(i,j)变化之后的灰度值,取值范围在[0,255]。前面的系数分别表示在像素点(i,j)的权重值[13-14]。
1.1.2 图像滤波 金具分类检测过程中噪声的干扰会影响其检测效果。图像预处理阶段使用合适的滤波方法可以有效去除噪声带来的干扰,同时也能够获得更多图像细节部分,有利于后续实验进行。本研究采用中值滤波进行滤波处理。中值滤波是非线性信号处理技术,当图像中某点出现噪声干扰时,该点的像素值比周围像素值高,中值滤波原理就是将数字图像中任一点的值,用该点邻域范围内各个点的中值代替,使得噪声污染处的像素值接近真实值,进而消除噪声对图像带来的干扰。中值滤波能够有效消除噪声的同时,保护该图像的边缘处信息,使得图像边缘信息能够被很好地保留。
HOG算法是把复杂的图像信息简化处理的过程,所以只包括图像的最基本信息,能够更加准确的识别图像的边缘。将一张图片分为很多个模块分别得到梯度信息和方向信息,最后汇总在一起。表2是图像中列举的某一点领域信息。图2是计算一张图片特征值的示意图。
表2 图片局部信息Table 2 Local information of pictures
图2 检测窗口Fig.2 Detection window
本研究给出了像素值是64×128的图片具体算法,检测窗口横向是8个小格,纵向是16个小格,共计8×16=128小格,每个小格代表1个cell:像素值是8×8,通过直方图处理后变成1×9的向量,即维度为9。block有36个数据(维度为36)滑动步长(横竖都为8):横向滑动7次,纵向15次,共计105次,每个block有36个数据,共计3 780维度。具体特征提取流程见图3。
图3 HOG算法流程Fig.3 Flow of HOG algorithm
支持向量机(Support Vector Machines,SVM)是将数据映射到高维度的空间[15],并在这个空间内找到并建立一个最大间隔的超平面,将训练集中的正负样本分开,保证正负样本在超平面之间的距离最大,这样分类误差就越小。并且SVM在解决很复杂的分类问题时候,只需要小样本进行训练[16-18],即可有效分类,符合机器学习要求,并且相比较神经网络,支持向量机具有很好的泛化能力。
SVM寻找最优平面的具体原理:分别用三角形和圆形表示代表需要分类的两类数据,即在高维空间寻找1个最优超平面划分两类数据。最优超平面:全部待分类样本点距离分割线最近,2个分割线距离最远,这个平面称为最优超平面。
图4表示最优超平面在二维空间的情况,这时它是一条直线,在三维空间内,最优超平面表示的就是一个面。以两类待分类数据为例,SVM就是在N维数据空间内寻找一个超平面,能够有效将数据分成两类。
图4 SVM算法分类图Fig.4 SVM algorithm classification diagram
超平面方程具体表达式为:
(2)
待分类样本能有效分开,相对应的约束条件为:
数据集:(x1,y1)、(x2,y2)…(xn,yn)
Y为样本类别:
当X为正样本时:
(3)
当X为负样本时:
(4)
合并式(3)、(4),得到
(5)
当待分类样本满足等号成立时,图4中线上的样本点就是支持向量机上的支持向量点,称为“支持向量”。
空间上任意一点到最优超平面距离为:
(6)
那么最优超平面的寻找就可以转化为数学上求解d的最大值问题,公式进一步优化得到:
(7)
由数学公式推导可知,d的最大值问题可以转化为求解‖W‖的最小值问题,引入拉格朗日乘子法在约束条件式(5)的情况下得到:
(8)
其中,ai是拉格朗日乘子,ai≥0
对W求偏导:
(9)
对b求偏导:
(10)
将式(9)、(10)代入式(8)可得:
(11)
式(11)中的函数只有ai一个变量。假设最优解为a0,b0表示分类阈值,即可得到最优分类函数:
(12)
所得分类函数(12),可以对二维空间的样本进行有效分类。在二维空间难以分类的线性不可分数据,可以将这个分类函数往高维空间映射即可。
本研究是将特征提取方法HOG进行改进,提取图像特征信息输入到SVM进行分类。整体试验流程见图5。
图5 金具识别工作流程Fig.5 Process of hardware identification
试验采集的金具数据集有2种样本包括耐张线夹、绝缘子。500个样本,训练集400个样本,280个绝缘子,120个耐张线夹。测试集100个样本,70个绝缘子,30个耐张线夹。其中规定绝缘子为正样本,耐张线夹为负样本。
本研究给出其中1张耐张线夹,给出预处理阶段结果,如图6所示。采集到的图像是彩色图像,试验第一步进行灰度化处理,得到灰度化结果图6(b)。
图6 预处理各个阶段图片Fig.6 Preprocessing pictures of various stages
灰度化处理过程中,参数系数的选取:0.30R、0.59G、0.11B。
试验第二步为检测中值滤波效果,对灰度化处理后的图像加入高斯和脉冲噪声干扰后分别加入中值滤波、领域均值滤波、加权平均滤波后得到结果图(d)、(e)、(f),对比结果可以发现中值滤波效果更好。
将预处理后的图像进行HOG特征提取,图7给出了HOG特征提取的特征图像和三维网格图,通过HOG特征提取的维度具体计算方法,cell设置是8×8大小,block是由相邻4个cell组成。使用的图片像素是64×128,得到维度值是3 780维。
先使用训练集训练出所需模型,然后使用测试集进行试验。为区别本方法的优势,使用2种试验方法进行对比:(1)HOG算法进行特征提取;(2)改进HOG算法进行特征提取,分别使用相同的待试验数据集进行试验,对比试验流程如图8所示。
图8 对比试验流程图Fig.8 Flow chart of comparism experiment
本研究预测样本中正样本(绝缘子)70个,负样本(耐张线夹)30个,表3给出了不加预处理和预处理HOG特征提取后分类的结果,可知,加入图像预处理后的准确率是96%,未加图像预处理的实验准确率是81%,但这只能表示两类数据中正样本(绝缘子)被分开的可能性很大,存在负样本(耐张线夹)被误分的情况,所以引入了召回率和精准率,召回率和精准率预处理以后的结果优于未处理之前的情况,二者的调和平均数(f)预处理以后的值都优于未处理的值。综合数据来看,在HOG特征提取之前加入图像预处理,该方法对于正负样本有着很好的区分,整体优于未加入图像预处理的方法。
表3 HOG-SVM和IHOG-SVM直接分类结果Table 3 Direct classification results of HOG-SVM and IHOG-SVM
本研究用相同的训练集和测试集,分别采用IHOG-SVM和HOG-SVM方法进行对比,IHOG-SVM在图像预处理阶段加入了灰度化和中值滤波技术,去除图像本身噪声对分类结果产生的影响,得到的准确率相比较未进行图像预处理有所提高,为输电线路金具识别检测实际应用提供了一种方法。
本研究的改进点只是在HOG特征提取之前作出一定方法研究,并未对HOG算法本身和HOG特征提取之后的算法作出改进,因此后期将对HOG算法本身和特征提取之后做相关研究。此外,SVM分类器自身参数调整将是未来研究重点。