曾庆祝,李新海,尹雁和,夏曼,廖伟全,梁景明
(广东电网有限责任公司中山供电局,广东 中山 528401)
在电力系统中,对于继电保护压板的巡检大多数采用的是人工巡检,即一个人读取压板数据,一个人校对数据库压板的信息,该方式花费时间多,依靠人工读取,并且容易出现误投、误退的情况。一旦继电保护压板误投或误退,可能导致保护误动或者拒动,引发严重的电网事故,对电网运行造成威胁[1]。
为了防止对继电保护压板的误操作,目前主要采用的方式是严格规范操作流程、使用颜色标识、人工智能图像识别技术等[2]。其中图像识别技术由于识别速度快、识别效果好、使用方便等优点,受到众多学者的重视[3-5]。
本文结合以往的一些研究,一种利用深度可分离卷积网络实现继电保护压板识别的方法。该方法首先基于TensorFlow机器学习平台创建深度可分离卷积网络;然后,对采集的压板图像进行标注,形成数据集,并对网络进行训练,得到图像识别模型;最后,使用TensorFlow Lite对模型进行转换和优化,并将其应用于嵌入式系统。该方法在嵌入式设备上应用时,没有延迟、离线情况发生,满足变电站工作人员使用手持嵌入式设备完成继电保护压板状态的核对任务要求,具有广泛应用价值。
卷积神经网络是一种带有卷积结构的深度神经网络,它的本质是一个共享权重的多层复合函数[9]。经典传统卷积神经网络有 LeNet、AlexNet、VGGNet、GoogleNet、ResNet等。 该类网络模型均已被应用于多种场景下,并且都经受了考验,获取不错的效果。但是这些模型为了追求高准确率,网络模型存在深度和复杂度越来越大,模型过于庞大的缺点。由于嵌入式设备资源有限,传统卷积网络模型在嵌入式设备上运行会出现设备内存不足、响应慢甚至无法使用等问题。以MobileNet为代表的深度可分离卷积网络的优势在于更小的体积、更少的计算量、更高的准确率和更快的速度[10-11]。
深度可分解是一种可分解卷积操作,它可以拆分为两个更小的操作:深度卷积和点阵卷积。对于标准卷积,其卷积核是用在所有的输入通道上,而深度卷积针对每个输入通道采用不同的卷积核,就是说一个卷积核对应一个输入通道,所以说深度卷积是depth级别的操作。而点阵卷积其实就是普通的卷积,只不过采用的是1×1的卷积核,如图1所示。
图1 深度级可分离卷积原理图
图3中的参数Dk表示的是卷积核,M表示的是通道数,N表示的是卷积核的个数,Dh表示的是输入图片的大小。深度卷积的计算量为a=Dk∗Dk∗M∗1∗Dh∗Dh;点卷积的计算量为b=1∗1∗M∗N∗Dh∗Dh。深度可分解的卷积计算总量为a+b。深度可分解卷积的计算量如式(1)所示。
如果深度可分离卷积网络使用了3∗3的卷积,那么深度可分离卷积网络相比标准卷积可降低大约九倍的计算量。对于深度可分解卷积,其一开始采用深度卷积对不同的输入通道分别进行卷积,然后采用点阵卷积将第一步的输出再进行结合,这样的操作与使用一个标准卷积的效果相差并不大,但是前者会大大减少计算量和模型参数量,从而达到提升网络运算速度的目的,使得该模型可适用于移动设备或者嵌入式设备中。
本文采用MobileNet作为研究工具,该网络为深度可分离的卷积的典型网络。该网络模型可有效减少网络参数,平衡准确率与延迟度之间关系。MobileNet网络结构设计,如表1所示。
表1 MobileNet网络结构设计
如表1所示,首先是一个3×3的标准卷积,然后就是堆积深度分离卷积,并且其中的部分深度卷积会通过步长等于2进行下采样;然后采用平均池化将feature变成1×1,根据预测类别大小加上全连接层,最后是一个softmax层。如果单独计算深度卷积和点阵卷积,整个网络有28层(Avg Pool和Softmax不计算在内)。整个网络的参数和计算量分布如图表1所示,可以看到整个计算量基本集中在1×1卷积上,因此MobileNet的计算量和参数量较其他网络具有绝对的优势。
本文研究的实验收集了广东某供电局所辖变电站继电保护压板图像作为原始实验数据。数据集的制作流程如图2所示。
图2 数据制作流程
(1)压板图像增强处理,将原始实验数据图片做数据增强处理,主要是通过平移、缩放、随机遮挡、颜色色差、锐化、噪声干扰、亮度调整等操作增加数据样本的数量,因为对于一个卷积神经网络即使图像数据样本只是有微小的改变,卷积神经网络也会把数据样本视为不同的图像,如图3所示为进行数据增强处理后的图像。
图3 图像数据增强对比效果
(2)压板图像分辨率标准化处理,把采集的压板图像标准化处理为统一大小和分辨率,数据样本图像大小为512∗512。
(3)压板图像标注,对数据进行人工标注,使用矩形框将压板及其标签圈出。
本文模型训练环境为基于Windows 10系统下的Python3.7和TensorFlow1.4机器学习平台。模型训练流程分为数据集划分、数据集文件转换和训练参数配置。
(1)在数据集划分
将图像数据集随机划分80%训练集、10%验证集和10%测试集。
(2)数据集文件转换
将标注数据集的XML文件转换为CSV文件,使用脚本把上述的标记后得到的XML文件转换成CSV文件,CSV文件内容包括有:图像名称、图像所属数据集、图像长度宽度、标记类型、标记的位置坐标,CSV文件部分内容如表2所示。
表2 CSV文件内容
(3)训练参数配置
表3 训练参数配置
模型训练采用逐渐预热(增加)学习率到0.8,然后再基于余弦不断衰减学习率,如图4(a)所示。网络结构经过50000次训练,损失函数曲线图,如图4(b)所示。
图4 模型训练分析
由图4分析可得,损失函数是衡量真实值与模型预测值不一样的程度,它是一个非负的实值函数,当损失函数越小,则模型的鲁棒性越好。在训练的过程中,虽然损失函数有波动,但是随训练的次数深入,损失函数越来越小。因此模型随着训练次数的增加,模型的预测是越趋向真实值。
本文使用基于linux的android系统作为嵌入式系统平台,通过TensorFlow Lite工具对2训练所得模型进行优化和改进,使其转换为适合在Android系统上运行的模型格式。TensorFlow Lite的工作流程,如图5所示。
图5 TensorFlow Lite的工作流程
(1)模型选择,选择2所述训练的模型。
(2)模型量化,本文分别对TensorFlow Lite提供的动态范围量化、全整数量化(Full integer quantization)、Float16量化做了对比实验,效果如表4所示。
表4 量化比较
由表4分析可得,本文所述优化模型采用动态范围量化方法,减小模型大小,实现模型运行的加速和精度的保持,使其适用于嵌入式设备。
(3)模型转换,本文采用 TensorFlow转换器(converter)对模型进行转换,转换后的格式为Flat-Buffers模型文件格式。
(4)模型优化,通过TensorFlow Model Optimization Toolkit对2所述训练所得模型进行优化,使得模型尺寸缩小、运行内存空间变小、低延迟,响应快,功耗低、对精度影响低。
(5)模型部署,通过应用程序将压板图像识别模型部署到移动端或嵌入式设备,使用TensorFlow Lite解释器在设备上运行。
经过上述的步骤后,在嵌入式设备上识别测试集数据效果如图6所示。图中绿色矩形为压板闭合,蓝色矩形为压板备用,红色为压板打开。
图6 压板识别效果图
文章提出一种利用深度可分离卷积网络实现继电保护压板识别的方法。首先,基于TensorFlow机器学习平台创建深度可分离卷积网络;然后,对采集的压板图像进行标注,形成数据集,并对网络进行训练,得到图像识别模型;最后,使用TensorFlow Lite对模型进行转换和优化,并将其应用于嵌入式系统。试验结果表明,深度可分离卷积网络在嵌入式系统上运行性能和识别速度达到预期效果,压板开合状态识别正确率达100%。
本方法具有使用硬件资源少、识别压板状态准确率高等优点,并且还可应用到多个场景,尤其是移动APP和嵌入式设备,能够极大地提高工作人员的工作效率,解决了以往人工核对压板过程中可能出现的问题,有效地减少工作人员的核对工作量。具有广泛应用价值。