基于机器视觉与动作识别的变电站智能安监管控技术研究

2023-08-19 09:59翁凌雯谢乾武胡东升
电子设计工程 2023年16期
关键词:池化时域卷积

翁凌雯,王 栋,潘 丹,谢乾武,胡东升

(1.国网福建信通公司,福建 福州 350013;2.安徽南瑞继远电网技术有限公司,安徽 合肥 230601)

电力生产包括发电、变电、输电及配电四个环节,其中变电是电网中连接发电与输电的重要枢纽,变电站安全、稳定地运行对于电力生产、经济发展与社会稳定均具有重要的意义。所以在电网公司的日常工作中,变电站的巡视、变电设备的维护及检修是保障其安全运行的重要手段[1-3]。随着智能电网建设进程的加快,变电站的运行维护面临着严峻的挑战,作业人员的资格准入、典型违章行为的及时发现及重要电力设施的状态监测均需运维人员的实时跟踪和全流程监管,而传统依靠人力的运维模式已无法满足电力生产的需求。因此,借助视频系统实现变电站的智能安全监控迫在眉睫[4-9]。

现阶段,变电站中已建立了较为完善的视频监控系统,视频探头逐渐成为了保卫变电站安全生产环境的有效手段,且部分变电站已实现了摄像头的无死角覆盖。但目前的变电站视频系统仍局限于监视的阶段,无法及时识别视频中的危险信息,并实现对全流程智能化的安全监管。基于上述分析,该文基于机器视觉与动作识别技术针对变电站的智能安全监管问题展开研究,通过引入深度学习算法(Deep Learning,DL),完成了视频信息的特征提取,进而实现了对危险行为的快速判别。

1 理论基础

1.1 机器视觉算法

卷积神经网络(Convolutional Neural Network,CNN)是机器视觉领域中常用的识别算法[10-13],其包括卷积、池化和全连接这三种运算。而以Two-Stream CNN 为代表的传统CNN 网络能够将动作分解成“空间+时间”的“物理量+动作量”组合,且分别从空间通道、时域通道进行学习,并以此获得良好的动作识别效果。但随着视频信息的引入,该种结构的CNN 网络忽略了空间通道及时域通道间的关联,从而影响了其在视频信息处理中的应用。因此,该文充分考虑到动作的三维特性,将Two-Stream CNN的时域通道扩展为局部时域和全局时域,并提出了一种三通道的卷积网络结构。该算法的基本流程如图1 所示。

图1 三通道卷积网络算法流程

由图可知,文中所使用的三通道神经网络从空间、局部时域及全局时域进行动作序列的特征提取,从而完成动作识别。

空间通道的输入是静态图像,对于此种图像的处理主要包括卷积与池化两种运算。二者是CNN网络中的基础运算,其中卷积运算的原理如下:

其中,f(x,y)是静态图像的特征,h(k,l)是卷积所使用的卷积核。图2 给出了卷积运算的示意图。

图2 卷积运算原理示意图

池化是一种将原始图像的特征值进行降采样的运算,其能够有效避免深度学习网络训练过程中的维度爆炸现象。常用的池化方法有最大值池化、最小值池化及均值池化。文中使用的是均值池化,其基本原理如图3 所示。

图3 池化运算原理

在局部时域通道中,使用图像的光流特征作为CNN 网络的输入,其提取方法如下[14-16]。

首先保留图像在RGB 颜色空间内的所有成像值E,并在该图像空间内按照颜色、梯度及速度三个维度建立如式(2)所示的约束方程:

式中,I1、I2是图像序列的邻域,、分别是图像像素点的成像值和光流值,u和v是图像横纵两个方向的速度,Ψ为图像的核函数。接着,在式(2)上引入方向梯度直方图(Histogram of Oriented Gradient,HOG)特征约束:

其中,δ和ρ是调节函数。在对全局时域通道空间进行特征处理时,采用亮度值的时间差分值作为CNN 网络的输入。记图像在像素点(x,y)的亮度值为I,则其差分结果D为:

接着,可得到全局时域特征:

如此便可得到三通道卷积网络在3 个卷积通道内的特征构造方法,而各个特征均需进行如图2-3所示的卷积、池化操作。此外,对于CNN 网络中的每个神经元,还需定义非线性激活函数。由于网络结构复杂,为避免算法在参数估计时出现梯度消失的现象,该文选择ReLU 函数作为激励函数:

1.2 算法的参数估计

在完成三通道CNN 网络的特征提取后,需对网络参数加以训练。采用误差反向传播算法(Back Proragation,BP)进行网络的参数估计,首先定义网络在训练时所使用的代价函数:

其中,h为隐藏层函数,θ表征模型的集合参数,其迭代更新的方法如下:

计算J(θ)的偏导数:

此时,可得到模型在第j次迭代后的参数集合:

在进行样本迭代的过程中,式(11)实现了批量样本的梯度下降,但由于该文使用的样本集规模庞大,容易使训练陷入局部最优。因此,在训练过程中基于部分样本(Mini-Batch),从规模为m的全体样本集中选择规模为n的Mini-Batch,以避免训练的过拟合。此时,式(8)可改进为:

根据式(8)-(11)的方法,能够得到CNN 网络中W、b的迭代更新方法:

2 方法实现

2.1 实验设计

为验证所提算法的有效性,首先在开放数据集上对算法在动作识别方面的精度进行验证。然后基于实际的变电站生产数据,验证算法在实际生产环境下的智能安全监控效果。文中所使用的开放数据集为UCF101,该数据集的相关信息如表1 第2 列所示。使用开放数据集的优势为便于和现有动作识别算法进行对比。此外,表1 第3 列还给出了该文自行采集的变电站内实际场景下的视频数据集。这些数据集包含了电力生产环境下的危险动作类别,如未佩戴安全帽、跨越危险区等10 种违规告警。

表1 数据集信息

结合数据集的规模,在3 个通道内均使用表2 所示CNN 网络,该网络包括5 个卷积层、3 个池化层及两个全连接层。且网络输出层神经元的个数与数据集中动作类别的个数一致。

表2 CNN网络结构

表3 算法仿真环境

表4 网络的训练参数

仿真所使用的硬件环境参数及网络训练时使用的训练参数,如表3-4 所示。

2.2 实验结果

如上文所述,该文提出的三通道CNN 网络先在UCF101上验证其分类性能,再应用于变电站的生产数据集中。算法在UCF101上的识别效果如表5所示。

表5 UCF上的仿真结果

从表5 的识别结果看,当将三通道CNN 网络中的3 个通道分别作为CNN 网络的特征提取通道时,算法的平均识别率在80%左右。其中,局部时域所在的通道平均识别率较高;当使用现有的Two-Stream 算法进行动作识别时,识别率较单通道方法具有显著提升,且提高了5%以上;而当使用该文提出的三通道识别算法时,算法的识别精度可达到88.38%,较双通道算法提升了3.09%。这证明了通道数增加后,特征并未产生冗余,故第3 个特征通道的引入仍对算法识别率的提升产生了积极作用。

随后,该文在实际的电力生产环境下进行了仿真实验。图4 给出了算法在对于未佩戴安全帽这一电力生产违规行为的识别效果。经过对大量识别结果的统计,文中所提算法的识别精度为93.45%,而Two-Stream CNN 算法的识别精度为88.28%,因此识别精度提升了5.17%。综合来看,算法在电力生产环境下的识别效果较UCF101 具有显著提升。这主要是由于UCF101 的样本中动作类别较多,且部分动作较为接近而导致的。

图4 算法在电力生产环境下的识别效果

3 结束语

文中设计了一种三通道卷积神经网络结构,通过在开放数据集和实际电力生产数据集上的仿真,验证了该算法可有效提升变电站生产中对于危险行为的识别精度。该算法增加了视频信号中的时空域关联,并对机器视觉领域中的空域、时域信号的融合处理提供了新的思路。在未来,随着智能电网建设进程的推进,变电站的安全智能监控技术将成为服务变电站运维的重要手段,且更广泛地应用于电力生产中。

猜你喜欢
池化时域卷积
基于Sobel算子的池化算法设计
卷积神经网络中的自适应加权池化
设施蔬菜病害识别中的CNN池化选择
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于卷积神经网络和池化算法的表情识别研究
基于时域信号的三电平逆变器复合故障诊断
基于傅里叶域卷积表示的目标跟踪算法
基于极大似然准则与滚动时域估计的自适应UKF算法
基于时域逆滤波的宽带脉冲声生成技术