基于Faster R-CNN 的非侵入式负荷识别方法

2022-06-07 01:20杨金成王永超费守江
分布式能源 2022年2期
关键词:户用特征提取负荷

杨金成 ,王永超 ,费守江 ,张 伟 ,曾 婧 ,李 娜

(1.国网新疆电力有限公司营销服务中心(资金集约中心、计量中心),新疆维吾尔自治区 乌鲁木齐市 830000;2.大连理工大学电气工程学院,辽宁省 大连市 116024)

0 引言

在电网互联化、信息化、智能化的发展背景下,精确的负荷设备识别对于电力系统规划、电力调度以及实现节能减排都具有重要意义。随着电动汽车、电采暖等新型负荷设备的接入,电力系统对负荷设备识别的精度提出了更高要求[1]。但目前非入侵式负荷设备识别存在着识别准确率低、且从户用智能电表采集到的数据样本偏小的问题[2-3],因此如何利用小样本数据精准识别负荷设备是本文要解决的重点。

近年来,一些电力市场化和电力系统智能化程度较高的国家开展了大量的非入侵式负荷识别研究。如美国、巴西等国家对负荷模式提取技术以及实际系统应用的研究都有了初步的进展[4];马来西亚国家电力公司也开展了负荷模式识别的研究,并在大用户用电稽查方面进行了应用[5]。而我国对电力系统数据挖掘的研究还有待实质性的提高,虽然一些高等院校和相关科研机构在电力用户负荷模式提取方面有一些进展,但距离成熟的商业应用还相差甚远。因此,根据我国国情,研究和开发成熟的电力用户负荷模式识别系统仍是一个具有挑战性的问题。在负荷识别方面,目前采用的主要方法有:谱聚类算法[6]、瞬时特征量法[7]、相量测量单元(phasor measurement unit,PMU)实测小扰动数据法[8]等,但是这些方法都有一定的局限性,如识别率较低、信息利用度不够等问题。瞬时特征量法采用的识别量较少,因而数据采集处理的工作量较少,但其识别准确率相较其他方法较低[9];谱聚类算法在粗选、细选的分布识别过程可以逐步缩小识别范围提高识别准确率,但带来的是前期庞大的负荷聚类工作。传统的Faster R-卷积神经网络(convolutional neural networks,CNN)算法在针对图像的目标识别的准确率为73.5%,准确率较低[10]。针对以上各类识别方法的局限性,本文采用深度学习中具有超强学习力并能够用少量样本数据实现特征提取的Faster R-CNN 算法,将其结构中的目标检测模型特征提取网络VGG16替换为Inception V2网络,并增大模型输入图像的尺寸,针对非入侵式户用负荷进行识别。

1 基于Faster R-CNN 的负荷识别总体思路

基于Faster R-CNN 的非侵入式负荷识别流程如图1所示。首先,对采集到的负荷特征数据进行预处理,其中包括小波分解去噪处理与数据归一化处理。其次,对传统的Faster R-CNN 进行改进,增大模型输入图像尺寸,以及替换模型特征提取网络VGG16为Inception V2网络。最后,建立非入侵式典型负荷的识别模板,运用改进后的Faster R-CNN网络对负荷识别模板进行特征提取,之后将负荷数据的电压 电流轨迹特征进行识别分析得到结果。

图1 负荷识别流程图Fig.1 Load identification flow chart

2 负荷特征的数据预处理

2.1 小波分解去噪处理

小波变换实质是保留主要信号的小波系数,将原始信号通过小波分解,抑制或过滤高分辨率的噪声部分,保留低分辨率的部分,进而重构原始信号。小波分解去噪流程如图2所示。

图2 小波分解去噪流程图Fig.2 Wavelet decomposition denoising flow chart

以某时刻的负荷数据作为信号样本,首先,根据其特征,选用相应的小波基:若信号较光滑,则选光滑连续的小波基,若信号线性性质较强,则选取线性小波基[11];然后确定小波分解的分解层数j;对所给的含噪信号g(k)进行分解,得到一组小波系数ωj,k。

接下来对小波系数进行阈值处理。其中对于分段的每层小波,首先确定每层小波的阈值,然后对小波系数进行软阈值函数处理,得到估计系数。如式(1)所示,当小波系数ωj,k的绝对值大于阈值T时,估计小波系数的绝对值为|ωj,k|-T,符号保持不变;当小波系数ωj,k的绝对值小于或者等于阈值T 时,估计小波系数为0,即

2.2 归一化处理

负荷识别算法能够更快地计算各个特征量之间的距离,降低由于负荷特征量级造成的精度损失误差,加快算法的收敛速度,因此须对重构后的信号(k)进行归一化处理,将所有特征量归一化到(0,1)区间,第i个特征xi的归一化的值为

3 基于改进的Faster R-CNN 的典型负荷识别模型

3.1 Faster R-CNN 算法

Faster R-CNN 作为单阶段目标检测算法,一方面,对小尺寸目标具有较好的检测效果,尤其能够基于少量样本数据实现对目标的检测[12-13];另一方面,具有比其他多阶段目标检测算法更快的检测速度。

如图3所示,Faster R-CNN 目标检测算法在结构上主要由4部分组成,即:特征提取网络、区域建议网络、区域特征图生成网络、分类与回归检测网络[14]。传统的Faster R-CNN 目标检测算法采用VGG16网络作为特征提取网络,用于实现对输入照片进行特征提取。其特征提取过程为:首先,将VGG16的全连接层fc6、fc7转换成卷积层,并添加额外层extra对VGG16提取到的特征进行进一步提取;然后,将提取得到的特征图,输入到区域建议网络中,计算得出存在需要识别的目标区域作为感兴趣区域;最后,在特征图上的感兴趣区域通过ROI pooling生成感兴趣区域特征图,进行分类与回归预测[15]。

图3 Faster R-CNN 结构示意Fig.3 Faster R-CNN structure diagram

在传统的Faster R-CNN 目标检测算法中,其结构中起到关键性识别作用的是区域建议网络。区域建议网络是一个全卷积网络,极大地提升了感兴趣区域生成的速度[16-18]。区域建议网络详细结构如图4所示,分为2个分支。第一个分支通过softmax对检测框进行分类,判断是目标还是背景;第二个分支计算检测框的偏移量。最终综合正反例概率与检测框偏移量,获得包含目标的精确检测框。由区域建议网络计算得到含有目标的精确检测框后,就可以在特征图上找到与精确检测框对应的含有目标的位置,也就是感兴趣区域。但感兴趣区域大小并不统一,不能直接进行分类与回归[19]。为此需要将感兴趣区域输入ROI pooling中统一大小,然后进行分类与回归。

图4 区域建议网络结构示意图Fig.4 Schematic diagram of region proposal network structure

3.2 改进的Faste r R-CNN 负荷特征识别算法

在采集的户用电表典型负荷特征数据生成的电压-电流轨迹曲线中,可了解到负荷特征曲线在细节处图像特征不够明显,且图像尺寸较小。如图5所示。

图5 户用电表典型负荷特征数据生成的电压 电流轨迹曲线Fig.5 Voltage-current trajectory curve generated by typical load characteristic data of household electricity meter

针对户用电表典型负荷特征的数据特点,提出一种改进Faster R-CNN 的负荷特征识别算法,即:

(1) 增大模型输入图像尺寸。在采集的电表负荷特征数据中,原图大小为560像素×420像素,但识别模板的像素水平平均较低。使用原Faster RCNN 模型的输入尺寸800像素×600像素,就需要对原图进行缩小,因此待识别的特征负荷图像便会同步缩小三分之一,故丢失了更多的负荷图像曲线的细节,导致网络难以对小目标进行有效学习。因此在原图基础上,考虑将负荷图像长边下采样到800像素或短边下采样到600 像素,代替原始Faster R-CNN 中长边560像素或短边420像素,增大训练图像尺寸,保留更多负荷图像曲线的细节,提高对小目标图像细节的识别效果。

(2) 替换模型特征提取网络。用于学习的模板图像中曲线变化尺寸较小,宽高之比较为固定,而实际图像曲线变化尺寸较大,宽高比多变。差异较大的图像曲线变化尺寸会对模型的识别造成极大的干扰。为解决该问题,将Faster R-CNN 目标检测模型特征提取网络VGG16替换为Inception V2网络,以满足对不同尺度的负荷特征图像曲线的特征提取。

不同于其他卷积神经网络在加深网络深度方向发展,Inception网络拓宽了网络的宽度。Inception网络在宽度方向使用不同大小的卷积核进行特征提取,可以同时提取不同尺度的特征。其结构原理图如图6所示。

图6 Inception网络结构原理图Fig.6 Inception network structure schematic diagram

改进后的Faster R-CNN 负荷特征识别算法模型结构如图7所示,由4部分组成:第一部分为Inception V2网络,第二部分是区域建议网络,第三部分为区域特征图生成网络ROI pooling,第四部分是分类与回归检测网络。采用Inception V2网络作为特征提取网络,用于实现对输入图像进行特征提取,然后将提取得到的特征图,输入到第二部分区域建议网络中,计算得出存在需要识别的目标区域,作为感兴趣区域;在特征图上的感兴趣区域,通过ROI pooling生成感兴趣区域特征图,然后进行分类与回归预测。

图7 改进的Faster R-CNN 结构Fig.7 Improved Faster R-CNN structure

4 算例分析

4.1 负荷辨识数据集

下载的Plaid数据集包含了美国某家庭一周时间的负荷数据,数据分为A 相和B相。每相上连接了不同的负荷。已知采样频率为12 MHz,每个周期采样200次,因此获得的电压 电流特征为1×100的序列。由于该数据集中缺少B相的电压数据,因此本文仅在A 相上进行试验。

根据数据集中负荷种类,寻找对应的电流与无功电压数据,获得每种负荷的特征量,产生新的数据集。将得到的新的数据集分成用于识别网络的训练集、测试集与验证集。

数据集是用于负载识别的公开数据集,最初版本包含了11种负载类别,200多个不同设备的稳态运行的电压 电流采样值。该数据集不断被其他研究人员扩充,现已有16种负载类别,1 876条负载数据,采样频率达到30 MHz。每周期500个采样值。但该数据集中包含了许多设备待机状态下的采样数据,其视在功率大多小于0.1 W,在实际工况下,1 W 以内的负荷投切事件很难被捕捉到。将该数据集中的实验数据经过筛选后,得到数据如表1所示。

表1 数据集整理Table 1 Data set collation

表1所示共计11种负荷,1 631条数据,将其划分训练集、测试集与验证集。通过前文介绍的数据处理方法将数据处理为识别网络可用的形式。

4.2 建立非入侵式典型负荷识别模板

首先将每一种负荷独立运行时的电流波形图作为输入,对卷积神经网络模型进行训练,实验涉及几种常见的家用典型负荷,包括空调、荧光灯、电风扇、冰箱等。

将图片输入网络后,经过第一次卷积运算后得到提取的特征图。图8所示的户用典型负荷独立运行可视化图像即为待训练的非入侵式典型负荷识别模板。

图8 户用典型负荷独立运行可视化图像Fig.8 User with typical load independent operation visualization image

4.3 Faster R-CNN 算法验证

配准好的户用典型负荷图像按照6∶2∶2的比例作为数据集,并划分训练集、测试集和验证集,利用其中心点特征信息的同时,也利用中心点周围的像素点信息。

将负载电流分解为有源和非有源正交分量,建立负荷电压-无功电流曲线,将其作为显著的电器特征。采用负荷的电压、电流和负荷电压-无功电流轨迹信息,生成了精度更高、尺寸更小的电器图像特征,作为Faster R-CNN 的特征数据。实验结果表明:采用基于负荷电压-无功电流的Faster R-CNN人工神经网络,可以显著区分不同种电器。如图9所示为户用典型负荷独立运行可视化图像的识别结果图。

图9 户用典型负荷独立运行可视化图像识别结果图Fig.9 Visual Image recognition result graph for independent operation with typical load of users

为了避免过度拟合,使模型具有广泛的适用性,在训练了深度学习模型后,采用10 折交叉验证[20]。在K 折叠交叉验证中,原始数据集被随机划分为K 个大小相等的子集。保留K 个子集中的一个子集作为测试模型的验证数据,剩余的K-1子集用作训练数据。然后,交叉验证过程重复K次,每K 个子集使用一次作为验证数据。最后对10次交叉验证的结果的正确率的平均值作为对算法精度的估计。

由图10可见,对于非线性负载(如白炽灯、洗衣机等)的识别效果达到了预期的效果,但对于线性负载(如电风扇、吹风机等)的识别准确率不算太高。数据集中的加热器等负荷由于状态单一,因此识别效果较其他线性负荷表现优异。

图10 数据集识别结果图Fig.10 Dataset recognition result graph

将传统CNN、改进前与改进后的Faster RCNN 得到的识别准确率结果进行对比如表2所示,根据文献[21]可知,采用灰度电压 电流轨迹作为负荷特征,并使用自定义的CNN 进行负荷识别。这种方法虽然将电压、电流数据进行可视化,但图像色调单一,未考虑颜色维度,且文献[17]的网络结构比较简单,最终导致识别准确率不高。改进后的Faster R-CNN 在数据标准化的过程虽然缩小了同类负荷间的差异,同时也缩小了相似负荷特征负荷间的差异。因此经过多次实验,测试集在经过识别后的准确率可达80%。

表2 改进后的方法与传统方法的对比Table 2 Comparison of the improved method with the traditional method

5 结论

本文提出了由改进的Faster R-CNN 提取电压-电流序列特征后连接全链接层实现对负荷特征的识别,该方法在传统的Faster R-CNN 目标检测算法基础上,增大了模型输入图像尺寸以提高对小目标缺陷的检测效果,替换模型特征提取网络VGG16为Inception V2网络,以满足对不同尺度的负荷特征图像曲线的特征提取。

在Plaid数据集上验证本文的识别方法,再用传统的负荷识别方法结果与未改进的Faster RCNN 进行识别的结果进行对比。在Plaid数据集上的识别网络仅有1.3万个参数的情况下,改进后的Faster R-CNN 对负荷的识别准确率可达80%。

通过数据验证,该方法显著减小了数据处理、识别网络的计算量,使识别的准确率与召回率均有提升,证明了改进后的Faster R-CNN 有效。

猜你喜欢
户用特征提取负荷
人造革合成革拉伸负荷测量不确定度评定
3项标准中维持热负荷要求对比分析
户用光伏从“微不足道”到“举足轻重”
Opening flexible resources by integrating energy systems: A review of flexibility for the modern power system
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
基于Daubechies(dbN)的飞行器音频特征提取
观察:户用光伏岔路口
起底浙江户用光伏