基于图转换和迁移学习的低压配电网户变关系和相位识别方法

2024-03-28 02:11:28罗醒华龙经纬徐超群赖国清杨慧敏
浙江电力 2024年3期
关键词:低压配电电表台区

欧 锋,罗醒华,龙经纬,徐超群,赖国清,杨慧敏

(1. 广东电网有限责任公司云浮供电局,广东 云浮 527300;2. 东南大学,南京 210096)

0 引言

随着我国经济水平的提升,电力事业快速发展,大众对电力的需求逐年增长,但是与电源和输电网络的建设相比,因为受到传统模式的限制,配电网的发展水平还是略逊一筹。配电网面临着更加频繁的变化,例如新建变电站、新建线路、新增用户负荷时常发生,大量开关与刀闸开合状态的改变导致电力装置的连接关系存在不确定性,一些地区仍存在供电卡断、重设备过载等问题[1];大部分设备的智能化程度不高,导致停电检修时出现故障和停电,扩大了停电范围,同时,智能数据采集能力仍然较弱,人工依赖程度较高,导致数据准确性下降;农村电网薄弱,设备利用率低、设备陈旧、损耗高、农村“低电压”等问题依然存在[2-3]。总而言之,配电网的拓扑结构越来越复杂,识别难度越来越高,配电网的安全稳定有效运行面临前所未有的挑战[4]。因此,研究一种准确率更高的低压配电网户变关系和相位识别的方法对于应对日益复杂的拓扑结构和减少电力公司的经济损失具有重要的实际意义。

国内外学者针对低压配电网的拓扑结构开展了大量研究工作,较为普遍的低压配电网户变关系和相位识别方法主要包括信号注入法和数据分析法两大类。信号注入法是分析设备对注入电力线的电压或电流特征信号的响应实现拓扑识别[5-7]。文献[8]通过对多路拓扑识别信号的收发和解析,考虑波形畸变,进口台区拓扑识别。文献[9]以电能表特征电流信号作为信号发送端,接收端采用DFT(滑动离散傅里叶变换)解码,通过对比确定户变关系和所属相位。文献[10]将线性回归和马尔科夫蒙特卡罗抽样模型相结合,集成电力载波通信数据与短时测量数据,以监控和识别低压网络拓扑变化。信号注入法识别准确率相对较高,但大多需要增加具备载波通信功能的设备,成本高、运维困难且容易受到强磁场等噪声源的干扰[11-12]。

数据分析法基于数据处理技术,依据量测数据间的关联关系挖掘拓扑模型,包括一维时间序列的聚类方法和使用深度学习进行数据挖掘的算法等[13-14]。随着智能电网建设的不断推进,AMI(高级量测体系)在配电网中配置越来越多,为拓扑识别提供了有效的数据支持[15],基于AMI 量测数据的配电网拓扑识别技术是目前的研究热点[16-17]。文献[18]为了纠正配电网拓扑的地理信息系统表示中的连通性错误,利用智能电表间隔测量,通过电压分布分析识别相邻电表,比较电压幅值预测客户的上游和下游关系。文献[19]利用Tanimoto 相似系数计算各组配电变压器、分支箱、装箱和智能电表之间的相关性和不相关性,从而实现低压配电网的拓扑识别。文献[20]将一维卷积神经网络与长短时记忆单元结合,构建混合神经网络模型CNN-LSTM,利用台区与终端用户数据进行户变关系识别。数据分析法对数据的完整性要求较高,在数据缺失的情况下识别准确率没有保障,目前数据分析法大多聚焦于用电数据的一维时间序列,由于用电数据不充足导致深度学习相关研究较少。

据此,本文提出了一种基于图转换和迁移学习的低压配电网户变关系和相位识别方法。首先将AMI获取的96点日电压数据进行基于格拉姆角和场的图转换,作为模型的输入;然后,基于迁移学习使用源域预训练的参数权重构建新的神经网络,以降低网络对目标域数据量的需求,提高网络精度;最后,通过实验对比分析低压配电网户变关系和相位识别的准确率和稳定性,验证了该方案的有效性。

1 基于格拉姆角场的用电数据图转换方法

近年来,受计算机视觉监督和非监督学习的启发,考虑将时间序列编码为图像的问题,以允许机器“视觉地”识别、分类、学习结构和模式。不少学者提出了将一维时间序列进行图转换的方法,借助计算机视觉技术来提升时间序列分类的效果[21-23],该方法本质上就是利用多像素通道表征样本差异性,从而更好地获取时间序列的深层特征。文献[21]提出了GASF/GADF(格拉姆角和/差分场)和MTF(马尔可夫转移场)两种时序图转换方法来重新编码时间序列数据,然后再使用卷积神经网络提取图像特征进行分类。文献[24]使用RP(递归图)揭示时间序列的内部结构,给出有关相似性、信息量和预测性的评估,根据序列数据的相空间变换信息补充特征,达到更好的分类效果。

为了同时保留用电数据的幅值相关性和时序依赖性,本文使用的将时间序列编码为图像的框架是GASF(格拉姆角和场),其中使用极坐标系统而不是典型的笛卡尔坐标来表示时间序列。以下给出基于格拉姆角和场的用电数据图转换的具体步骤。

1)针对长度为n的日用电时间序列X={x1,x2,…,xn}(本文实验为AMI 提供的96 点日电压数据),使用最小-最大定标器进行缩放,将X里的值归一化到[-1,1]的区间里:

式中:xi为i点电压数据,i=1,2,…,n。

2)将时间序列X 转换为极坐标表示,其中将时间序列中的值编码为角度余弦,将时间戳编码为半径:

式中:φ为时间序列中的值转化后的角度;r为极坐标半径;ti为时间戳;N为规范极坐标系跨度的常数。

这种用极坐标系表示的方法是一种理解时间序列比较新颖的方法,随着时间的增加,相应的值在跨度圆上不同角度之间发生扭曲。这种编码首先是双射的,当φ∈[0,π]时,cosφ是单调的,在给定一个时间序列的情况下,目标图像只有一个并且极坐标系中也只有一个结果具有唯一的逆映射;其次,这种编码方法与笛卡尔坐标相反,能够通过r坐标保留绝对的时间关系,即保持时间的依赖性[25]。

3)将重新缩放的时间序列转换为极坐标系统后,通过考虑每个点之间的三角和,利用角度来识别不同时间间隔内的时间相关性。格拉姆角场包括GASF 和GADF(格拉姆角差分场),本文主要用GASF定义如下:

基于AMI获取的96点日电压数据,包括变压器三相数据、同一台区用户数据、不同台区用户数据。为了更直观地展示图转换前后差别,选择同一台区下的电表1和电表2以及不同台区下的电表3,分别展示了3个电表A相电压的一维用电数据时间序列曲线及其对应的二维图像,如图1所示。

表1 MobileNetV1网络结构Table 1 Structure diagram of MobileNetV1

表2 模型参数设置Table 2 Parameter settings of the model

表3 各模型户变关系识别实验对比Table 3 Comparison of household-transformer relationship recognition experiments across various models

图1 日电压时间序列的GASF图转换Fig.1 The time-series plot of daily voltage transformed by GASF

从图1可知,基于GASF的图转换方法很好地保持了时间的依赖性,随着时间从左上角往右下角移动而增加,且通过方向相对于时间间隔k的叠加表示相对相关性,而主对角线G(i,i)是k=0时的特殊情况,其中包含了原始的值和角度。结果表明,一维用电数据时间序列曲线中的差异性在二维图像中表现得更加明显,同一台区用户GASF 图像的相似性大于不同台区用户,相同相位台变侧和用户侧GASF 图像的相似性大于不同相位。

2 基于迁移学习和卷积神经网络的低压配电网户变及相位识别模型

实际情况中电网用户数据稀缺、获取途径有限、样本数量较少,没有足够多的数据样本进行深度学习模型的训练,达不到较好的精度。针对这一问题,本文提出基于图转换和迁移学习的低压配电网户变关系和相位识别方法GASF-TLM。

2.1 基于MobileNetV1的迁移学习

MobileNetV1 模型是Google 针对手机等嵌入式设备提出的一种轻量级的深层神经网络,核心是深度可分离卷积块。深度可分离卷积块由深度可分离卷积和1×1 普通卷积组成,将标准卷积拆分为两个操作:深度卷积和逐点卷积[26]。深度可分离卷积的卷积核大小一般是3×3,对输入的特征层的每一个通道单独进行卷积,输入通道数和输出通道数一样,功能是进行特征提取,而1×1的普通卷积能够完成通道数的调整。深度可分离卷积如图2所示。

图2 深度可分离卷积示意图Fig.2 Diagram of depthwise separable convolution

MobileNetV1的网络结构如表1所示,网络由28层构成(不包括平均池化层和全连接层,且把深度卷积和逐点卷积分开算),除了第一层采用标准卷积核之外,剩下的卷积层都采用深度可分离卷积块。

MobileNetV1 能够很好地进行分类操作,但是训练十分耗时。因为深度学习模型隐含层数和参数较多,从零开始训练需要大量的标签数据、计算成本和时间成本,而低压配电网的GASF 图片数据集仅包含少量样本,不适合大规模的深度网络训练,很难训练出有效的深度模型,所以引入迁移学习来解决这个问题。迁移学习能消除深度学习模型的局限,很大程度上推动了深度模型训练的进程,降低了对数据量的要求。

基于MobileNetV1的迁移学习如图3所示,具体操作步骤如下。

图3 MobileNetV1的迁移学习Fig.3 Transfer Learning of MobileNetV1

步骤一:将AMI获取的96点电压数据集转换为GASF图片数据集,分为训练样本和测试样本。

步骤二:微调已经利用网络数据预训练的MobileNetV1 以构造用于GASF 图片特征提取的新的神经网络,保持模型卷积层的结构不变,向卷积层载入预训练好的权重与参数,设计适用于框架结构模型上的全连接层。

步骤三:使用训练样本对新构造的网络进行训练,使用测试样本对训练完成的网络模型进行测试。

2.2 构建分类器

针对同一台区下的用户电表数据差异性小和变压器三相数据差异性小的问题,为了更好地识别台区用户和台区变压器之间的关系,在构建分类器时引入了Triplet Loss 函数,用于达到缩小类内距离、扩大类间距离的效果。

Triplet Loss 的输入是一个三元组,如图4 所示。a 指anchor,基准电表A 日电压GASF 图片的特征向量;p 指positive,与基准图片A 属于同一个拓扑分支的电表B 日电压GASF图片的特征向量;n 指negative,与基准图片不属于同一个拓扑分支表电表C 日电压GASF 图片的特征向量。

图4 Triplet Loss示意图Fig.4 Diagram of Triplet Loss

使用函数表达为:

式中:α为阈值;为基准值;为与基准值相近的值;为与基准值相斥的值。

损失函数的通用公式如式(7)所示:

在本文例子中研究的就是电表日电压的GASF图片的特征向量之间的欧几里得距离,可以将式(7)简化为:

式中:d(a,p)是anchor和positive之间的欧几里得距离;d(a,n)是anchor和negative之间的欧几里得距离。最终的目标是拉近a和p之间的距离,拉远a和n之间的距离。

在训练时,往往有两种方法:一种是离线法,训练集所有数据经过计算得到对应的embeddings(嵌入),可以得到很多的三元组,然后再计算triplet loss,这种方法效率不高,因为需要读取所有的数据得到三元组,然后训练反向更新网络;另一种是在线法,在线生成triplets(三元组),从训练集中抽取部分样本,然后计算部分embeddings,通过从小批量中选择positive和negative来完成。

因为只使用Triplet loss 会使得整个网络难以收敛,所以需要引入Cross-Entropy Loss(交叉熵损失)来辅助triplet loss 收敛,构建分类器。假设有一个包含n个元素的数组A,i表示A中的第i个元素,则这个第i个元素的softmax(归一化指数函数)输出就是:

式中:Si为第i个元素的softmax 输出;ei为第i个元素的指数值;n为元素个数。

2.3 整体流程

基于图转换和迁移学习的低压配电网户变关系和相位识别的整体流程如下:

1)数据预处理,筛选AMI获取的96点电压数据集,剔除异常数据。

2)进行GASF 图转换,将一维的96 点电压数据集转换为二维图像数据集,将同一拓扑分支下的电表日电压GASF 图片打上同一标签。将二位图谱作为模型的输入,选取样本的80%作为训练集,20%作为测试集。

3)基于迁移学习训练模型,微调已经利用网上数据预训练的MobileNetV1 以构造用于GASF图片特征提取的新的神经网络,保持模型卷积层的结构不变,向卷积层载入预训练好的权重与参数。将所得特征层取全局平均池化,进行神经元个数为128 的全连接,然后进行L2 标准化处理,此时输出得到长度为128 的特征向量。在Triplet Loss 和Cross-Entropy Loss 构建的分类器的作用下,使用训练样本对新构造的网络进行训练,使用测试样本对训练完成的网络模型进行测试。

4)输出测试结果,将每个用户电压日电压GASF 图片的特征向量与变压器日电压GASF 图片的特征向量之间的欧几里得距离进行比较,判断用户所属台区及相位,进行低压配电网户变关系识别和相位识别,并判断准确率。

3 实验及结果分析

以实际数据为基础,建立两种实验场景:低压配电网户变关系识别和低压配电网相位识别。分别验证所提模型的准确性和稳定性。

3.1 数据来源

迁移学习中MobileNetV1预训练采用CASIAWebFace 数据集。这是一个开源的用于人脸识别的数据集,包含10 000 个人,一共50 万张人脸图片。

低压配电网户变关系和相位识别算例数据来自于国家电网公司。该数据集包含了30 个台区,共30个配电变压器和360个用户,从2021年4月1日—6月30日AMI采集的96点电压数据,每个台区的配电变压器连接12个单相智能电表。

3.2 网络训练

所有实验均在Windows10 操作系统的Pycharm(基于Python3.6)环境下进行,使用Tensorflow、Keras作为深度学习框架,实验平台的硬件配置为Tesla K40 GPU 以及Intel Xeon E5-2620 2 GHz CPU。

按照表2进行模型参数设置,然后训练基于迁移学习的新的卷积神经网络,随着训练的进行,模型准确率和损失值逐渐趋于平稳,说明本文所提模型从有限的用户日电压GASF 图片训练集中已经学习到充分的特征与规则,并且没有发生过拟合,如图5所示。

图5 精度及损失值变化曲线Fig.5 Variation curves of accuracy and loss value

3.3 实验对比

为了更好地评估所提方法的性能,在同一数据集上,针对没有进行图转换的一维数据选择用1D-CNN(一维卷积神经网络)[22-24,27-29]、SVM(支持向量机)[30]模型作为常用机器学习模型的典型代表进行对比实验。针对进行过图转换的二维数据,基于相同的GASF 转换二维图像生成方法,选择GASF-CNN(二维卷积神经网络)、GASF-M(基于MobileNetV1的格拉姆角和场)模型作为没有经过迁移学习的代表进行对比实验。

不同模型在5次户变关系识别实验中的识别准确率情况见表3,不同模型在5次相位关系识别实验中的识别准确率情况见表4。各个模型在户变关系识别和相位关系识别上各5次实验中的准确率分别如图6、图7所示。

表4 各模型相位识别实验对比Table 4 Comparison of phase recognition experiments across various models

图6 户变关系识别实验结果Fig.6 Experimental results of household-transformer relationship recognition

图7 相位识别结果Fig.7 The phase recognition results

由表3、表4、图6 和图7 可知,本文提出的GASF-TLM模型5次实验的户变识别准确率平均值为98.55%、相位识别准确率平均值为95.43%,准确率明显高于传统模型。5组模型大致可以分为三类:第一类是传统的基于一维时间序列的模型,包括SVM 和1D-CNN 等;第二类是基于二维图像的较为广泛使用的模型,包括GASF-CNN 和GASF-M等;第三类是本文提出的基于图转换和迁移学习构建的新模型GASF-TLM。三类模型中,第一类模型的识别准确率相对较低;第二类模型比第一类模型识别准确率有所提升,GASF图转换很好地保留并增强了原本的一维时间序列所具有的特征;而GASF-TLM 模型比第二类模型识别准确率又大大提升,迁移学习很好地利用了源域的数据及参数权重,提升了目标模型的准确率。

在户变关系识别和相位关系识别两种情景下,因为台区变压器A、B、C三相的一维时间序列相似性远大于不同台区变压器间的相似性,所以用户电表的相位识别难度远大于户变关系识别。由上文可知,一般情况下不同模型在相位关系识别场景下的准确率要低于户变关系识别的场景,但本文所提的GASF-TLM 模型较为稳定,准确率下降幅值较小,适用场景较为广泛。

为了评估本文所提方法的稳定性,在三大类别的模型中各选出一组,包括SVM、GASF-M、GASF-TLM 3 种模型,分别进行10 轮、每轮10次的户变关系识别实验,得到3 个模型的准确率。统计3个模型在各个准确率区间上出现的次数,计算出相对频率(次数/总次数)。

实验可得SVM、GASF-M、GASF-TLM 3种模型的准确率相对频率如图8 所示,其中SVM模型准确率数值在90%以上的次数只有总次数的3%,GASF-M 模型准确率数值在90%以上的次数约占总次数的70%,而GASF-TLM 模型准确率数值大多都在95%以上。结果表明,本文所提方法准确率波动更小。

图8 各模型识别准确率相对频率对比Fig.8 Comparison of the relative frequencies and recognition accuracies across the models

为了评估样本数量对各模型的影响,随机选取了300、600、900、1 200、1 500 个用户电压样本,分别对5个模型进行实验,结果如图9所示。

图9 样本数量对各模型性能的影响Fig.9 The impact of sample size on the performance of each model

由图9可知,本文所提方法受样本数量变动有轻微影响,准确率始终保持在90%以上。SVM、1D-CNN、GASF-CNN、GASF-M 4 种模型受样本数量影响较大,尤其是GASF-M模型使用了深度学习网络,在没有充足样本的情况下,根据斜率可以看出其受样本数量变动影响较大。因此,本文所使用的迁移学习方法降低了对数据量的要求,所提模型具有较强的适用性。

4 结论

1)本文所提出的GASF-TLM 模型在户变关系识别中平均准确率为98.55%,在相位关系识别中平均准确率为95.43%,优于目前普遍的基于一维时间序列和基于二维图像的识别方法。

2)GASF-TLM 模型在多次实验中识别的准确率大多稳定在95%以上,相比其他模型具有更高的稳定性,且波动较小。

3)本文所提出的基于图转换和迁移学习的低压配电网户变关系和相位识别方法降低了对样本数量的要求,在其他模型受样本数量影响准确率大幅波动的情况下,GASF-TLM 模型具有较强的适用性。

猜你喜欢
低压配电电表台区
巧判电表测量对象
电表“对”与“错”归类巧掌握
低压配电网接地方式及与剩余电流保护的配置探究
电子制作(2019年22期)2020-01-14 03:16:54
看电表
降低台区实时线损整治工作方法
电子制作(2017年2期)2017-05-17 03:55:22
工厂供电系统低压配电保护电器的选择研究
三合一集中器作为台区线损考核表计的探讨
多功能低压台区识别设备的研制
提升台区线损正确可算率的措施与实践
中低压配电网能效管理系统设计及其实现