摘要:针对目前低压配电网日线损预测精度较低,原始电力数据缺失和异常值问题,提出了一种包含数据预处理和改进LSTM预测网络的双阶段线损率预测,及基于GAN扩充样本,增加样本多样性的方法。改进LSTM预测网络为一个融合多层LSTM的R-CNN深度学习网络架构,可提取电力数据特征以及时间维度信息。通过实验,与Bi-LSTM、LSTM自动编码器、CNN-GRU、BL-Seq2seq相比,所提预测网络的RMSE、MAE、RA2、训练时间指标综合性能最优。实验结果表明,所提预测网络在低压配电网日线损率预测中可以获得更好的预测精度,且模型训练时间最短。
关键词:低压配电网;线路损失;深度学习;卷积神经网络;循环神经网络
中图分类号:TP391;TM711文献标志码:A文章编号:1001-5922(2025)01-0188-05
A daily line loss prediction method for medium and low voltage distribution networks based on improved LSTM
BIAN Shufang,ZHANG Wei
(1.State Grid Jibei Electric Power Company Limited,Tangshan Fengrun District Power Supply Branch Co.,Ltd.,Tangshan 063000,Hebei China;
2.State Grid Jibei Electric Power Company Limited,Luanzhou Power Supply Branch Co.,Ltd.,Luanzhou 063700,Hebei China)
Abstract:In order to solve the problems of low accuracy of daily line loss prediction,lack of original power data and outliers in the current low-voltage distribution network,a two-stage line loss rate prediction method including data preprocessing and improved LSTM prediction network and a method based on GAN to expand the sample and increase the sample diversity were proposed.The improved LSTM prediction network was an R-CNN deep learning network architecture with multi-layer LSTM,which can extract features and temporal dimension information from power data.Through experiments,compared with Bi LSTM,LSTM autoencoder,CNN-GRU,BL-Seq2seq,the pro-posed prediction network had the best comprehensive performance in terms of RMSE,MAE,RA2,and training time indicators.The experimental results showed that the proposed prediction network can achieve better prediction ac-curacy in predicting the daily line loss rate of low-voltage distribution networks,and the model training time is the shortest.
Key words:low voltage distribution network;line loss;deep learning;convolutional neural networks;recurrent neu-ral network
正确计算低压配电网中日线路损耗[1-2]对配电网的安全管理具有重要意义。由于低压配电网布线复杂,线路长度和负载差异巨大,传统方法预测性能较低[3]。因此,迫切需要引入新技术、新方法提升线损预测性能。随着国家智能电网的不断建设和5G、传感器、通信[4,5]等技术的快速发展,低压配电网的数据采集能力正在逐步提高,越来越多的数据可以应用于低压配电网线损的计算。提出了一种基于卷积神经网络(CNN)的线路损耗评估方法[6]。提出了一种基于大数据挖掘的配电网低电压台区线损诊断方法[7]。
循环神经网络(RNN)及其变种长短时记忆(LSTM)、门控循环单元(GRU)等对处理和分析时间序列数据具有较大优势[8-10],已广泛应用于负荷预测、信号处理等领域。因此,部分学者将LSTM[11]、GRU[12]等具备学习时间维度特征的模型引入配电网台区线损预测模型,以改善CNN等网络的预测精度较低的缺点。针对上述问题,提出了一种改进LSTM的低压配电网日线损率预测方法。该方法通过双阶段训练,实现低压配电网中日线损率准确预测。
1线损影响因子
为了提高低压配电网中日线损率预测的精度,本节根据低压配电网线损的影响机制构建特征因子。选用计算精度较高的等效电阻法,研究分析了低压配电网线损的影响机理。低压配电网简化电路模型如图1所示。
根据等效电阻法,低压电网总线路损失的计算方程可以表示为:
式中:A为低压电网中的总线路损失;N为配电网的结构参数,其根据接线模式而变化;k为负载形状因子;Iav为变压器二次侧的平均电流;Reql为低压电网的等效电阻;Kb为三相不平衡系数;t为运行时间;D为年日历天数;mi为电表数量;Adbi为电表的月能量损失;AC为无功负载补偿设备的能量损失。
由于静态线路因素与动态运行因素相对分离,研究将低压电网中的静态线路因素和动态运行因素相结合,建立了一种混合因素表征和分析配电网线损影响机制。该混合因素为低压配电网中所有用户的供电距离和平均日用电量的平均乘积:
式中:Me为供电混合因素;Pi为用电设备i的功率;n为低压配电网中的用电设备总数量;Di为用电设备i和配电网的变压器之间的距离。
综合考虑低压配电网线损的所有因素,选择了以下8个特征因素,包括供电半径、低压配电网总线路长度、低压配电网中的用电设备数量、低压配电网的负载率、三相不平衡度、负载形状因子,功率因数和混合因素。
2线损率预测模型
所提线损率预测模型整体架构如图2所示。
由图2可知,该架构为一个典型的2阶段框架,包括数据预处理和改进LSTM预测网络。数据预处理阶段包括基于GAN的样本扩充以及对数据进行归一化操作,从而为有效训练奠定基础。第二阶段改进LSTM预测网络为一个融合多层LSTM的R-CNN深度学习网络架构,其中R-CNN用于特征提取,多层LSTM学习电力数据的时间维度信息。通过双阶段训练,实现低压配电网中日线损率准确预测。
2.1数据预处理
考虑到电表故障、天气条件、存储、通信等异常问题,配电网采集的电力数据将存在异常值和缺失值。这些异常值和缺失值将干扰正常训练,必须在训练前进行数据清洗。
GAN[13-15]通常由2个深度神经网络组成:生成器和鉴别器。生成器模型学习如何生成与真实数据相似的分布,鉴别器模型学习如何区分生成样本和真实样本。令Tf为生成的样本数量。z(i)RM,i1 2…Tf为拟合到生成器的输入噪声向量,其样本均匀分布在[1 1]上;M为要生成的低压配电网线损影响因素的数量。生成器的损失计算公式如下:
式中:ℒG为生成器的损失函数;DGz(i)为指示样本为伪生成数据的概率;θg为生成器的参数。
在训练过程中,鉴别器计算概率DGz(i),并给出伪生成样本Gz和真实数据集F之间的差异。因此,鉴别器的训练可总结为通过最小化真实数据和伪生成数据之间的损失函数:
式中:ℒd为鉴别器的损失函数;θd为鉴别器模型的参数。
在样本扩充之后,应用Box-Cox[16-17]转换技术将扩充后的数据转换为更适合有效训练的特定格式,以消除电力数据分布的偏移。Box-Cox变换如式(5)所示。
式中:di(λ)为第i个经Box-Cox变换计算的新样本;di为第i个原始样本;λ为变换参数。
应用最小-最大归一化[18]技术将数据转换到特定的范围,从而消除数据维度可能给深度学习模型带来的干扰。最小-最大归一化公式如方程(6)所示。
式中:Di为第i个最小-最大归一化后的数据;d为混合数据集中的最小值;d x为混合数据集中最大值。
2.2改进LSTM预测网络
CNN[19]是一种众所周知的深度学习架构,通常由4种类型的层组成:卷积层、池化层、全连接层和回归层。卷积层运算的基本方程如式(7)所示。
式中:Cl为第l卷积层的输出特征;σ为激活函数;x为卷积层的输入;W为卷积层的权重;b为偏置。
由于强大的特征提取能力,CNN架构已广泛应用于图像分类、视频分类、时间序列数据预测等领域[20]。然而随着网络深度增加到一定程度,CNN会出现模型性能饱和的退化问题。为了解决退化问题,有学者提出了CNN的变种算法R-CNN架构。研究提出了融合多层LSTM架构的R-CNN深度学习网络架构。LSTM中每个门的操作如式(8)~式(10)所示。
式中:it、ft、ot分别为输入门、遗忘门和输出门的第t个特征状态;W为权重;b为偏置;W和b的下标i、o、f分别代表输入门、输出门和遗忘门的权重和偏置;为激活函数;h为隐含层特征值;xt为输入特征值。
所提出的改进LSTM预测网络结构如图3所示。
由图3可知,该预测网络包含3种类型的层:含4个卷积层,其中第3个卷积层(Cnov3)融合了第1个卷积层(Cnov1)和第2个卷积层(Cnov2)的特征。第4个卷积层(Cnov4)融合了第2个卷积层(Cnov2)和第3个卷积层(Cnov3)的特征。其次,多层LSTM中第1个LSTM层融合了第3个卷积层(Cnov3)和第4个卷积层(Cnov4)的特征。在LSTM的学习过程中,根据当前状态和前一状态更新不同单元的特征值,从而更新参数并最小化损失函数。最后,将特征转发到FC层实现最终预测。
3实验与分析
3.1数据集
实验的数据集来自某区域收集的8 343组低压配电网数据。每个低压电网的特征因子每天采集1次,连续记录15 d。经数据清洗后,剔除部分缺失数据,将清洗后的数据制作为原始数据集。接下来,应用GAN对数据集进行样本扩充操作。训练完成GAN后,将所有生成的数据均放置在训练集中,而测试集中的所有数据都来自原始数据集。基于GAN的数据扩充方法如图4所示。为了训练预测网络模型,将数据集按9∶1的比例划分为训练集和测试集。
3.2实验设置
实验时环境设置如下:其中硬件为Windows 10操作系统的台式电脑,32GB RAM和GE-FORCE-GTX-2080-Ti GPU,Intel-Core-i7 CPU。软件环境为pycharm2020社区版,网络架构由Python 3.7中pytorch 1.8.1搭建并执行。Python中主要使用的模块如下:pandas 0.25.1,numpy 1.17.2,matplotlib
3.1.1。预测网络训练时超参数设置如下:初始学习率为0.000 1,学习率衰减率为0.000 1,衰减周期为500,批量归一化数量为128,dropout概率设置为0.25,迭代总次数为20 000。多层LSTM数量设置为3。
3.3结果与分析
3.3.1数据扩充对比实验
首先,对于数据扩充方法的性能进行测试。实验分别对比了原始数据集、SMOTE扩充数据集、GAN扩充数据集中数据统计情况。需注意,电力数据已经归一化为0至1之间。比较指标包括:平均值、标准差、最小值、最大值、第一四分位数(Q1)、第二四分位数(Q2)、第三四分位数(Q3)。数据扩充对比实验结果如图5所示。
由图5可知,与SMOTE扩充数据集相比,GAN生成数据与原始数据更加接近,即在统计上更显著。实验结果表明了经GAN数据扩充后,可有效提升数据质量。
3.3.2交叉对比实验
主要利用均方根误差(RMSE)、平均绝对误差(MAE)、R-调和平方(RA2)、训练时间等指标评估模型性能。RMSE表征测量实际值和预测值之间的差异。MAE为绝对误差的平均值。RMSE和MAE指标的数学方程如式(11)、式(12)所示。
式中:fRMSE和fMAE分别为RMSE和MAE的值;n为观测值的数量;yi为实际值;y(̂)i为预测值。
为了消除特征因素数量的影响,引入了RA2指标,该指标定义为:
式中:R2 a 为指标RA2;p 为特征因素的数量;ym为观测值的平均值。
为验证所提配电网日线损率预测模型的性能,分别对比了Bi-LSTM、LSTM自动编码器[8]、CNN-GRU[9]、BL-Seq2seq[10]等方法。表1所示为与其他基线方法对比结果。
由表1可知,与Bi-LSTM、LSTM自动编码器、CNN-GRU相比,所提改进LSTM预测网络在RMSE、MAE和RA2指标分别实现了较低的误差率。与BL-Seq2seq相比,所提改进LSTM预测网络RMSE、MAE和RA2指标误差率相差不大,且RA2指标略低。然而训练时间指标表明所提模型训练性能最优,这表明所提改进LSTM预测网络可通过较少的网络参数获取较优的预测性能。
4结语
(1)分析了配电网线损的物理和运行影响机制,构建了低压配电网电气特性因素;
(2)提出了低样本数据下基于GAN的样本扩充方法,从而提升样本多样性;
(3)构建了改进LSTM的低压配电网日线损率预测网络。该预测网络为一个融合多层LSTM的R-CNN深度学习网络架构,其中R-CNN用于特征提取,多层LSTM层学习电力数据的时间维度信息。通过双阶段训练,从而实现低压配电网中日线损率准确预测。
【参考文献】
[1]唐赓.电网同期线损检测系统的设计与实现路径[J].粘接,2022,49(5):170-173.
[2]胡程平,陈婧,胡剑地,等.配电台区线损率异常自动检测系统设计[J].粘接,2022,49(5):188-192.
[3]田铭兴,赵远鑫,王江彬.基于等效的视在功率计算新方法[J].电力自动化设备,2017,37(9):153-158.
[4]梅建华,杨彦辰,云利军,等.多视角人体红外步态信息采集与处理[J].云南师范大学学报(自然科学版),2022,42(4):36-40.
[5]陶妍.基于5G的绿色宽带通信系统研究与实现[J].云南师范大学学报(自然科学版),2022,42(3):42-46.
[6]肖荣洋,黄雁.基于卷积神经网络的线路损耗智能评估方法研究[J].自动化与仪器仪表,2023(1):188-193.
[7]王坚,刘畅,张忠静,等.基于大数据挖掘的配电网低电压台区线损诊断[J].自动化技术与应用,2023,42(12):124-127.
[8]庞传军,余建明,冯长有,等.基于LSTM自动编码器的电力负荷聚类建模及特性分析[J].电力系统自动化,2020,44(23):57-63.
[9]吴永洪,张智斌.基于贝叶斯优化的CNN-GRU短期电力负荷预测[J].现代电子技术,2023,46(20):125-129.
[10]徐先峰,王世鑫,龚美,等.引入BL-Seq2seq模型进行负荷预测[J].计算机仿真,2021,38(8):103-107.
[11]吴龙雨,黄耀辉,邢艺腾,等.基于长短期记忆网络的配电网台区线损预测系统[J].电工技术,2021(9):60-62.
[12]生西奎,付强,于洋,等.基于深度学习GRU网络的配电网理论线损计算方法[J].电测与仪表,2021,58(3):54-59.
[13]杨顺,郝晓燕,马垚,等.基于生成对抗网络的差分隐私生成数据方法[J].计算机工程与设计,2024,45(1):39-46.
[14]赵宏,李文改.基于扩散生成对抗网络的文本生成图像模型研究[J].电子与信息学报,2023,45(12):4371-4381.
[15]陈丽,许思扬,刘芳,等.基于生成对抗网络的OFDM信号生成[J].电子科技大学学报,2023,52(6):841-850.
[16]杨保奎,张建勋,李慧琴,等.基于Box-Cox变换与随机系数回归模型的非线性退化设备剩余寿命预测方法[J].航空学报,2023,44(11):199-211.
[17]刘会家,江旭旭.基于BOX-COX变换与改进核密度估计潮流计算[J].电子测量技术,2022,45(14):65-70.
[18]杨寒雨,赵晓永,王磊.数据归一化方法综述[J].计算机工程与应用,2023,59(3):13-22.
[19]杨盼盼,郭杨成.基于深度学习的城市道路沥青路面病害智能检测仿真实验[J].粘接,2023,50(12):174-178.
[20]许洪光,李凤英,郭茜.机器学习算法改进及在化工故障诊断中的应用[J].粘接,2022,49(5):85-89.
(责任编辑:苏幔,平海)