基于FCM-GPR模型的电力网空间负荷预测方法研究

2021-09-07 05:42:08武志宇周筱淋王雨佳
山东电力高等专科学校学报 2021年4期
关键词:高斯均值聚类

武志宇,周筱淋,王雨佳

(辽宁工程技术大学,辽宁 葫芦岛 125000)

0 引言

准确的中长期电力负荷预测有利于电网的安全稳定运行,为电网规划提供基础数据。合理、有计划地安排各类用户的用电时间,可减小最大负荷与最小负荷的差值,充分利用发电和供电设备容量,提高系统运行的经济性[1]。

目前,电力负荷预测模型主要包括统计模型、人工智能模型和混合模型三大类[2]。传统的统计学预测模型主要有自回归模型、自回归综合移动平均模型、指数平滑模型和时间序列分析模型。文献[3]比较了几种不同的统计模型,模型对序列平稳性要求较高,而且本质上只能捕捉线性关系,无法捕捉电荷变化与相关因素之间存在的复杂非线性关系。在人工智能预测方法中,人工神经网络可以较好地处理非线性拟合问题。文献[4]提出了基于人工神经网络和互信息理论的预测方法,该模型充分考虑了负荷数据的内在特点和外部重要因素,成功解决负荷的非线性、非平稳性和非季节性的问题,但该模型只适用于小数据集,且操作过于复杂。

目前大部分预测模型是从数学层面对传统算法进行改良,而忽略了负荷本身的特点[5]。部分预测模型忽略了特征选择的重要性,往往根据直觉或使用单一标准而未从负荷序列的特点分析中进行选择。本文针对以上不足,提出一种结合模糊聚类和高斯过程回归的混合模型,对原始负荷数据分别从日尺度、月尺度和年尺度进行可视化分析,从中挖掘整理出有效的时间尺度特征数据;将影响负荷的时间尺度数据以及天气数据进行模糊聚类处理,汇总出最优特征集;将特征数据代入高斯过程回归模型,所得输出结果为混合模型的最终负荷预测值。结合实际电力数据对模型进行验证,结果表明该模型具有较高的预测精度和鲁棒性。

1 电力系统负荷预测种类及影响因素

负荷日期类型的划分是负荷预测的关键因素。根据实际需求不同,电力负荷预测按照时间尺度分为超短期、短期、中期、长期负荷预测[6]。

1)超短期负荷预测,以分钟和小时为最小单位的负荷预测,主要用于电力系统的潮流控制以及电力系统暂稳态参数计算。

2)短期负荷预测,以天和周为最小单位预测两周以内的电力负荷,在电力调度、售电公司参与现货市场的工作中发挥关键作用,能够为基本发电计划、系统安全分析、日内实时交易等提供基础数据[7-8]。

3)中期负荷预测,月至年的负荷预测,主要作用是确定机组运行方式和设备大修计划等[9]。

4)长期负荷预测,未来3~5年甚至更长时间段内的负荷预测,主要为电网规划部门根据国民经济发展和对电力负荷的需求所作的电网改造和扩建工作进行远景规划。

负荷预测由于受天气、工作日、节假日等因素影响会表现出时间序列的规律性,为实现有效的负荷预测奠定了基础[10]。

2 数据预处理及方法

原始数据经过挖掘处理后可以更加清晰地表征影响负荷的特征。负荷预测模型框架如图1所示。

图1 负荷预测模型框架

2.1 数据预处理

2.1.1 异常数据检测与填补

由于原始数据中存在的一些异常数据,对电力负荷预测模型的建立与求解会产生无法预估的影响,本文使用3σ方法进行异常值检测。

3σ探测方法的思想源于概率论中的切比雪夫不等式。对于任意ε>0,有:

式中:X为样本数据;E(X)为X的数学期望;D(X)为X的方差。

当ε=3σ时,统计数据与平均值的离散程度可以由其标准差D(X)=ε反映,因此有:

式(2)值约等于0.11,即统计数据与其平均值的距离超过3σ的比例不会超过12%。因此可将统计数据与平均值之差的绝对值超过3σ的数据作为异常值。为了减小异常值对于模型建立的干扰,本文利用均值填补法替换异常值。

2.1.2 数据归一化处理

原始数据中包括最高温度、最低温度、平均温度、相对湿度、降雨量等,由于这些量的量纲不一致,而且预测模型中输入输出的数据单位不一致,因此需要对输入数据进行归一化处理。归一化后的数据,不存在量纲,并且取值范围在[0,1]之间,数据归一化处理的公式为:

式中:x_nor为归一化处理后的值;x_source为原始数据;x_min为原始数据中的最小值;x_max为原始数据中的最大值。

在得到归一化的数据之后,可以利用模糊C均值聚类算法进行聚类处理,通过设置最优聚类数目,得到影响负荷预测的最优特征集。

2.2 基本理论

对历史负荷数据进行可视化分析,提取时间尺度数据,结合归一化后的天气数据,通过模糊聚类提取重要特征,作为预测变量输入到高斯过程回归模型中进行负荷预测。

2.2.1 模糊C均值聚类

模糊C均值聚类(FCM)是把N个向量xi(i=1,2,…N)分为c个模糊组,并求每组的聚类中心,使得非相似性指标的目标函数达到最小,而每个给定数据点用0与1之间的隶属度来确定其属于各个组的程度。

设 X={x1,x2,...,xn}为 n 元数据集合,xi∈ Rs。模糊C均值聚类方法就是把X划分为c个子集S1,S2,...,Sc,若用A={α1,α2,...,αc}表示这c个子集的聚类中心,uij表示元素xj对Si的隶属度,则模糊C均值聚类算法的优化目标函数为:

uij满足如下约束条件:

式中:U={uij}为c× n矩阵;A={α1,α2,...,αc}为s×c矩阵;dij为xj与ai的距离,经典的模糊C均值聚类算法使用欧氏距离。

图2 模糊C均值聚类算法流程图

修正隶属度矩阵:

2.2.2 高斯过程回归建模

高斯过程回归(GPR)是一种机器学习回归方法,GPR模型假设包括噪声(回归残差)和高斯过程两部分,具有严格的统计学理论基础,通常被用于低维和小样本的回归问题。基于高斯过程及其核函数所具有的便利性,GPR在时间序列分析、图像控制和自动控制领域得到应用[11]。与支持向量机、神经网络相比,GPR具有容易实现、参数自适应获取、非参数推断灵活以及输出具有概率意义等优点[12]。

高斯过程(GP)是任意有限个随机变量均具有联合高斯分布的集合,其性质完全由均值函数m(x)和协方差函数k(x,x′)确定,即:

式中:x,x′∈Rd为任意随机变量。因此GP可以定义为:

f(x)~GP(m(x),k(x,x′))

为了符号表示上的简洁,通常会对数据进行预处理,使均值函数为0。考虑噪声因素的干扰,高斯过程的一般模型为:

式中:x为输入向量;y为受噪声污染后的观测值;ε为独立的白噪声,假设ε~N(0,σ2n)。

式(9)中,f(x)和ε均服从高斯分布,因此y也服从高斯分布,由此得到观测值y的高斯分布:

则观测值y和预测值f*的先验联合高斯分布为:

其中,K(X,X)=Kn=(kij)为n阶对称正定的协方差矩阵,矩阵元素 kij=k(xi,xj)用来度量 xi与xj之间的相关性;K(X,x*)=K(x*,X)T为测试点x*与训练集的输入X之间的n×1阶协方差矩阵;k(x*,x*)为测试点x*自身的协方差;In为n维单位矩阵。

在新的高斯分布输入x和已有的N个观测样本(X,y)的条件下可计算出预测值f*的概率分布为:

2.2.3 GPR模型的参数说明

3 负荷曲线及特性指标

负荷的变化特性一般通过负荷曲线及特性指标反映。分析负荷曲线及特性指标可以准确描述电力负荷随时间的变化特性,用于分析地区电网的电网结构和用电模式,并可用于预测电力负荷变化的规律和趋势。

3.1 负荷曲线

在不考虑其他负荷分量的情况下,负荷的变化规律往往呈现一定的周期性,包括负荷的日周期性和周周期性。通过分析负荷的周期性,建立科学的负荷预测模型,从而增加模型的精准度[13]。

3.1.1 负荷的日周期性

日周期性主要表征一天的负荷变化规律。图3为某地区2020年1月6日和2020年1月7日连续两个工作日对应的负荷曲线图,每15 min一个采样点,每日96点。

图3 某地区连续两天日负荷曲线

3.1.2 负荷的周周期性

负荷周周期性的研究对于负荷预测的准确度具有重要的意义。图4为某地区2020年1月6日至2020年1月19日连续两周的负荷曲线图。

图4 某地区连续两周的负荷曲线

通过对连续两日和连续两周负荷的可视化分析可知,负荷序列具有明显的日周期性和周周期性。后续负荷特性指标的提取将分别以日、月、年为单位展开。

3.2 负荷特性指标

负荷特性指标表示负荷变化的规律和特性,常用的指标有日负荷特性指标、年负荷特性指标及负荷同时率等,主要指标如表1所示。表中,Pd-av为日平均负荷;Pd-max为日最大负荷;Pd-min为日最小负荷;Pm-av为月平均负荷;Pm-max为月最大负荷值;Pmax为年最大负荷;E为年用电量;Pav为年平均负荷,等于年电量E除以8 760;Tmax为年最大负荷利用小时数。

表1 负荷特性指标及其计算公式

4 实验分析

4.1 实例数据处理

依据本文所建立的电力系统负荷预测模型,用某市2018—2020年的数据作为历史样本对模型进行训练。对原始数据进行处理,得到负荷的一系列特性指标以及气候指标数据,包括日平均负荷、月平均负荷、日负荷率、日最小负荷率、月不均衡系数、季不均衡系数、年负荷率、最高温度、最低温度、平均温度、相对湿度和降雨量11项指标。

4.2 指标聚类处理

对整理出来的11项指标数据采用模糊聚类方法进行聚合,通过谱系图得到聚类结果。聚类结果分为5类,可分别概括为日尺度指标、月尺度指标、年尺度指标、温度指标和湿度指标。

4.3 模型训练及负荷预测

将历史负荷数据代入本文所建立的高斯过程回归模型进行训练,分别对日尺度和月尺度数据进行预测,真实负荷数据与预测数据对比如图5所示。

分析图5可知,对于日尺度负荷和月尺度负荷,利用高斯过程回归模型中的resubLoss函数计算得出预测损失分别为0.064%和0.045%,预测精度都很高,有效实现了对短期负荷的精准预测。

图5 负荷预测效果对比图

5 结语

本文采用模糊聚类算法以及高斯过程回归算法进行电力系统负荷的预测。首先,通过分析挖掘出影响负荷变化的特性指标,为建立高斯过程回归模型提供基础。其次,利用聚类算法消除特性指标中的冗余信息,建立基于高斯过程回归算法的负荷预测模型。最后,通过利用某市负荷数据作为实例进行了计算,验证了该算法的有效性。高斯过程回归模型虽然能进行全局预测,但未能聚焦于局部信息,要进行更加精确的短期预测,可以采用局部预测模型,例如结合ARMA和GPR模型进行预测。

猜你喜欢
高斯均值聚类
小高斯的大发现
天才数学家——高斯
基于DBSACN聚类算法的XML文档聚类
电子测试(2017年15期)2017-12-18 07:19:27
均值不等式失效时的解决方法
均值与方差在生活中的应用
基于改进的遗传算法的模糊聚类算法
关于均值有界变差函数的重要不等式
有限域上高斯正规基的一个注记
一种层次初始的聚类个数自适应的聚类方法研究
对偶均值积分的Marcus-Lopes不等式