申伟伟 刘牮
摘要:负荷预测是电力系统分析与运行的基础,对机组组合、经济调度、安全校核等均具有重要意义。随着电网规模不断增大,数据库时间跨度也随之变大,对不良数据及冗余数据的处理造成影响,负荷预测精度和速度的提高难度显著增大。针对这一问题,提出基于懒惰学习与聚类算法的组合模型。該模型以懒惰学习(Lazy Learning, LL)算法为基础,通过选择相似样本对负荷进行差异性预测建模。在预测应用中,为缩小样本库数量,减小 LL算法的预测时间,利用模糊C均值聚类(Fuzzy C-means,FCM)对用电特征进行聚类从而生成局部训练集,以改进LL算法局部建模。实验结果表明, FCM- LL组合算法不仅能高效精确地预测负荷,而且能实现数据库的实时更新。
关键词:负荷预测;模糊C均值聚类;懒惰学习
DOIDOI:10.11907/rjdk.173319
中图分类号:TP319
文献标识码:A 文章编号:1672-7800(2018)008-0165-04
英文摘要Abstract:Load forecasting,which is of great significance to unit set,economic dispatch and safety check,is the basis of power system analysis and operation.With the growing size of the power grid,the time span of the database becomes wider.Due to the limitation of bad data and redundant data,the difficulty in improving the accuracy and speed of load forecasting increases significantly.In order to solve the problem,a combined model based on lazy learning and clustering algorithm is proposed in this paper.This model uses lazy learning (LL) algorithm as the basis to select the similar samples to model the load forecasting.In order to reduce the number of sample banks and the prediction time of LL algorithm,fuzzy C-means (FCM) is used to cluster electricity features to generate local training sets to improve LL algorithm Local modeling.The experimental results show that the FCM-LL combination algorithm proposed in this paper can not only predict the load efficiently and accurately,but also realize the real-time update of the database.
英文关键词Key Words:electricity demand forecasting; fuzzy C-means clustering; lazy learning
0 引言
短期负荷预测在电力系统运行中起着关键作用,对区域经济调度具有重要意义,负荷预测精度决定了电力系统优化的科学性。
上世纪80年代我国经济高速发展,导致电力需求飞速上升,负荷预测开始成为电力公司必须实施的一项工作。随着科学技术的迅猛发展,新的预测方法源源不断出现[1],新方法可分成两大类:①基于数学统计类的经典预测方法,比如回归分析法、时间序列法等;②基于计算机算法的新型预测方法,如人工神经网络法、支持向量机等[2]。
近年来提出了多种负荷预测模型,如 BP神经网络、小波分析和支持向量机等。其中,BP神经网络具有较强的非线性映射能力和泛化能力,但容易产生过拟合和局部最优;小波分析具有较强的逼近、容错能力,但小波基函数的选择和参数初始化没有一定的依据准则;支持向量机可剔除大量冗余样本,鲁棒性较好,但对大规模样本训练难以实施,解决多分类问题存在困难;回归分析法在数据少时训练速度快、误差率小,但对大量数据处理效果差[3]。上述电力负荷预测算法由于精度和使用范围限制,无法满足越来越复杂的电力系统负荷预测要求[4]。针对上述不足,本文提出了一种基于模糊C均值聚类(Fuzzy C-means,FCM)与懒惰学习(Lazy Learning,LL)组合模型的预测方法,先采用FCM算法对原始数据进行较小噪声数据预处理,然后在筛选后的数据集中使用LL建立预测模型。算例表明,本文提出的方法可根据不同场景下的用电需求有针对性地建立预测模型,与传统LL相比,提高了预测精度、缩短了预测时间。
1 FCM-LL组合模型预测原理
传统的 LL算法每一次局部建模都需要遍历所有的训练集特征值,存在不良数据及冗余数据,使得局部建模点的选取偏离待测点,造成预测失真。因此,本文提出使用FCM算法对训练集进行分类,缩小数据规模,为LL算法提供筛除噪声数据的训练集方法。
1.1 FCM原理
由上面两个条件发现,模糊C均值聚类算法是一个简单的迭代过程[7]。FCM确定聚类中心ci和隶属矩阵U步骤如下:①用0、1之间的随机数初始化隶属矩阵U,使其满足式(1)中的约束条件;②用式(4)计算c个聚类中心ci,i=1,…,c;③根据式(2)计算价值函数。如果它小于某个给定阈值,则算法停止;④用式(5)计算新的U矩阵,返回步骤②。
以上算法也可通过先初始化聚类中心再执行迭代过程实现。由于不能确保FCM收敛于一个最优解,算法性能很大程度上由初始聚类中心决定。因此,需寻求新的快速算法确定初始聚类中心,或者每次用不同的初始聚类中心启动该算法,多次运行FCM[8]。
1.2 LL原理
LL算法是一种基于“相似输入产生相似输出”原则的算法,是一种本质为自适应模式的灵活建模方法,其对每一个采样点都从历史数据库中选择最匹配的数据向量建立估计模型[9],每个模型只对当前的采样点有效,能够有效解决普通预测模型过度拟合问题[10]。
其中,f是未知的非线性映射,Y表示采样点输入向量X对应的输出向量,即预测值,ε(X)是零均值白噪声,通过获取采样点时刻t的实际输入向量求取当前的负荷。
LL根据近邻原则从历史数据库中选择与当前采样点最匹配的建模点,在不知道过程的非线性映射情况下,采用K向量近邻(K-vector nearest neighbors,K-VNN)方法测量采样点与历史数据库中点的距离[11]。选择K个距离采样点最近的点{ui,yi}Ki=1作为建模点,建立相应的线性模型近似表征系统的非线性特征并预测输出。其中{ui,yi}表征一个采样点,按实际情况划分为输入部分ui和输出部分yi。
要特别注意的是LL方法是多输入单输出的,也就是说每次只能预测一维输出。如果需要预测多维输出则需要建立多个一阶线性回归多项式,分别对每一维输出进行预测[13]。
1.3 基于FCM-LL组合模型的负荷预测
1.3.1 负荷特性分析
本文选用武汉某高校学生宿舍楼2017年4月1日至2017年5月27日的用电数据及影响因素进行分析。影响负荷的因素较多,如温度、天气条件、节假日等。
在预测之前需对负荷特性进行研究,由物理经验得知负荷变化受到温度或天气条件的影响,其中温度指最高温、最低温,天气条件指日照强度、湿度影响等。本文针对的是日负荷预测,其一日内天气类型并不单一。本文进一步细化两两不同气象间的关联性关系,量化天气类型如表1所示,对不同天气下的负荷进行合理划分[14]。
影响负荷的另一个因素是节假日,节假日期间,人们会选择休息或外出游玩,学校教学楼用电会减少。除上述影响因素外,还有一些社会因素,如人均消费水平、工业发展水平等。但对日负荷来说这些因素变化缓慢,而且长时间范围内的负荷记录分析显示,其变化总体呈现稳定的增长态势,故对日负荷影响因素而言其变化趋势基本为零,可忽略不计[15]。
1.3.2 FCM-LL预测模型
传统的 LL算法每次局部建模都需要遍历所有的训练集特征值,且存在不良数据及冗余数据,使得局部建模点的选取偏离待测点,造成预测失真[16]。因此,本文提出使用FCM算法对训练集进行分类,缩小数据规模,为LL算法提供筛除噪声数据的训练集。
构建基于FCM-LL负荷预测模型步骤如下:①将负荷Y及当天对应最高温x1、最低温x2、天气特征x3、是否节假日 x4作为输入特征值 X建立训练样本((x1,x2,x3,x4),Y),输入向量 Xi为特征值训练集,输出向量 Y为待测点负荷;②因为影响负荷的特征值大小单位不一致,所以对实际训练集和待测点数据进行归一化处理;③通过FCM获取待测点所在的与其匹配程度最高的局部估计模型训练集;④在待测点所在类中通过K-VNN选取k=5个近邻点建立局部学习模型;⑤针对局部模型得到待测日负荷值。
2 短期负荷预测实例
本文选用武汉某高校实验楼2017年4月1日至2017年5月27日的用电数据及影响因素建立模型,进行预测、分析。在进行预测前,需要对模型的输入数据标准化,先求出各变量(指标)的算术平均值(数学期望)xi和标准差si,然后进行标准化处理[17] 。
由表2、表3可以看出,现阶段使用的FCM-LL算法在预测精度方面效果更好。对10组数据进行了预测,其中有9组数据的预测结果显示,FCM-LL比LL好。特别说明第5组数据,使用 FCM- LL的誤差较大,这是因为在对数据进行模糊 c均值处理后,第5组数据寻求近邻点的集合很小,其近邻点只能找到两个,对预测结果造成了影响。而使用LL预测时误差较小,这是因为第5组数据寻求近邻点的集合没有受到影响,所找到的近邻点有的偏大有的偏小,数据足够多,所以抵消了误差[18]。在相同数据规模下,改进的组合算法耗时低于0.19s,预测精度指标为2.53%;而传统算法时间超过0.3s,预测精度指标为7.8%。改进后的组合算法在保持较高预测速度的同时达到了更高的预测精度,预测结果可靠性更高。此外,本方法计入天气因素,相对预测速度提高了33%,预测精度也提高了。天气特征值的加入为近邻点的选择提供了有效依据,能够更加快速地寻找到待测点的近邻点。
再随机抽取10组数据作为测试集进行预测,从图1的预测曲线可以看出,FCM-LL组合预测模型的结果更加吻合实测值曲线,这验证了本文所使用的组合模型能更快速准确地预测日负荷,更好地满足工程需求。
3 结语
当数据量变大时,传统的懒惰学习在短期负荷预测方面会存在精度不足、耗时长的缺点,本文对此作出修改,使用聚类与懒惰学习组合预测模型,有效降低了预测规模与噪声的影响。下一步研究是改进预测方法,使其内部参数均变为自适应,对光伏发电、风力发电及并网后的负荷进行预测,并在电力系统其它问题上应用此算法。
参考文献:
[1] 张云,王渡,庄羽.基于新陈代谢灰色马尔可夫模型的工业园区用电量预测[J].电力需求侧管理, 2014,16(4):610-611.
[2] 赵腾,王林童,张焰,等.采用互信息与随机森林算法的用户用电关联因素辨识及用电量预测方法[J].中国电机工程学报,2016,36(3):604-614.
[3] 张思远,何光宇,梅生伟,等.基于相似时间序列检索的超短期负荷预测[J].电网技术,2008,32(12):56-59.
[4] 李明干,孙健利,刘沛.基于卡尔曼滤波的电力系统短期负荷预测[J].电力系统保护与控制,2004,32(4):9-12.
[5] 孟安波,卢海明,李海亮. 纵横交叉算法优化 FCM 在电力客户分类中的应用[J]. 电力系统保护与控制,2015,43(20):150-154.
[6] CAI W,CHEN S,ZHANG D.Fast and robust fuzzy c-means clustering algorithms incorporating local information for image segmentation[J].Pattern Recognition,2007,40(3):825-838.
[7] 孟安波,卢海明,李海亮. 纵横交叉算法优化 FCM 在电力客户分类中的应用[J]. 电力系统保护与控制,2015,43(20):150-154
[8] ZHANG D Q,CHEN S C. A comment on alternative C-means clustering algorithms [J]. Pattern reconition,2004, 37(2):173-174.
[9] 程毛林.数据拟合函数的加权最小二乘积分法[J].数学的实践与认识,2012,42(4):70-76.
[10] 栾媛媛,王忠仁,奚阿丹,等.基于改进BP神经网络的客户投诉预警模型研究[C].中国通信学会学术年会,2010.
[11] 汪璟玢.一种结合空间聚类算法的R树优化算法[J].计算机工程与应用,2014,50(5):112-115.
[12] BREIMAN L. Random forest[J].Machine Learning, 2001,45(1):532-533.
[13] CHAMBERS D W. Key performance indicators[J].Journal of the American Dental Association, 2013,144(3):242-244.
[14] 周文杰,杨璐,严建峰. 大数据驱动的投诉预测模型[J].计算机科学,2016,6(7):53-59.
[15] 程其云.基于数据挖掘的电力短期负荷预测模型及方法的研究[D].重庆:重庆大学,2014.
[16] 尹玉芬. 地区电力系统负荷特性分析与需求侧管理研究 [D].广州:华南理工大学, 2010.
[17] CHERMAN E A,SPOLA R N,VALVERDE-REBAZA J,et al.Lazy multi-label learning algorithms based on mutuality strategies[J].Journal of Intelligent & Robotic Systems,2015,80(1):261-276.
[18] 高亞静,孙永健,杨文海.基于新型人体舒适度的气象敏感负荷短期预测研究[J].中国电机工程学报,2017,37(7):1946-1954.
(责任编辑:杜能钢)