基于K-means的电力系统典型日负荷特性计算方法研究

2020-03-23 06:08段博文许沈彬马骋张强衣涛
无线互联科技 2020年1期

段博文 许沈彬 马骋 张强 衣涛

摘   要:针对传统典型日负荷特性选取方法误差较大的问题,文章提出了基于K-means的典型日负荷特性计算方法。首先,以月为尺度对全年日负荷特性曲线进行分组。其次,计算日负荷特性曲线的最大值、最小值、最大值发生时间、最小值发生时间、峰谷差率5个指标对其进行归一化,利用K-means聚类分析方法对每组样本数据5个特征值进行聚类分析。最后,在排除突变负荷特性后,选择距离聚类中心最远的样本为本月典型日负荷特性。结果表明:所提方法能有效选取典型日负荷特性曲线。

关键词:K-means;典型日;负荷特性

通常选取典型日负荷特性进行电力系统相关计算分析。目前,对于典型日负荷特性曲线的选取方法没有统一规定,国内一般采用主观选择法[1],由于是人为选择,结果误差较大。另一种是抽样法,但传统的随机采样易出现数据聚集的现象,在数据密集区抽取的样本较多,从而导致采取数据在整个样品中不均衡,出现很多误差。一般的聚类法面对大数据会存在耗时长、聚类数目不确定等问题。国外采用的启发式场景消减法的算法扩大了数据处理能力,能有效改善算法的执行效率,解决了一般的聚类问题,但是聚类内个体数分配典型日权重,当典型日数量较少时,所得到的典型场景在负荷和资源总量方面与原始数据将存在一定的偏差。K-means方法简单易行、操作简单,是目前使用最为广泛的聚类分析方法之一,采用K-means聚类分析方法,在相关指数基礎上进行日负荷特征曲线的提取,一定程度上解决了典型日负荷计算中存在的误差。

1    K-means聚类理论

K-means聚类算法是一种常用的动态聚类算法,实现过程是:首先,选择聚类中心,对样本作初始分类;其次,根据聚类准则,判断聚类是否合理,不合理就修改聚类,直至合理为止。相对于经典的无监督聚类算法而言,K-means聚类算法具有简化计算、加快收敛速度等特点。

每个聚类内的成员应尽可能地接近,所以聚类密集性越小越好。但是在极端情况下,当每个输入矢量被分为单独的类时,聚类密集性有最小0,因此,需要对聚类数目进行选择,找到具有实用性且较优的聚类数目[6]。

2    某电网典型日负荷特性曲线的选取

以某电网某一年全年8 760点负荷数据为聚类分析样本,以月为时间尺度进行典型日负荷特性的提取。首先,以月为时间尺度,计算样本数据的按照月负荷特性样本的最大值、最小值、最大值发生时间、最小值发生时间、峰谷差率5个指标进行归一化处理;其次,分别对12个月日负荷特性曲线特征值进行K-means聚类,根据类中90%样本到类中心距离小于某个距离确定分类数目,并选取距离类中心样本数据较远且非孤立点的样本为典型日负荷特性。某电网12个月负荷特性曲线样本数据与月负荷特性中心样本距离分布如图1所示,1~12月样本数据密集性较好,与中心样本的距离较小。提取某电网月负荷特性典型日详细步骤如下[7-8]:

第1步,以某电网全年365日负荷特性数据为样本,以月为单位进行分组。

第2步,按照月负荷特性样本的最大值、最小值、最大值发生时间、最小值发生时间、峰谷差率5个指标进行聚类分析计算。将最大值、最小值按照公式(3)进行归一化处理,最大值发生时间、最小值发生时间按照公式(5)进行归一化处理,峰谷差率用公式(4)进行归一化处理,然后用K-means聚类方法进行聚类。

第3步,每组类数目的确定判据为可采用簇内90%的样本距离类中心的距离小于某个特定误差值确定的分类数目,本次项目取每组类数目等于1。

第4步,选取距类中心距离最远的样本为本月典型日负荷特性以确定典型日。

第5步,典型日修正,观察类内样本距离,在密集性好的样本中选择距离类中心距离最远的样本为典型日。

3    基于K-means方法选取典型日负荷特性的相关讨论

(1)利用K-means聚类分析方法确定典型日负荷特性,也是一种多指标中心计算的方法。K-means聚类分析方法是一种基于机器学习的智能数据分类方法,与常规统计方法相比,是兼顾样本多个特征值的分类方法。提取的类中心表示了多个指标的中心。

(2)利用K-means聚类分析方法计算类中心时,由于其初始解的不确定性,导致运算结果可能不唯一,但这些解均为满足聚类误差的解。为了得到最优解,在计算结果处理上采用了3个甄别最优中心解的准则:首先,如果两次聚类获得的类中心不同,而两个分类结果的类内90%样本数据距离类中心的平均距离又相等,则存在距离类中心最远距离最小的解为最优解。其次,如果两次聚类获得的类中心不同,而两次分类结果的类内90%样本数据距离类中心平均距离不等,则平均距离小的解为最优解。最后,如果两次聚类获得的类中心不同,且两次分类结果的类数不同,则类数少的解为最优解。

(3)利用K-means聚类分析方法选取典型日负荷特性时,聚类效果与数据是否具有明显分类特征有关,当样本数据具有明显的分类特征时,聚类计算结果可较好收敛,不具有振荡性。当聚类结果出现局部振荡时,可用人工方法进行进一步甄别,以获得最优解。

(4)某电网负荷特性分类结果表明了很好的收敛性,经过20次实验计算,无多解出现。

4    结语

本文针对电力系统典型日负荷特性曲线提取问题进行了研究,提出了一种基于K-means聚类分析方法的电力系统典型日负荷特性曲线提取方法,并以某电网全年365日历史负荷数据样本为例,以月为时间尺度,计算了每个月的典型日负荷特性曲线,验证了此方法的有效性。

[参考文献]

[1]刘娇扬,郭力,杨书强,等.配电网中多光储微网系统的优化配置方法[J].电网技术,2018(9):2806-2815.

[2]GAO Y,HU X Y,WANG L,et al.Multi-objective bilevel coordinated planning of distributed generation and distribution network frame based on multiscenario technique[J].IEEE Transactions on Sustainable Energy,2017(4):1415-1429.

[3]BARINGO J M,BARINGO L,CONEJO A J,et al.Probabilistic power?ow with correlated wind sources[J].IET Generation,Transmission&Distribution,2012(5):641-651.

[4]蔡国伟,王大亮,王燕涛,等.一种基于最短距离聚类与关联度分析的典型日选取新方法[J].中國电力,2008(4):19-22.

[5]孟令奎,段红伟,黄长青,等.一种基于语义聚类的典型日负荷曲线选取方法[J].华北电力大学学报(自然科学版),2013(1):43-48.

[6]方茂益,孙志杰,周国鹏,等.基于FCM配电侧典型电力日负荷曲线分类研究[J].华北电力技术,2016(11):15-19.

[7]彭秋生,魏文红.基于核方法的并行模糊聚类算法[J].计算机工程与设计,2008(8):1881-1883.

[8]LI J H,LAN F,WEI H.A Scenario optimal reduction method for wind power time series[J].IEEE Transactions on Power Systems,2014(6):2628-2635.

Abstract:The paper presents a typical daily load characteristic calculation method based on K-means, aiming at the problem of large error in the traditional typical daily load characteristic selection method. First, the annual load characteristic curve is grouped in a monthly scale. Next, the maximum value, the minimum value, the maximum value generation time, the minimum value generation time, the peak-to-valley and the 5 indexes of the daily load characteristic curve are normalized, and the five characteristic values of each group of sample data are clustered by the K-means cluster analysis method. and finally, after the characteristic of the mutation load is eliminated, the sample furthest from the cluster center is selected to be the typical daily load of the current month characteristic. The results show that the proposed method can effectively select the typical daily load characteristic curve.

Key words:K-means; typical day; load characteristic