国网上海长兴供电公司 张佳杰 王岚青 张小芳 中国电建集团装备研究院有限公司 李鹏辉 上海电力大学 李 峥
近年来,随着国家开展整县光伏政策的推进,农村地区光伏占比逐渐增大,导致其配电网台区内负荷类型出现了新特点。随着分布式光伏的不断加入,开始出现低压电网功率倒送问题,使电网的运行产生一些负面影响。因此,有必要研究含分布式光伏接入配电网台区负荷的特性分类问题,从而对变压器选型、错峰调度管理、电网规划提供有力支持。光伏发电系统的容量和接入配电网位置等因素均对配电网的电压分布有影响,光伏渗透率较高的配电网可能出现电压越限的情况,影响了供电电压的稳定性。
目前,配电网台区负荷分类方面展开已有一定的研究。负荷分类方法主要以用电负荷曲线作为研究数据,通过统计学习方法,如聚类分析,挖掘单一或不同用户的典型用电特征[1]。聚类分析作为数据挖掘方法之一,有着广泛的应用,相较于数据挖掘方法中有监督的分类,不需要提前划分类别的无监督式聚类方法更加适用于对用电行为进行分析,其可以以较高的效率获得数据在全局范围内的分布特征,并且有较好的应用前景。因此,如何区分光伏台的光伏特性和传统单纯用户的负荷特性,已经成为业务和技术部门关注并急切需要处理的问题。
本文通过对农村配电网台区负荷数据进行聚类分析,通过数据清洗、归一化和K-Shape聚类分析方法[2],挖掘出配电网台区分布式光伏发电规律,在农村居民用户负荷的背景下,分析农村台区的负荷规律以及用电的高峰低谷等情况,为进一步的负荷预测、改变发输电计划或是调整电价等措施提供。
农村配电网负荷分析是从负荷数据中挖掘负荷特性信息,数据的准确性直接影响所挖掘信息的有效性与可靠性。由于负荷数据的采集、传输和存储过程中存在一定数据缺失,因此需要对数据进行预处理。
针对负荷数据存在的数据缺失和数据噪声等问题,本文首先剔除整体缺失10%以上的负荷数据,其次对部分缺失数据的样本进行滑动平均插值处理,最后通过高斯滑动平均剔除异常数据。
为了方便比较不同量纲特征数据,同时考虑到功率倒送,本文采用零均值归一化。
目前,针对负荷分析问题,研究人员提出了多种聚类方法,其中聚类方法的选择需要根据数据的性质和分析目的而选择。台区负荷数据是一种典型的时间序列数据,因此本文选择一种针对时间序列数据聚类的K-Shape算法进行聚类分析[3]。该方法在许多聚类算法已被用于负载预测问题。确定最佳算法在一定程度上取决于数据集的性质、目的和挖掘目标。在本文中,使用K-Shape聚类算法,有效保存数据特征的时间序列形状。该方法通过一个基于形状的距离度量,实现高效地分析和比较时间序列,并根据形状的距离度量属性,计算聚类质心,从而实现挖掘数据体征,实现对时间序列的聚类。
K形聚类算法由三个主要组件组成:一是基于形状的距离测量;二是时间序列形状提取和;三是基于形状的时间序列聚类。具体如下。
首先计算形状距离,该算法针对时间序列使用高效计算方法导出比例、位移均不发生变化的距离度量。并且,序列和序列的相似性由公式(1)确定。
其产生的值介于0到2之间,0表示时间序列的完全相似性。
为了准确提取形状,该算法将质心计算最优设为函数目标,函数最μ*k优定义为序列的平方相似性最大时对应的聚类中心。优化问题形式如下:
其中,Pk是第k个分区,是第k个分区的初始质心。为了将序列与参考序列对齐,该算法使用SBD度量,该度量为每个序列识别一个理想的移位。
该序列聚类操作需要通过SBD距离度量、形状提取的方式。将序列集X、聚类数K作为K形聚类算法输入,并将相关时间序列随机分给聚类中心。然后,通过算法计算出质心并进一步细化簇的成员关系。重复上述操作直到算法收敛或达到最大迭代次数。
本文选择以华东地区某县农村配电网台区为例进行分析。其中,某台区已知含分布式光伏,且分布式光伏占负荷率大约20%以上,因此本文以此作为含分布式光伏系统的典型台区。该台区在晴空条件下工作日和节假日负荷曲线如图1所示。
通过图1可知,工作日从早上7点到下午4点之间,功率为负值,存在倒送现象,最大倒送电流出现在上午12点至下午1点之间,最大倒送负荷为9.926kW。节假日最大倒送负荷出现在上午11点至12点之间,最大倒送负荷为19.14kW。由于农村电网台区负荷较轻,当处于轻负荷阶段,由于光伏发电的并网接入,负荷低谷点从正常的凌晨转移到了白天,甚至出现低压电网倒送功率现象。总体来说,分布式光伏的接入使得农村配电网台区出现了负荷低谷点转移的现象,因此有必要通过聚类分析的方法找出类似的台区,从而实现更有效的配电网管理。
由于分布式光伏接入后台区负荷出现负荷低谷转移现象,因此为了对含分布式光伏台区负荷数据的聚类结果进行类别确定时,本文主要以负荷特征指标分类中的曲线类指标为主,对配电网台区的单日负荷曲线进行分析与分类,对不同类型单日负荷曲线所表现的用电行为特征加以分析[4]。
本文针对收集到的华东地区某县农村配电网824个台区为例进行典型日分析,每天共96个采样点(采样频率15min)进行试验分析。本文首先采用了K-Shape聚类方法进行聚类,此时的相似性度量函数选用欧氏距离函数。通过聚类可以得到五种负荷模式,如图2所示。本文参考文献[5]的分类,对分布式光伏接入台区负荷进一步划分。
双峰双谷型负荷曲线,用电时间多集中于白天,但与单峰型曲线的不同在于出现两个用电时段高峰。图2所示双峰型曲线的负荷主要集中在两个时间段:第一个时间段是上午7点开始,另一个时间段是晚上5点到6点,如图3所示,此类型的单峰型曲线多出现于第三产业的餐饮业和生活服务类。
双峰日间单谷型负荷曲线,由于日间光伏发电功率较大,因此负荷出现了典型的低谷转移,从原有的夜间,转移到了白天。
如图3所示,双峰型曲线的负荷主要集中在两个时间段:第一个时间段是上午5点到7点,另一个时间段是晚上6点到8点。此类单峰型曲线多出现于分布式光伏接入的生活居民负荷,且光伏接入量较大。
双峰夜间单谷型负荷曲线,用电时间多集中于白天,但与单峰型曲线不同在于出现两个用电时段高峰。
如图4所示,双峰型曲线的负荷主要集中在两个时间段:第一个时间段是上午10点开始,另一个时间段是晚上5点到7点,此类型的单峰型曲线多出现于第三产业的餐饮业和生活服务类。
如图5所示,单峰双谷型负荷曲线用电时间主要集中在白天,晚上后半夜负荷非常小,同时由于分布式光伏的接入,在原有单峰型负荷曲线的基础上在下午1点至3点出现了第二个负荷低谷,负荷日峰谷差大,负荷率较低。这类用户一般是生活居民负荷,其用电特性体现在白天人们出去上班晚上回家,用电量主要集中在夜晚,晚高峰一般在晚上6点到8点时间段。
如图6所示,避峰型曲线的负荷主要集中在晚上,白天负荷用电量很低,日最值差比较大,负荷率较高。这是农村灌溉类用电设备产生的避峰型曲线。
本文提出了一种基于K-Shape聚类的含分布式光伏接入的农村配电网台区负荷分类方法。在对典型含分布式光伏接入的台区负荷分析的基础上,根据负荷低谷转移特性,利用K-Shape方法对台区负荷进行了分类。通过上述方法,可以得到居民用户接入分布式光伏的台区用电规律以及负荷高峰低谷信息,从而为农村配电网台区负荷预测,分布式光伏管理等提供了数据支持。