张洋瑞,杨 鹏,申洪涛,冯 波,赵俊鹏,陶 鹏
(国网河北省电力公司电力科学研究院,石家庄 050021)
基于聚类算法的低压台区线损分析方法研究
张洋瑞,杨 鹏,申洪涛,冯 波,赵俊鹏,陶 鹏
(国网河北省电力公司电力科学研究院,石家庄 050021)
针对低压台区损耗在电网总损耗中所占比重比较大的现状,提出一种基于聚类算法的低压台区线损分析方法。介绍线损分析流程,根据台区日均线损率、线损率变异系数、三相不平衡、功率因数异常等4个维度特征值构建线损分析模型,并通过实际算例验证了该方法的可行性。
聚类算法;低压台区;线损分析方法;线损分析模型
电网企业在电能输送和营销过程中,自发电厂出线起至客户电能表止,所产生的电能损耗和损失称为电力网电能损耗,简称线损。线损率是反映电网规划设计、技术装备水平和经济运行水平的重要指标[1]。按照理论线损计算,各电压等级电网中,380 V电网(即低压台区)线损率最高,约为6%~10%;按照统计线损计算,低压台区损耗约占电网总损耗的20%[2]。因此,研究低压台区线损情况具有重要意义。
聚类分析是一种根据数据本身结构特征对数据进行分类的方法,通过聚类分析,可以把数据分成若干个类别,使得类别内部的差异尽可能的小,类别间的差异尽可能的大。聚类分析按照研究对象的不同,一般分为样本聚类和变量聚类;按照分析方法不同,一般分为分层聚类、快速聚类和两步聚类[3]
层次聚类法又称系统聚类,主要思想是对相近程度最高的两类进行合并组成一个新类,不断重复这一过程直至归为一类。或者采用相反的过程,先把所有样本归为一类,再逐次分类,直至分为n类。
快速聚类法又称K-均值聚类,主要思想是将数据视为K维空间上的点,以距离为标准进行聚类分析,将样本分为指定的K类。其中K-means最为常用,改进型算法K-Medoids也有较为广泛的应用。
两步聚类又称两阶段聚类,主要思想是先以距离为依据形成相应的聚类特征树节点,构建聚类特征树,然后通过信息准则确定最优分组个数对各个节点进行分组。
依托用电信息采集系统,对海量数据进行深入挖掘,以低压台区线损率与计量在线监测异常事件为分析对象,提出了一种基于聚类算法的低压台区线损分析方法,该方法的分析流程如图1所示。
图1 低压台区线损分析方法流程
2.1 基础数据抽取
低压台区线损分析的目的在于确定台区配电系统结构运行的合理性,找出配电系统运行、计量装置运行以及线损管理等方面存在的薄弱环节。
为实现对台区线损的深入分析,依托用电信息采集系统,以一定范围(市、县供电公司)的低压台区为研究对象,抽取统计周期内的台区日线损率及计量在线监测异常事件作为分析数据,构建原始数据矩阵。其中,台区日线损率由用电信息采集系统每天采集的供、售电量自动计算得出,计量异常事件选取对线损影响显著的三相不平衡和功率因数异常两类。
2.2 数据甄别处理
台区日线损率受基础档案正确率、采集成功率、采集数据完整率等影响较大,因此需要对原始数据进行甄别处理,筛除明显异常的线损数据。考虑到线损率的大小和波动情况能较好反映台区线损水平,定义变量日均线损率和线损率变异系数。
其中,台区日均线损率能够反映线损率的平均水平;线损率变异系数能够反映台区线损率的离散情况,消除日均线损率差异较大的影响,其计算公式为:
2.3 特征值生成
三相不平衡及功率因数异常作为反映台区统计周期内是否发生计量异常事件的特征值,定义为离散变量,发生记为1,未发生记为0。
日均线损率虽然能反映台区线损水平,但如果直接作为特征值使用K-means算法[4]进行聚类分析,所得分组结果与当前线损管理工作指标不能完全吻合。将某市公司所辖台区日均线损率作为特征值使用K-means算法进行聚类分析,所得分组结果见表1和图2。
表1 聚类分组结果
分组组内数量中位数最小值最大值所占比例1 8729 2.46%0.00%4.69%35.83% 2 8698 6.90%4.70%9.59%35.71% 3 6016 12.12%9.60%16.99%24.70% 4 293 21.42%17.07%27.90%1.20% 5 173 34.03%28.19%41.77%0.71% 6 326 50.00%41.90%55.39%1.34% 7 49 61.77%56.14%66.32%0.20% 8 36 72.03%66.76%76.30%0.15% 9 16 82.63%79.02%86.41%0.07% 10 23 92.31%88.18%99.47%0.09%
图2 聚类分组结果
从聚类结果可以看出,线损率分布呈阶梯型,高于20%的台区占总体比例较小。参考国家电网公司关于台区月度同期线损的相关规定,将日均线损率定义为离散变量。线损率介于0~10%的台区定义为“良”,线损率介于10%~20%的台区定义为“中”,线损率大于20%的台区定义为“差”。
将线损率变异系数定义为连续变量,与日均线损率、三相不平衡、功率因数异常以及台区编号共同构建特征值矩阵。
2.4 聚类分析
由于选取的特征值既有连续变量又有离散变量,且数据规模较大,故选取两步聚类法作为聚类分析算法。同时,两步聚类法利用统计量作为距离指标进行聚类,并根据一定的统计标准来“自动地”建议甚至于确定最佳的类别数,结果的正确性更有保障。
聚类分析过程中选取施瓦兹贝叶斯准则作为聚类准则,并对连续变量进行标准化处理,以达到更为精确的聚类分组结果。
从某供电公司分析区域抽取1个月的线损相关数据作为研究对象,经过数据筛查和预处理后,得到反映线损管理水平的4个变量:日均线损率、线损率变异系数、三相不平衡和功率因数异常,以此作为聚类分析的特征值,如表2所示。
表2 聚类分析特征值
选取施瓦兹贝叶斯准则作为判断聚类效果的统计指标,进行聚类分析,得到的聚类结果见表3。
表3 聚类分析结果
由表3聚类结果可以看出:
a.第1、2组日均线损率为良,变异系数均值较小,说明线损率正常但略有波动,线路运行水平和线损管理水平较好。但第2组有三相不平衡事件发生,说明台区内存在负荷分配不均的情况,线损管理水平可进一步提升。
b.第3组日均线损率为良,变异系数极大,且有功率因数异常事件发生,说明统计周期内线损率波动剧烈,说明可能存在计量装置故障或配电设备老化等方面的问题。
c.第5、7组日均线损率为中,变异系数均值很小,说明线损率较高且波动很小,线路运行和线损管理水平一般。其中,第7组有三相不平衡发生,应首先排查、处理台区负荷分配不均问题。
d.第4、6组日均线损率为差,变异系数均值很小,说明线损率很高且波动很小,线路运行和线损管理水平较差。其中,第6组有三相不平衡发生,应首先排查、处理台区负荷分配不均问题。
在台区线损分析中,一般对月度线损较为重视,仅对月度线损率较高的台区重点分析研究;而影响台区线损的管理、技术因素有很多,需要逐一排查。以上提出了一种基于聚类算法的台区线损分析方法,通过对台区日均线损率、线损率变异系数、三相不平衡、功率因数异常等4个维度特征值的聚类分群,不仅清晰的展示了线损的平均水平和波动情况,而且与三相不平衡和功率因数异常等技术线损因素密切联系,对于台区线损管理工作有一定的辅助决策作用。
[1] 赵全乐.线损管理手册[M].北京:中国电力出版社,2007.
[2] 余卫国,熊幼京,周新风,等.电力网技术线损分析及降损对策[J].电网技术,2006,30(18):54-57.
[3] 陈胜可.spss统计分析从入门到精通[M].北京:清华大学出版社,2010.
[4] 张良均,陈俊德,刘名军,等.数据挖掘:实用案例分析[M].北京:机械工业出版社,2013.
本文责任编辑:杨秀敏
Research of Low-voltage Distribution Network Loss Based on Cluster Analysis
Zhang Yangrui,Yang Peng,Shen Hongtao,Feng Bo,Zhao Junpeng,Tao Peng
(State Grid Hebei Electric Power Research Institute,Shijiazhuang 050021,China)
Aiming at low-voltage distribution network loss occupy larger proportion of total loss in the power grid,a low-voltage distribution network loss analysis method based on cluster analysis is proposed.Introduce process of loss analysis,according to the low-voltage distribution network average daily loss,coefficient of variation,three phase unbalance,power factor abnormal total of four-dimension characteristic value to construct the line loss analysis model,and the feasibility of the method is verified by practical example.
cluster analysis;low-voltage distribution network;line loss analysis method;line loss analysis model.
TM764.1
B
10019898(2017)02000803
20170109
张洋瑞(1985-),男,工程师,主要从事电力计量方面的工作。