詹昕 姚奔 金诚 刘烨 沈星汝
摘要:针对探索线损率真实成因,进而指导配电网储备项目开发的问题,提出了基于K-means和主成分回归的线损率影响因素分析模型。首先,通过K-means将数据集中具有相似特征的数据聚为同类,进而对每一类数据进行线损率影响因素分析;接着,选取影响线损率的指标,完成数据归一化处理后,使用主成分分析法对指标进行降维处理;最后,通过线性回歸的方法得到各指标对线损率的影响系数。基于国网同期线损系统采集的Y市B区35 kV电压等级用户数据,仿真验证了所提基于K-means和主成分回归的线损率影响因素分析方法的有效性。
关键词:K-means;主成分分析;线性回归;线损率;影响因素
0 引言
为紧跟大数据时代的步伐,国家电网公司已建设的同期线损管理系统为智能电网的发展提供了数据支撑。线损指的是电能在电网运输过程中以热能形式散发的能量损耗[1]。线损率是电力企业的一项重要综合性技术经济指标,它能反映出供电企业的规划设计、生产技术和运行管理水平。为有效挖掘同期线损管理系统中数据的价值,电力公司需要从战略高度着眼、战术角度入手,将先进的数据挖掘技术手段和科学的系统采集数据手段有机地结合起来[2]。
1 基于K-means聚类算法的日线损分析
K-means的核心就是将一堆数据聚集为K个簇,每个簇中都有一个中心点称为“均值点”,簇中所有点到该簇的均值点的距离都较到其他簇的均值点更近[3]。
在同期线损管理系统中,选取了Y市B区35 kV电压等级2018年4月—2019年4月的日线损率数据。对完成初步数据清洗后的样本进行聚类分析后,数据集被聚类为3类,降维后的聚类可视化图如图1所示。观察可视化图,可认为对数据集的聚类效果较好,能将具有相似特征的数据划分为一类。
2 主成分回归分析
2.1 原理
主成分分析法是通过恰当的空间变换,使新变量主成分成为原变量的线性组合,并选取少数几个在原始总信息量中占比较大的主成分来分析事物的一种方法[4]。其分析流程如下:
(1)对原始数据进行标准化处理。假设原始数据具有p个指标,且每个指标有n个观测样本,可得原始观测矩阵:
由于主成分是从协方差矩阵求得的,而协方差受评价指标量纲和数量级的影响,因此,为克服这一缺陷,需要对原始指标进行标准化处理:
(2)计算标准化后的p个指标的协方差矩阵,即:
(3)计算相关矩阵R的特征根和特征向量。首先,求出相关矩阵R的特征值λi(i=1,2,…,p),并降序排列,即λ1≥λ2≥…≥λp≥0;然后,分别求出各个特征值所对应的特征向量ei(i=1,2,…,p)。
(4)计算方差贡献率ai及累计方差贡献率a(k),第i个主成分yi的方差贡献率为:
最后,线性回归的数学模型如下所示:
2.2 仿真结果
基于本文段落1中的聚类分析方法,对Y市B区35 kV电压等级各类用户的日线损率数据进行主成分回归分析。各类中各指标对线损率的影响系数如表1所示。
因此可认为:在第0类样本中,对线损率产生主要影响的是指标“其他公司转入”电量,并且呈负相关。在第1、2类样本中,对线损率产生主要影响的是指标“其他电压等级输出”,并呈正相关[5]。
3 结语
电力公司已建设的同期线损管理系统为智能电网的快速发展提供了海量的数据支持。为了挖掘用户数据价值从而为电力公司提供建设性的指导,本文提出了基于K-means聚类算法、主成分回归分析方法的线损影响因素分析模型;基于Y市B区35 kV用户2018年4月—2019年4月的日线损数据,仿真分析了影响线损率的主要因素,为电量的有效调度提供了指导性建议。本文所提的数据挖掘方法,对提升线损管理水平、指导电量调配等实际工程问题具有现实意义,能及时调整电网公司降损措施,降低企业成本,提高企业效益。
[参考文献]
[1] 蒋利民,霍大伟,闫华光,等.配电网理论线损计算方法的数值分析[J].电测与仪表,2012,49(9):47-51.
[2] 李超英.基于电网智能化的中低压线损管理研究[D].天津:天津大学,2011.
[3] 姚劲松,安立进,黄文思,等.基于KPCA-SVM的同期线损数据治理研究[J].计算机与数字工程,2018,46(12):2534-2538.
[4] 陈静,陶加贵,周前,等.主成分分析在省级电网线损管理综合评价中的应用[J].电力科学与工程,2016,32(4):36-40.
[5] 袁慧梅,郭喜庆.用遗传算法辅助设计的人工神经网络计算配电网线损[J].电网技术,1998,22(12):17-19.
收稿日期:2020-05-06
作者简介:詹昕(1987—),男,江苏扬州人,高级工程师,研究方向:电力系统自动化。