基于偏最小二乘的配电网线损率影响因素定量分析

2019-02-20 06:42:40丁忠安蒋敏敏林永春谢国荣
仪器仪表用户 2019年3期
关键词:损率台区气象

丁忠安,高 琛,蒋敏敏,林永春,谢国荣,吕 游

(1.国网福建省电力有限公司 电力科学研究院,福州 350009;2.国网信通亿力科技有限责任公司,福州 350009;3.华北电力大学 新能源电力系统国家重点实验室,北京 102206)

0 引言

配电网线损率是反映电网经济运行水平的综合性技术经济指标之一,配电网线损对电网的经济运行、无功优化以及输配电价制定等工作有着重要的影响。随着用电负荷增加,低压配电网的线损问题越来越突出。通过分析配电网线损的影响因素,进而得到准确的线损计算方法,不仅有利于降低线损率,提高电能传输效率,而且还有利于配电网设计和结构优化,提高电网企业的经济效益[1]。

配电网线损率的机理计算方法是通过分析配电网中电力损耗设备的物理特性,建立对应的等值模型来计算线损率,其中包括均方根电流法、最大电流法、平均电流法、最大负荷损耗小时法和等值电阻法等方法[2]。由于配电网结构及电力设备特性复杂,在计算线损率时需要较多的等效和假设,从而会造成计算结果的偏差,不便于科学、准确地降损分析。随着配电网信息化技术的发展,各台区线路的电压、电流、功率等电力运行数据已实现了在线测量,采用神经网络等人工智能技术分析配电网电力运行数据并建立线损率预测模型,可以实现配电网线损率的快速计算。在建立线损率模型时,需要分析线损影响因素来确定模型的输入变量。现有的方法一般通过定性分析选择线损的影响因素,但是,台区配电网线损受多种因素影响,且各因素之间也相互联系。因此,通过定量分析选择对线损影响程度较大的因素,对实现配电网线损率的建模和计算都有重要的意义。

偏最小二乘(Partial Least Squares,PLS)是一种新型的多元统计数据分析方法,PLS方法集多元统计回归、典型相关分析和主成分分析的基本功能为一体,可以同时实现数据结构简化和变量间相关分析[3,4]。PLS通过寻找与因变量相关性最大的变量组合,提取的主成分具有很好的解释性并且能够克服各变量存在多重相关性。通过PLS方法消除多个变量间的相关性,得到全部变量对因变量重要性指标。

本文提出一种配电网线损影响因素的定量分析方法,基于电网数据利用PLS法分析各参数对配电网线损率影响的重要性指标,实现各影响因素的定量表征,为配电网线损率的建模和计算提供变量选取的依据。

1 线损数据采集及预处理

1.1 线损影响变量选择

配电网线损是指在给定的时间内,配电网各元件消耗的电能。配电网的线损主要包括:线路导线中的损耗,电能表线圈和铁芯中的损耗,电容器和电缆的介质损耗等,这些损耗主要受电网布局、用电性质及用电负荷等因素的影响。选择与台区配电网网架结构和负荷相关的电气特征参数来作为初始变量,主要包括:台区变压器容量x1、台区用户数x2、用户总容量x3、表计数目x4、居民容量占比x5、有功电量x6、无功电量x7、均方根电流x8、气象温度x9、气象湿度x10和气象风速x11;其中,台区变压器容量x1、台区用户数x2、用户总容量x3和表计数目x4反映了网架结构参数对配电网线损率的影响,居民容量占比x5反映了台区主要的用电性质对配电网线损率的影响,有功电量x6、无功电量x7和均方根电流x8反映了台区的负荷水平对配电网线损率的影响,气象温度x9、气象湿度x10和气象风速x11反映了气象条件对配电网线损率的影响。

表1 电力运行参数变化范围Table 1 Range of changes in power operating parameters

1.2 线损数据预处理

基于上述分析的特征变量,采集某地区5个台区低压配电网时间跨度从2017月8月1日~2017年9月30日,共两个月的电力运行数据。其中,有功电量和无功电量每日采集一个样本,均方根电流由各相电流采集后折算成每日一个样本,气象温度、气象湿度和气象风速每小时一个样本,并通过数据融合折算为每日一个样本,台区变压器容量、台区用户数、用户总容量、表计数目和居民容量占比由台区档案查询得到。为了保证所采集数据的真实和有效性,需要对其进行预处理,以避免因数据问题带来计算误差[5]。在进行预处理时,考虑以下方面:

1)离群点处理:对于离群点样本,通过K-means聚类方法来检测离群点,并对整条数据记录删除。

2)缺失样本处理:对于某变量的缺失样本,利用该样本附近的数据样本进行插值填充;如果该记录的变量样本缺失过多,则删除本条数据记录。

3)样本有效性判定:以表计的采集成功率来剔除无效样本,当该条样本的电力数据采集成功率低于99%时,则本条样本记录无效,应当删除。

对采样数据进行预处理和清洗后,最终共得到210条数据样本,其中各电力运行参数的变化范围如表1所示。

由表1可以看出,不同变量的变化范围和量纲均不相同,为了使计算结果不受变量变化范围和量纲的影响,需对原始数据进行归一化处理,按照式(1)归一化到[-1,1]范围内。

其中,x和x'分别是归一化前和归一化后的值,xmax和xmin分别是变量的最大值和最小值。

2 基于单变量PLS的重要性分析

2.1 PLS原理

设样本容量为n,将上述变量作为自变量,其样本矩阵记作X∈Rn×p,将线损率作为因变量,其样本矩阵记作Y∈Rn×1。按照式(2)标准化处理,使样本均值为0,方差为1。

将自变量和因变量数据标准化后,得到矩阵E0、f0,记t1、u1为E0、f0的第一主成分,w1、c1为E0、f0的第一主轴为单位向量。提取第一个主成分t1、u1,并使t1和u1尽可能携带各自变量系统中的变异信息,t1与u1的相关程度能够达到最大。即有:

用Lagrange法解此优化问题,得到:

由于f0是单变量,则有c1=1,易求w1为:

可得到第一主成分:

然后求得回归方程:

用残差矩阵E1、f1取代E0、f0,求第二主成分t2,并依次进行,直至满足交叉有效性原则。

图1 线损率影响变量重要性计算流程Fig.1 Line loss rate impact variable importance calculation process

2.2 变量重要性指标

定义变量重要性指标v来表征自变量xi对因变量y的解释能力和重要程度。

其中,r(y,th)用来计算两变量之间的Pearson相关系数,m是主成分的个数,是轴wh的第i个元素。

将v进行归一化,得到归一化后的各变量重要性指标γ:

3 计算结果分析与讨论

3.1 计算流程

将台区配电网的台区变压器容量、台区用户数、用户总容量、表计数目、居民容量占比、有功电量、无功电量、均方根电流、气象温度、气象湿度和气象风速作为初始特征变量,从配电网电力运行数据采集数据样本并进行预处理和归一化,利用PLS方法基于式(2)~式(10)进行变量重要性分析。详细的流程如图1所示。

表2 各变量重要性指标值Table 2 Value indicator values for each variable

图2 各变量的重要性指标归一化值Fig.2 Normalized values for the importance indicators of each variable

3.2 结果分析

按照上述流程进行计算,经过4次迭代后满足精度要求,得到PLS各主成分的值,基于式(9)计算各变量的重要性指标值,如表2所示,并按式(10)计算重要性的归一化值,如图2所示。由表2和图2可以看出,配电网的台区变压器容量x1、用户总容量x3和居民容量占比x5对线损率影响最大,这说明网架结构参数及台区用电性质对配电网线损率有着重要的影响,而台区用户数x2和表计数目x4与上述3个变量相比,影响较小。从图2还可以看出,变量x6和x8的重要性指标也较大,表明有功电量和均方根电流对电网线损率也有一定的影响,即配电网负荷特性也影响着线损率。在气象因素中,气象温度x9对线损率的影响最大,而气象湿度x10和气象风速x11的影响相对较小。

通过上述分析,可以用台区变压器容量x1、用户总容量x3和居民容量占比x5来表征配电网网架结构,用有功电量x6和均方根电流x8来表征配电网负荷特性,用气象温度x9来表征气象特性。这样在进行线损率建模和计算时,便可将11维的影响因素变量降低为6维,而且去除不相关变量,从而简化计算量并提高计算精度。

4 结论

提出一种基于偏最小二乘的配电网线损影响因素定量分析方法,基于机理分析,选择配电网线损率的影响变量,从配电网中采集各变量的电力运行数据,并对数据进行清洗、补全等预处理和归一化,去除离群点、缺失样本以及量纲对分析结果的影响,基于PLS算法得到各参数对配电网线损影响的重要性指标,实现各影响因素的定量表征。实验结果表明,可以将影响配电网线损的11维变量降低为6维,从而为配电网线损率的建模和计算提供变量选择的依据。

猜你喜欢
损率台区气象
气象树
我国水库淤损情势分析
水利学报(2022年3期)2022-06-07 05:26:02
《内蒙古气象》征稿简则
内蒙古气象(2021年2期)2021-07-01 06:19:58
气象战士之歌
心声歌刊(2019年5期)2020-01-19 01:52:52
大国气象
降低台区实时线损整治工作方法
电子制作(2017年2期)2017-05-17 03:55:22
无功补偿极限线损率分析及降损措施探究
电子制作(2017年2期)2017-05-17 03:55:17
供电企业月度实际线损率定量计算方法
电子制作(2016年1期)2016-11-07 08:42:53
三合一集中器作为台区线损考核表计的探讨
多功能低压台区识别设备的研制