核主成分与随机森林相融合的配电网线损计算方法研究

2022-09-13 02:14赵成斌
能源与环保 2022年8期
关键词:决策树计算结果配电网

张 华,陈 淼,孙 博,赵成斌

(国网上海浦东供电公司,上海 200122)

线损是电网经济运行水平的关键指标,同时也是反映供电公司管理水平的重要考核指标[1]。尤其是对于一些偏远地区,存在着诸如供电设备老化、电网结构不合理、窃电等问题,会使得该地区出现很高的电能损耗[2],而通过配电网线损计算可为该地区电网结构及运行方式的优化提供很好的技术指导[3]。因此,对配电网线损计算进行研究对于降损节能和电网公司的综合管理水平及经济效益的提高具有重要的意义。

配电网线损传统计算方法主要有均方根电流法、回路电流法和等值电阻法等[4],这些方法虽然具有理论成熟和准确度高等优势,但其需要众多的电气运行信息及参数,且对数据的精确度要求很高[5]。目前我国各地的配电网自动化程度差异很大,传统线损计算方法的计算实施难于有效开展[6]。近年来,人工智能方法被广泛应用于配电网线损计算,取得了较好的效果,不仅能保证较高的精度,而且还能极大地简化线损计算过程[7]。文献[8]将支持向量机法应用配电网线损计算,但其对特征量的要求较高。文献[9]采用BP神经网络法进行线损计算,但其收敛速度较慢,且易陷入局部最优的问题。以上线损计算方法均未进行特征量处理,且存在着线损计算结果精确度不高的问题。

本文提出了一种融合核主成分与随机森林的配电网线损计算方法,通过线损计算实例的分析,对本文方法的实用性和优越性进行了验证。

1 核主成分和随机森林算法基本理论

核主成分分析主要指抽取主成分时使用非线性映射的方法,原始向量由映射函数映射到高维空间,然后再进行线性主成分分析[10]。核主成分分析通过核技巧能够有效避免传统主成分分析中非线性变换的未确知性,所提取的主成分贡献率更加集中,核主成分分析法的优越性已在工程实践中获得广泛的认证[11]。在配电网运行信息不全的条件下,能够获取的特征量较少,而通过核主成分分析后,可进一步挖掘特征量之间的相关性,提供更多且更高质量的特征量,从而为特征量与线损非线性映射关系的建立提供更好的基础。

随机森林算法是一种集成学习的强分类预测器,其对单棵决策树的分类能力要求并不高,鲁棒性和抗干扰能力很强[12]。随机森林算法核心原理是bootstrap重抽样法,生成的决策树是互不相关的,并独立地训练样本和投票,避免了决策树算法识别中过拟合问题的影响[13]。随机森林算法无需独立的测试样本便可实现分类误差的无偏估计,从而有效提高了对待评估样本的预测正确率,随机森林算法在数据挖掘和故障诊断方面,其高效性和实用性的优势获得了广泛的认证[14]。

随机森林算法的各决策树的独立性能有效减少特征量与线损之间出现过拟合的问题,随机森林算法更不易陷入局部最优,能有效提高线损计算的速度[15]。随机森林算法的高干扰性能有效应对配电网运行信息采集时存在干扰的问题,降低对特征量的要求,且随机森林算法具有更强的非线性映射能力,能使线损计算取得更高的精度。

随机森林算法构建如图1所示。过程如下:①导入所有原始样本数据,生成训练集X;②对训练集采用bootstrap重抽样法进行抽样,获得K个训练集,并使每个子集合与训练集X的抽样数一致;③对K个训练集做分类回归树建模处理,寻找各训练集袋外数据的最优分类精度,获得相应数量的决策结果;④对K个决策结果再进行投票表决处理,获得最终结果。

图1 随机森林构建示意Fig.1 Random forest construction schematic diagram

自变量X训练后获得的决策树群为{J1(X),J2(X),…,Jh(X)},则最终输出结果J(X)为:

(1)

式中,h为训练轮数;N(·)为示性函数;Y为输出变量。

当随机森林算法中的决策树的数量达到一定程度时,其泛化误差将趋于一上界值PE*:

(2)

袋外数据为抽取训练集时未被抽中的原始训练集样本,它能够对随机森林算法的性能进行评估[16]。决策树Ji的OOB准确率OOBCorr(i)为

(3)

式中,OOB(i)为决策树Ji对应的袋外数据样本;OOBSize(i)为袋外数据样本的规模;OOBCorrectiNum(i)为诊断后诊断正确的分类结果的数量。

2 融合核主成分与随机森林的线损计算

配电网线损的传统计算方法主要有等值电阻法等,该方法虽然准确性高,应用广泛,但等值电阻法需要众多的电气参数,且计算过程复杂[17]。由于配电网线损的特征量较少,尤其在配电网运行信息不全的条件下,配电网线损的特征量会更少,较少的特征量会使得算法训练后得到的分类器差异不大,造成线损计算结果精度较差。因此,本文引入核主成分分析,将线损特征量从低维的状态空间映射到高维的核空间,更好地挖掘特征量互相之间存在的联系。在核空间用随机森林方法训练得到差异性符合要求的分类器群,从而提高线损计算的精度,而经核主成分法处理后的特征量相关性更弱,可减少随机森林算法训练时的复杂度,从而提高训练的速度。随机森林算法在构建分类体系时,每棵决策树均是随机生成的,且投票也是独立的,因此能够完全避免过拟合的问题,有效避免算法陷入局部最优的问题。随机森林算法对样本数据适应力强、抗干扰性能强,在进行全局搜索时准确性更为优异,能以更快的速度获得全局最优解[18]。

本文以等值电阻法的线损计算结果以及影响配电网线损的电气特征量作为随机森林训练和测试的样本数据,选取的线损相关特征量有:线路总长度、主干线路长度、分支线路长度、导线单位长度电阻、月有功供电量、月无功供电量、配电变压器容量、配电网三相不平衡度和配电网负载系数[19]。本文以这9个配电网线损相关电气特征量来估计配电网的线损,首先采用核主成分进行分析,然后再用随机森林算法实现特征参量与配电网线损之间的非线性映射。本文配电网线损主要计算流程如图2所示。

主要过程为:①对配电网的供电信息进行分析,提取需要的相应电气特征量,并对获得的特征量样本进行归一化处理,然后对归一后的样本矩阵Xi进行核主成分,获得变换矩阵Ti及其变换后的矩阵Yi。②对Yi做重采样处理,为对随机森林进行训练,对特征量进行随机抽取后得到样本矩阵Zi,选取核主元后得到测试样本矩阵Di。③选取合适的随机森林模型参数,模型的输出为配电网线损,采用训练样本矩阵Zi对随机森林进行训练,并对随机森林的参数做改进处理。④采用测试样本矩阵Di测试本文的配电网线损计算模型的准确性和稳定性。

图2 配电网线损计算模型Fig.2 Distribution network line loss calculation model

3 配电网线损计算实例分析

3.1 线损计算实例

以某城市的10 kV配电网为例进行线损计算分析,挑选具有代表性的20条线路的历史数据作为建立本文融合核主成分和随机森林算法的配电网线损计算模型的样本,其中一条线路的拓扑结构如图3所示。

图3 10 kV线路网络结构Fig.3 10 kV line network structure diagram

本文核主成分的核函数选择为高斯核函数,随机森林算法的最佳分裂的变量数mtry和最小节点尺寸取值均为3,OOB误差估计已被证明可无偏估计随机森林算法的性能,本文随机森林OOB错误率与随机森林中树的数量变化情况如图4所示。

图4 随机森林的OOB错误率变化Fig.4 Variation of OOB error rate in random forest

由图4可知,随着决策树数量的增加,随机森林的OOB错误率呈现逐渐下降的趋势,当决策树的数量大于33时,OOB错误率已稳定为0。为保证算法具有一定的裕度,本文取随机森林决策树的数目为40。

3.2 线损计算结果对比分析

为体现本文所提融合核主成分和随机森林方法的实用性,采用本文方法进行多次线损计算,结果如图5所示,具体情况见表1。

图5 线损计算结果对比Fig.5 Comparison diagram of line loss calculation results

表1 计算结果误差情况Tab.1 Error of calculation results

其中等值电阻法的线损计算结果作为参考,计算结果的比较采用均方根误差(RMSE)和平均绝对误差百分比(MAPE),RMSE和MAPE值越小[20],表明结果与预参考值越接近,RMSE和MAPE的计算公式为:

(4)

(5)

根据图5可知,本文融合核主成分与随机森林的配电网线损计算方法的计算结果与线损参考值非常接近。表1的计算误差也表明,采用核主成分进行特征量优化处理能提升配电网的线损计算效果,本文线损计算结果的MAPE和RMSE分别为2.53和1.65,线损计算结果误差很小,本文方法能在配电网线损计算中获得很好的精度。

4 结论

本文提出了融合核主成分和随机森林的配电网线损计算方法,利用核主成分对线损特征量处理后再由随机森林进行线损的非线性映射计算,通过配电网线损计算实例的分析,结果表明随机森林算法具有更加强大的非线性拟合能力,而本文采用核主成分进行特征量优化处理后能进一步提升配电网的线损计算效果,计算后的误差MAPE和RMSE非常小,准确度很高。本文融合计算方法能获得优良的计算效果,可为配电网的线损管理及节能降损提供有效的理论参考和技术指导,从而更好地提高配电网的经济性和管理水平。

猜你喜欢
决策树计算结果配电网
配电网FTU配置优化方法研究
10千伏配电网线损原因与管理策略探析
决策树和随机森林方法在管理决策中的应用
关于城市10kV配电网自动化实施的探讨
趣味选路
扇面等式
求离散型随机变量的分布列的几种思维方式
决策树学习的剪枝方法
决策树多元分类模型预测森林植被覆盖
10kV配电网现状及智能化改造