基于弹性网络算法的预安排重复停电分析模型

2022-07-06 08:14彭明洋陈晓科彭发东杨强林金郁冉杨
广东电力 2022年6期
关键词:关联系数弹性关联

彭明洋,陈晓科,彭发东,杨强,林金郁,冉杨

(1.广东电网有限责任公司电力科学研究院,广东 广州 510080;2.广东电网有限责任公司,广东 广州 510600;3. 广东电网有限责任公司潮州供电局,广东 潮州 521051;4.广东电网有限责任公司云浮供电局,广东 云浮 527399)

“十三五”以来,随着配电网建设改造的推进和新一轮农村电网升级工作的开展以及新型城镇化速度的加快,市政建设工程量增大,电网建设和改造任务繁重,造成大量的计划施工及检修停电。预安排停电仍然是我国停电的主要原因[1],而且造成了相当一部分用户多次重复停电。挖掘预安排停电影响的关键业务要素,更有针对性地制订业务管控策略,减少重复停电次数,是提升配电网供电可靠性的重要突破点。

近年来,随着智能电网的不断发展和配电网智能化水平的不断提高[2],对电网运行状态的数据收集技术趋于成熟,机器学习、数据挖掘等数据科学技术在电网大数据分析中的应用越来越受到重视[3-14]。现阶段关于配电网可靠性分析方法的研究中:或受限于数据渠道窄、数据集成处理能力弱,对配电网投资规模、网架结构、系统运行、设备运维等领域多源异构数据的信息挖掘不足;或针对较为粗糙的总体性指标,采用层次分析法、德尔菲评分法等进行分析,主观性相对较大[15-22]。刘科研等[16]依据各类工程单位投资造成的预安排停电量的历史数据,设置不同类别工程停电管理水平的可行域上下界,通过对比待评价时间段各类工程单位投资造成的预安排停电量,对预安排停电管理水平进行量化评价。姚忠胜等[17]采用层次分析法和熵权法组合赋权,并引进相关性影响系数,修正计算供电可靠性综合评价指标。郑瑜等[21]通过计算项目单位投资造成的停电时户数,定性研究各类项目投资对配电网可靠性的影响。总体而言,现有分析方法所进行的相关性分析多为汇总、比对等较为粗糙的方法,只关注各类投资、网架结构等单一领域,导致所反映的配电网预安排停电相关运行可靠性的颗粒度不足,对多领域业务指标间的多源性协同作用机制利用不充分,评价结果可能存在不同程度的失真情况;而过分依赖专家经验的定性讨论,也难以深入挖掘多源异构状态下的复杂关联机制。

为此,本文首先从配电网规划建设、系统运行、设备运维等领域出发,选取与预安排停电相关的业务指标,构建特征指标池,并选取多次预安排停电用户占比作为预安排重复停电评价指标;再结合业务分析需求,基于历史数据,通过计算皮尔逊线性相关系数、肯德尔秩相关系数、斯皮尔曼秩相关系数对特征指标进行筛选;然后采用弹性网络算法估计相关业务指标对预安排重复停电指标的关联系数,并计算得到相应的权重系数;最后进行算例分析,以国内某区域所辖19个供电管理单位的历史数据构建关联模型,分析各业务指标对预安排重复停电的影响权重。

1 构建特征指标池

从预安排停电管理现状来看,每年基建、大修技改投资涉及的电网改造建设、设备检修类项目是预安排停电需求的主要来源,年度投资规模很大程度上直接关联当年预安排停电需求数量。为尽可能降低预安排停电的影响,供电企业不断完善网架结构,提升转供电能力,在停电前充分统筹整合停电计划,减少临时停电,并采用合环转电、不停电作业等措施。因此,预安排停电相关的影响因素主要来自电网投资规模、网架结构、系统运行、设备运维等业务领域,建立预安排重复停电分析模型需要提取预安排停电影响因素特征指标作为自变量指标组合,选取预安排重复停电评价指标作为因变量指标,挖掘业务指标和预安排重复停电指标之间存在的内在联系。

根据目前各领域业务指标统计情况,综合指标数据采集的可行性与数据质量,初步选取的预安排停电影响因素特征指标主要包括:基建投资、大修技改投资、单辐射线路数量比例、可转供电率、架空线平均分段数、用户临时停电率、合环转供电比例、计划停电不停电作业化率。以多次预安排停电用户占比作为预安排重复停电评价指标。上述指标组合待进一步数据校验后,用于构建预安排重复停电分析模型的特征指标池。初步构建的特征指标池层级结构如图1所示。

图1 特征指标层级结构

2 基于弹性网络算法的预安排重复停电分析模型

针对初步构建的特征指标池,收集各业务指标与预安排重复停电指标的历史数据,采用皮尔逊线性相关系数、肯德尔秩相关系数、斯皮尔曼秩相关系数等分别量化二者之间的关联程度,进一步筛选具备一定关联程度的业务指标,并增补关联程度不显著但符合业务分析需求的业务指标,最终确定用于构建关联模型的有效业务指标组合。对数据进行标准化预处理,采用弹性网络算法构建关联模型,基于拟合优度系数评估关联模型的有效性,计算单位自变量指标变化对因变量指标变化的加权平均值,获得各领域业务指标对预安排重复停电指标的贡献度。

2.1 基于业务指标关联度分析确定自变量指标组合

针对所构建的特征指标池,基于历史数据,采用皮尔逊线性相关系数、肯德尔秩相关系数、斯皮尔曼秩相关系数分别计算自变量和因变量之间的关联程度,探索业务指标与预安排重复停电指标之间的关联程度,结合业务分析需求筛选用于构建关联模型的有效业务指标。

皮尔逊线性相关系数rp可用于计算2个指标之间的线性关联程度,是极为经典且通用的关联度指标,其计算公式为

(1)

式中xi、yi(i=1,2,…,n)分别为2个指标的样本数据点,n为样本容量。rp的取值范围为[-1,1]。rp越接近0,表明2个指标之间的线性关联程度越弱;rp越接近-1,表明2个指标之间越具有相反的线性变化趋势;rp越接近1,表明2个指标之间越具有相同的线性变化趋势。

肯德尔秩相关系数及斯皮尔曼秩相关系数可用于计算2个指标之间的非关联程度,反映数据样本中所蕴含的秩关联程度。肯德尔秩相关系数τ经典定义的计算公式为

(2)

式中:sgn(B)为符号函数,当B>0时取值为1,当B<0时取值为-1,当B=0时取值为0。τ的取值范围为[-1,1]。τ越接近0,表明2个指标之间的秩关联程度越弱,当2个指标之间完全无关联度时,该指标取值为0;τ越接近-1,表明2个指标之间的秩排列呈现越相反的变化趋势;τ越接近1,则表明2个指标之间的秩排列呈现越相同的变化趋势。

与肯德尔秩相关系数不同,斯皮尔曼秩相关系数ρ首先将数据样本点对应转换为次序样本点,然后计算次序样本点的皮尔逊线性相关系数,其计算公式为

(3)

式中rx,1,…,rx,n和ry,1,…,ry,n分别为对应样本数据x1,…,xn和y1,…,yn的次序,即rx,i为样本点xi在x1,…,xn中排序的序号。当样本数据(x1,y1),…,(xn,yn)互不相等时,斯皮尔曼秩相关系数的计算公式为

(4)

ρ的取值范围为[-1,1]。ρ越接近0,表明2个指标之间的基于次序变换后的线性关联程度越弱,当2个指标之间完全无关联度时,ρ取值为0;ρ越接近-1,表明2个指标之间基于次序变换后呈现越线性相反的变化趋势;ρ越接近1,表明2个指标之间基于次序变换后呈现越线性相同的变化趋势。

基于计算所得的各业务指标与预安排重复停电指标的皮尔逊线性关联系数、肯德尔秩相关系数和斯皮尔曼秩相关系数,对初步选取的8个业务指标进行关联度校验,最终确定用于构建关联模型的业务指标组合。给定的业务指标入选标准为:皮尔逊线性相关系数、肯德尔秩相关系数、斯皮尔曼秩相关系数三者之一达到0.2及以上;或者3个指标数值均低于0.2,但符合业务分析需求。

2.2 数据预处理

经过0-1标准化处理之后的数据会呈现平均值为0、标准差为1的规范性和固定性。具备规范性及固定性的数据可提高后续弹性网络算法的准确性。虽然0-1标准化处理可能对后续建模具备一定的效果改善作用,但对样本数据量也有一定的要求,可用的数据量越大,效果越明显。若数据量相比自变量指标的数量而言不够大,且数据之间的数量级差异不大,则0-1标准化处理的效果反而可能不理想(数据量不足容易导致样本数据特征的代表性不足)。此时不进行0-1标准化处理而直接使用原始数据,也是一种合理方案,可结合实际业务的特征决定。此外,也可以分别基于0-1标准化处理的数据、原始数据构建关联模型,根据业务分析需求及业务背景,确定最佳的关联模型所对应的数据预处理方式。

2.3 采用弹性网络算法构建关联模型

基于标准化预处理后得到的各业务指标与预安排重复停电指标数据,结合业务场景分析需求,采用弹性网络算法构建关联模型。

弹性网络算法[23]是结合了岭回归和套索回归算法优点的一般性正则化算法,在诸多实际领域有着广泛的应用。具体而言,该算法考虑线性回归模型

G=ζ0+ζ1H1+…+ζdHd+ε

(5)

的未知系数估计问题。式(5)中:G为多次预安排停电用户占比;Hk(k=1,2,…,d)为预安排停电影响因素指标,d为指标总数;ζk为指标Hk对多次预安排停电用户占比影响的关联系数(待确定);ζ0反映配电网自身所具有的基准多次预安排停电用户占比;ε为不可观测项,包括其他未被纳入模型的指标对多次预安排停电用户占比G的潜在影响及误差。

对式(5)的回归模型求平均,消去不可观测项ε,得到模型E(G)=ζ0+ζ1H1+…+ζdHd,E(G)为多次预安排停电用户占比的平均值,反映配电网运行的预安排停电状态。通过求解式(6)的带二次规划问题,计算线性回归方程的各领域业务指标关联系数的弹性网络估计值。

(6)

式中:α、β为调整参数,对业务指标的关联系数估计值进行控制;gi为多次预安排停电用户占比的第i个样本数据;hij为第j个预安排停电影响因素指标的第i个样本数据。当β=1时,弹性网络算法即为套索回归算法;当β=0时,弹性网络算法即为岭回归算法;当0<β<1时,弹性网络算法可同时具备套索回归算法和岭回归算法的变量选择和压缩系数特性。以上优化问题可通过经典的优化算法求解。

2.4 基于拟合优度系数的关联模型评估及关联系数分析

根据关联模型的拟合优度系数RS评估关联模型的有效性,计算公式为

(7)

式中γj为关联系数的弹性网络估计值。当RS≥0.85时(阈值0.85可根据实际数据量结合专家意见进行调整)即可认为关联模型刻画达到所需精度。若RS<0.85,可增补更多的业务指标到自变量指标组合中,重新构建关联模型直至拟合优度系数达到要求;亦可结合实际业务分析需求依然使用所得的关联模型。

如果γj为0,表明对应的业务指标对多次预安排停电用户占比无影响;如果γj为负(正)值,表明对应的业务指标对多次预安排停电用户占比的大小有反向(正向)的效果。

2.5 获得影响因素指标对预安排重复停电指标的贡献度

根据拟合优度系数符合要求的关联模型结果,将单位自变量指标变化对因变量指标变化的加权平均值作为贡献度指标,进一步评判各业务指标对预安排重复停电指标的贡献度,计算公式为

(8)

式中Ik为第k个预安排停电影响因素指标对预安排重复停电指标的贡献度。

3 算例分析

本节以国内某区域电网所辖19个管理单位的配电网投资规模、网架结构、系统运行、设备运维等领域业务指标及预安排重复停电指标的历史数据作为样本进行算例分析。

3.1 业务指标的关联程度

所考虑的自变量指标包括基建投资、大修技改投资、单辐射线路数量比例、可转供电率、架空线平均分段数、用户临时停电率、合环转供电比例、计划停电不停电作业化率共8个指标,所考虑的因变量指标为多次预安排停电用户占比。分别计算8个业务指标与因变量指标间的皮尔逊线性相关系数、肯德尔秩相关系数及斯皮尔曼秩相关系数,见表1。可以看出,全部业务指标与因变量指标均具备一定的关联程度,可共同构成后续关联模型的自变量指标组合。

表1 各自变量指标与因变量指标的关联程度

3.2 不进行原始数据的0-1标准化处理

所选19个管理单位8个业务指标的历史数据量相比自变量指标数量不够大(只有19个样本数据,不到所选8个指标数量的3倍),且原始数据各指标的数量级差别不大(基建投资、大修技改投资均以亿元为单位,指标数值大部分为个位数,架空线平均分段数的数值也为个位数,其余指标取值范围均为0~1),故不进行0-1标准化处理,采用原始数据构建关联模型。

3.3 基于弹性网络算法的预安排重复停电分析

采用弹性网络算法构建所选8个业务指标对多次预安排停电用户占比的关联模型,得到的关联模型拟合优度系数为0.918 5,表明关联模型的精度足够高。提取关联模型中各自变量的关联系数见表2,影响权重见表3。

表2 弹性网络关联模型自变量的关联系数

表3 弹性网络关联模型自变量的影响权重

3.4 关联模型结果分析

由表3可知,可转供电率及计划停电不停电作业化率的影响权重排名前2且远超其他指标,表明多次预安排停电用户占比的主要影响因素为可转供电率及计划停电不停电作业化率。结合表2中这2个指标的关联系数可以发现,可转供电率、计划停电不停电作业化率每提高10%,可分别降低2.2%、1%的多次预安排停电用户占比。因此,该区域可着力优先改善这2个指标,通过完善网架结构、提升环网转供电能力、充分应用不停电作业手段,来降低多次预安排停电用户占比。大修技改投资相比基建投资对预安排重复停电影响权重较大,需要加强对设备检修类项目的停电计划管控,减少因电网设施计划检修对用户重复停电的影响。用户临时停电率的影响权重为0.000 2,表明该区域临时停电管控能力较好,基本上不造成用户预安排重复停电影响。

4 结束语

针对现有配电网预安排停电相关的分析方法存在适用场景单一、颗粒度粗糙、客观性欠缺等问题,本文提出一种基于弹性网络算法的预安排重复停电分析模型。构建配电网预安排重复停电指标及投资规模、网架结构、系统运行、设备运维等领域业务指标的多重评估维度指标体系,以多次预安排停电用户占比指标为标准,采用弹性网络算法构建各领域业务指标与预安排重复停电指标的关联模型。通过关联模型分析挖掘多次预安排停电用户占比与预安排停电因素相关的业务指标间的内在关系,可有效准确地挖掘内在作用规律,量化各领域业务主要影响因素指标的贡献度。该分析模型可用于配电网预安排重复停电管控分析,根据预安排重复停电主要影响因素有针对性制订改善措施,也可通过不同领域业务指标目标值组合分析预测预安排重复停电指标目标值。该模型可为电网公司了解预安排重复停电主要影响因素提供客观精准的参考依据,为支撑多领域业务协同优化管控、精准施策、进一步提高预安排停电管理水平提供数据赋能。

猜你喜欢
关联系数弹性关联
为什么橡胶有弹性?
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
为什么橡胶有弹性?
基于灰色关联度对山东小麦新品种(系) 综合表现评价分析
应用灰色关联度法分析稠油热采油井生产主控因素
注重低频的细节与弹性 KEF KF92
“一带一路”递进,关联民生更紧
弹性夹箍折弯模的改进
奇趣搭配
大豆产量及主要农艺性状的相关性及灰色关联度分析