基于多维特征量融合的配电网拓扑异常溯源与应用模型研究

2020-08-08 03:14
浙江电力 2020年7期
关键词:双电源配电网变压器

(国网浙江海盐县供电有限公司,浙江 嘉兴 314300)

0 引言

配电网同期线损异常治理作为“分区、分压、分线、分台区”同期线损监测治理工作中重要一环,目前正面临着多方面挑战。其中10(20)kV分线线损分析工作为配电线路同期线损异常治理的重要内容[1]。PMS2.0 系统中的拓扑关系是线损率的计算基础,也关系到现场电力线损治理作业人员的安全。在实际配电网拓扑异常的治理过程中,线损治理人员需要查询电网GIS(地理信息系统)、PMS2.0 系统、用电采集系统、营销业务系统等系统,提取图形信息、档案信息、电量负荷等多源数据,对不合理线损率进行判断。线路拓扑异常点分析对线损管理人员业务和数据分析处理能力要求极高,同时存在基础数据量大、拓扑异常诊断分析复杂和排查难度较高等问题,目前缺少量化分析和综合分析的手段[2]。

目前有关电网拓扑异常的国内研究较少,从管理和理论角度说明配电网拓扑异常对线损率影响的分析流程和处理策略,没有依靠数据搭建基于大数据的数据挖掘和机器学习模型并提出有效的解决方法[3]。

为此,本文从实际应用场景出发,首先分析了浙江省嘉兴海盐地区的中压线损异常原因,针对配电网线路拓扑异常造成台区线损异常的情况进行分析,通过大数据挖掘技术,协同营配专业合理分工,充分挖掘每条10(20)kV 配电线路拓扑异常的数据价值。以机器学习算法为基础,规则引擎为补充,构建了线变关系、双电源和线路转供3 个子分析模型,并使用浙江某市的现场数据进行模型验证。结果表明本模型可以有效的识别定位配电网拓扑异常,减少配电网中高损、负损线路,大大缩短了人工排查时间和精力,大幅提升线损异常排查效率,夯实基础数据质量管理,成为泛在电力物联网的建设应用典型。

1 配电网线损异常分析

经过调研,2018 年海盐公司共有公用配电网线路220 条,全年累计发生线路“负损、高损”495 起,其中409 起为线路拓扑异常引起,占比高达82.63%,强化线损拓扑异常治理迫在眉睫。

传统治理模式以人工排查为主,手段有限,数据量大,异常排查无目的性,诊断工作复杂,治理效果差[4-5]。结合大数据挖掘我们发现:线变关系异常、双电源问题、转供是3 种常见配电网拓扑异常。

线路-变压器问题是线路在建档和运维过程中,档案记录未及时更新等原因,导致10 kV 线路与变压器对应关系混乱,存在异常(简称线变关系异常)。

双电源问题是指一个高压用户存在两个或多个计量点,每个计量点分别对应着一条线路[6]。由于现场实际操作和系统档案录入等方面出入,导致线路与计量点关系错误。

转供则是一种倒闸操作,需要线路停电对设备进行检修时,为了保证供电可靠性,电力人员会切换配电变压器或专变用户的供电线路,称为倒闸。转供倒闸操作通常是临时性操作,会导致档案数据变化,从而影响线损计算或配电线路相关的分析[7-8]。因此,需要从运行数据的变化特征上进行分析,识别转供的情况。

在本文统称为配电网拓扑异常,如图1 所示。实际场景中原属于线路A 的变压器A3,A4转移到线路B,而系统计算线损时,按照原先档案拓扑计算,则线路A 会发生大损,线路B 会发生负损的情况。将直接导致供电企业对每条线路的成本核算错误,影响供电企业的正常经营和长期规划[9]。线路停电时无法及时告知用电客户,造成用电客户的经济损失。

图1 配电网拓扑异常

2 配电网拓扑异常模型

上一章对海盐地区中压线损原因进行调研,根据调研结果,建立适用于海盐地区的配电网台区线损智能诊断模型,基于运行数据的配电线变关系分析,双电源分析和线路转供分析3 个模型如图2 所示。

图2 多维特征量融合配电网拓扑异常模型

本研究对浙江省某市2 527 条线路,35 841个公变和25 574 个专变用户进行建模,结合电力营销系统,用电信息采集系统和调度OPEN3000等系统,获取运行数据如:负荷、电量、电压、线路日电量和线损率等,根据设备采集状态对数据异常值和缺失值过滤筛选处理,剔除电压数据中非整时刻(15,30,45)的数据,确保采集电量数据、负荷数据的准确性,汇总、关联有效的信息进行数据挖掘。

2.1 基于运行数据的线变关系异常分析

本文在长期稳定运行的线路中,选择10 546个公变台区和高压用户作为基础样本。根据2019年现场已核实发生过档案异常的变压器中,随机选择282 个公变或专变为异常样本,其余未发生过档案异常的变压器为正常样本。

2.1.1 样本特征构造

基于供电企业现有采集数据进行样本特征构造,从用电信息采集系统中获取配电变压器的负荷数据,如电压、电流、功率等数据。对档案异常的特征进行了电压曲线对比分析如图3 所示,横坐标表示异常发生时间某天的96 个时刻点,纵坐标表示变压器电压、实际正常供电线路与错误供电线路电压。分析发现变压器与实际供电线路的电压具有明显的相似性,而错误供电线路则无相似性。

因此,本文基于电压数据进行特征构造。使用皮尔逊相关系数探索线路与线路下所有变压器的电压相关性如式(1)所示[10]:

式中:Cp为电压相关性特征;Cp,ij为线路下变压器i 与变压器j 之间的电压相关性;Cp,il为变压器i 与线路l 的电压相关性。

考虑到每条线路的配变数量不一致,无法直接将电压相关性矩阵代入模型,所以对计算得到的电压相关性特征做列聚合,计算每一行统计学中的最大值、最小值、平均值、标准差等[11],得到关于电压相关性的统计矩阵,如式(2)所示:

式 中:pi,mean,pi,std,pi,max,pi,min,pi,skew,pi,kurt分 别 为变压器i 与同线路下所有变压器及线路的皮尔逊相关系数平均值、标准差、最大值、最小值、偏度和峰度,用于描述变压器i 与线路的电压相关性分布特征。以pi,mean为例,其计算为:

同时加入变压器自身的电压数据统计值,如式(4)所示:

式中:ci,mean,ci,std,ci,max,ci,min,ci,skew,ci,kurt分别为在指定时间内变压器i 对所属线路l 电压比值的平均值、标准差、最大值、最小值、偏度和峰度等。以ci,mean为例,其计算式为:

式中:Ui,k为变压器k 在时刻的电压值;Ul,k为线路l 在时刻k 的电压值。

为了从全局观测短期、中期的线路和变压器的运行状态。研究选取当前日期前1,3,7,15,30,60,90,120,150 天作为不同的观测时间尺度特征。

在固定的观测周期内,统计负荷特征可反映线路以及变压运行状态,研究统计了不同线路在不同时间尺度下电压相关性的统计学数据,如均值、最大值、最小值、方差、标准差、分位数等数据作为入模特征,得到样本数据集X:

式中:p1,p3,p7分别为基于1 天、3 天、7 天的电压数据构建的相关性特征;c1,c3,c7分别为基于1 天、3 天、7 天电压数据构建的统计学特征。

2.1.2 模型构造

在Kaggler 比赛发布的《实践中模型堆叠指南》中提出一种Stacking(堆叠)模型融合的思想[12],Stacking 算法是一种特殊的集成方法,通过结合不同个体学习器的预测结果产生元层学习器,对数据进行预测。当训练数据量大时,可以有效的避免单模出现过拟合或者欠拟合而造成模型的预测准确率低的现象[13]。因此本文采用Stacking 思想对模型结果进行堆叠表决。

Stacking 模型投票表决法如图4 所示,模型构造流程如图5 所示。首先,分别采用逻辑回归、朴素贝叶斯、支持向量机、决策树、随机森林、梯度提升决策树、极端梯度提升和轻量梯度提升算法构建8 个一级子模型y1,mdl,j,各个一级子模型输出样本被判别为1的概率值p1,mdl,i,p1,mdl,i∈[0,1][14-17]。

随后,通过不重复组合7 个一级子模型的输出,作为二级子模型的输入特征值,以此构建7个LR(逻辑回归)二级子模型,并预测第j 个二级子模型的输出y2,mdl,j,其中j=1,2,…,7。

进而统计7 个二级子模型中输出为0 和1 的数目count0和count1,计算公式为:

图5 模型构造流程

最后,通过投票法决定该样本的输出(0/1),即是否发生线变,投票机制为:

式中:count0和count1分别是7 个二级子模型预测出来0 和1 的数目统计;yfinal为样本的二分类类别。

2.2 基于运行数据的双电源分析引擎

根据双电源的特点,对双电源用户进行定义,即1 名用户对应2 块电表,且这2 块电表分别由不同线路供电。

对浙江某供电企业的所有专变用户进行分析,得到双电源用户174 名。获取双电源变压器供电的线路以及同线路的所有变压器电压数据,对异常和缺失数据进行删除,保留近1 个月数据完整度超过70%的配电变压器[18-20],计算待检测的双电源线路中变压器与同侧、对侧两条线路的电压相关性和差值。

2.2.1 变压器电压相关性计算

由于双电源用户的户号都存在两块不同的电表,且2 个电表分属2 条线路。分别计算每个电表与同用户下所有线路电表的电压相关性。定义本侧线路为档案所属线路,对侧线路为同用户下另一个表计的档案所属线路。

统计6 月份15 天每个电表与本侧、对侧线路的电压相关性,得到本侧线路15 天相关性箱型图如图6 所示,对侧线路15 天相关性箱型图如图7 所示。从图中我们发现,每日电压相关性均在0.75~1.0 之间,大多数相关性在0.9 左右,并保持稳定。

图6 本侧线路15 天相关性箱型图

图7 对侧线路15 天相关性箱型图

计算每个电表15 天内的本侧和对侧线路相关性的平均值,得到分布统计特征如图8 和9 所示。图8 本侧线路15 天相关性平均值分布图中相关性平均值更聚集在0.9~1.0 之间,计数均在100 以上,平均值0.8 以下分散计数,均不足30。图9 对侧线路15 天相关性平均值分布图中事件也聚集在0.9~1.0 之间,但计数在75 以上,0.8以下分布较多且不等计数25 左右。由此可见,本侧线路相关性平均值比对侧线路相关性更聚集,发生计数更频繁,分布在0.95 左右,所以可以根据电压相关性来构造特征。

图8 本侧线路15 天相关性平均值分布图

图9 对侧线路15 天相关性平均值分布图

2.2.2 特征构造

设专变用户ID 为u,两组变压器分别接终端m,线路为l。电压相关系数为Pml,u。例如:专变用户1,有两个终端,终端1(meterno1)与本侧线路1(lineid1)电压相关系数为P11,1,与对侧线路2(lineid2)电压相关系数为P12,1;终端2(meterno2)与本侧线路2(lineid2)相关系数为P21,1,与 对侧线路2(lineid2)相关系数为P22,1。

终端1 的特征Pm1,1=P12,1-P11,1,终端2 的特征Pm2,1=P21,1-P22,1,两个特征共同构成用户u 的特征Pu1=[Pm1,1,Pm2,1]。

对每个用户,以终端1 的相关性差值为X 坐标,终端2 的相关性差值为Y 坐标,以Pm1为X轴,Pm2为Y 轴绘制得到热力图如图10 所示。得到最多的特征值分布在0~0.1 之间。可以观察到大多数双电源用户分布在原点和第三象限附近,第一、二、四象限分布较少。

2.2.3 双电源异常指标构建

图10 用户与终端的相关性差值热力图

双电源用户只存在变压器与线路所属关系不一致的情况,不存在两个变压器终端接在同一个线路上的情况[21]。比如,用户1 的特征为Pu1=[Pm1,1,Pm2,1]。根据业务经验和样本统计分析,若Pm1,1大于0,说明对终端1 与线路2 的相关性大于线路1,即终端1 属于线路2 的概率较大。因此,研究定义双电源发生的概率为异常嫌疑度Psp1,双电源异常发生的概率(嫌疑度)计算结合以上样本特征分析得到以下4 种判断情况。

(1)Pm1,1和Pm2,1均大于0,其发生双电源异常的概率较大,公式为:

(2)Pm1,1和Pm2,1均小于0,确定为正常用户,双电源发生概率(嫌疑度)为0。

(3)当Pm1,1>0 且Pm2,1<0 时,若说明用户正常,双电源发生概率(嫌疑度)为0;若确定为双电源发生概率(嫌疑度)较大的用户,计算公式为:

(4)当Pm1,1<0 且Pm2,1>0 时,与情况(3)类似。

经过以上计算,双电源异常发生的概率(嫌疑度)分布如图11 所示。图中大部分用户嫌疑度集中在0.1 以下。所以,双电源分析引擎设定嫌疑度大于0.1 的用户即为双电源异常怀疑对象。

2.3 基于运行数据的转供分析模型

变压器A 在线路A 下,变压器B 属于线路B,在实际电网运维检修过程中,线路AB 之间增加导线和断路器,当断路器发生动作时,变压器A3 和A4 从线路A 供电转换到线路B 供电,由于档案所属线路A,会导致线路A 发生负损,线路B 发生大损[22-24]。结合转供特征大数据分析,发现转供线路的有功功率具有突变性,计算线路功率当前时刻与下一时刻的差值,正常供电时差值小且稳定,一旦发生转供,差值波动大。

图11 嫌疑度分布和异常用户分布图

2.3.1 特征计算

根据转供记录获取对应线路和电压器的当天和前后1 天(总计3 天)的数据,得到变压器与线路的时序数据,计算每个时刻线路功率和和上一个时刻的功率差值,计为功率差ΔA:

获取ΔA 的时间序列数据,计算均值、标准差按照6sigma 管理策略,定义功率差的均值±3sigma为合理区间。

2.3.2 异常识别

因为每个时刻发生转供的事件与其他时间的事件无关,所以每个时刻发生转供的概率符合正态分布。本文针对每条线路的每个时刻,观察当前时刻及后续5 个时刻的差值。利用正态分布计算这6 个时刻值是异常点的概率,计算公式为:

同时,每个时刻发生转供事件为随机事件,任何时刻都为随机变量,服从同一分布,并且互相独立。所以每个时刻发生转供事件独立同分布计算,得出时刻ti是异常的整体概率pti,公式为:

当pti大于基于经验判断的阈值0.01,则判定为时刻ti线路发生了转供。将转供线路电量差值时间序列数据可视化如图12 所示。可发现发生转供的线路电量明显突变,模型可以准确的感知到线路发生转供。

转供操作是电网运行的常规操作方式,因此需要每日监控线损情况,分析线损异常线路。通过本模型的分析,能够及时发现转供线路,计算真实的线损数据。

图12 发生转供线路的电量波形

3 模型效果评价

本研究数据采自“浙电云”大数据平台,穿透多系统进行数据整合,数据来源广、容量大[25]。采用8 种子模型优劣对比,形成最优Stacking 顶层模型,输出结果更具有科学性,三大算法模型相辅相成,对全量数据进行分析,精准推送异常配变,结合历史数据和样本数据,融合分为训练集和测试集不断训练得出优化模型。

3.1 线变关系异常分析模型效果评估

为确保评估准确,采用选择AUC 作为评估指标。计算分类准确程度,ACC=模型正确预测样本数/总样本数,得到各模型在测试集上的使用效果如表1 所示。

表1 各模型测试效果

对应的ROC_AUC 曲线如图13 所示。

图13 ROC_AUC 曲线

根据样本标签统计出正、负样本的数量,假设正样本数量为P,负样本数量为N;接下来,把横轴的刻度间隔设置为1/N,纵轴的刻度间隔设置为1/P;再根据模型输出的预测概率对样本进行排序(从高到低);依次遍历样本,同时从零点开始绘制ROC 曲线,每遇到一个正样本就沿纵轴方向绘制一个刻度间隔的曲线,每遇到一个负样本就沿横轴方向绘制一个刻度间隔的曲线,直到遍历完所有样本,曲线最终停在(1,1)点,整个ROC 曲线绘制完成。这样每一组图像在图中都会有一个坐标,可以连成一条折线。一般的,希望分类器得到的分类结果是完全正确的,也就是正例样本全部都能够被检测出来,并且不会混入反例样本,这个时候TPR→1 且FPR→0,反应在图像上好的分类器的折线应更加接近左上角,当样本足够多时,折线就近似为圆滑的曲线。所以,从图13 和 表1 中可以发现,前4 个算法Naive Bayes,LogisticRegression SVM,DecisioTree的AUC 曲线(实线)未贴近左上角1.0,因此准确率较低,但是泛化能力比后几个模型高,可以充分证明经过Stacking 后可以结合各个模型的优点,削弱缺点的影响。

最终模型输出得到混淆矩阵,67 个异常用户中,可以准确定位64 个用户,异常识别命中率达96%。本线变关系模型能够有效识别线变关系异常的中压线路,辅助进行线损异常排查,保证线损指标的真实可靠,有助于提高线变关系准确性。

3.2 双电源异常分析结果

研究对浙江某供电企业的1 027 名专变用户进行分析,将双电源异常发生的概率(嫌疑度)大于0.1 的用户进行标注,并绘制电压相关性差值结果散点如图14 所示。

图14 用户与终端的电压相关性差值散点图

图14 中,横、纵坐标分别标识用户与终端1和2 相关性数值。从图中可以看出用户与终端电压相关性差值在第二象限,标识点的用户即为双电源异常用户,共识别出22 个异常用户。经过与现场电力人员核实,准确识别双电源异常用户20 户。证明本分析引擎可以有助于梳理双电源用户真实的线变关系,提高专变用户的供电可靠性。

3.3 配电网拓扑异常模型应用效果

由于当前国内外研究工作主要是针对低压用户所属台区的校验和馈线拓扑结构关系的校验,并未涉及台区配变所属10 kV 中压线路的校验(即线变关系校验),也无利用大数据机器学习的方法进行配电网拓扑识别。所以本文与传统人工10 kV 配电网拓扑识别方法对比如表2 所示。本研究3 种方法可以有效的提高配电网拓扑异常识别准确率,其中线变异常识别准确率为96%,双电源为85%,转供为60%,传统人工排查拓扑治理准确率为20%。配电网线路拓扑异常排查时间下降,治理效率提高由传统2 个/天/人,最高可提高到5 个/天/人。识别时间从传统人工现场排查2 h,缩短到系统算法判别40 min 以内。

表2 配电网拓扑识别方法对比

综上,运用本研究3 种方法配电网拓扑识别模型,可有效指导营配协同治理,协同现场开展现场集中核查、数据整治工作,现场核查准确率高达91.3%,同期线损高损、负损线路数下降82.6%。某市公司10(20)kV 分线达标率情况2018年为79.04%,2019 年提升至98.14%。

另外,可减少高压用户信息报送错误,减少高压用户投诉风险,提升用户满意度。通过模型,寻找线损最小下线路联络开关最优位置,提升电网运行效益。强化现场验证与模型识别相结合,提升治理效率,循环迭代最优模型[26],推广应用将推进配电网线损精益化管控。

4 结语

配电网拓扑异常模型的研究,可以帮助现场人员快速定位10 kV 线路线损拓扑异常,找出线变关系异常,辅助电网人员制定合理的配电网拓扑方案。从而提高现场排查工作效率,提升线损治理水平,将带来大量的经济效益、社会效益和管理效益,模型应用前景广泛,可以推广复制至各个地区。下一步,将在现有模型的基础上,使用更多地域的电网运营数据,对现有模型进行改进,提出适用范围更广的配电网拓扑诊断模型。

猜你喜欢
双电源配电网变压器
10KV变压器配电安装柜中常见问题分析
理想变压器的“三个不变”与“三个变”
面向电力通信的传输设备双电源供电系统设计
配电网FTU配置优化方法研究
低压配电系统的双电源或双回路电源的切换位置
10千伏配电网线损原因与管理策略探析
关于城市10kV配电网自动化实施的探讨
浅谈煤矿应急电源的类型及现场应用
变压器光纤测温探头的安装固定
理想变压器的理解和应用