基于孤立森林算法与大数据挖掘的配电网故障距离估计方法*

2022-05-20 15:02向绍斌涂水员
电气工程学报 2022年1期
关键词:边缘代理配电

向绍斌 涂水员

(广西防城港核电有限公司电仪部 防城港 538000)

1 引言

配电网中故障距离的准确测定对于提高运维检修效率,减少停电时间,具有重要的实际意义,但是传统的通过变电站开关保护跳闸,再根据故障指示仪巡线确定故障具体位置的方法,具有效率低、人工成本高的缺点,无法满足近年来配电网规模越来越大、人们用电可靠性要求越来越高的需求[1-2]。

虽然在输电系统中,故障测距已经有了较多的研究[3-4]。但是,在配电网中由于线路呈发散式网络拓扑结构,尤其到末端,分支会更多更复杂,故障定位会存在多重估计的问题,即可能会存在满足等效条件的多个点,导致检测出多个具有相同估计的故障位置,从而影响故障定位过程的不确定性。

文献[5]提出了基于阻抗法的故障距离估计方法,但该方法存在多重估计问题。文献[6]提出了一种基于改进阻抗的故障距离多重估计方法,采用变电站电流和电压暂态特性去辨别多重估计,但辨识率不高。文献[7]提出了一种基于广义单端阻抗的故障定位方法,通过电流分布系数校验,减小了三相接地故障时多重估计的误差,但该方法不能实现单相接地的准确故障距离估计。文献[8]基于粗糙集和自学习的配电网故障诊断技术,以故障影响因素为条件属性,以故障类型为决策属性,通过自学习归约生成粗糙集规则表,进行配电网的故障诊断,但该方法对于复杂回路的故障距离估计准确性还较低。文献[9]基于距离矩阵与分支系数实现配电网故障定位,通过分析配电网拓扑和故障行波的传输路径建立故障分支判定矩阵,并通过改进的行波定位方法实现故障点定位,该方法虽具有较高的准确性,但分支判定矩阵的构建在实际操作中有较高的实现难度。文献[10]将马尔可夫模型引入配电网断路器的可靠性模型中,以计算稳态可用性、故障率和平均故障间隔时间,但未考虑海量数据累积误差对故障定位的影响。

近几年,随着物联网技术的不断发展,“云大物移智”等先进技术越来越受到了电网的青睐,配电物联网应运而生。在配电物联网中,边缘计算、云计算等技术有助于促进提高配电网在运维、管控等方面的水准,以实现精益化的管理目标,提升配电网可靠性,这使得配电网线路故障测距成为可能。

为此,针对配电网线路径向分布、分支线复杂特性,存在多重估计的问题,提出了一种基于孤立森林算法与大数据挖掘的配电网故障距离估计方法。在“云-管-边-端”新型配电物联网架构上,基于边缘计算,即配电边缘代理装置,引入孤立森林算法对异常数据进行识别,通过配电云主站汇聚信号中提取的异常特征数据集,利用大数据挖掘技术定义故障事件间的关联,将异常数据特征集分组为具有相似特征的集群,构建系统发生树,根据数据相似性组织不同的分支分组,确定具体的故障区域。主要工作如下。

(1) 针对传统配电自动化架构缺乏互联、协同自治的问题,提出了一种“云-管-边-端”新型配电物联网架构,其中边缘侧的配电边缘代理装置将配网末端设备数据本地化处理,并结合云侧的配电云主站进行大数据分析,通过云边协同,提高数据处理的效率和准确性。

(2) 针对配电网线路径向分布、分支线复杂特性,存在多重估计的问题,提出在靠近终端设备的边缘侧配置配电边缘代理装置,引入孤立森林算法对故障前后数据进行预处理并识别异常特征,在云侧的配电云主站中采用BDMBCR构建系统发生树,根据数据相似性分组确定不同的分支,定位故障位置,从而进一步缩小了故障距离范围,提高估计准确性。

2 配电网故障距离估计方法

2.1 配电物联网架构

传统的配电自动化系统结构包含了感知层、网络层和应用层三层结构,其中“感知层”由配电终端设备组层,负责配电网数据的采集,“网络层”负责传输感知层的数据至应用层,“应用层”即配电主站服务,负责处理分析终端设备数据,实现业务处理。为了提高配电自动化的数据处理效率,降低延时,引入边缘计算层,即构成包含了“云、管、边、端”四个层次的配电物联网架构,其结构如图1所示。

图1 配电物联网系统架构

其中,“端”是配电物联网架构中状态感知和数据采集的终端设备,包括智能传感单元、配电终端和用能采集设备等。

“边”是位于网络边缘的配电边缘代理装置,就近为终端设备提供相应的计算和决策服务。该层次能够进行终端设备数据的本地化分析,由此高效融合边缘计算和配电云主站大数据分析,进一步提高配电物联网系统整体的计算性能。

“管”是“边”与“云”之间数据交互的通信网络,利用软件定义方式进行多种通信模式融合,包括远程通信网和本地通信网,实现通信资源的灵活管控。

“云”是配电云主站,利用云计算、大数据等技术实现海量终端设备数据的处理和决策分析,实现物联网架构下的全面云化。

基于“云-管-边-端”的配电物联网系统架构,提出故障距离估计方法。当变电站出口保护断路器检测到故障事件时,带有故障时间戳的触发器通过通信网发送到配电云主站。配电云主站下发故障处理指令至配电边缘代理装置,通过配电边缘代理装置发送触发信号至配电网末端各个分支和用户处安装配电终端和智能电表,由海量配电终端和智能电表上送记录的故障前后电压电流数据。由于发生故障时,故障点前后的数据会发生异常突变,在边缘侧配电边缘代理装置,基于孤立森林算法从海量数据中高效提取异常点的特性,形成异常特征数据集上送配电云主站,配电云主站基于BDMBCR将异常数据特征集分组为具有相似特征的集群,构建系统发生树,根据数据相似性组织不同的分支分组,确定具体的故障区域。

2.2 基于孤立森林算法的故障数据特征提取

数据特征提取包括电压和电流信号的预处理,即在配电边缘代理装置中将收集的智能电表(用户单元)和配电终端(分支箱)数据进行特征提取,其中采用孤立森林算法进行故障时数据差异分析[11]。

由配电网末端各个分支和用户处安装的海量配电终端和智能电表提供特征提取所需的故障前后电压电流基频分量幅度、相位角等数据,由于发生故障时,故障点前后的数据会发生异常突变,孤立森林算法具有从海量数据中高效提取异常点的特性,因此本文采用该算法对这些海量数据进行异常点检测。在这之前首先由海量配电终端和智能电表对数据进行预处理,其过程包括以下方面。

(1) 配电终端和智能电表采集提供一个周期内故障前后的电压电流数据。通过低通滤波器,滤除信号中可能存在的谐波。

(2) 采用离散傅里叶变换(Discrete Fourier transform,DFT)对电压电流每个相位(故障前后)进行DFT运算,获取相位角数据。

(3) 计算电流和电压的相角差,包括每个相位故障前后的相角差。

由于发生故障时,故障点前后的数据特征会存在差异,本文采用孤立森林算法处理每个相位故障前后数据之间的异常特性。孤立森林作为一类集成学习算法,常用来检测异常数据,尤其适用于特征连续的电气量时序数据。按照集成学习的方式,要求具备多个基分类器,以提升孤立森林算法的处理性能,即需要在配电边缘代理装置训练一定数目的孤立树(Isolated tree,iTree)[12]。

孤立森林算法的处理效果直接取决于iTree的数目与任一iTree的样本数据量[13]。其约束条件为

式中,{xn}为节点n中iTree的数目;Xmin为iTree数目的最小值;配电边缘代理装置集合为N= {1,2, … ,n, … ,N}。

式中,{yn}为节点n中任一iTree的样本数据量;Ymin为任一iTree样本量的最小值。则配电边缘代理装置上每棵iTree的最大计算量为配电边缘代理装置中特征提取流程如图2所示。

图2 特征提取流程

前文预处理后的数据,汇集至配电边缘代理装置形成数据集,选择其中故障前后的数据形成数据训练样本集,随机选取还没有构建iTree的样本得到子样本集,直到所有数据点孤立,然后利用由多棵iTree融合而成的孤立森林选取数据属性,采用划分值f对数据集进行分割,并通过递归方法构造异常数据筛选节点,获取异常数据特征集。其中,孤立森林是由许多棵iTree融合形成的,iTree中的任一节点均为叶子节点。基于配电边缘代理装置的孤立森林的详细构造过程如算法1所示。

算法1:配电边缘代理装置中孤立森林构造过程

2.3 基于BDMBCR的故障距离估计方法

配电云主站由前置处理器、数据库服务器、数据挖掘服务器和Web服务器通过数据总线构建而成[14]。前置处理器从配电边缘代理装置汇集异常数据特征集,初始化进程,同时触发数据库服务器和数据挖掘服务器。

数据库服务器用于存储来自智能电表、配电终端和配电边缘代理装置的相关数据,形成NoSQL代码库。在代码库中,与给定故障事件相关的异常数据特征集都存储在数据库的单个文件内,并且每个文件只存储来自一个装置的数据,与传统的关系数据库相比,代码库复杂性更低。数据挖掘服务器负责执行BDMBCR,将异常数据特征集分组为具有相似特征的集群。最后,将Web服务器用作通信前置,以确保用户的安全便捷访问。

BDMBCR将文件中的异常数据特征集相关联,以找到其中的相似之处[15]。当发现相似之处时,BDMBCR返回一个系统发生树,按层次将比较的文件关联起来,并根据文件之间的相似度形成文件组。BDMBCR步骤如下。

(1) 标准化压缩距离(Normalized compression distance,NCD):用于检查文件之间相似性的指标,该指标基于文件压缩前后的文件大小。由文件压缩形成方阵,其长度等于已分析文件的数目,则矩阵的每个元素对应从所涉及文件中获取度量[16]。因此,在所有输入文件中都获得了NCD。

(2) 邻接(Neighbor-joining,NJ):用于构建系统生成树,输入对应的NCD矩阵。

(3) 快速FN分组(Fast newman, FN):用于在复杂文件集中识别并划分文件组。

使用上述过程生成的文件作为输入数据,BDMBCR采用计算两个文件间距离的方法对异常数据特征集进行差异分析,两个文件间的距离越小,文件中包含的异常数据特征相似度就越大。而生成的数据矩阵表示每对元素的相似性信息,该数据矩阵由NCD生成,是NJ的输入数据,NJ构建了系统生成树。

执行过程的最后一步是形成簇,BDMBCR使用FN来解析系统发生树,提取相似元素的组。这些数据是从每个故障事件中提取的特征,因此,在构建系统发生树的过程中,故障事件会根据其相似性被组织成不同的分支,以便分组。配电网故障距离估计的步骤如下。

(1) 配电云主站通过分析异常数据特征文件的相似性,查找和分组故障的群集组成,这些群集的故障在配电线路中彼此靠近,即代表一个区域。这些分组的故障事件以不同灰度组织在系统生成树中,如图3a所示。因此,可以预估位于相近区域的故障将被分组在同一群集中,由系统生成树为集群中分组确定不同标记。

(2) BDMBCR输出将集群中的每个故障事件关联起来,为线路设置不同的故障区域,数据量越大,故障区域颗粒度将越细。如图3b中所示,按比例显示从图3a获得的区域,并用不同灰度隔开,其中5为位于变电站附近主分支的故障,4为位于主分支的故障,3为位于单相分支故障,2为位于线路末端的故障;1为位于主分支的其他故障。

图3 BDMBCR故障事件关联区域示意

(3) 减少多重估计,通过边缘侧装置特征分析和提取归类,然后由配电云主站BDMBCR确定故障事件关联区域,使得配电线路的任何支路在BDMBCR上都有一个定义明确的区域,将大大减少支路故障受多重估计的影响。

如前所述,对所有可用配电终端和智能电表的故障数据进行预处理,生成包含每个故障事件特征的文件,对这些文件进行数据挖掘并返回具有最相似特征的集群。传统的数据特征提取方法无法满足配电网中数据快速处理的需求,提出的方法在数据源附近建立边缘计算层,即配电边缘代理装置,引入孤立森林算法对数据进行预处理并识别异常数据特征,从而减少数据传输时延,提高故障距离估计准确率。

由于进行数据挖掘的文件越大,执行计算的工作量就越大,因此,需要减少从每个事件中提取的特征数目,以减少输入维度,从而减小文件大小。与传统故障距离估计相比,在云计算中引入BDMBCR,可进一步缩小故障范围,并推断故障的位置。

3 试验分析与结果

基于IEEE 34测试仿真系统模拟配电线路,如图4所示,模拟典型的多分支配电线路,并考虑瞬态和稳态条件,进行故障分析。

图4 IEEE 34测试仿真系统线路仿真

仿真参数设置如下:额定电压10 kV,用户侧电压380 V,分三相分支和单相分支,配有电容器组。在无荷载情况下,每段等距布置五个故障点,故障点间的最小距离为50 m。在三相支路的每个故障点,模拟了11种故障类型(A-G、B-G、C-G、AB、BC、CA、AB-G、BC-G、CA-G、ABC、ABC-G),故障电阻范围在1~1 000 Ω,故障起始相角在0~180°随机变化。模拟配电终端安装于10 kV线路,模拟智能电表安装于用户侧,终端采样率为一个周波256个点,提供电压电流数据,与边缘侧的配电边缘代理装置和云侧的配电云主站通信,所有配电边缘代理装置、配电终端和智能电表都同步到同一时间戳。

3.1 多重估计影响区域分析

如图5所示,其中突出显示的区域是由传统故障定位器基于电抗进行多次估计的长度,可明显看出易受多重估计影响的区域。

图5 利用传统故障定位器的多重估计影响区域

将所提方法应用于上述场景,配置配电边缘代理装置、配电终端和智能电表,仿真结果如图6所示。配电终端和智能电表将数据上传至配电边缘代理装置,配电边缘代理装置提取数据特性并将其发送到配电云主站,然后通过BDMBCR运行数据。对比以上试验结果,所提方法在减少多重估计的区域方面更有效。

图6 所提方法产生的多重估计影响区域

3.2 多重估计影响长度分析

针对11种故障类型进行仿真,采用常规故障定位距离作为评价指标,结果如表1所示。可以看出,对于A-G和B-G两种类型的故障,其影响长度都大于其他类型故障。这是因为系统的拓扑结构导致,即大多数横向分支为单相(A相和B相)。

表1 多重估计影响长度

(1) 案例1:配置配电边缘代理装置、配电终端,表1中第3列为每类故障的多重估计总长度,第4列为与传统方法相比减少的百分比。可以观察到,对于A-G故障,通过使用所提方法处理在变电站级别获得的特征,将多重估计影响长度减少到3.57 km(减少92.01%)。对于B-G故障,多重估计影响长度由传统方法得到的30.085 km减少到所提方法得到的3.9 km,减少87.04%。对于C-G故障,其长度减少了19.89%。对于相间短路,多重估计影响长度减少了8.68%~15.69%。在其他类型的故障中,没有长度缩减。

(2) 案例2:配置配电边缘代理装置、配电终端和智能电表,在A-G故障的情况下,所提方法将多重估计长度减少至1.274 km,与传统方法相比减少97.15%,与案例1相比减少64.31%。考虑B-G故障,多重估计长度从30.085 km(传统方法)和3.9 km(案例1)减少到0.97 km。对于C-G故障,与传统方法相比,减少了71.27%,与案例1相比,减少了65.38%。对于相间短路,与传统方法相比,减少了44.82%~48.18%。此外,在案例1中没有减少长度(两相接地和三相接地)的情况下,案例2中都相应地减少24%~27%(两相接地)和16%~20%(三相接地故障)。

3.3 与其他方法的对比分析

基于案例2试验场景,从11种故障中选出A-G、BC、CA-G、ABC和ABC-G这五种故障类型,将所提方法与文献[5]、文献[13]和文献[7]中的方法进行对比试验,试验结果如图7所示。

图7 不同方法中多重估计的影响长度

从图7可看出,在发生不同故障类型时,所提方法的多重估计影响长度均少于其他方法,尤其在单相接地和两相间故障时效果明显,其中单相接地时仅为1.2 km。由于其在配电边缘代理装置中引入孤立森林算法对数据进行异常识别,能够提高故障距离估计准确率,并且采用BDMBCR数据挖掘技术对数据进行处理,以推断出故障可能发生的位置,进一步缩短了影响长度。文献[5]利用高阻抗定位故障距离,方法较为传统,因此故障影响长度最长。文献[13]在高阻抗故障定位的基础上,融入了基于小波包变换和极限学习机,能够在一定程度上提升方法的处理性能,但效果不明显。而文献[7]利用虚拟线路阻抗实现故障距离估计,优于文献[5]和文献[13],影响长度均有所降低,但在处理海量数据时效率较低。

4 结论

配电网中带负荷分布的径向分支拓扑结构使得传统配电网故障定位技术受多重估计的影响,难以实现准确估计。为此,提出了一种基于孤立森林算法与大数据挖掘的配电网故障距离估计方法。

(1) 面向“云-管-边-端”配电物联网架构,在配电边缘代理装置中引入孤立森林算法对采集数据进行特征提取,并于配电云主站中结合BDMBCR数据挖掘技术推断故障可能发生的位置。

(2) 将所提方法应用于两种场景进行仿真试验分析,场景一的结果表明了BDMBCR挖掘复杂数据和识别模式的潜力,尤其是在单相接地故障中,多重估计的长度明显缩短;场景二的结果表明了引入用户侧智能电表数据能够进一步改善估计结果。并且所提方法的故障影响距离优于其他对比方法,尤其是单相接地和两相间故障时效果明显,其中单相接地时仅为1.2 km,由此证明了所提方法具有一定的应用前景。

猜你喜欢
边缘代理配电
基于配电带电作业的供电可靠性提高有关思考
浅谈配网自动化建设与配电运行管理
10kV配电线路维护工程的安全措施分析
电力系统中配电线路运行故障检测技术
1号异星球餐馆·不可思议的代理老板
《航空模型》团体代理招募
一张图看懂边缘计算
澳航货运代理有限公司船期表
复仇代理乌龟君
在边缘寻找自我