基于随机矩阵的电网多元数据异常状态诊断

2023-10-28 10:45刘道杰

计算机测量与控制 2023年10期

杨扬，刘道杰，李炜

(1.山东石油化工学院机械与控制工程学院，山东东营 257061；2.中国石油化工股份有限公司胜利油田分公司，山东东营 257061)

0 引言

据统计，我国停电事故占电力系统故障的95%以上[1-2]，各类故障发生时，故障选线相对困难。近年来，电网信息管理系统大规模推广应用，可实现用电信息采集、配电自动化等功能。与此同时，随着系统长时间运行，产生了运检、调度、营销等方面的大量多源数据，这些海量数据为研究电网故障提供了有利条件。伴随电网数据多维度、强耦合、高随机性的特征，计算机终端数据异常庞大，计算工作呈现指数增长趋势。导致在大电网系统中出现网损增大、电压质量变差等问题，影响到系统安全平稳运行，严重时会引起电压崩溃造成大面积的停电事故。因此，如何有效利用、处理这些海量数据，保障电网安全稳定运行，是当前电力大数据时代下亟待解决的问题[3]。

近年来，国家电网持续加大对电力大数据的研究与应用，出现了大量电力调度自动化MIS(管理信息系统)，伴随产生大量的动态数据，推动了对大数据时代电网故障检测和分析的研究。由于高斯噪声、测量误差等因素造成的数据具有随机性，采用随机矩阵理论可对电网进行有效的分析。如文献[4]通过对数据流中的变异点进行检测，借助样本协方差矩阵最大特征值对低信噪比环境电网异常状态进行检测。文献[5]利用随机矩阵理论对电网负荷曲线中的异常点进行了检测和修正。文献[6]利用数据源和失效模式的映射，通过处理大量数据粗糙集信息熵来简化信息。但是随着电力系统规模的不断扩大，需要假设和简化构建模型和参数，计算量大且精确度不高，难以实现电网实时检测分析，同时特征数据具有不同类型和结构，这给数据存储、运维策略带来很多问题。应用随机矩阵原理对配电网络故障选线中多源异常数据的处理，在不需要假设、简化的情况下，可以减少分析过程中的偶然性、不确定性，该方法能够准确、实时地获得分析结果，从而实现了配电网的故障选线。在大数据的基础上，通过对电力系统的历史数据的分析，可以使电网的故障选线更加有效。

本文结合单环定理、特征值谱分析等随机矩阵理论对电网故障进行检测，提出了一种结合平均谱半径(MSR)理论和M-P定律双重判据定位方法。将数据的统计学特征与故障选线策略相对应，为大数据构架解决电网故障检测提供了新思路。本文通过IEEE39节点标准系统和某油田实际电网两个算例进行验证，结果表明了该方法的准确性和有效性。

1 高维随机矩阵相关理论

1.1 M-P定律

1976年Marcenko和Pastur提出并证明了M-P法则，用于描述任意矩阵的特征值，其矩阵经验频谱分布满足某种规则[7]。

在矩阵分析中，一般采用经验频谱分布函数，一个m阶的方阵U，它的经验谱分布函数为：

(1)

对高维随机矩阵Xmxn，将其各列单独提取出来，形成N个维数为M的向量，从这M个向量中任意选一个向量：

xa=[x1a，x2a，x3a，…，x(m-1)axma]

(2)

则Xmxn的样本协方差矩阵为：

(3)

一般地，高维随机矩阵Xmxn的样本协方差矩阵还可以做如下定义：

(4)

随机矩阵Xmxn的协方差矩阵Sn，其特征值λi收敛于函数F(λi)，满足F(λi)极限谱密度函数分布：

(5)

通过M-P定律，可以很好地估算出随机矩阵中各个要素的标准偏差，并与特征值的频谱密度作比较，使其直观地反映出这些偏差程度。

1.2 单环定理

在高维随机理论中，通过对矩阵的经验特征值分配概率来量化结果。在不受干扰的情况下，它的特征值在复平面上向一个圆环聚敛。相反在某一特定因素作用下，随机矩阵的特征值分布将不再聚敛。步骤如下：

随机矩阵Xmxn做归一化处理后成为，得到标准的非Hermitian随机矩阵：

(6)

式中，μ(xi)，σ(yi)分别为随机矩阵Xmxn的第i列均值和标准差2]满足：

(7)

非Hermitian随机矩阵Ymxn可以按照公式(8)求其奇异值等价矩阵Yu，i；

(8)

式中，U为Haar酉矩阵，并且有：

(9)

奇异值等价矩阵Yu，i是一个高维随机矩阵，其满足公式(10)性质：

Yu，i=UnΛnVn

(10)

其中：Λn是一个复对角阵；UnVn是两个互不关联的随机酉矩阵，并且严格服从Haar分布。

假设Yu，i有W个奇异值等价矩阵，那么求所有等价矩阵积Z：

(11)

(12)

式中，i=1，2，…，W；σ(zi)为Z的标准差。

(13)

单环定理能将采样矩阵的特征降维为奇异值的频谱分布，并具有成熟的可视化方法，从而实现对测量数据的异常情况地直接比对。图1采用Matlab中plot函数绘制示意图，图中细实线代表r=1的外环，细虚线代表长度为(1-δ)L/2的内环，※号代表的是λ2，◎代表的是λ1。电网在非异常状态下，对差分、规范化的采样矩阵Xmxn进行归一化，所得的矩阵单元近似为独立高斯分布。

图1 单环定理示意图

1.3 平均谱半径(MSR)理论

采用随机矩阵法来分析特定事件时，用平均谱半径来判定(MSR)[8]：

(14)

式中，rMSR为矩阵的谱平均半径，λi为矩阵的M个特征值。图2为IEEE39节点9号发生故障时MSR计算结果。由于采用滑动时窗的原因，从第200个数据开始显示，正常状态下的MSR分布在内环和外环之间，当故障发生时会跌落至内环以下。如图2所示，设置5 s发生单相接地故障，MSR小于内环半径，表明系统异常工作。MSR的波动性和失效时间都与模拟值一致，失效持续时间与Tw相关，MSR实现了从宏观角度来判定系统工作状态。

1.4 样本协方差矩阵理论

电网中选取n个节点量测数据作为空间样本，其中每个节点共有m个状态变量，构成N个变量，即N=n*m。在任意采样时刻Ti，所有节点量测数据构成一个列向量：

x(ti)=[x1i，x2i，…，xni]H

(15)

在一个时间段内，N个向量在时序上矩阵分布为公式(16)：

X=[x(t1)，x(t2)，…，x(ti)，…]

(16)

为了可以对电力网络数据进行实时分析，采用了滑动时间窗[10-12](图3)加以辅助，实时窗口长度为Mw，宽度为Nw。当数据都是正常值的时候，生成的矩阵是满足某种分布规律，而遇到异常数据出现时，时窗生成的矩阵的奇异性就会变化。采样时向后平移一个采样点，因为前Tw宽度数据没有，所以只能检测之后发生的故障，移动时窗每次仅对Tw宽度数据处理，可以减少历史处理对当前数据状态的影响(具体分析见3.1)。ti时刻的实时滑动时间窗包含ti时刻的当前数据和(Nw-1)个相邻的历史数据，即

图3 滑动时间窗口

(17)

在状态评估时间窗内，对系统的M个可测状态参量测量N次，所有测量数据组成的具有电网时空特性的M行N列数据：

(18)

2 电网故障检测步骤与阈值设定

本算法故障检测分两部分，一部分是确定故障时间的(如图4)，第二部分为判别故障馈线及故障类型(如图5)。

图4 确定故障时间流程图

图5 确定故障馈线与类型流程图

2.1 故障检测步骤

2.1.1 确定故障时间

从数据源采集数据后，采用滑动时间窗口处理数据，融合历史数据和当前数据作为量测时间序列D，对矩阵进行差分、加躁、归一化预处理生成Haar矩阵U，差分的目的是使样本数据平稳化，若一次差分后仍未符合要求，则采取二次差分，一般二次差分即可满足平稳要求。

2.1.2 确定故障类型

通过1)得到故障时间后，选取故障时间附近时窗宽度的三相电压数据作为数据源同样采用滑动时窗的方法得到时间序列矩阵，并对其预处理，得到协方差矩阵，将所有节点的ABC三相各分为一组，通过计算频谱偏差比较超过阈值的大小确定故障馈线，通过汇集所有节点故障相后综合分析得到故障类型。若某节点仅有一相超过阈值，则判定为单相故障；若某节点有两相超过阈值，则判定为相间故障；同理，若三相均超过阈值，则判定为三相故障[9]。

2.2 阈值设定

电网出现故障时，矩阵谱的变化对矩阵元素变化的影响最大，特别是最大特征值和最小特征值，因此定义t时刻的频谱偏差ds(t)为：

(19)

通过对各节点位置分析矩阵的频差进行对比，对电网故障进行准确定位[13-15]。在有大量节点的情况下，相邻的结点往往具有近似的频谱偏差，很难找出最大频谱偏差的结点。为了准确地识别故障节点，本文对节点频谱偏差进行了以下改进：

(20)

式中，dts节点t改善了原指标数据输出，dmax为各结点最大偏差值，ddif1为最大值与次最大值的差值。由上式可知，对于任意一个节点t，均有dmax-dt≧ddif1，进一步可得dts≤2/ddif1。同时，相对原偏差较大的节点和原偏差值幅度较为接近，最大与第二大差值为较小的实数，经上述公式处理后，偏差可被判别。

3 算例分析

3.1 算例1—IEEE39模型分析

算例1基于图6新英格兰IEEE39节点模型，仿真总时长T=10 s，系统运行频率为60 Hz，数据采样频率也为60 Hz，选择每个节点及线路测量仪(117个)三相电压电流功率等k个采样参数构成数据源矩阵U，设置时窗宽度T_windows=200。

图6 IEEE39节点系统

3.1.1 异常状态判定

以IEEE39节点系统节点负荷增加作为异常状态的判定，区别于正常状态和故障状态的电网第三种状态异常状态。本案例以节点负荷变化验证算法判断的准确性。设置节点20设置5 s时从7.5 MW变化到30 MW，持续时间0.25 s，研究判据对异常时刻的准确性[3]。设置的负荷变化节点及变化幅度如表1所示。

表1 负荷变化表

由图7(a)可知谱平均半径大于内环半径附近，未跌落至内环以内，区别于故障状态。从频谱偏差的图7(b)中看出在5 s时出现大幅升高，说明出现非正常状态。

图7 频谱偏差图

通过比较圆环分布图8(a)和(b)可知，正常状态时奇异值分布基本在圆环里面，异常状态奇异值有部分分布在环外[3]。

图8 状态图

3.1.2 故障时间确定

算例1用MSR和频谱偏差分析运行整体态势，采用滑动时间窗口选取含有故障时间所有节点的三相电压作为数据源矩阵进行具体分析[7]，并用M-P定律和单环定理来双重判断故障时刻，验证判定方法是否在电网系统运行中有效性。

1)相同节点发生不同故障：

设置节点4处在t=5 s时分别发生单相、相间、相间接地、三相故障，故障持续0.25 s。由于算例中滑动时间窗口采样点数T=200，故系统运行状态监控测量的开始时间为200/60 s，0到(200/60)s无法检测出故障不显示数据，故谱平均半径图像开始的显示时刻为第200/60时刻。

从随机矩阵法和MSR的定义中可以看出，在MSR小于内环时，系统的工作是异常的。在图9、图10中，MSR和谱偏离度的波动性和异常时间都与提前设定值一致。其中，异常状态持续时间和Tw相关，还可以推断出异常的恢复时间。MSR值越低，谱偏离度越高，表明其与电网的运行相关性越大。

图10 节点9发生单相故障时的频谱偏差

如图10所示，正常时刻的特征值基本分布在圆环内，其采样时间窗口内数据的谱平均半径为0.840 4，在内环和外环中间。5 s单相故障时刻的特征值基本分布在内环外侧，当5.017 s时检测到故障发生，其单相、相间、三相故障的谱平均半径(取稳定时段下的数值)分别为0.275 06、0.129 18、0.101 94均小于内环半径。当采用谱平均半径和频谱偏差检测到故障时间后，为进一步验证，作出异常数据和正常数据的单环定理图进行对比，利用M-P定律和单环定理来双重验证准确性。

图11为故障单环图，从特征点的分布集中在圆环内可以识别出异常数据。图12 M-P律图对比看出正常数据和异常数据的区别，异常数据的核密度曲线与极限谱密度函数分布偏离了理想状态。

图11 故障单环图

图12 故障M-P律图

2)不同节点发生相同故障：

图13表示不同节点发生不同故障的MSR归纳图，节点9和节点18在5 s分别设置持续时间为0.25 s的单相、相间、相间接地、三相故障，故障程度越高，MSR跌幅越大。MSR数值由大到小的顺序依次为单相接地〉相间故障〉相间接地〉三相接地，故障程度由大到小的顺序依次为三相故障〉相间接地〉相间故障〉单相故障，所以该方法可以实现不同故障判别。

图13 不同节点发生不同故障的MSR图

如果出现短路故障，则多个测点的数据都会发生同样趋势变化，矩阵的相关性会增强，不能满足独立的高斯分布。同一故障在多个结点出现时，所产生的关联程度也不一样，因而特征值向中心聚集的程度也不一样，异常的程度与系统内部的关联度呈正相关，与特征值向中心聚集的程度成正比。

3.1.3 故障类型识别

利用IEEE39模型对单相故障、相间故障、三相故障的仿真分析各节点三相电流，分别分为A相、B相、C相电流采用改进后的频谱偏差来测试故障类型的准确性。由阈值设定公式频谱偏差为5.2，得节点4发生各种故障时的三相电压频谱偏差。当检测到故障后，进行故障定位和故障类型判别，设定故障为节点4分别设定单相故相间故障、三相故障，设置故障时间5 s，持续时间0.25 s，采集滑动时窗长度的包含故障时间所有节点的三相电流并计算频谱偏差dRa、dRb、dRc，如图14(a)、(b)、(c)中，横坐标为节点编号，纵坐标为三相电流频谱偏差。

3.2 算例2—A油田电网模型分析

以A油田某年1～6月期间的全部线路电压监测数据为例，每隔1小时即可进行数据采集。应用高维随机矩阵理论，先从时间维度上计算出频谱偏差和谱平均半径，初步确定故障时间，在经过M-P定律和单环定理双重判定故障时间，选取故障时间附近的时窗宽度数据再构成数据源，对频谱的偏离进行了空间维度的分析，找到异常数据的来源，确定故障馈线。

3.2.1 确定故障时刻

首先采用滑动时间窗口生成时序矩阵，再经过差分、加躁、归一化处理得到协方差矩阵，最后求取特征值、谱平均半径和谱偏离度，如图15、16所示。在圈中对应时刻，频谱偏差和MSR都是异常的，偏离正常指标。

图15 谱平均半径

结果与算例1理想模型对比差异较大，可以看出实际生产中与理论算法的差异性，使得在应用到实际环境中出现不适应现象。但是故障时刻相较于正常状态区别较大，相对明显的MSR下跌仍然有较好的判断能力，故标准算例及实际系统均能较好地看出本算法的可靠性，能精确的确定故障时间。图16中表示1 080 h和3 800 h为故障时刻，进一步使用M-P和单环定理双重判据，每个随机矩阵的特征值特性如图17(a)和(b)所示。

图16 频谱偏差

图17 谱密度函数与M-P定律比较

对比图17发现，当特征值增加时，正常状态的核密度估算曲线的概率密度会先增加后降低，曲线的重合度较故障状态更大。故障状态的核密度估计曲线则与M-P定律重合度小，核密度估计曲线随着特征值的增大而呈现出先升后降的趋势，与正常状态时有很大差异。由此看出，故障状态时电压、电流数据与正常状态时电压、电流数据存在很大差别，矩阵不再具有独立的分布特征，从而判定在3 080 h系统发生故障。

3.2.2 故障位置判定

以3 080 h异常时间为例，对频谱的偏差进行了空间维度的分析，并找到了异常数据的来源。在图18中给出了3 080 h的频谱偏差，其中Ⅰ线、Ⅵ线频谱偏差程度与其他线有较大偏差，故判定故障馈线。

图18 电流数据的频谱偏差(空间维度)

4 结束语

根据随机矩阵相关理论进行电网异常分析、线路故障时刻和故障类型判定及故障选线。通过应用两个算例数据源建立随机矩阵的方法，并对其进行了分析验证算法。在技术上，它避免了传统的人工拉路方式，不能适应配网故障后的自动选线。通过对故障选线的研究，对不同故障线路所产生的随机矩阵的特性分布进行了分析，利用M-P律和核密度曲线重合度和单环原理对故障线路进行快速、准确的选择。

1)采集三相电压电流数据源构建高维随机矩阵，采用滑动时间窗口生成时间序列并对其进行差分、加噪、归一化生成协方差矩阵，求特征值和特征向量。利用谱偏离度、谱平均半径等指标对电网线路进行分析。

2)提出一种MSR和M-P定律双重判据定位方法，通过IEEE39节点标准系统及某油田电网某年1～6月份的全部线路电压、电流数据两个算例，通过比较结果表明所提方法的准确性和有效性。

本文应用随机矩阵法对电网异常和故障状态进行研究，根据随机矩阵极限谱分布的原理，给出了频谱偏离程度和谱平均半径的定量计算方法，相比其他算法，该算法的优势在于谱偏离度的大小之前小了很多，从而大大扩大了故障检测的范围，提高了故障识别的效率。