李武璟, 谢醉冰, 原博, 魏朝阳, 臧阔, 杨安奇
(1. 国家电网公司西北分部, 陕西, 西安 710048;2. 国网南京南瑞集团公司(国网电力科学研究院), 江苏, 南京 211106;3. 国电南瑞科技股份有限公司, 江苏, 南京 211106)
态势感知(situation awareness,SA)对电力系统运行具有重要意义,重新考虑态势感知对未来电网至关重要[1-3]。这些未来的电网总是规模巨大,拓扑结构复杂。在一个新的规则下运作,他们的管理模式有很大不同[4-6]。另一方面,数据越来越容易访问,而数据驱动的方法在未来的电网中变得很自然。但面临以下问题:① 大量数据导致的维度诅咒;② 提取大数据分析所需的资源成本;③ 对于海量数据源存在“坏”数据。为了解决以上问题,本研究根据电网中的电压和电流的快速波动产生的随机性,利用随机矩阵理论(random matrix theory,RMT)来模拟这些快速波动,从而实现对电网状态的分析。该算法基于大系统的随机矩阵和随机系统建模的基本理论,通过数据建模框架将RMT和电力系统分析联系在一起。文章还在此基础上研究了一些电力系统的应用。
在平衡状态下运行,电网服从式(1),
(1)
式中,Pis和Qis是节点i的功率注入,Pi(V,θ)和Qi(V,θ)是网络的功率注入,其满足式(2),
(2)
综合式(1)和式(2),可以得到式(3),
w0=f(x0,y0)
(3)
其中,w0是节点的功率注入向量,取决于Pis,Qis,x0是系统状态变量,取决于Vi,θi,y0是网络拓扑参数,取决于Bij,Gij。
系统的波动,即数据集中的随机性,可表示为式(4),
w0+Δw=f(x0+Δx,y0+Δy)
(4)
用泰勒展开式,将式(4)展开得式(5),
(5)
系统状态变量x的值相对稳定,增量的二阶项(Δx)2和高阶项是可忽略的。此外,式(2)表明f″yy(x,y)=0。结果,式(5)变成了式(6),
Δw=f′x(x0,y0)Δx+f′y(x0,y0)Δy+f″xy(x0,y0)ΔxΔy
(6)
假设网络拓扑不变,即Δy=0。由式(6)推导出式(7),
Δx=(f′x(x0,y0))-1(Δw)=S0Δw
(7)
另一方面,假设功率需求不变,即Δw=0。由式(7)推导出式(8),
Δx=S0Δwy
(8)
这里wy=[1+f″xy(x0,y0)ΔyS0]-1[f′y(x0,y0)],注意,S0=(f′x(x0,y0))-1,即雅可比矩阵J0的逆矩阵。
至此,电力系统的运行可以用随机矩阵的形式进行建模。如果存在意外的有功功率变化或短路,系统状态变量x0,即Vi,θi的相应变化将分别服从式(7)或式(8)。
在没有实际证据的情况下,雅可比矩阵J和s0几乎保持不变。考虑到在时间点i=1,…,T观测到的T个随机向量,关系式的形式是ΔXs=S0ΔW,其中ΔXs表示状态变化[Δx1,…,ΔxT],ΔW表示相应的功率注入或拓扑参数的变化。
正如上文所指出的,这些快速波动通常表现出高斯统计特性[8]。在实际应用中,由高斯酉系综(Gaussian Unitary Ensemble,GUE)和拉盖尔酉系综(Laguerre Unitary Ensemble,LUE)被用于所提出的模型中,如式(9),
(9)
其中,X是标准高斯随机矩阵,是独立同分布(i.i.d.)的复高斯随机变量C是复数域。
设fA(x)为A的经验密度,是GUE或LUE矩阵,并定义其经验光谱分布(ESD)FA(x),如式(10)。
(10)
其中,I(·)表示事件指示函数。
让gA(x)和GA(x)表示A的真特征值密度和真谱分布,所以结合维格纳半圆定律gA(x)可以表示为式(11),
(11)
(12)
然后将E[FA(x)]与GA(x)之间的柯尔莫果洛夫距离表示为Δ如式(13)所示,
(13)
文献[4]证明了O(N-1)阶Δ的是一个最优解。
基于RMT的方法包括3个步骤,如图1所示。① 大数据模型,使用RMM的实验数据对系统进行建模;② 大数据分析,对指标系统进行大数据分析;③ 工程解释将统计结果可视化并解释给操作员以供决策。
图1 基于RMT的SA方法
这种方法是通用的。在电网和输电设备的异常检测和诊断领域已经进行了大量成功的尝试[9]。
根据文献[4],经典决策方法和建议的决策方法的总结可以被改进为图2。
图2中的虚线描述了一般过程和相应的工具。由于机理模型的本质,这些工具无法处理大量数据,这些模型都是低维的,导致它完全依赖于少量参数的确定性结果,可能会导致效率低下甚至不正确的大数据分析。此外,由于普遍存在的随机性和不确定性,一些物理参数如导纳矩阵会引入系统误差。
图2 电力系统数据利用方法
在经典统计框架下,只有2个典型的数据矩阵X∈RN×T可供使用,即①N,T都小;②N小,T大。这一前提条件极大地限制了海量数据的利用。所以,基于模型的框架无法将海量数据转化为有用的大数据分析。虽然这些海量数据有助于模型的改进和参数的修正,但是很难用非常大的数据量来进行更精确的分析。并且更多的数据意味着更多的错误。此外,由误差累积和伪相关等挑战引起的偏差不会通过低维过程得到缓解——程序的维数受模型维数的限制。所以在此需要使用基于RMT的数据驱动方法。
基于RMT方法的框架是从样本协方差矩阵代替真实协方差矩阵开始的。可以使用RMT中的工具[10]对大协方差矩阵进行几乎最优估计。基于RMT的程序概述如下。
1) 单环定律与MSR
单环分析执行SA的步骤如下。
1.选择任意原始数据(或所有可用数据)作为数据源。
5.进行高维分析;
a) 观察实验环并将其与参考值进行比较;
c) 将τMSR与理论值E(τMSR)进行比较。
6.在下一个时间点(ti=ti+1)重复步骤2-5。
7.在时间序列上可视化τ,即绘制τ-t曲线。
8.做工程解释。
对于M-P定律分析,步骤非常相似,除了以下不同。
2.在步骤4中计算的特征值为λM。
在5c)中将τ与理论值E(τ)进行比较。
请注意,单环定律将数据集的信息映射到复平面(CN×T→C),而M-P法则则将此映射到右半实轴(CN×T→R+),这种基本的差异在数据可视化中起着关键作用。
标准的IEEE 118节点系统如图3所示,事件假设如表1所示。因此,每个节点上的功率需求作为系统注入(图4a),而电压可作为操作状态(图4b),均为可获得的。
图3 IEEE 118节点系统的分区网络
(a) 假定事件
(c) 不同的操作状态
表1 系列事件
3.2.1 异常检测
图5表明,当系统中没有信号时,实验RMM与环律和M-P定律很好地匹配,线性特征值统计(LES)的实验值与理论值近似相等。这验证了使用高斯白噪声建模每个节点的快速波动的理论合理性。另一方面,在阶跃信号的开始违反了单环定律和M-P定律。此外,提出的高维指标τMSR对tend=901处的异常极为敏感,如图5e所示,τMSR开始剧烈变化,而原始电压幅值仍在正常范围内(图4c)。此外,使用结果τ的检测结果如图6所示,证明不同的指标具有不同的有效性。
(a) X0的单环定律
(c) X6的单环定律
(e) τMSR-t曲线
3.2.2 具有异步数据的SA
所提出的数据驱动方法在空间和时间上都对坏数据具有鲁棒性。本文研究了异步数据的SA。异步数据在SCADA、WAMS等数据平台上普遍存在。问题主要是由错误的时间标签或通信延迟引起的。有时,对于某个信号,适当的延迟保护或交互/响应机制也可能导致数据异步。传统的方法很难对时延进行测量甚至检测,因而提出的方法在这里有特殊的意义。
利用模拟数据,对7个节点(11、14、50、52、53、77和81)进行了25个采样点的人工延迟。通过上面介绍的级联操作,如图6所示获得结果。有趣的是,该方法对异步数据具有鲁棒性:① 在t=501和t=901处检测到异常;② 节点52是最敏感的节点;③ 通过更详细的观察,甚至可以定量得出节点52存在25个采样点延迟(925-900)的结论。另外,精确的延迟值可以恢复到特定的节点。本文生动地展示了所提出方法的威力。
图6 异步数据的态势感知
3.2.3 利用现场数据进行案例研究
在此选取我国某个电网,用34个PMU采集潮流数据。原始数据如图7所示。
图7 PMU的原始数据
很明显,故障开始于采样时间t=3 271。图8给出了故障前(3101-3100),故障期间(3173-3272)和故障后(7201-7300)的环分布和M-P定律。
这意味着,在正常情况下,真实世界的数据确实遵循环规律和M-P定律,并且在故障发生时它们违反了这些规律。此外,基本矩阵B和级联矩阵Ci的LESt-τ曲线如图9所示。它表明节点8、9、26、27、28、10、11和12与该故障最相关;而节点1-7则不那么敏感。
为了处理未来智能电网系统的海量时空数据,在此提出了RMT算法,该算法具有许多独特的优点。它们以大随机矩阵的形式,一次性处理高维、宽时间跨度的海量数据。RMT算法将这些数据作为一个整体处理。这样,对于一些不完善的数据,仍然可以获得高可靠的决策。
(a) 错误前的单环定律
(c) 错误中的单环定律
(e) 错误后的单环定律
图9 LES t-τ曲线