面向智能电网的PCA 近似法错误数据注入攻击

2021-03-22 09:12褚云龙谢丽荣张小东刘鹏飞
计算机与数字工程 2021年2期
关键词:方差高斯总线

褚云龙 谢丽荣 张小东 任 景 刘鹏飞

(1.国家电网公司西北分 西安 710048)(2.国网南京南瑞集团公司(国网电力科学研究院) 南京 211106)(3.国电南瑞科技股份有限公司 南京 211106)(4.智能电网保护和运行控制国家重点实验室 南京 211106)

1 引言

智能电网可以显著提高电网的效率和可靠性[1],其作为相互连接的配电网,可以通过双向通信和电力流动来简化电力传输、分配、监控和控制[2~4]。智能电网安全包括对通信网络和配电网的保护,这是由于这两个系统需要确保访问的可用性以及在威胁下的稳定性[5~6]。如果网络状态信息被恶意篡改,网络可能会因物理损坏而造成区域供电不稳定[7]。因此,状态估计是建立能源管理中心电网实时模型的关键功能。

为了确保状态估计的完整性,目前的电网系统采用了坏数据检测(BDD)来过滤由设备故障或恶意攻击引起的错误测量数据[8]。电力系统可使用BDD系统来检测由设备故障、遥测故障和通信噪声引起的随机误差。随着配电网结构变得越来越复杂,通过综合通信网络攻击电力系统的方式也越来越多。利用配电网拓扑的雅可比(Jacobian)矩阵生成的攻击可以轻松地绕过BDD 系统[9]。然而由于系统中可能出现新的漏洞,因此BDD 系统可能无法彻底保护系统。

本文在介绍智能电网系统模型,状态估计和BDD的基础上,分析了传统的错误数据注入攻击的特点,给出了PCA的基本原理和所提出的错误数据注入攻击。利用累积分布函数(CDF)分析了BDD对所提注入攻击的性能表现。最后通过仿真模拟验证了所提方法的有效性。

2 系统建模

2.1 系统模型

本文考虑具有n+1 总线的电力系统。假设连接总线i 和总线j 的输电线路中的电阻比其电抗小,那么从总线i 到总线j 的有功潮流模型可以表示为[10]

其中,Vi和θi分别表示总线i 处的电压幅值和相位角,Xij表示总线i 和总线j 之间的电抗。考虑到注入总线i 的有功功率Pi,能量守恒产生所有总线的能量:

其中,Ai表示直接连接到总线i 的一组总线。 Pi表示电力负载。虽然式(1)是非线性的,但利用局部线性化模型的加权线性最小二乘估计的迭代来获得状态估计。因此,在系统运行点附近,可使用局部线性化模型[11]来分析状态估计。在直流潮流研究[12]中,通常假定相位角之差为θi-θj,在任意一对总线之间都很小,电压幅度接近于1。因此,通过将式(1)中代入式(2),可得:

2.2 状态估计

设xi≡θi表示相位角。状态估计问题是估计系统状态x=(x1,x2,…,xn)T,其中(⋅)T表示转置操作,将一个总线当作参考总线;因此,只需要估计n个相位角。控制中心观察来自m 个有效功率流分支的测量的向量z=(z1,z2,…,zm)T,m ≥n。因此,测量通常可描述为

其中,P(⋅)表示测量z 与状态x 之间的非线性关系,v=(v1,v2,…,vm)T~N(0m×1,Σv) 表示零均值为0m×1的高斯测量噪声向量,其表示m×1 向量,包含所有零元素,且×表示乘法,协方差矩阵diag(⋅)表示对角矩阵,Im×m表示m×m 单位矩阵。在直流潮流模型中,使用Jacobian 矩阵或拓扑矩阵:

式(4)的线性近似模型可以表示为

其中,H 是m×n 矩阵。矩阵H 是一个满秩矩阵,允许由z 估计x 。假设m ≥n,则rank(H)=n,根据式(6),可确定x 的最大似然估计:

2.3 BDD

其中,Cov(r)=(Im×m-G)Σv(Im×m-G)T,Cov(r)为r的协方差矩阵,G=H(HTWH)-1HTW 为m×m 矩阵。阈值测试[13]可以用于检测由于攻击、传感器故障和拓扑错误导致的错误数据,可以表示为

其中,|·|表示量值、H0和H1分别表示没有和有假数据注入的假设,γ 是决定阈值,ri表示r 的元素。

3 错误数据注入攻击

在对Jacobian 矩阵了解的情况下,攻击者可以注入一个向量a,使新的测量结果za=z+a,其中a 和za是m×1 向量,伪装成原始测量结果z=Hx+v 可以实现攻击:

其中,c=(c1,c2,…,cn)T是一个任意n×1 的非零向量。则产生的残差为

3.1 PCA基本原理

PCA作为一种有效地数据统计分析的方法,通过减少给定的未标记高维数据集的维数,同时尽可能保持其空间特征[14]。基于原始数据集(或随机向量)z 及其实现(或观测向量)zi,i=1,2,…,d ,其中d 表示观测向量的数量,zi是m×1 向量。 z 的样本平均向量为PCA 的目标是找到 一 个单位向量,即 投 影的四分之一和这个方向性最大值。让数据集z"=z-μz,其平均向量μz"=0m×1。设Z"m×d=(z"1,z"2,…,z"d),Z"的每列到的投影可以写为

在不失一般性的前提下,可以将ΣZ"的特征值按降序排列:

PCA 操作的步骤:1)得到数据集z 的样本平均向量μz。2)根据ΣZ"=ΣZ,计算样本协方差矩阵ΣZ。3)求ΣZ的特征值,按降序排列(λ1,λ2,…,λm)和特征向量。4)计算可用于将z 转换为˜的变换矩阵:

3.2 利用PCA对矩阵推导

本文研究了配电网拓扑未知情况下的错误数据注入攻击问题,并从线路测量的相关性中进行了推理。PCA 使用正交变换将一组可能相关变量z的观测值转换为一组线性不相关变量x˜,即主成分。因此,式(19)可以写成:

特征向量构成了一个正交基,PCA算法使主成分的方差最大化来减小数据集的维数,这表明第一主成分具有最大的特征值λ1。˜的样本方差可以表示为

其中,式(15)的第三个等式成立,则第一个主成分有最大的方差,第二个主成分有第二大方差,以此类推。

一般情况下,第i 个主成分可以表示为

通过PCA 的主成分的个数可以小于原始变量的个数。在智能电网中,由于Jacobian 矩阵的维数限制,本文使用状态变量n 作为主分量的个数。因此,去掉那些非主分量,表示n <i ≤m,具有小的方差或ΣZ的特征值,根据式(20),z可近似为

其中,Px=H+HPCA是n×n 投影矩阵的主要组件xPCA到原始状态变量x,H+是n×m 矩阵,其伪逆表示H 。 x ≈PxxPCA≠xPCA。 x 、xPCA和z 之间的关系可以用图1中的向量投影来描述。

图1 x、xPCA 和z 之间的关系

3.3 错误隐形攻击

本文忽略测量噪声,测量值可以表示为

比较式(23)和式(25),则PCA矩阵为

这表明HPCA可以近似地表示为原始拓扑矩阵H 和Px的乘积。本文基于HPCA提出了攻击方案,使用m×1攻击向量为

其中,c 是任意n×1非零向量,当PCA矩阵HPCA可以近似地写成原始Jacobian 矩阵和另一个矩阵(如PPCA)的乘积:HPCA≈HPx。

由于用于符合原始Jacobian 矩阵H 的维数减少,则PCA矩阵HPCA只是P˜的近似值。

4 性能分析

式(9)的渐近累积分布函数(cdf)为

其具有的类型函数为

其中,Frmax(γ)=P(rmax≤γ)表示rmax的cdf,P(⋅)表示概率,e(⋅)表示指数函数,α 和β 是cdf 的参数。如果rmax的统计样本可用,则可以估计这些参数,使分布的理论均值和方差与样本均值和样本方差相匹配。为了使用这种参数估计的矩匹配方法,需要将参数的平均μ 和方差σ2表示为

根据μ 和σ2可以确定α 和β。如果v 的概率密度作为指数函数在上尾衰减,则上述cdf 的残差极值可以用于v 的其他未知分布。|ri|的瑞利分布的上尾实际上作为指数函数衰减。最后,基于cdf的漏检概率Pmiss≡P(maxi|ri|<γ|H1|)可以表示为

其中,P(⋅|H1) 表示以H1为条件的随机变量的概率。

5 实验分析

本文使用不同的网络拓扑结构进行Monte Car⁃lo模拟以评估所提出的攻击性能,这些拓扑结构使用MATPOWER[15]得到。测量包括所有总线的功率注入测量和所有分支的功率流。首先,仿真结果在IEEE 14 总线的配电网模型[16]上进行,如图2 所示。IEEE 14总线模型中有54个测量值。

图2 IEEE 14配电网模型

信噪比为10dB。对于传统的错误数据注入攻击,状态向量为xa=x+c,其中c 的元素由方差为的高斯随机变量随机生成。在这种情况下,信噪比定义为,其中,和分别表示xa和x 的方差,则3dB,即假设注入向量产生的状态向量的方差比比原始测量数据产生的状态向量方差高3dB。对于其他攻击,同样定义了信噪比。如果没有错误数据,则因此,信噪比IEEE14 总线考虑三种状态变量分布:1)均为非高斯分布;2)均为高斯分布;3)高斯和非高斯混合分布。

图3给出了在均匀状态变量条件下IEEE 14总线配电网模型中漏检概率Pmiss与无攻击测量的决策阈值γ(理想)、具有Jacobian矩阵(完美)、随机攻击(随机)的常规攻击以及使用PCA 近似法(PCA-Sim)提出的攻击。

图3 在均匀状态变量条件下漏检概率与决策阈值的关系

不考虑Jacobian 矩阵具有最低的Pmiss的随机攻击,完美攻击的性能与理想状态的性能是一致的,因此,完美攻击是一种隐蔽的攻击。另外,所提出的PCA 攻击的性能可以通过对Jacobian 矩阵来接近理想条件和完美攻击的性能,并且比随机攻击的性能要好得多。此外,理论计算结果(PCA-Ana)与该方法的仿真结果也较好的匹配,进一步证实了所提出的攻击方法的优越性。

图4 给出了在所有高斯状态变量条件下,IEEE14 总线配电网模型上理想、完美、随机和所提出的PCA 攻击的漏检概率Pmiss和决策阈值γ ,而图5 中的状态变量混合了50%高斯和50%非高斯随机变量。所提出的PCA 攻击对状态变量的各种分布具有稳定性,并且其性能仍然可以接近理想状态和完美攻击的性能。

综合图3~图5所示,所提出的PCA攻击的性能只受状态变量分布的轻微影响。

图4 在所有高斯状态变量条件下漏检概率与决策阈值的关系

图5 在混合50%高斯和50%非高斯状态变量条件下漏检概率与决策阈值的关系

6 结语

本文在Jacobian 矩阵和状态变量分布假设未知的情况下,采用主成分分析(PCA)近似法研究了错误数据注入攻击问题,并从线路测量的相关性中对Jacobian矩阵进行推导,利用累积分布函数(cdf)分析了所提方法的性能。通过仿真模拟验证了所提方法的有效性,该方法可为防止电网被错误数据入侵开辟了潜在研究方向。

猜你喜欢
方差高斯总线
关于CAN总线的地铁屏蔽门控制思路论述
数学王子高斯
方差生活秀
揭秘平均数和方差的变化规律
方差越小越好?
方差在“三数两差”问题中的妙用
从自卑到自信 瑞恩·高斯林
Q&A热线
PCI9030及其PCI总线接口电路设计