一种基于SVR和GRU的新型电力监控防护系统

2023-03-27 02:04申晓杰李更达
计算机技术与发展 2023年3期
关键词:态势指标体系监控

申晓杰,廖 华,李 闯,潘 鹏,李更达

(中国南方电网 超高压输电公司 南宁监控中心,广西 南宁 530025)

0 引 言

随着“智慧电网”的建设和发展,数字化通信、自动化控制、智能传感器等新型智能信息化系统也不断出现在电力行业,传统电力系统中的发变电、配输电等各个环节也需要得到进化和升级[1]。通过智能化设备和数字化控制技术将电气电子设备和各级用户联系起来构成智慧电网,能够保证电力系统大大提升电能利用效率和能源转化效率,极大地保证了电力系统的供电质量和安全可靠性[2-3]。

电力监控防护系统能够在电网的安全运维中时刻监视并控制电力系统和电网线路,是智慧电网最重要、最关键的核心环节之一。在电力系统的发变电和配输电过程中,电力监控防护系统能够更加灵活、平稳和高效地监控电力设备工作状态。2003年,美国和加拿大出现大面积电力瘫痪,经济生活受到了严重影响。究其原因,是因为电力系统预警提示过程出现了严重故障,导致电力监控防护系统不能及时处理。2015年,网络黑客对乌克兰的电力监控防护系统进行疯狂攻击后,造成了境内大规模电力瘫痪。2019年,网络黑客对委内瑞拉的电力监控防护系统进行攻击,最终导致国内出现了大规模停电,严重威胁国家安全。所以,当前智慧电网的建设和运维面临的最大问题是如何能保证电力监控防护系统的安全稳定运行[4-5]。

安全防护方案的关键在于实时感知电力监控防护系统的安全态势。从一个角度来说,常规的安全防护屏障主要设置在网络系统外部,检测外部恶意攻击;而电力监控防护系统在保证感知外部攻击的同时,还能敏锐察觉来自系统内部漏报的危险和攻击[6-8]。从另一个角度来说,风险或者攻击来临时,如果能够提前感知异常信号,并做出相应措施,将大大提高安全监控防护系统的准确率和可靠性。因此,实时监控智慧电网和智能电力系统的运行状态,准确捕捉电力通讯网络和电力数据系统的异常信号,在构建智慧电网过程中具有重要研究价值。

该文构建了电力监控防护系统安全识别指标体系;构建了基于SVR的安全态势识别模型;构建了基于GRU的安全态势预测模型,三个研究点之间关系如图1所示。去除冗杂安全因素,构建电力监控防护系统安全识别指标体系;基于安全识别指标体系,构建电力监控防护系统安全态势识别模型;基于安全识别数据和历史数据,构建电力监控防护系统安全态势预测模型;设计并实现电力监控防护系统安全态势识别与预测系统。该研究为电力监控防护系统的安全运维提供重要参考,为构建智慧电网提供了技术支撑。

图1 研究体系框架

1 安全识别指标体系

首先,基于支持向量机的递归特征消除(SVM-RFE)技术分析了电力监控防护系统中所有安全识别指标的相关性;然后,采用皮尔森相关系数(Pearson)对所有指标之间的冗杂度,去除冗杂特征;最后,构建了最优特征子集目标函数筛选出最优指标集,并建立了电力监控防护系统安全识别指标体系。

1.1 基于SVM-RFE的指标相关性分析

该文采用支持向量机(Support Vector Machine,SVM)分类算法将数据分为两类,并分别贴上标签secure和danger。通过人工技术对原始样本数据标注为yi,构成训练集T:

(1)

在此设定第i条样本数据为Ti(i∈[1,m]),类别标签为yi∈{1,-1},样本数据的评估指标维度为n,第i条样本数据的第j个评估指标数值为xij,最后将电力监控防护系统的运行状态定义为安全(secure:1)和不安全(danger:-1)。同时,对于运行状态的样本数据定义为x,f(x)是分类决策函数,是对样本数据x的分类结果,表达式如式(2)所示。式中的αi和b分别为通过训练得到的拉格朗日乘子和位移,sgn()是符号函数。通过SVM模型训练样本数据T,第j个向量ω的指标权重可表达为式(3):

(2)

(3)

通过SVM-RFE进行序列后向选择(SBS)。对于包含所有安全指标的集合S,逐个去除对模型分类结果影响最小的安全指标x,直到获得指标相关性排序。特征与模型分类的相关性强度与评价分数cj呈正相关,第j个安全指标的权重系数为ωj,则剔除最小影响的安全指标x可以通过权重平方表达式计算:

(4)

1.2 基于Pearson的冗余性分析

通过SVM-RFE筛除部分冗杂指标之后,安全指标之间仍然会存在识别效果相近的线性冗杂指标,因此,该文采用皮尔森相关系数(Pearson)对冗杂指标的线性相关性进行分析,并进一步剔除冗杂安全指标[9]。Pearson相关系数取值范围为(-1,0),其绝对值与两个指标相关度呈正相关,绝对值越大,冗杂度越大,则公式如下:

(5)

1.3 最优特征指标子集的选择

通过对电力监控防护系统的所有安全指标进行筛选,再筛选剩下的安全指标构建最优指标子集,最后构成最优安全识别指标体系[10]。该文利用适应函数同时考虑分类准确率和特征子集的丰富度,函数值越大,指标集越优,适应函数表达式为:

(6)

式中,Q是电力监控防护系统的全部安全指标集合,S为剔除冗杂安全指标后进行相关性排序的子集,|S|和|Q|分别为指标集S和Q的指标数量,P(S)为对指标集S进行训练后的模型分类准确率,P(S)与|S|和|Q|之间的权重因子由μ表示,μ∈[0,1]。

1.4 安全识别指标体系

该文共选用35个安全状态指标构建安全状态候选指标集,其中包括20个流量特征候选指标和15个设备运行候选指标。模拟网络对相同设备进行攻击,计算、统计并提取指标数据,以3 s为间隔获取设备运行时的400个样本数据。构建四个安全指标体系对该方法进行验证。指标体系A:包含所有指标;指标体系B:剔除了大冗余度指标;指标体系C:对指标集进行相关性排序,构成最优特征子集;指标体系D:根据该方法,对剔除冗杂指标的指标集进行相关性排序,构成最优特征子集。通过对四个指标体系进行相应的SVM模型训练,并基于secure和danger数据样本以2∶3的比例构成测试集,以验证SVM分类模型的准确性。

依据文中方法,首先对安全指标进行相关性排序,通过选择得到了表1的剔除前最优指标集(第1列),剔除了最优指标集中的冗杂指标后,得到了表1的剔除后最优指标集(第2列)。分析表1可知,剔除后的最优指标集较之前缺少了指标retr_counts,这是因为retr_counts和SYN_pkts的冗杂度为0.764,同时retr_counts的相关性较低,因此retr_counts被剔除。对四个指标体系的分类结果进行分析,结果如图2所示。分析图2可知,基于SVM的分类准确率从高到低排列为:体系D>体系C>体系B>体系A。因此,剔除冗杂度较大的安全指标可以提高分类准确率(B>A),剔除相关性较小的安全指标也可以提高分类准确率(C>B)。同时,由于体系C不仅剔除了相关性较小的安全指标,也剔除了部分冗杂度较小的安全指标,而体系D同时剔除了相关性较小、冗杂度较大的安全指标,造成分类准确率低于体系D的实验结果(D>C)。所以,该文构建的最优安全指标集满足了电力监控防护系统的感知需求。

表1 剔除前后最优指标集构建结果

图2 四种指标体系实验结果对比

2 基于SVR的安全态势识别模型

2.1 SVR识别模型的构建

支持向量回归(Support Vector Regression,SVR)在面对小样本、非线性和高维度的实际问题上可以保持优秀的泛化能力,准确识别电力监控防护系统的运行状态[11]。通过前文得到了m个识别指标的最优安全指标集I(i1,i2,…,im),第i条样本数据的输入向量为xi,样本记录为Ti(i∈[1,n]),样本标签为yi,并构建训练数据集T:

(7)

在此定义一个函数φ(x)实现输入空间到高维希尔伯特空间的非线性映射,并且w和b分别为权向量和位移,则高维特征空间的线性回归函数为:

y=f(x)=wφ(x)+b

(8)

定义变量ε为f(x)与y的最大偏差,损失函数为:

L(f(x),y,ε)=

(9)

因此,该问题可转化为:

(10)

(i=1,2,…,n)

(11)

(12)

通过上式可对w和b进行求解:

(13)

得到最终的SVR模型:

y=f(x)=wφ(x)+b=

(14)

核函数K(xi,xj)的选择决定了是否能够将线性不可分问题转化为可分问题[13]。高斯径向基核函数(RBF)能够在参数少和线性不可分的情况下体现良好的性能,因此选择RBF作为SVR预测模型的核函数:

(15)

2.2 安全态势计算方法

安全态势的计算前提需要对设备权重w进行赋值dv,第i个设备重要性赋值dvi:

(16)

通过SVR模型识别的第i个设备安全态势值为yi,则电力监控防护系统的安全态势值PSS可以通过下式计算:

(17)

2.3 安全态势识别结果分析

为验证基于SVR构建的安全态势识别模型的有效性,该文模拟了恶意攻击,将900个数据样本以3∶1的比例构建训练集和测试集。同时,利用粒子群寻优算法(PSO)将最优算法参数定义为:C=83.54,σ=6.67,ε=0.01。对SVR识别模型和BPNN识别模型进行对比分析,实验结果如图3和图4所示。

图3 模型识别结果对比

图4 模型实验结果对比

分析图3可知,BPNN识别模型的安全态势识别值和实际值差值波动较大,明显高于SVR识别模型。这表明SVR识别模型具有更高的识别准确率,并且具有更加稳定的识别效果。分析图4可知,SVR模型的评估值与实际值误差绝对值为0、1、2的样本数量明显多于BPNN模型,而随着误差绝对值越来越大,SVR模型的样本个数明显少于BPNN模型。SVR模型的识别精度整体优于BPNN模型。对SVR模型和BPNN模型进一步进行对比,结果如表2。分析表2可知,相较于BPNN模型,SVR模型在RMSE上降低了43.60%,在MAPE上降低了70.23%。这说明,所构建的SVR安全态势识别模型具有更好的识别能力和模型准确率。对比SVR和BPNN两个识别模型可知,SVR模型能够在样本数量少的情况下保证较高的泛化能力,准确识别未知数据,能够在降低训练成本的前提下保证攻击样本的类型和压力。而BPNN往往需要进行大量训练和参数寻优,如果初始化参数取值不当,BPNN模型容易出现陷入局部最优的情况。同时,BPNN需要构建样本大、维度高的训练数据集,面对小样本的情况还会出现过拟合现象。

表2 模型识别结果对比

3 基于GRU的安全态势预测模型

3.1 基于GRU预测模型

(18)

(1)定义神经元输入为xt,Wz和Uz分别为输入层到隐藏层、上一个状态到当前状态的更新门权重,设置激活函数为sigmoid,矩阵拼接表达为+,更新门zt的表达式为:

(19)

(20)

(3)定义神经元输入为xt,Wr和Ur分别为输入层到隐藏层、上一个状态到当前状态的重置门权重,设置激活函数为sigmoid,矩阵拼接表达为+,重置门rt的表达式为:

rt=σ(Wrxt+Urht-1)

(21)

为保证预测模型的准确率,同样采用sigmoid函数作为GRU隐藏层的激活函数。由于函数能够在处理非线性问题的时候保证较快的收敛速度和较好的处理效果,不会出现梯度消失的问题[16],因此,采用leaky_ReLU函数作为GRU全连接层的激活函数:

(22)

设定损失值为loss,定义yi和ytrue为第i个样本的模型预测值和实际值,损失函数为:

(23)

3.2 预测精度对比分析

该文对比分析了三种模型在进行安全态势预测的模型预测精度,分别为:径向基函数(RBF)预测模型[17]、SVR预测模型和该文设计的GRU预测模型,其中RBF神经网络模型是一种单隐层的三层前馈网络,采用的是改进布谷鸟搜索法对RBF模型进行优化,并引入了动态发现概率和模拟退火。采用RMSE和MAPE对三种预测模型进行对比分析,结果如表3所示。分析表3可知,设计的GRU预测模型相较于RBF模型和SVR模型的均方差误差(RMSE)分别降低了19.23%和23.56%,平均绝对百分比误差(MAPE)降低了48.33%和58.73%。对比三者实验结果可知,GRU具有更擅长执行时间序列的学习能力,在安全态势预测上具有更高的预测精度。

表3 模型预测精度对比

截取其中100个数据样本的预测结果与实际值进行对比分析,预测结果对比分析如图5所示。数据样本1~33、34~66和67~100分别对应模型预测的安全态势在上升阶段、峰值阶段和下降阶段。分析图5可知,所构建的GRU预测模型在数据样本安全态势的上升、下降和峰值预测中均能保证良好的吻合效果,无论是变化趋势还是预测值准确率,GRU预测模型相较于RBF和SVR模型均具有更小的预测误差。

图5 100个数据样本的模型预测结果对比

4 电力监控防护系统实现与验证

所设计的电力监控防护系统主要分为数据分析、安全态势和用户交互三个部分,如图6所示,其中安全态势部分主要包括指标体系模块、安全态势识别模块和安全态势预测模块。

图6 原型系统功能架构设计

利用python攻击模拟器对电力监控防护系统进行攻击模拟。分析模拟结果可知,所设计的电力监控防护系统能够实时感知系统内部或者外部的恶意攻击,准确捕捉设备或者网络运行状态,能够及时预警反馈安全问题。当设备或者网络受到威胁或者攻击时,能够实时识别并准确预测,证明了该方法的有效性、准确性以及系统可行性。

5 结束语

为了实现“智慧电网”背景下对电力监控防护系统的精细化、实时化和智能化的复杂要求,从指标体系构建、安全识别模型和状态预测模型共三个方面对电力监控防护系统的设计进行了研究,并实现了新型电力监控防护系统的可视化,主要创新点如下:

(1)基于支持向量机的递归特征消除(SVM-RFE)技术,基于皮尔森相关系数(Pearson)去除冗余特征,构建了电力监控防护系统安全识别指标体系。

(2)基于支持向量回归(SVR)技术,构建了基于SVR的安全态势识别模型。相较于BPNN模型,SVR模型的安全态势识别结果在RMSE上降低了43.60%,在MAPE上降低了70.23%。

(3)基于门循环单元(GRU)神经网络,构建了基于GRU的安全态势预测模型。GRU预测模型相较于RBF模型和SVR模型的均方差(RMSE)分别降低了19.23%和23.56%,平均绝对百分比(MAPE)降低了48.33%和58.73%。

(4)实现了电力监控防护系统,通过实验验证了系统可行性。

该研究为电力监控防护系统的安全运维提供重要参考,为构建智慧电网提供了技术支撑。

猜你喜欢
态势指标体系监控
The Great Barrier Reef shows coral comeback
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势
你被监控了吗?
我国天然气供需呈现紧平衡态势
Zabbix在ATS系统集中监控中的应用
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
县乡一体化探索呈加速态势
PDCA循环法在多重耐药菌感染监控中的应用