基于主动识别的多渠道风险数据感知方法

2022-11-18 14:01曹世龙蔡颖凯王一哲付瀚臣刘鑫
电子设计工程 2022年22期
关键词:多渠道样本事故

曹世龙,蔡颖凯,王一哲,付瀚臣,刘鑫

(国网辽宁省电力有限公司营销服务中心,辽宁沈阳 110000)

风险数据感知是指在对风险数据进行深度挖掘和评估的基础上,感知某个领域的安全数据。风险数据感知不仅在互联网、金融、移动通信等领域得到了广泛应用,在电力系统中也引起了高度关注。电力系统在运行过程中会产生一定的风险,这些风险一部分属于运行风险,一部分属于生产安全风险,与电力系统的供电能力、配电网拓扑的安全性、作业环境、电力设备的运行状态等因素密切相关。由于电力系统中风险数据感知能力有限,导致风险数据在预测和感知中存在较大局限性[1-2]。

为了提升风险数据的预测和感知能力,国内学者对其进行了深入研究。其中,有学者提出基于数据分析的风险数据感知方法,构建电力系统风险数据感知模型,通过该模型进行风险数据感知;并将其与多维数据进行融合,通过融合后的风险数据,识别电力系统中存在的安全风险。以上风险数据感知方法虽在预测系统中存在的风险,但风险数据感知能力和风险趋势分析能力较差,风险数据识别范围较大[3-4]。

为了解决以上出现的问题,该文提出了基于主动识别的多渠道风险数据感知方法,对多渠道风险数据进行提取、挖掘和判断,最后通过实验研究验证了该文方法的应用效果。

1 多渠道风险数据提取

采用空间重构法对多渠道风险数据进行特征信息提取,在异构数据分布结构中,风险数据在储存系统中节点间隔为d,风险数据的特征信息结构可以用模型表示为:

其中,G1表示特征结构;表示α对应的采样特征点;表示β对应的采样特征点;Y1表示特征终止点;G2表示信息结构;表示α对应的信息特征点;表示β对应的信息特征点;Y2表示信息终止点[5-6]。

上述风险数据分布的关联规则集合满足式(2):

基于空间异构条件,对风险因素数据检测评估,得到风险数据的分布结构模型如图1 所示。

根据图1 可知,风险状态数据储存节点是风险数据划分的重要依据。采用分隔模型筛选多渠道风险数据储存节点,筛选出的储存节点作为检测评估数据库。根据储存信息特征,在直径为Dn的风险数据范围内划分风险数据,得到k个特征子集Ak,特征子集中数据信息存在重复向量,会出现向量交叉,影响估计结果。采用空间重构法对风险数据状态分布进行分析,得到满足特征的融合方法,确定风险数据的空间融合特征量,由此得出多渠道风险数据信息储存节点的增益模型为:

其中,Hi(x)表示得到的增益模型;k表示风险数据特征量;pk表示融合的数据总量。

根据式(2)得到风险数据储存节点的采样数据集为x={x1,x2,…,xn},为风险数据的识别奠定基础[7-8]。

2 多渠道风险数据关键要素挖掘

对多渠道风险数据致险因素整理归类,按其影响效果强弱分为三级。其中,一级因素包括6 类,二级因素有50 类,三级因素中有255 类。将各类风险因素归于一个风险因素体系[9-10]。风险因素对数据安全性存在关键性影响,所以要挖掘风险因素中的关键要素。由于三个级别的风险因素存在包含关系,即一级因素中包含二级因素和三级因素,数据挖掘中存在重复数据。该文采用PCA 剔除法,消除目标数据中的重复数据,以保证挖掘到的信息数据为关键要素,且能很好反映多渠道关键风险因素影响效果。

1)标准化处理计算公式为:

其中,为风险影响因素Zi的平均值;D(Zi)为风险影响因素的特征方差;Xi表示标准化后的第i个三级风险影响因素值。

2)以多渠道风险因素样本为数据基础,对风险因素及风险事故进行分析,根据风险因素造成的危害,建立对应因果数据样本集,引入相关性概念,分析风险影响因数。n起事故中风险影响因素构成的矩阵为:

其中,X为大小为n×m的标准化三级风险影响因素矩阵;第i个风险影响因素向量为Xi=[X1i,X2i,…,Xni]T。对风险影响因素向量Xi和Xj进行相关性分析,其表达式为:

其中,cov(Xi,Xj)为风险因素向量Xi和Xj平方差指数;D(Xi)和D(Xˉj)分别为向量Xi和Xj的协方差系数。

构建n个风险影响因素的相关系数矩阵R为:

其中,R表示得到的相关系数矩阵;ρmm表示风险因素。根据特征方差公式|λE-R|=0 对相关性系数矩阵R求取特征向量[11-12]。

3)λr为特征值,表示m个关键风险因素的方差值,风险因素中包含m个关键风险因数,关键因素占所有风险因素的百分比,即第p个风险因素的方差值贡献率ωp,其表达式为:

3 基于主动识别的数据风险判断

3.1 变量选取

引入风险事故危害评估值概念,将其作为风险数据感知模型中的变量,则n起风险事故的危害评估表达式为:

其中,Y表示事故危害等级划分标准,无具体大小量值,T表示危害的严重程度,将风险要素作为变量输入风险危害模型,n起事故中m个风险要素矩阵表达式为:

其中,表示关键风险因素在第n起事故中的垂直向量。

当关键因素为连续性因素,则取真值,若风险因素为分散性存在,则对其赋值,赋值大小取决于分散程度大小,赋值范围在0~1 之间,并将其以脉冲形式作为时间编码发射[13-15]。

3.2 参数设置

将i=120 个风险关键因素作为输入变量,风险危害评估值j作为层神经元数量输入SNN[16]。

网络参数设定决定预测模型的精确度,指标跳帧会影响神经元网络的运行,所以采用MSE 作为参考指标,控制数据的跳帧。设定神经元数量范围为50~110,初始权重范围为0~0.001,神经突触数量范围为10~20,神经元突触延迟范围为0.001~0.003,衰减时间系数范围为0.001~0.01。对参数调整时,保持其他参数不变,输入MSE 最小值时,输出参数为最优结果。

3.3 风险数据识别

信号发射编码公式为:

其中,T为编码后的神经元信号发射时间,单位为毫秒;Tmax表示边界值1 对应的神经元信号发射时间,单位为毫秒;T*为风险因素关键系数。

将r作为编码变量加入脉冲发射,发射时间tx∈[0,Tmax],对应的输出脉冲发射时间为tY,输入和输出的时间差为Δt,输出脉冲发射时间与时间差的关系为:

t时刻事故发生的概率为P(t),通过下式可得到t时刻的风险值R(t)

根据贝叶斯公式可计算得出风险因素事故发生概率值,风险因素事故发生概率值为与事故发生概率的累乘值,将各个风险要素中的关键要素条件概率值转化为标准值为:

其中,i为风险关键要素代号;m为风险关键要素数量。

4 实验分析

为验证该文提出的基于主动识别的多渠道风险数据感知方法的实际应用效果,将基于大数据分析的配电网风险数据感知方法与该文所提方法进行实验对比。以电力系统中出现的150 起电力事故为例,分析可能引发电力事故的原因,并构建事故原因多渠道风险数据样本集,从中挑选出一部分作为测试样本,将测试样本中的多渠道风险数据系数阈值设置为0,从多渠道风险数据样本集中提取出部分风险数据主成分,并进行方差运算,如果风险数据主成分贡献率为94%,说明该风险数据主成分集中了引起电力事故的绝大部分多渠道风险因素,然后将多渠道风险数据系数阈值提升到0.25,以此识别多渠道风险数据样本,集中大部分风险关键要素,将多渠道风险样本预测值与提取值进行对比,不同方法下预测误差评估指标对比结果如图2 所示。

由对比结果可知,采用该文所提的基于主动识别的多渠道风险数据感知方法,其预测误差评估指标明显优于基于大数据分析的配电网风险数据感知方法,具有更好的多渠道风险数据预测性能。该文提出的基于主动识别的多渠道风险数据感知方法的风险数据感知能力比基于大数据分析的配电网风险数据感知方法更高。采用该文方法多渠道风险数据样本预测值与提取值具有较高的一致性,吻合度较好,而采用基于大数据分析的配电网风险数据感知方法,多渠道风险样本预测值与提取值相差较大,吻合度较低。

为了更详细、具体地体现出不同多渠道风险数据感知方法的感知性能,利用均方根误差和平均绝对百分比误差评估不同方法的感知准确度。为了分析该文所提方法在电力系统生产运行过程中多渠道风险数据感知情况,选择事故原因多渠道风险数据样本集中某一次生产作业为例,生产时间间隔为2 min,将引起电力系统事故的多渠道风险要素输入到样本集中,对该次生产作业进行风险数据感知,感知结果范围如图3 所示。

生产作业开始阶段,风险等级较低,工作人员生产技能水平、专业水平和生产内容决定了电力系统生产作业的风险等级,随着生产作业时间的不断增长,生产作业环境的变化,工人的体能、精神状态出现一定变化,再加上部分工作人员被临时抽调,只剩部分工作人员进行生产作业,在身体疲劳的情况下出现生产失误,导致了生产事故的发生,在该次生产作业过程中,随着作业时间的增加,该文所提方法预测电力系统事故的风险等级在降低,说明该文所提方法的风险趋势分析能力较高,而基于大数据分析的风险数据感知方法预测电力系统事故的风险等级不降反升,说明风险趋势分析能力较低。基于以上获得的风险数据结果对不同方法下的多渠道风险数据识别范围进行对比发现,该文所提方法的多渠道风险数据识别范围较小,波动较为稳定,而基于大数据分析方法的多渠道风险数据识别范围较大,具有不稳定性。

5 结束语

该文所提基于主动识别的多渠道风险数据感知方法优于基于大数据分析的配电网风险数据感知方法,该文方法的多渠道风险数据感知和风险趋势分析能力更佳,多渠道风险数据识别范围更小,具有更好的稳定性。

猜你喜欢
多渠道样本事故
学中文
用样本估计总体复习点拨
废弃泄漏事故
小恍惚 大事故
规划·样本
随机微分方程的样本Lyapunov二次型估计
浅谈如何通过体育教学提高学生体育素质
电子商务环境下闭环供应链定价策略探讨
大学英语多渠道词汇教学
“官员写作”的四个样本