基于半监督的电网虚假数据实时监测系统设计

2022-09-02 06:25黄颖祺周亚胜
电子设计工程 2022年16期
关键词:数据量残差监控

武 婕,邓 彬,黄颖祺,李 娜,周亚胜

(1.深圳供电局有限公司系统运行部,广东深圳 518000;2.兴唐通信科技有限公司科技发展部,广东深圳 518000)

电网在长时间的运行过程中会产生大量的运行数据,实时数据中会出现大量的假数据,给系统的数据处理带来了很大的困难[1]。因此,要做到防患于未然,迅速解决问题,确保电力系统正常稳定运行,就必须对电力系统运行状态的参数数据进行实时监测和分析,及时跟踪系统或设备的运行情况。由于传统的数据库需要读写数据,而基于磁盘介质的存储结构存在误差大、效率低等问题,不能满足高实时性数据处理的要求,因此,必须对实时系统中的假数据进行监控[2-3]。

为了保证在负载变化、通信延时、通信链路丢失等情况下对虚假数据进行实时监测,设计了一种约束传感器实时监测系统。但是该系统最大的缺点是不能完全保证系统的安全,因为不能充分考虑所有可能产生的假数据。基于模型试验系统,实时估计当前系统的状态变量和测量值,并与最优值、历史数据或指标函数进行比较,当估计的残值或指标函数超过某个阈值,或当前数据的概率分布与历史数据的分布不一致时,即为误差数据。但系统无法有效地检测到重放攻击数据,从而导致监测结果错误。为此,提出了基于半监督的电网虚假数据实时监测系统设计。

1 系统硬件结构设计

在电网综合运行过程中,传统的串口传输方式由于数据量大、传输速度慢,不利于数据的高效处理和实时监控。针对这一问题,设计了基于半监督的电网虚假数据实时监测系统的硬件架构,如图1 所示。

图1 系统硬件结构

由图1 可知,该系统主要由功率放大器、数据采集卡、电荷放大器以及远程监控设备等组成。将采集的数据和信息通过网络传输给远程监控设备,要求监控设备的参数和工作模式通过人机交互界面实现[4]。

1.1 远程监控机

远程监控机结构如图2 所示。

图2 远程监控机结构

远程监控机采用RV-2000 视频监控终端采集视频信号[5-7],信号通过光纤网络传送给监控服务器,监控中心的监控器将流媒体转发服务器获取的数据转换并分解成为每秒25 帧的数字图像,再由LCD 显示屏显示图像内容[8-10]。

1.2 数据采集卡

采用1604HS 系列采集卡采集数据,其具有4 个计数通道和3 个编码测量通道,是一种具有数据采集功能的微机扩展卡[11]。通过USB 总线将数据采集卡连接到PC 机,1604HS 数据采集卡结构如图3 所示。

图3 1604HS数据采集卡结构

在监控装置安装好数据采集系统后,实时运行的电压或电流信号被传感器采集,经A/D转换成FIFO。存储在FIFO 中的数据达到一定数量之后,使用ARM 处理器处理数据[12]。

1.3 端子板

端子板是一种电子元件,其接线采用螺丝、夹子等元件,将多个端子板组合起来,根据不同功能对板件进行排列。通信传输与供电有机结合,使同一通信卡连接不同类型的仪器和信号,只需更换电路板跳线,就能有效减少线路上的节点数[13]。外端设有插接板,便于维修,更换外端时无需拆下连接线[14]。其具有接线快速、压实可靠、故障发生率低的特点。无需特殊配置接线板,直接将导线与接线板连接,内部采用专用接口,通过专用电缆可快速插入PLC 或DCS[15]。

1.4 电荷放大器

由一对场效应管和一个高增益运算放大器构成的YE5850电荷放大器,具有输入电流大、放大器功率大等特点,可以将输出电压的电荷量按一定比例放大。YE5850 型电荷放大器具有15 V 稳定的工作电压,外加限流保护电路,可直接由DC 输入插座供电。

1.5 功率放大器

AV-500 功放不仅拥有先进的5.1 声道解码系统,还支持WiFi-2.4 G、Bluetooth4.0 和高速USB2.0连接,有助于在网络和移动设备上播放音频媒体。通过对低音的合理管理,可调节高低通滤波器的转角,达到音质和谐的目的。在支持立体声直通主调的同时,弹性调节空间音质。全面支持多种音频格式,采用多种高速连接方式,将接口设置为3 进1 出形式,实现快速切换。

2 系统软件部分设计

2.1 基于半监督学习建模

半监督迭代学习是两种模式,分别是监督模式下的学习方式和无监督模式下的学习方式。使用半监督迭代学习方法,既能标记大量数据,又能对标记数据进行迭代学习与训练。基于半监督学习建模如图4 所示。

图4 基于半监督学习建模

针对长时间序列主信息特征,采用基于半监督交叠的聚类分析方法提取样本序列,并将该样本序列用于对各种常规行为进行初始化,当样本数远小于总样本数时,采用迭代学习方法进行训练,以提高半监督学习的鲁棒性[16]。

基于半监督迭代学习训练过程如下:

步骤一:通过相应的半监督学习,建立阈值模型,对不同种类的A 样本进行判别,计算在这一步中,每个正常行为的样本数为n;

步骤二:对最有可能出现的每一类样品进行抽样,如果抽样不合格,应立即停止这些样品的采集工作;

步骤三:以半监督学习方法获得的参数为样本序列的初始值,对电网采集的参数进行进一步训练;

步骤四:更新阈值模型参数;

步骤五:依据更新后的阈值,判断序列样本,如果该样本中存在训练参数,则需按照步骤一重新训练;如果不存在,则立刻停止训练,输出训练结果[17]。

2.2 基于半监督虚假数据检测

利用半监督学习模型来判断数据是否异常,然后使用半监督入侵检测算法检测虚假数据。对于半监督迭代学习模型,当序列的有效特性得到充分描述时,模型的预测残差将不再包含任何有效信息,而残差是纯无序的随机波动。检测残差序列包含了大量不能充分利用的信息,即序列中各项目间的相互关系,与纯随机噪声序列相比,残差序列具有更强的相关性。基于半监督虚假数据检测流程如图5所示。

图5 基于半监督虚假数据检测流程

训练时采用正态数据模型,每一刻对输入数据进行N次预测,并且假设每一学习步的序列满足正态分布N元,在每一刻的序列数据中,每个维度的方差和均值都是N,得到的统计值作为参考值。训练结束后,对模型进行异常检测,并对测试集上的数据进行实时KLD 计算,在此基础上得到当前数据的残差估计,假定残差估计为N元正态分布,并对残差估计分布与基准数据之间的KLD 进行分析,以判断当前数据是否为假数据,如果当估计残差小于预定的报警阈值时,判断是否为正常数据。

针对迭代学习过程后的训练集数据,在时间轴上的预测误差向量序列为:

训练集中使用的全部都是正常数据,因此,误差向量序列统计结果为正常检测依据。将实时获取的误差向量e与标准的KLD 统计,能够得到异常检测决策统计结果,如下所示:

式中,DKI表示异常检测值数量,Ghj表示异常检测系数。当式(2)计算结果S大于设定报警阈值时,则说明该数据为虚假数据,否则是正常数据。

3 实验结果分析

3.1 攻击方式确定

设定3 种攻击方式如下:

攻击1:对远程终端设备进行攻击,改变传感器的测量值,影响系统状态估计。

攻击2:针对传感器和数据采集监控器进行数据传输攻击,改变初始传感器测量数据。

攻击3:当受到攻击时,使监测形式同样发生改变。

3.2 实验结果与分析

分别使用基于约束传感器的实时监测系统R1、模型监测系统R2和基于半监督监测系统R3对3 种攻击下产生的虚假数据量进行监测,监测结果如图6所示。

图6 3种系统虚假数据量监测结果对比

由图6 可知,在攻击1 情况下,使用基于约束传感器的实时监测系统、模型监测系统的虚假数据量与实际虚假数据量分别相差22×104bit、10×104bit,使用基于半监督监测系统的虚假数据量与实际虚假数据量一致。

在攻击2 情况下,使用基于约束传感器的实时监测系统、模型监测系统的虚假数据量与实际虚假数据量分别相差6×104bit、10×104bit,使用基于半监督监测系统的虚假数据量与实际虚假数据量一致。

在攻击3 情况下,使用基于约束传感器的实时监测系统、模型监测系统的虚假数据量与实际虚假数据量分别相差2×104bit、10×104bit,使用基于半监督监测系统的虚假数据量与实际虚假数据量相差2×104bit。

通过上述分析可知,使用基于半监督监测系统的虚假数据量监测结果更加精准,为了进一步验证3种系统的监测效率,以1 min 为时间间隔进行对比分析,结果如表1 所示。

表1 3种系统监测效率对比分析

由表1 可知,使用基于约束传感器的实时监测系统最高监测效率为0.81;使用模型监测系统最高监测效率为0.65;基于半监督监测系统最高监测效率为0.96。

4 结束语

该文提出的基于半监督的电网虚假数据实时监测系统,通过硬件结构设计及软件部分优化,结合基于半监督学习模型,通过迭代学习检测虚假数据,通过实验验证了该系统设计的合理性。根据电网综合业务数据监控的需要,利用专业实验装置对系统进行验证,实现了对复杂电网结构及特殊环境下的实时运行数据监控。基于半监督的电网虚假数据实时监测系统,提高了系统监测效率,提高了电力企业数据质量,确保电网安全稳定地运行。

猜你喜欢
数据量残差监控
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
The Great Barrier Reef shows coral comeback
基于大数据量的初至层析成像算法优化
基于残差学习的自适应无人机目标跟踪算法
高刷新率不容易显示器需求与接口标准带宽
宽带信号采集与大数据量传输系统设计与研究
基于深度卷积的残差三生网络研究与应用
你被监控了吗?
科学训练监控新趋势——适时监控