基于云边协同架构的电力物联网数据分类处理方法

2022-12-07 01:09周忠冉顾亚林张俊杰
微型电脑应用 2022年11期
关键词:云端边缘架构

周忠冉,顾亚林,张俊杰

(南京南瑞信息通信科技有限公司,江苏,南京 210003)

0 引言

现有的基于云计算架构的电力物联网会将这些数据全部传入云端进行数据分析和处理,这不但会使云端背负较大的计算压力,也会给数据传输路线造成巨大的宽带负担,因而这种模式已经无法满足行业日益増长的数据处理需求[1-2]。本文基于边缘计算架构设计了一种基于云边协同架构的电力物联网数据分类处理方法。本方法把在边缘层汇总收集的原始数据利用随机森林算法进行分类和处理,并反馈处理结果,相比较于传统的云中心架构的电网数据处理方法,本方法提升了数据处理的速度,同时又避免了将数据上传和等待数据返回的延迟,达到了对数据的快速响应。

1 相关技术

1.1 随机森林

(1)

其中,函数f(dj)为统计dj出现次数[3-5]。

数据集X依据第j个属性划分的对应基尼系数公式为

(2)

其中,|X|是集合X中元素的个数。

选择对应基尼系数最小的第j个属性作为其数据集分裂的依据进行分割数据集。

1.2 优化随机森林

结合粒子群算法思想,选取CART树的数量T以及数据子集大小k的最优解,缩短模型训练时间,提升模型检测准确率[6],每个粒子包含两个属性,分别为速度v和位置p。

假设对T和k进行初始化的次数为A,粒子空间维度为B,在该粒子空间中,每个粒子在解空间中单独搜寻最优解,将其作为个体极值,则第a个粒子的个体极值表示为Pa={vab,pab},其中a=1,2,…,A,b=1,2,…,B。Pa通过学习自身历史经验和种群全体历史经验,更新速度v和位置p数值,第a个粒子更新的va和pa[7]表示为

βrandom(vab)(Pab-pab)

(3)

Pab=pab+vab

(4)

引入袋外数据误差εodb来找到最优解,记为Pbest,对应的εodb表达式为

(5)

其中,εi表示第i棵CART树的袋外误差。由于随机森林构建每一棵CART树都是在数据集中选取一个子集进行构建,因此余下的数据集可以作为验证数据集去评估该棵CART树[8]。袋外误差率在一定程度上可以体现随机森林的分类准确率。

参数优化流程如下所示。

第一步 初始化次数为A,粒子空间维度为B,每个粒子初始速度和位置分别为va和pa。

第二步 将每个粒子带入随机森林模型,计算εodb。

第三步 对于粒子Pa,如果其对应的εodb

第四步 返回第二步,直到满足最大迭代次数。

当获取最佳CART树的数量T以及数据子集大小k后,可以根据该参数构建随机森林模型。

1.3 LSTM-FCN

LSTM在RNN的基础之上增加了一个长期状态c来保存长期状态,解决了梯度消失问题,非常适合处理时间序列的分类问题[9]。

LSTM神经单元的计算公式如下:

ct=sigmod(ft)×ct-1+sigmod(it)×tanh(ct)

(6)

ht=sigmod(ot)×tanh(ct)

(7)

FCN将传统CNN中的连接层全转化成多个卷积层,故称为全卷积网络。当卷积层的层数为L,X为长度为F0且时间步长为t的特征输入向量时,每层的滤波公式为

(8)

其中,l为当前的层数,Wl∈RFl×d×Fl-1为张量,bl∈RFl为偏置值,d为过滤持续时间,f(·)为校正线性单元。

LSTM-FCN通过在LSTM中加入注意机制,实现了LSTM-RNN中很难学习到的长时间依赖项,其架构如图1所示。

图1 LSTM-FCN 结构

2 模型构建

2.1 模型架构

本文提出的方法架构如图2所示,分为设备层、边缘层和云端层。设备层包含各个产生数据的设备终端,负责收集数据,进行数据预处理并将其发送到边缘层;边缘层为部署在设备层附近的数据处理器,其靠近设备终端,实时汇总预处理数据,就近提供数据处理等服务。通过改进的随机森林模型将其分为正常上载数据和待处理数据,之后将正常上载数据和待处理数据的结果反馈给设备,实现设备的实时检测。同时,将待处理数据上传到云端层。在云端利用Bi-LSTM数据分类模型对这些数据进行分类存储,利用大数据和专家系统进行全网的设备分析和用户用量等的分析,再将分析结果下传到对应的边缘层,对涉及到的设备进行优化处理。

图2 基于云边协同架构的电力物联网数据分类处理方法架构

2.2 边缘层数据分类

在电力物联网中,需要在边缘层对数据进行处理,快速判断设备的运行状态并对其进行故障检测,完成对异常情况的及时处理,防止更大的故障出现。而电表中的数据通常用于进行用量分析和需求分析,必须结合全网的数据进行分析,需要传输到云端层后进行处理[10]。

因此,设备层实时采集和汇总原始数据D后,对其进行数据预处理得到D′。根据数据的来源,边缘层首先将数据进行初步分类,判断数据是否为异常数据,将其分为正常上载数据UpD和待处理数据PeD。边缘层直接将上载数据上传到云端层进行进一步分类分析,同时将异常结果反馈给设备层,实现实时检测。

2.3 边缘层故障检测

对于获得的预处理数据D′,在边缘层使用优化的随机森林进行故障检测,伪代码如图2 所示。对数据D′采用滑动窗口方式进行特征提取,利用Bagging方法从原始数据集中随机抽取训练数据子集训练T棵CART树,利用测试数据集进行测试,输出结果为综合T棵CART树的分类结果。完成后将故障检测结果下传到设备层,并将待处理数据PeD={Time,Type,Data},打包发送到云端层。

算法1 随机森林故障检测模型

图2 故障检测模型

2.4 云端数据分类

在云端层,接收到来自边缘层处理数据PeD,需要对这些数据进行分类存储以便于之后的大数据分析。本文采用LSTM-FCN对数据进行分类,分类过程如下。

(1) 输入数据传入时间卷积块,数据在块中先通过时间卷积层,再使用批量归一化,之后通过ReLU激活函数得到该块的输出,输出再作为输入传送到下一个卷积块,重复2次上述过程。

(2) 经过3个堆叠的时间卷积块的数据进入全局平均池化层。

(3) 输入数据同时被送入维度混洗层(dimension shuffle layer),之后将变幻后的数据输入到由BasicLSTM和Attention LSTM组成的LSTM块中,之后经过Dropout。

(4) 将全局平均池化层和LSTM块的输出进行串联,发送到softmax分类层进行分类,得到分类结果。

3 实验验证

实验数据选取江苏某市变电站2019年的数据作为样本数据集,其中70%的数据作为训练集,剩下30%作为测试集。为了验证算法的性能,选取变电站1—6月的数据,选用SVM 方法、贝叶斯和本文的随机森林模型算法进行比较,比较结果如图3所示。

图3 算法性能比较测试

从图3可以看出,本文的随机森林算法在准确率上基本优于其他2个算法,平均准确率在93%左右。

为验证云端数据分类模型的性能,选取变电站2019年7月的数据,分成数量大小为50、100、150、200、250的数据集,使用本文的LSTM-FCN和传统的LSTM、FCN进行比较,如图4所示。从图4可以看出,本文的LSTM-FCN算法在准确率上基本优于其他2个算法,平均准确率在94%左右。

图4 算法准确率比较测试

选取变电站2019年1—5月的数据,分别分成5个数据集,使用本文的LSTM-FCN和传统的LSTM、FCN进行比较,如图5所示。从图5可以看出,本文的LSTM-FCN算法在准确率上基本优于其他2个算法,平均准确率在94%左右。

图5 算法准确率对比测试

4 总结

现有的电力物联网技术无法满足行业日益増长的数据处理需求,本文基于电力物联网架构云边架构,设计了一种基于云边协同架构的电力物联网数据分类处理模型方法,利用随机森林算法对感知层数据进行实时分类和处理,在云端层利用LSTM-FCN数据分类模型对这些数据进行分类存储,测试结果证明了该模型方法具有较好的实用价值。下一步将针对低带宽、长时延场景下的云边协同数据处理技术进行研究,完善云边协同模型,更好地支撑电力智慧物联体系建设。

猜你喜欢
云端边缘架构
基于FPGA的RNN硬件加速架构
四海心连·云端汇聚
功能架构在电子电气架构开发中的应用和实践
云端之城
基于云服务的图书馆IT架构
WebGIS架构下的地理信息系统构建研究
一张图看懂边缘计算
云端创意
在云端
在边缘寻找自我