李莎
(1.长沙理工大学,湖南长沙410000;2.国网湖南省电力有限公司益阳供电分公司,湖南益阳413000)
Tensorflow框架是由Disebellef所研发的人工智能学习系统,该框架具有较强的可移植性和灵活性。目前,在深度学习框架中,该框架是具有代表性的,通过建立Tensorflow框架,进一步构建深入学习用电异常检测模型,能够实时检测异常的用电数据。第二,结构递归神经网络和LSTM结构,对于长短期记忆特征典型网络的结构来说,是由一个或多个长短信息模块构成,其包含4个部分,分别为输入、输出门、遗忘门以及长短期记忆单元。对于结构递归神经网络是通过相似的多个神经网络结构递归,进一步构造为复杂深度网络,在2维平面中其结构是与树类似的,一般来说,在递归时很容易产生权重指数消失,进而会使数据无法与结构递归神经网络获得对应联系,而长短期记忆结构递归神经网络能够解决上述问题,同时,在机器翻译以及基因分类等多个领域中获得应用。
为能够实现对异常用电模式的相关检测,本研究提出可使用记忆深度学习框架用户切电模式检测模型,如图1所示:
图1 模式检测模型图
该模型是通过深度学习的方式,以找到用户用电与用电数据之间的关系,进一步分析窃电用电数据。第一,数据源以及数据集。本研究数据源来源于某电力企业所采集数据采集数据频率为每隔15分钟,样本是数据源的其中部分数据,对于某电表三相电流数据可构成一个数据维度,共288维,标签数据为该企业现场检查和专家分析结果。为确保数据的安全性,要求对所收集数据需经过脱敏分析,为能够使数据与实际情况相接近,在训练集中可降低异常数据比例为进一步检测模型在确定数据分析的能力,在测试时可适当引入一些异常数据,第二,数据预处理,在数据设计时会出现一些错误或重复的数据,对此需要对所采集的数据进行预处理。本研究采用数据清洗以及归一化处理,前者是删除一些重复信息,进行缺失信息补充,纠正错误信息,如式1为数据归一化处理公式。
特征提取网络。为能够实现特征数据的提取,可研究利用特征提取模块,通过该模块是由长期记忆模块连接构成的,即由上一个短期记忆模块输出作为下一个模块输入,在具体使用过程中,要求构建模型需对高维数据进行处理,一般来说,特征之间关系包含于高维度数据,这些特征能够反映数据特性,在大量数据中存在较多特征关系,这种情况下利于准确进行模型判断,而大多数单一模块很难从高度数据中提取多种类型特征和特征关系。为解决该问题的研究,可将所输入的高维度数据分为三个大小基本一致的子数据,即X1、X2、X3,对于子数据可进行特征提取,共有10个模块,可构建递归神经网络进一步提取高维度数据特征,利用上述方法,能够获得特征数据,以实现用户用电模式特征匹配,进一步标注数据类型,为实现这一项目的的研究,提出可使用由三层全连接隐含层所构成的神经网络,以实现对用户特征数据的匹配。在损失计算和梯度优化时,利用损失函数能够准确计算目前模型损失偏差,通过函数计算基因负反馈调节,合理调整各参数,如式(2)为本研究所构建的损失函数公式。
在上述公式中实际分类标签为yreal,分类结果为yclass,针对该损失函数,可采用适应性矩阵估计优化,以获得最小化损失函数值,深度学习Tensorflow框模型实现反馈调节。
研究学者在模型结构评价过程中提出混淆矩阵,针对异常用例数据作为负类,对于正常用电数据可将其定义为正类,使用混淆矩阵来表示最终的分类结果。比如,通常利用行对应实际所属类别,而列可对应对应分类器进行类别预测,在混淆矩阵下形成多样化的评价指标,包括准确率,漏警率等指标,以实现模型结果评价,如下公式所示:
在该公式中,正常数据分类的正常数目为ntp,异常数据分类的异常数目为ntn,将正常数据分类为异常数目为nFp,将异常数据分类为正常的数目为nFN,准确率主要是指在测试样本中,正确识别数目所占比例,如果准确率高,表明该模型所识别异常用电概率越低,在总异常数据中漏警率是指模型错误识别数据的比例,如果漏警的越低,表明利用该模型错误识别用户模式为正常的概率越低。
为验证本研究提出模型的有效性,将深度学习模型与非深度学习模型进行比较,共开展5次实验,选取平均值为最终结果,除此之外,将将该模型与多层长短期记忆深度学习模型进行比较开展5次实验,运行周期长达15000次。
本研究由某电力公司所提供数据样本作为数据集,该样本中涉及多个用户两个月内的三相电流有关数据,共计3860条,在其数据集中共含有309条异常用电数据,其中342条为正常数据,在训练集中异常数据占8.28%。在测试集中有51条异常用电数据,81条正常数据,在测试集中异常数据占38.64%。基于深度学习,Tensorflow学习框架使用一台计算机,其CPU为INrelE34核,内存为8G。测试集中部分异常数据如下表1所示:
表1 测试集中部分异常数据
相比支持向量基模型和BP神经网络模型来说,本研究提出的基于深度TensorFlow学习模型具有良好性能。经过5000个周期运行之后,研究提出的模型以及基于多层长短期记忆学习模型,两种模型准确率变化较小,认为上述两个模型逐渐趋于稳定状态,经过模型之后,相比基于多层长短期记忆学习模型来说,研究提出的模型准确率要高,在经过5000个周期之后,研究提出的模型相比基于多层长短期学习模型来说,准确率变化幅度要小,整体来看,本研究提出的基于深度Tensorflow框学习框架模型,其具有良好的鲁棒性和准确性。
本研究提出基于深度学习以实现用户异常数用电数据检测模型,利用该模型能够从用户实际用电中获取用电数据,基于深度学习框架进一步构建用户窃电检测模型,提取数据特征,构建结构递归神经网络,通过三层全连接进一步构建数据特征匹配神经网络,将本研究提出的模型与基于支持向量机模型以及BP神经网络模型对比,通过实验结果发现,相对来说具有良好的识别准确率和较低漏警率,可及时发现用户模式的异常数据,准确性较高,除此之外,相比基于多层长短期记忆学习模型来说,本研究所提出的用户窃电检测模型,其具有鲁棒性,准确性。后续需深入研究深度学习模型学习速度以压缩检测时间,能够快速提取用户日常用电信息,实现特征匹配优化,不断满足用电需求。