LSTM 模型在用电信息采集系统数据计量分析

2024-01-31 10:35邹贤求
电气技术与经济 2024年1期
关键词:置信区间电表用电

邹贤求

(国网湖南省电力有限公司娄底供电分公司)

0 引言

利用用电信息采集系统可以通过远程方式对相关计量点的数据信息进行采集[1],截至目前已经在我国几亿只电能计量器上得到应用。对于采集得到的电压、功率、电流等数据信息可以上传至系统站中,利用大数据分析技术进行处理,以便及时掌握电表的运行状态,发现存在的问题[2]。由于大量的电表在应用过程中,受到各类环境因素影响,难免出现故障问题,通过数据分析可以及时发现计量异常现象,不需要利用传统的人工方式进行排查,能显著提升工作质量和效率,为电力企业的经济效益提供坚实的保障[3]。本研究利用长短期记忆网络(LSTM)模型,对用电信息系统采集的数据信息进行深度挖掘分析,可以及时发现计量异常现象。通过实践测试发现其具有良好的效果,值得进一步推广应用。

1 用电信息采集系统数据的特点

我国当前使用的电表通常为智能电表,电表采集得到的电压、电流、功率,包括有功功率和无功功率,及其随时间的演变情况等信息,能够很好地反映出智能电表的实际工作状态[4]。利用用电信息采集系统对智能电表的上述信息进行采集,基于先进的数据分析技术进行处理,可以及时发现电表计量过程中存在的异常问题。一般情况下表计异常点比较隐蔽,且会持续比较长的时间,实践过程中发现表计异常点主要表现为三种形式,分别为数据偏大、数据偏小、数据持续缺失。如果存在数据缺失问题,在数据预处理阶段就可以发现。针对其他问题则需要进行深入的数据挖掘分析,不同用户的用电行为特征与大小存在很大差异,所以需要基于系统采集的数据信息进行深度的数据挖掘与甄别,才能发现用户的用电行为异常现象。

如果表计数据信息出现持续性的数据偏小或者偏大,而没有按照正常的规律变化,那么可以根据数据库中存储的此类异常点之前的数据信息进行数据分析,很快就可以确定异常点的开始时间[5]。如果数据库中没有存储足够的数据信息,那么将很难查找到异常点开始时间,此时就需要利用电力模型确定异常点开始时间,比如对线损率进行排查计算,但这类方法需要依赖很多的数据信息,计算量和工作量很大,工作质量和效率不高。本文基于长短期记忆网络(LSTM)模型进行数据挖掘分析,能够快速的确定表计数据的异常情况,效率较高。

2 数据分析模型概述

2.1 模型概述

本研究利用深度学习算法对用电信息采集系统收集得到的数据信息进行挖掘分析,判断存在的电表计量异常问题,具体为长短期记忆网络(LSTM)模型。利用深度学习算法时需要利用已有的数据信息对模型进行训练与验证,然后可以利用该模型对电力用户未来的电流、电压以及功率等数据进行准确预测,基于预测结果设置一个置信区间。如果实际结果正好处在置信区间范围以内,则认为不存在异常问题。相反的,如果实际结果不处在置信区间范围以内,则认为实际结果与预测结果之间存在明显的偏差,可以认定对应的采集点存在数据计量异常问题。下文将对LSTM模型进行深入介绍,基于该模型可以对电压、电流、功率等常见的电参数的异常点进行有效甄别。模型需要输入的是电流、电压或者功率的历史数据信息,模型输出的是下一个采集点的置信区间,并将实际结果与置信区间进行对比,判断是否存在异常问题。

2.2 模型结构

整个LSTM模型可以划分成为不同的结构,每个结构均具有对应的功能,所有功能结合起来就可以实现电流、电压、功率结果的预测与分析。具体包括遗忘门结构、输入门结构、当前输入单元状态、当前时刻单元状态、输出门的计算结构等。以下对各结构或状态的情况进行简要介绍。

对于遗忘门结构的计算过程可以利用式(1)表示:

式中,Wf为遗忘门结构的权重矩阵;bf为遗忘门结构的偏置矩阵;[ht-1,xt]表示将括号内的两个量进行拼接,ht-1、xt分别表示LSTM模型前一时刻的输出以及当前时刻的输入情况;σf表示遗忘门激活函数。

对于输入门结构的计算过程可以利用式(2)表示:

式中,σi表示输入门的激活函数;Wi为输入门结构的权重矩阵;bi为输入门结构的偏置矩阵。

利用c′表示当前时刻输入的单元状态,具体操作时可以利用式(3)进行计算:

式中,Wc为该单元的权重矩阵;bc为该单元的偏置矩阵。

利用ct表示当前时刻的单元状态,该状态主要由两部分构成:第一是基于前一时刻的单元状态ct-1获得,具体是ct-1与遗忘门ft相乘;第二是基于当前输入单元的状态获得,具体是c′t与输入门it相乘。具体计算过程可按式(4)进行:

式中,符号“◦”表示根据元素进行相乘。根据以上公式,LSTM模型可以把当前记忆c′t和长期记忆ct-1进行有效结合,最终构建出新单元状态ct。

输出门的计算过程可以按式(5)进行处理:

式中,σo表示输出门的激活函数;Wo表示输出门的权重矩阵;bo表示输出门的偏执矩阵。

3 异常数据甄别基本测试分析

3.1 模型的训练

利用LSTM模型对功率大小实施预测,可以得到待测时间点功率大小的概率预测置信区间范围。主要的网络模型结构参数如下:循环神经网络为4层,包括输入层、LSTM层、普通隐含层、输出层,其中输入层为96×1序列输入,LSTM层和隐含层分别设置有8个节点和4个节点,输出层的节点数量只有1个。系统每间隔15min采集一次数据信息,利用该模型可以利用96个点的历史数据信息对未来一个时刻的数据进行预测。使用模型之前需要利用历史数据信息对LSTM模型进行训练,本案例中准备的训练样本信息为5856个,共完成了400次迭代训练,训练批数为512次,每次迭代运算需要使用4~5批数据信息。其中训练的数据可以分为两种类型,分别为训练集和验证集,其中验证集占所有数据信息比例的5%。利用历史数据信息对模型进行训练和验证以后,发现利用模型得到的数据信息基本在100%置信区间范围以内,并且整个置信区间的范围非常窄,意味着LSTM模型对功率进行预测的置信区间具有很好的效果,且区间范围对于异常数据信息的分析识别具有非常好的参考意义。如果实际的参数信息超过了模型预测的置信区间范围,那么说明实际参数信息与历史数据样本信息的时序规律不相符,属于异常数据点。

3.2 评价指标

对于本研究所述的异常数据信息分析模型,可以采用两个重要的指标进行评价,分别为检出率和误检率,以上两个指标分别用kacc、kerr符号表示,其计算公式如下:

式中,Nb表示实际所有的异常点数目;Nt表示利用模型正确检测出来的异常点数目;Nf表示错误检测的异常点数目。

使用不同大小的噪声方差对不同类型的参数信息进行预测,对两个关键指标进行了统计计算。对于电压参数信息,当噪声方差为0.5V2时,kacc和kerr分别为79.66%和16.94%;当噪声方差为0.7V2时,kacc和kerr分别为83.05%和13.55%。对于电流参数信息,当噪声方差为0.01A2时,kacc和kerr分别为72.88%和25.42%;当噪声方差为0.05A2时,kacc和kerr分别为77.97%和18.64%。对于功率参数信息,当噪声方差为7kW2时,kacc和kerr分别为67.8%和15.25%,当噪声方差为13kW2时,kacc和kerr分别为76.27%和13.55%。上述所有参数中,kacc和kerr的平均数分别为76.27%和17.23%。

4 实际电表电流和功率的测试结果

为了验证LSTM模型在用电信息系统数据计量异常分析中的应用效果,结合实际情况选取了三只存在异常数据的智能电表为对象进行分析,电表分别用Ⅰ、Ⅱ、Ⅲ序号表示。选取的是2023年3月6日~5月7日的数据信息,每间隔15min采集一次数据信息,在两个月时间里共测量得到了5952个点的数据信息,主要是功率值、电压值和电流值等,利用上文提出的LSTM模型对计量异常数据信息进行识别,以达到检验LSTM模型的目的。下面对具体的测试过程以及结果进行分析。

4.1 电流变化率过大异常问题

在普通电力用户一天的用电过程中,其电流值通常不会出现明显的变化,如果通过分析发现用户的电流存在明显突变现象,大概率是存在计量异常问题。如图1所示为电表Ⅰ的电流大小以及电流变化情况,图中显示的是电表Ⅰ在3月6日的电流数据及其变化情况,从图中可以看出,第37个采集点的电流及其电流变化值存在异常现象,利用LSTM模型判定为异常点数据,异常的根据是电流变化率过大,与实际数据进行对比分析,发现异常点的甄别判断是有效的。

图1 电表Ⅰ的电流大小以及电流变化情况

4.2 功率变化率过大异常问题

普通电力用户的用电功率不会出现明显的变化,如果用电功率存在突变问题,则很可能是存在计量异常问题。如图2所示为电表Ⅱ的功率大小以及功率变化情况,图中显示的主要是4月25日电表Ⅱ的数据信息。

图2 电表Ⅱ的功率大小以及功率变化情况

从图中可以看出,在第57个采集点的功率以及功率变化值出现了显著的变化现象。利用LSTM模型进行分析判断后,认为第57个采集点属于异常点数据信息,判断的根据是该采集点的功率存在突变现象。通过与实际情况进行对比,认定该异常点的甄别是有效的。

4.3 电流功率相关性异常问题

根据相关的理论可知,对电力用户而言,其用电功率与电流的平方是成正比的,意味着电力用户的电流越大,对应的功率也越大。如果通过用电信息采集系统采集得到的电流和功率数据信息之间不匹配,则大概率是存在计量异常问题。如图3所示为电表Ⅲ的电流大小以及功率变化情况,图中显示的是5月7日电表Ⅲ的数据信息。利用LSTM模型对相关的数据进行深入挖掘分析以后,认为第75个采集点的数据信息存在异常现象,主要的根据是第75个采集点的电流值相对较小,但是功率值却相比较大。这与基本的电力常识相冲突,因为在电压保持不变的情况下,功率应该与电流的平方成正比。通过与实际情况进行对比,发现该采集点确实存在数据异常现象,验证了LSTM模型甄别判断过程的有效性。

图3 电表Ⅲ的电流大小以及功率变化情况

利用LSTM模型对智能电表的异常数据进行分析时,可以结合实际情况决定是否将相关结果反馈给有关部门。如果某一个智能电表在一段时间内只是出现个别异常数据信息,则需要对该异常点的前后数据信息进行更加细致地排查,确定是否出现了数值偏小或者数值偏大的更加隐蔽的数据计量异常问题,如果不存在上述问题,可以认定为是偶然现象,无需向有关部门进行反馈;如果某一个智能电表在很短的时间内出现了很多次异常数据点,可以认定该电表存在计量异常现象,需要及时将结果反馈给有关部门。

综上所述,针对用电信息采集系统收集得到的数据信息,利用LSTM模型进行深入地挖掘分析,可以及时发现智能电表计量过程中存在的问题,该模型是可行有效的。通过与实际的数据信息对比,发现平均检出率和平均误检率分别为76.27%和17.23%。能够大幅缩小故障问题的排查范围,为电力企业提供很好的现实参考价值。

5 结束语

在人工智能的发展历程中,LSTM模型以其卓越的数据建模和推理能力,得到了全球学术界和业界的广泛关注和推崇。针对用电信息采集系统采集的电压、电流、功率等大量数据信息,通过运用LSTM模型进行深度挖掘和分析,能够快速准确地发现电表计量过程中存在的异常问题。通过实践测验发现LSTM模型的平均检出率和平均误检率分别为76.27%和17.23%。这些测试结果有力地证明了LSTM模型的实用性和有效性,这对于进一步推广LSTM模型在用电信息采集系统数据计量异常分析中的应用具有重要的现实意义。

猜你喜欢
置信区间电表用电
用电安全
巧判电表测量对象
定数截尾场合三参数pareto分布参数的最优置信区间
电表“对”与“错”归类巧掌握
p-范分布中参数的置信区间
用煤用电用气保障工作的通知
多个偏正态总体共同位置参数的Bootstrap置信区间
安全用电知识多
用电安全要注意
列车定位中置信区间的确定方法