赵月爱,秦佳宁
(太原师范学院 计算机科学与技术系,山西 晋中 030619)
随着社会经济的发展和科技生产力的提高,人类的生活、生产已经进步入了高电气化时代,家用电气的普及达到了前所未有的程度.但是电能在方便人类的同时,又造成了电气火灾事故的危险.目前,在火灾事故中,约30%左右是由于电气火灾引起的.在电气火灾中,电气线路火灾约占60%,而低压电气线路火灾又占电气线路火灾的90%以上[1].
面对愈加严峻的电气火灾形势,传统的运用单一探测器的火灾自动报警系统局限性较大,甚至有些需要人工干涉,难以实时探测火灾,因而常常耽误了最佳的灾情救援时间.近几年来多传感器数据融合技术不断发展,在火灾探测领域处于十分重要的地位[2].因此,如何利用多传感器实现对电气火灾的精准预警是一个值得深入研究的内容.
目前,国内外学者已经设计了几种火灾预警的数学模型,例如,基于回归分析[3]、聚类分析[4]、神经网络[5]、灰色系统理论[6]及时间序列[7]等.但是,由于输电线路负荷的模糊性及非线性的特点,使这些方法在预测时不能很好达到负荷预测的精度,而LSTM作为一种基于时间序列的递归神经网络,在短期预测中具有更高精准度,在众多领域被使用.李伟山等人利用LSTM设计了煤矿瓦斯预测方法[8];李智敏等人利用LSTM针对人体活动行为进行了识别研究,证明了递归神经网络在行为识别中具有较高的精确度[9];陈韫等人利用LSTM深度网络对城市道路短时交通状态进行了预测[10].考虑到LSTM算法能够处理序列变化的数据,解决长序列训练过程中梯度消失与爆炸问题.因此,本文将其应用于电气火灾的预测中,并进行了实验研究.
本文分析了引起电气火灾的重要因素,基于TensorFlow的LSTM神经网络算法对某地区输电线路上的数据进行了分析,通过多次数据迭代和参数调优对模型进行了训练,实验结果表明,基于TensorFlow的LSTM神经网络算法对于电气火灾的预测不仅具有较高的准确度,而且泛化能力强,预测效果明显好于其他学习算法.
引起电气火灾的因素众多,包含输电线路短路、接地故障、电路过电流、绝缘老化以及电热设备引燃可燃物等因素,但输电线路短路占大部分比例,而短路火灾中90%是由于接地屏蔽故障导致,这时就需要对剩余电流进行特殊的测控来防止这类由异常漏电流导致的接地渐变性事故,另外还需对漏电电流参数、电流电压参数、工作电压参数以及线缆温度参数进行检测,以便随时把握电气线路或电气设备的异样状况,及早发现并消灭电气线路中的火灾隐情,为居民和企业的生活与生产提供保障.
因此,本文选取以下特征作为衡量火灾发生概率的关键因素:
1)漏电电流.非正常的漏电流会导致接地渐变性故障,易引起短路现象.
2)电流电压.随时掌握线路的火灾危险和异常状态.
3)工作电流.以便监控线路的电流负荷.
4)电缆温度.线缆温度过高容易烧断线路,产生火花引发火灾.
TensorFlow是基于DistBelief开发而成的开源的人工智能软件学习库,可用于深度学习与深度神经网络方面的研究.其中,Tensor即张量,表示N维数组,Flow即流运算,表示基于数据流图的计算,因此,TensorFlow运算模式为N维数组从数据流图的某端点流动到其他端点.TensorFlow拥有高度的灵活性、优良的可移植性、自动求微分功能以及多语言的支持功能等特性,已逐步成为最受欢迎的深度学习工具.本文对TensorFlow中的LSTM算法进行了实验研究.
循环神经网络(Recurrent Neural Networks,RNN)作为一种递归神经网络,能更好地处理并预测序列变化的数据,充分地分析挖掘数据中的时序信息和语义信息[11].RNN通过把前几个时刻的隐藏层输出数据作为自身层的输入来保留时间维度信息.RNN的结构图如图1所示.其中,模块A输入为Xi,输出一个值hi,通过循环把信息从当前位置传递到下一位置.
长短时记忆(Long Short Term Memory,LSTM)神经网络是RNN网络的进一步演变,不仅能够记忆长序列中的规律,还能够避免梯度消失与爆炸[12].LSTM结构图如图 2 所示,与RNN网络相比,LSTM网络多了记忆功能,用记忆块(Memory blocks)取代隐层单元(Hidden units),并把前一时刻的信息存储在这些记忆块中的记忆单元(Memory cell)中,而且增加输入门(Input gate)、输出门(Output gate )和遗忘门(Forget gate),输入门代表此刻的输入信息,遗忘门代表此刻丢弃的信息,输出门代表最终网络输出的信息.它们共同作用来记忆信息的序列特征.记忆线和输入输出线是记忆块的2条主线,其中,t-1时,记忆线中的状态ct-1经由遗忘门状态ft和输入门状态it的相继处理后获得该时刻的记忆线并输出ct; 而输入输出线在t时刻输入一组新的变量值xt与上一时刻的隐含层输出状态ht-1一同经由输出门状态ot的运算后,参考记忆线在该时刻的输出ct,得到隐含层的输出结果ht.LSTM中t时刻所得的ct和ht将被传递到下一时刻参与计算.
图1 RNN结构图图2 LSTM结构图
为了求得ct和ht详细的运算步骤如下所示:
(1)
(2)
(3)
(4)
(5)
计算LSTM记忆线的t时刻输出ct,如式(6)所示:
(6)
计算LSTM的t时刻隐含层输出ht,如式(7)所示:
ht=ot×tanh(ct) .
(7)
计算t+1时刻的序列值,并根据输入的历史序列数据和模型训练的结果,得到t+1时刻的电气火灾发生概率预测值.计算方式如式(8)所示.
(8)
式中,W2是处于输出层和隐含层之间的权重矩阵;b则是输出层的偏项.
为验证算法的有效性,对部署在某地区的来自A、B、C、D四个不同输电线路监控数据(每天间隔一分钟记录一次)共计1067万条数据进行了分析.算法在Ubuntu 16.04 操作系统下的TensorFlow 1.3.0 开发完成.运行环境为英特尔酷睿i5-8250@1.60 GHz处理器,8GB内存.
获取庞杂的历史输电线路负荷数据中,机械或人为因素常常导致负荷数据中出现数据的偏执与缺失,这些缺失或异常数据存在会极大地影响预测的精度,因此,需要对源数据进行加工与处理.
针对上述“坏数据”,采用下述方法进行处理:
1)概率统计方法.通过对正常数据采取概率统计来找出该数据的置信区间,以此来辨别出异常数据进行处理.
2)曲线替代方法.对明显超出正常负荷曲线的异常数据进行消除替代处理.
3)经验修正方法.从经验角度出发,通过对比正常负荷曲线,找到某时间段内数据值来修正异常数据.
4)平均值填充方法.针对缺失数据,取相邻数据的平均值来填补从而完善数据源.
此外,由于各项影响电气火灾的因素量纲不同,如果将不同量纲的数据直接导入进行模型训练,很容易会出现模型不收敛的结果,因此要对数据进行归一化处理:
(9)
其中,Xnorm为归一化后数据,X为原始数据,Xmax和Xmin分别为原始数据的最大值及最小值.
为了评估LSTM 神经网络预测结果的表现力,采用评价分类模型时通用的准确率(Accuracy),精确率(Precision),召回率(Recall)、F-Measure来评估预测的准确度.
(10)
(11)
(12)
(13)
式中,P为精确率,R为召回率.F-Measure是Precision和Recall加权调和平均,F值越接近1,说明效果越好.TP表示将真正例预测为真,FN表示将真正例预测为假,FP表示将假正例预测为真,TN表示将真反例预测为假.
图3 模型的训练方式
模型的输入输出如图3所示,模型的输入特征为这些参数t时段前的r个连续时间序列的参数值,输出为t时段输电线路全部传感器的参数值,其中模型的输入为虚线矩形框,模型的输出则为虚线箭头表示,不同的线型代表不同的训练,如:xt为t时间段的全部传感器的参数值.为了增强模型的表现力,需要采用简单交叉验证的方式选择合适的LSTM层数、各层节点数、迭代次数.
实验结果表明,采用2层LSTM构建的循环神经网络,在每层包含的隐藏层节点数为10、时间步长为32时,模型具有较好的表现力.模型的学习率为0.001,批处理大小为60,最大迭代次数为800次,激活函数为ReLU,Dropout概率为0.5,即每个隐层节点有50%的概率被抛弃.
本实验预测方式为利用前32个时间序列的数据,预测第33个时间段的数据.经过反复调参和迭代分析,在A、B、C、D四个不同数据集上的实验结果如表1所示,本实验所构建的LSTM模型在不同地区的输电线路参数训练集中的准确率、精确率、召回率都能达到80%以上,但地区B的F-Measure值明显低于其他地区,后续将深入研究其他造成电气线路短路的因素.
表1 不同地区的样本下算法的准确率、精确率及召回率对比
在A、B、C、D四个不同数据集上分别采用LSTM神经网络、CART决策树、KNN三种算法对电气火灾预测情况进行了比较,其中训练数据占70%,验证数据占10%,测试数据占20%,结果如表2所示.
表2 不同地区不同算法的准确率、精确率及召回率对比 %
从实验结果可以看出,与CART决策树算法、KNN算法相比,LSTM神经网络算法预测的精度更高,性能更稳定些.
本文设计并实现了基于LSTM神经网络的电气线路火灾预测模型,借助TensorFlow智能学习系统平台进行了实验研究,该模型能更好地学习多个输电线路参数的相关特征,并且拥有较长时间的记忆功能,可对多个输电线路传感器数据进行有效学习.实验结果表明该模型有准确率高、误报率低、安全可靠等优点.今后将考虑更多影响电气火灾的因素,进一步研究多传感器数据之间的相关性,从而逐步提高模型预测的表现力.