陈浈斐, 章黄勇, 马宏忠, 李志新, 李呈营
(1.河海大学 能源与电气学院,江苏 南京 211100; 2.国家电网有限公司电能计量重点实验室国网江苏省电力有限公司营销服务中心,江苏 南京 210019)
电力设备是电网的关键组成部分,种类多、数量庞大。目前电网朝向智能化、自动化发展的趋势不断增强。因此大量的传感器设备被用于进行设备状态监测,采集的数据构成了庞大的数据集[1],其中包含大量非结构化数据。从积累的大量数据中挖掘与设备状态相关的信息,判断是否有故障存在或者进行故障预测,对于保障电网安全稳定运行有重要意义。
传统上,电力设备故障诊断方法分为两类:基于数学模型的诊断方法和基于设备监测数据的诊断方法[2]。基于数学模型的诊断方法准确性和针对性很强,但面对实际情况缺乏适应性[3]。基于设备监测数据的诊断方法将故障诊断过程分为特征提取和特征分类两个主要过程。特征提取过程应用傅里叶变换、小波变换和经验模态分解等方法,特征分类过程应用支持向量机、决策树、随机森林和人工神经网络等传统机器学习算法。然而,此类方法只能提取数据的浅层特征,并且特征提取过程需要专业知识支撑。随着状态监测设备不断增多、设备监测数据量不断增长,传统方法无法有效处理海量设备监测数据,因此需要发展新的故障诊断方法。
近年来,随着计算机技术的快速发展[4],深度学习技术的研究浪潮再次兴起。深度学习技术能够处理海量数据,提取输入数据的深层特征,应用于医疗健康、图像识别和自然语言处理等方面,获得巨大成功。深度学习技术应用于故障诊断领域,可以实现特征提取与特征分类过程合并,对专业知识依赖小。在面对设备复杂故障情况时,深度学习技术能够针对监测数据的特点进行数据挖掘,具有很好的实际应用价值。总而言之,深度学习技术具有强大的提取数据特征的能力,为基于电力设备监测数据的故障诊断方法提供了新的途径。
本文以基于电力设备监测数据的故障诊断方法为研究主题,总结电力设备监测数据的特点,梳理深度学习技术在电力设备故障诊断领域的应用及面临的挑战。
按数据结构不同,电力设备数据可以分为结构化数据和非结构化数据,从数据规模上看,非结构化数据是主要的数据类型[5]。表1为电力设备数据主要来源。
电力设备数据的特征如下[6]:
(1) 具有大量、多样和高速的大数据基本特征[7]。
(2) 电力设备监测数据与被监测设备关系密切,监测的状态量是设备的关键状态量。
表1 电力设备数据来源
(3) 记录故障过程的数据少。
(4) 数据质量不高。监测数据中存在“脏”数据,数据质量不能满足后续故障处理的要求。
(5) 数据分布于多个系统。
传统的故障诊断方法不能适应电力设备数据的新特性,这给故障诊断技术的研究带来新的挑战。深度学习是一种新的应用于故障诊断领域的技术。与传统机器学习方法相比,它具有多层网络结构,通过大量故障数据的训练,可以提取数据更高层次的抽象特征,且不需要人工参与。在复杂情况下可以有效提取故障特征,与电力设备数据的新特点更契合。
深度学习是当前人工智能领域重要的研究方向,技术目标是模拟或者实现人类行为,特点可以总结为:大数据样本、深层网络结构、自动提取深层抽象特征及多层网络参数逐层预训练[8],能够蓬勃发展主要得益于大数据集处理技术和计算机技术在并行、异构计算方面取得的进步。
典型的深度学习网络包括卷积神经网络(convolutional neural network,CNN)[9]、递归神经网络(recurrent neural network,RNN)[10]、深度置信网络(deep belief network,DBN)[11]、堆栈自编码网络(stacked autoencoder,SAE)[12]及生成式对抗网络(generative adversarial network,GAN)[13]。
在电力设备的长期运行中,出现故障是不可避免的,主要的原因包括外力破坏设备绝缘、设备长时间运行绝缘老化和设备本身存在制造缺陷。近年来,电网中新增了大量的传感器设备,已建成的设备运行管理平台迅速积累了大量的设备运行数据。传统的故障诊断方法难以适应大数据时代下的故障诊断工作,诊断效率低下。因为具有从大量数据中提取高层次抽象特征的能力,所以深度学习技术逐渐在故障诊断领域获得广泛运用。表2为不同深度学习网络在故障诊断领域中的部分应用。
表2 深度学习在电力设备故障诊断领域中的应用
基于深度学习的故障诊断方法与传统故障诊断方法的区别:
(1) 处理数据量、状态量种类增多。
(2) 特征提取能力增强,在早期故障、微小故障故障诊断方面能力突出。
(3) 减少了对于先验知识的依赖。
(4) 基于大量数据可以诊断出更多故障类型。
(5) 从一般数据(电压、电流、功率)中挖掘与设备状态相关的信息的能力增强。
( 6)诊断结果准确性受样本数量和样本准确性限制。
通过设备监测数据进行故障预测,及时地发现早期故障,有利于安排合理的检修计划,减少经济损失和停机时间。在电力设备的监测数据中,电压、电流和功率等数据一般都会采集的数据,此类数据中也会隐藏设备的故障信息,挖掘这类数据进行设备故障预测具有实际的应用前景。文献[14]通过dropout层和批归一化技术解决线路故障预测中过拟合问题,可以离线训练模型,然后在线运行,具有实际应用意义。
在设备故障预测的研究中,为了获得更为稳定的诊断结果,应该考虑融合与设备相关的多源数据,如环境负荷数据、气象数据、定期检修信息及地理信息数据。
面对蕴含设备状态信息的电力设备数据,在提取具有应用价值的特征的过程中,应用深度学习技术面临以下几方面的挑战。
(1) 故障样本数量不足。设备带故障运行存在很大隐患,一般发现故障后就会及时停机,数据采集不完全;运维检修时,故障记录不规范,记录缺失。
(2) 故障诊断结果准确性不高。不同故障之间的特征区别小,并且存在环境因素的干扰,使得模型诊断结果不能达到工程应用的要求。
(3) 故障诊断的效率偏低。模型参数多,诊断时间不能满足实时性的要求。
(4) 实际应用平台计算能力和存储空间小。电网中的嵌入式设备受硬件条件限制,难以运行计算量很大且需要大量存储空间的深度学习网络模型。
深度学习是人工智能领域重要的研究方向,在故障诊断与预测领域中有很好的应用前景,随着时代发展,将在以下三个方面得到进一步发展。
(1) 基于可解释的深度学习模型进行诊断。基于可解释的深度学习模型,可以在提取故障特征过程中融合专家经验,提升特征提取效果,提高诊断的准确性。
(2) 多源数据深度融合。打破系统间存在的数据壁垒,实现数据共享,将图像和文本等非结构化数据融入到基于设备状态监测结构化数据进行故障诊断的过程中,利用设备全景数据融合进行故障诊断。
(3) 提升深度学习故障诊断稳定性。增强深度学习技术在传感器故障和电磁干扰等因素影响下诊断结果的稳定性,能在灵活多变的实际运行环境中准确诊断故障。