赵春晖 胡赟昀 郑嘉乐 陈军豪
电力工业是我国国民经济中的支柱型产业.随着我国经济的飞速发展,社会对电力的需求不断提高.在我国的电源结构中,燃煤发电一直是主力电源,也是火电的主体[1].虽然受能源资源、环境保护、应对气候变化等影响,我国核电、风电、太阳能得到快速发展,但由于煤电成本低、供电安全可靠、资源立足国内,以煤为主的能源结构仍将长期保持不变.国际能源署则预测,即使到2030 年,全球能源对化石燃料的依存度仍高达80%.随着信息化和工业化的深度融合,应对互联网、大数据、云计算等信息领域新技术发展,推进火电行业的智能转型升级,是加快构建高效、清洁、低碳、可持续的电力工业体系的必然选择.
近年来,为了实现可持续发展,火力发电行业积极开展结构调整,“上大压小”,以大容量、高参数、低能耗的超临界和超超临界机组取代高能耗小火电机组,基本形成了以超超临界机组为主体的电力能源结构.百万千瓦超超临界机组已经成为我国电力工业发展的代表性机组和主流方向.在工业和信息化部发布的《高端装备制造业“十二五”发展规划》中,百万千瓦级超超临界火电发电机组被列为近十年我国高端装备制造业具有自主知识产权的12 项重大成果之首.与常规火力发电装备相比较,百万千瓦超超临界机组具有许多特殊性,如单机容量大、热力参数高、系统规模庞大、参数耦合严重、非线性程度高、参数波动要求严格、安全可靠性要求高等,机组出现性能退化甚至故障是不可避免的,运行过程一旦发生重大故障将造成机组非停[2].为提高百万千瓦超超临界机组的运行安全稳定性,需要开展装备运行工况监控的深入研究,包括及时发现异常、识别故障并快速制定应对措施,从而消除安全隐患,降低发电装备非停风险,最大限度保障现役百万千瓦超超临界机组的安全可靠运行,这对于减少电力生产事故、提高电能生产效率具有十分重要的意义[3].
燃煤发电装备运行工况监控技术是了解和掌握燃煤发电装备在使用过程中的状态,确定其整体或局部是否正常,早期发现故障及其原因,并预报故障发展趋势,给出故障处理对策与建议的技术.工况监控从广义上来讲,包括了状态监测和故障诊断.状态监测[4-6]是对装备状态异常的判别,是故障诊断的起点和基础.状态监测通过了解和掌握设备的运行状态,包括采用各种检测、测量、监视、分析和判别方法,结合系统的历史和现状,考虑环境因素,对装备运行状态进行评估,判断其是否处于正常,是否为优,为装备的故障分析、合理使用和安全工作提供信息和准备数据.故障诊断[4,7]根据状态监测所获得的信息,结合已知的结构特性和参数以及环境条件、该设备的运行历史(包括运行记录和曾发生过的故障及维修记录等),对设备可能要发生的或已经发生的故障进行预报、分析和判断,确定故障的性质、类别、程度、原因和部位,指出故障发生和发展的趋势及其后果.研究燃煤发电装备运行工况监控技术,包括状态监测与故障诊断,是实现智能电厂的关键核心.
目前专门针对燃煤发电装备的工况监控工作尚未形成系统的理论体系.在Web of Science 核心数据库中,按照主题词“Power plant monitoring” 检索结果,关于发电过程监控的科学引文索引(Science citation index,SCI)科研文章数量正呈现逐年上升趋势,目前保持在每年700 篇左右的数量,表明其研究正在引起科研工作者的重视,并逐渐成为人们关注的焦点.燃煤发电装备运行过程本质上是典型的工业生产过程.因而,除自身独有的特性以外,燃煤发电装备生产过程也包含与其他工业生产过程类似的运行特性,例如设备耦合导致的非线性问题、大规模多设备问题、多闭环回路导致的动态性问题等.除此以外,燃煤发电装备子系统众多,每个子系统中包含多种设备,有些设备与其他工业生产过程中的设备也具有相似性,尤其是应用广泛的旋转机械设备.针对上述共性问题,有些研究虽未直接用于燃煤发电装备,但已取得有效进展并在其他工业生产过程得以验证.考虑到方法的通用性和研究对象的共性,这些前人研究方法或可应用于燃煤发电装备的工况监控研究中.因此,本文在讨论一些共性问题时,也加入了对其他工业生产过程研究方法的讨论,希望为燃煤发电装备工况监控研究带来借鉴.
目前,从过程历史数据中提取信息并据此进行建模监测的数据解析方法[8]已成为运行工况监控研究的一个热点.概括来说,数据解析方法通过分析挖掘收集的发电过程数据,提取数据内部隐含的信息和特征,从而揭示发电过程的运行状态并追溯故障原因.与专家经验等定性知识相比,数据解析方法可以理解为一种特殊的基于知识的方法,其主要的不同在于这些知识是从大量的工业数据中提取得到的,无需系统的精确模型和先验知识.随着工业互联网和物联网技术的迅猛发展,工业智能化水平显著提高,人们可以便利快捷地观测、采集和存储大量过程数据(如高频的振动信号和低频的传感器测量信号、工艺数据和产品质量等数据),为深入的解析和过程理解提供了丰富的数据支持.工业大数据概念由此提出[9-11],引起了国内外学者的广泛关注.而机器学习方法的发展也为数据驱动的发电装备运行工况监控研究提供了理论指导[12].近年来,机器学习[13-16]的理论和方法体系正在不断向深层次发展,深度学习[17-19]、零样本学习[20]、集成学习[21-22]、监督与半监督学习[23]等为发电过程工况监控技术提供了丰富的分析手段.
本文从分析燃煤发电装备的本质特性出发,揭示了其变负荷深度调峰导致的非平稳运行特性和全流程复杂耦合特性,在此基础上总结了发电过程区别于一般连续过程的问题,指出了研究燃煤发电装备工况监控算法的必要性.进而,基于这些特性,我们对面向发电装备工况监控的数据驱动算法30 年来的发展进行了回顾和分析.从算法层面来讲,我们把发电装备工况监控算法的发展分为3 个阶段:传统工况监控算法阶段、非平稳分析算法阶段和多模式分析算法阶段.其中,多模式研究包括时间分析框架和条件分析框架.在此基础上,梳理了目前存在的问题,并进一步介绍了发电装备工况监控领域未来可能的发展方向.
百万千瓦超超临界机组热力系统规模庞大、设备多样、参数众多且相互影响,是个极其复杂的对象[24-25].超超临界机组运行在高温高压的环境中,热力系统是其能量转换的主要场所.如图1 所示,机组通过锅炉燃烧将化学能转变为热能,蒸汽推动汽轮机转动做功,将热能转变为机械能.由于运行环境恶劣且自身特性复杂,发电装备热力系统的状态监测与故障诊断具有很高的难度.本节首先介绍百万千瓦超超临界机组热力系统以变负荷非平稳为主的复杂特性,然后对发电装备工况监控的难点问题展开分析.
平稳性指时间序列的均值和方差不随时间变化[26],保持长期稳定.但是,发电过程运行状态明显不符合平稳性定义.受变负荷调峰等影响,发电运行状态呈现明显的非平稳特性.如图2所示,负荷和其他参数都随着时间非平稳波动.这种情况也称为装备的变工况.以磨煤机为例,每台装备配备了6台磨煤机,由于负荷变化,以及装备工作时6 台磨煤机之间根据需要启停切换,因此需要改变输入的给煤量设定值.由于给煤量的变化,将会引发磨煤机运行工况的变化.根据装备运行参数是否随时间变化,非平稳变化涵盖了稳态工况和非稳态工况.稳态工况[4]是指装备运行过程中系统参数始终保持恒定不变或者变化率较小的稳定情况.非稳态工况[4]是指装备运行过程中系统参数变化率较大的非稳定情况,即动态过渡工况.特别是近年来风电、光电等新能源并网造成的电网负荷波动、峰谷差加大以及用户侧需求的变化,导致装备出现频繁深度调峰等新常态,由此导致热力系统很多参数都在随时间发生变化,装备往往无法处于稳态工况,具有明显的变负荷非平稳运行特性.对于非平稳运行过程,正常过程状态变化在某些特征参数上的反映与故障引起的变化非常相似,这些变化的重合给异常工况的及时检测和故障原因的准确诊断带来很大难度.因此,全工况下百万千瓦超超临界机组热力系统的状态监控与故障诊断要比单一稳态工况的状态监控与故障诊断要求高、难度大,还存在很多问题和挑战需要深入探讨和研究.
图2 百万千瓦超超临界机组非平稳运行轨迹示意图Fig.2 Schematic of non-stationary operation trajectory of 1 000 MW ultra-supercritical unit
如图3 所示,燃煤发电装备发电的工艺过程生产流程长、系统规模庞大、设备结构复杂、空间分布广.热力系统囊括锅炉、汽轮机2 大主机及3 大风机、磨煤机、给水泵、循环水泵、凝结水泵等辅助设备.设备之间的耦合性、系统的复杂性,以及高温、高压、高速旋转的特殊工作环境,导致高故障率和故障后果的高危害性.这样的复杂系统,可能发生的故障亦复杂多样,且故障表征复杂耦合,故障产生的影响传播后可能产生新的故障表征.此外,装备频繁深度调峰导致运行参数动态多变,装备复合故障多发,故障因果不清、不确定性强.以图4 中磨煤机和空预器设备故障为例,对应不同故障源,具有不同的故障表征.故障表征与故障源之间并非简单的单一映射关系.相对于单一故障,复合故障则是更为复杂的多对多问题,即多个故障源对应多个故障表征.发电装备全流程的特点、设备部件的复杂性、变量间的耦合性以及实际故障数据的稀疏性,使得故障的及时诊断和溯源面临着严峻的挑战.
图3 百万千瓦超超临界机组全流程运行示意图Fig.3 Schematic of the full-condition operation of 1 000 MW ultra-supercritical unit
图4 磨煤机磨辊磨损与空预器磨损的故障表征示意图Fig.4 Diagram of fault characterization of coal mill roller wear and air preheater wear
除了变工况非平稳特性以及全流程复杂耦合特性之外,发电装备运行还具有工业过程的一些典型共性问题.总结如下:
1)非线性.虽然线性关系直观明了,线性模型的构建也简单易行,但是不可否认大部分过程变量之间的关系都是非线性的[27-29].譬如,凝汽器的尺寸和容量的关系,发电机的扭力、转速和输出功率的关系等.
2)非高斯性.工业过程受到操作点设定改变、工况变化等因素影响,其对应的数据往往不服从高斯分布[30-32].由图2 所示,电厂数据受不同负荷影响,时间轴上不同时期的数据显然不能用同一个高斯模型来表征和涵盖.
3)时变性.即使工业过程不发生故障,它也会随着时间的变化偏离预设值[33-35].这往往由外界环境变化和设备本身的自然变化导致,例如催化剂失活、设备老化、传感器漂移以及预防性维护和清洁等.
4)动态性.动态特性是指工业过程数据具有的与时间相关联的特性[36-38],即:实际过程变量前后的测量值往往相互关联,体现出明显的时序相关性,即过程动态特性.该特性受对象上施加的控制手段和作用影响,并与对象的内在机制关系紧密,包括过程所处的工况、物理化学反应机理以及外界噪声、扰动等.发电装备由于多系统耦合以及控制策略的使用,具有典型的动态性.
5)多源性.工业过程中产生的数据不仅数量庞大,而且来源丰富、类型多样.传感器的多样性往往使得不同设备间数据的采样频率、存储形式也各不相同,导致数据具有多源性.例如:除温度、压力等低频的过程数据外,燃煤发电装备中的旋转设备还会产生大量高频的振动信号.
如前文所述,燃煤发电装备运行工况监控任务包括了状态监测与故障诊断两方面.工业大数据概念的提出,使得基于数据驱动的工况监控成为关注的热点.但是,发电装备的复杂特性导致发电装备的工况监控任务存在以下一些难点:
1)随着工业智能化进程不断加快,对燃煤发电装备运行过程实行智能化监控的要求也日益提高.发电装备在运行过程中产生大量的过程历史数据.如何分析挖掘过程数据,提取数据内隐含的信息和特征,实现智能化的发电装备工况监控,是需要考虑的问题.
2)区别于一般连续过程,发电装备运行过程具有显著的变工况非平稳特性,稳态工况与过渡工况频繁交替,给运行异常的及时检测和故障诊断带来了较大困难.如何精准描述变工况过程,建立非单一稳态工况下的监测或诊断模型是亟待解决的一个难题.
3)类似于其他工业过程,发电装备运行过程具有一些典型的复杂特性,包括非线性、非高斯、时变性、动态性、数据多源性等,由此也带来了工业过程工况监控的共性问题.如何将其他工业过程的工况监控方法移植应用到燃煤发电装备过程中,也亟待研究.
综上,深入分析百万千瓦超超临界机组热力系统运行中的特点和问题,构建百万千瓦超超临界机组运行工况监控技术,有利于提高机组设备的透明化水平,保障机组的安全、可靠运行,对我国电力工业节能与低碳经济目标的实现具有重要意义,必将推动智能电厂的进一步发展.
上一节主要介绍了燃煤发电装备的生产过程及其特性,并围绕着设备的复杂特性,凝练了燃煤发电装备工况监控的难点问题.本节将主要介绍基于数据驱动的燃煤发电装备工况监控理论和方法的基本发展历程.首先,介绍传统的基于数据驱动的燃煤发电装备工况监控方法;其次,介绍复杂特性下的基于数据驱动的工况监控方法.其中,将重点介绍针对非平稳特性的工况监控方法,包括以协整分析(Cointegration analysis,CA)等为代表的典型非平稳信号分析方法、时间驱动的多模态分析方法以及最新兴起的条件驱动的多模式分析方法.进而对变负荷非平稳运行状态下燃煤发电装备其他复杂特性进行深入解析,介绍现有的针对具体问题的工况监控研究工作.
鉴于目前专门针对百万千瓦超超临界机组的运维管理研究工作尚未形成系统的理论方法体系,下面将从已有的燃煤发电装备工况监控的研究工作出发进行介绍.燃煤发电装备的故障诊断是以检测到的机组运行状态信息为前提的.因此,一般所讲的燃煤发电装备工况监控技术,往往将状态监测和故障诊断放到一起.国内外学者对燃煤发电装备工况监控理论与方法进行了广泛的研究.概括说来,燃煤发电装备工况监控方法主要包括基于解析模型的方法[39-42]和数据驱动的方法[43-67].
其中,基于解析模型的方法通过建立燃煤发电装备精确的数学模型和构造可观测输入输出量残差信号来反映装备期望行为与实际运行模式之间的一致性,从而指示与判断运行状态的正常与否,进而诊断故障原因.基于解析模型的工况监控方法主要应用于线性时不变系统,但是大多数火电系统和设备都是非线性、时变的.此外,基于解析模型的诊断方法需要对诊断对象及故障机理有深刻的认识,然而对于燃煤发电装备这样的复杂非线性系统,其结构复杂、动态时变以及强耦合特性显著,难以通过建立精确的解析模型实现工况监控.不同于基于解析模型的方法,数据驱动的方法通过对系统运行数据的分析处理,能够在无需知道诊断对象的先验知识和系统精确解析模型的情况下完成系统的工况监控.
近年来,随着数据测量与存储技术的飞速发展,人们可以方便快捷地获取和处理装备的低频运行参数和产品质量数据(如温度、压力、流量、风量、功率、转速、电流等),以及高频运行信号(如汽轮机、风机等旋转机械的振动),为数据驱动的工况监控技术奠定了基础.数据驱动的燃煤发电装备工况监控技术主要是通过分析挖掘收集的发电过程数据,提取数据内部隐含的信息和特征,从而揭示发电过程的运行状态和追溯故障原因.目前数据驱动的传统工况监控方法主要包括多元统计的方法和人工智能的方法.
由于具有强大的降维和数据处理能力,多元统计分析的方法[43-54]在燃煤发电装备故障诊断研究领域得到广泛关注.Ajami等[45]将主元分析(Principal component analysis,PCA)应用于电厂状态监测,减少了由于机理模型的不确定性和操作条件变化导致的误报警.文献[46]针对燃煤发电装备运行工况的连续性,提出了一种改进的多步向前滑窗PCA 方法,并将其应用于某600 MW火电机组双背压凝汽器运行状态监测.Sun等[47]提出一种改进的用于锅炉泄漏检测的PCA 方法,解决常规PCA 方法用于状态监测时误报警率偏高的问题.此外,香港科技大学高福荣研究团队[51-52]、东北大学王福利研究团队[53]、清华大学周东华等[54]、浙江大学赵春晖等[55-57]等在数据驱动的状态监测、故障诊断和故障缓变趋势预测等研究方向提出了许多具有创新性的思想方法,取得了丰富的成果并应用到不同的领域.
人工智能的方法[55-65]主要通过模仿和实现人类(熟练操作人员、技术人员、专家)在燃煤发电装备监控过程中的某些思维和行为,自动完成整个工况监控过程.Costa等[60]结合神经网络和模糊逻辑,提出了一种两阶段诊断模型,首先使用神经网络初步诊断故障的类型,然后利用模糊系统分析诊断结果的可靠性,给出具体的信任度.Rakhshani等[61]将数据挖掘与人工神经网络用于热电站锅炉的状态监测与故障诊断,首先利用数据挖掘方法将锅炉多测点数据聚类为3 类:正常运行状态族、直接故障状态族、有故障先兆状态族,然后采用两类神经网络进行训练,完成故障的及时检测并对故障进行诊断.我国学者主要采用神经网络方法[66-67]对燃煤发电装备进行工况监控的研究,取得了显著的成果.与传统信息处理方法相比,神经网络方法具有强大的非线性表达能力和自适应学习能力,增大了对环境变化的适应能力,其在燃煤发电装备工况监控领域的应用研究一直是一个热点.但是神经网络学习得到的信息以权值形式存储,属于不易理解的隐式知识,因而导致神经网络方法的诊断过程难以解释.此外,已有燃煤发电装备热力系统的故障诊断方法,主要针对某一稳定负荷工况下获得的运行数据展开研究,仅有少数文献通过建立不同工况下的多诊断模型实现了不同稳态工况下的故障诊断[67].
针对检测出的异常状态,除了诊断故障原因,还可以采用故障预测技术实现对故障的早期发现并预测其未来的发展趋势,便于对燃煤发电装备进行及时调整,避免恶性事故的发生.在燃煤发电装备中,除了个别突变故障,大多数故障的发生是有一个渐进过程的.从设备正常运行到出现故障征兆再到发生故障灾害是一个较慢的过程,如果在故障早期时发现,准确预测设备性能退化趋势,可以减少事故发生的几率,进一步提高系统运行的安全性、可靠性和有效性.评估与预测未来可能的失效与剩余使用寿命已成为国内外研究的热点问题.目前,针对燃煤发电装备缓变故障预测技术的研究还处于起步阶段,相关的研究学者和成果都比较少.虽然一些研究学者进行了初步的有益尝试[68-70],但是由于百万千瓦超超临界机组热力系统结构复杂、子系统及设备之间存在较强的耦合性、系统运行工况复杂多变,准确的故障预测难度非常大.因此,百万千瓦超超临界机组缓变故障预测方法有待深入研究.
表1 对比了基于解析模型的方法和数据驱动的发电设备工况监控方法.基于解析模型的发电设备工况监控具有一定的理论支撑,能够反映发电系统的主要规律.但是,机理模型参数众多,需要对过程机理有充分了解和认知.此外,模型参数辨识难、实用性较差.特别是对发电过程这一复杂的物理化学反应和能量转化过程来说,单纯基于机理的解析模型很难保证精度和准确性.数据驱动的方法不需要假设或对模型参数的经验估计,具有强大的建模能力.虽然利用数据驱动的方法对电厂设备进行状态监测和故障诊断越来越受到研究学者关注并在工程实践中获得广泛应用,但是,它在理解过程运行特性、分析故障机理、解释故障原因方面仍然具有一定的局限性.
表1 基于解析模型和数据驱动的发电装备工况监控方法总结Table 1 A comparing summary between analytical-model-based methods and data-driven methods for condition monitoring of power generation equipment
上述的传统工况监控方法大多针对单一特定运行模式进行工况监控的研究.然而,在火电热力系统实际运行过程中,负荷的频繁变化会使得热力系统关键设备部分运行参数的均值和方差随时间发生改变,呈现出明显的非平稳特性[71],由此导致装备的变工况问题非常普遍.稳态工况与过渡工况的频繁交替,给运行异常的及时检测带来了较大困难.一方面,故障特征很容易被非平稳趋势所掩盖,正常的工况变化与异常变化难以区分;另一方面,传统的工况监控方法不能准确地描述非平稳变量间的关系,由此可能导致错误的监测结果.
此外,由于变工况现象,尤其是过渡工况的存在,实际火电热力系统运行过程的工况监控相比单一稳态工况下的工况监控难度更大要求更高.针对非平稳工况监控研究的发展历程,本节将从典型非平稳分析方法、时间驱动的多模式分析方法和最近兴起的条件驱动多模式分析方法3 个方面进行介绍.
2.2.1 典型非平稳分析方法
考虑到实际工业过程运行时的非平稳变化特性,一些信号处理方法广泛应用于非平稳过程运行工况监控.例如,小波变换[72-74]、短时傅里叶变换[75-77]、Wigner-Ville 分布[78-80]等用于分析非平稳振动信号,实现机械设备过程监测及故障诊断.Huang等[81]提出了经验模态分解方法,可以用于任何类型的信号的分解.作为一种自适应的时频分析方法,经验模态分解在处理非平稳信号上有很大的优势[82].上述信号处理的方法可以有效处理具有非平稳特性的振动信号,但是这些方法都只适用于分析单个过程变量.
除了信号处理的方法外,一些学者提出利用自适应策略来解决非平稳问题[34,83-84].该策略的主要思想是通过连续更新模型来捕获非平稳变化.Li等[34]推出了两种递归PCA 算法来自适应更新PCA 监测模型,Yu等[84]推出了递归指数慢特征分析算法来解决模型误更新问题,实现精细化的自适应状态识别.然而自适应更新策略无法有效区分正常的变化和故障,特别是对于缓慢变化的故障过程容易将故障错误的适应进来,存在着一定的局限性.此外,一些传统的方法通过计算原始非平稳时间序列差分来消除非平稳趋势[85].Box等[86]与Castillo[87]用差分整合移动平均自回归模型(Autoregressive integrated moving average model,ARIMA)来描述过程的非平稳特性.Berthouex等[88]提出用ARIMA模型来预测废水处理过程的运行状态.但差分处理会导致数据中部分信息的丢失(如动态信息等),从而影响过程监测效果.
针对燃煤发电装备非平稳运行工况监控,另一种常用的方法是基于协整分析的方法[89-90].Engle等[90]提出了协整理论,认为具有非平稳特性的变量间可能存在着长期的动态均衡关系,即各个变量围绕着一个共同的长期趋势随机波动.这个长期均衡关系就是协整关系.协整关系是由变量所处系统所决定的,描述了变量之间内在本质的相互关系,协整变量的线性组合是平稳的.根据这样的理论观点,如果能够建立起工程系统变量之间的协整关系模型,那么当系统发生故障而造成变量之间关系被改变时,相应的信息便会反映在模型残差(新息变量)中.因此,通过对模型残差进行分析,便可以得到故障特征和系统状态信息.Chen等[91]首次将协整分析用于工业蒸馏装置的状态监测,为复杂工业过程的非平稳运行工况监控带来了新的思路和方法.其主要原理是,当过程运行在正常工况下时,可以建立非平稳变量间的协整模型,并得到一个平稳的残差序列;当运行过程中有故障发生时,系统中参数或结构会发生变化,从而影响变量间的动态关系,此时非平稳变量间原有的共同趋势发生改变,即这些变量不再是协整的,所以其线性组合后的残差序列也不再是平稳的.因此可以通过对残差序列进行监测,判断过程中是否有故障发生.在此基础上,Li等[92]做了进一步改进,通过对提取的残差序列进行平稳性检验,获得多个平稳的残差序列,基于全部的平稳残差序列建立监测模型,从而更全面地提取过程信息.随后,协整分析方法开始逐渐应用于工业设备的工况监控中[93-95].
针对百万千瓦超超临界机组,由于新能源并网造成的电网负荷波动、峰谷差加大以及用户侧需求的变化,机组常处于大范围非平稳运行模式.Zhao等[96-102]基于协整分析方法展开了状态监测和故障诊断的一系列系统性研究,并通过实例验证了它们的有效性和合理性.针对不断变化的工况,Zhao等[96]结合协整分析和慢特征分析方法构建了一种面向非平稳动态过程的全工况监测策略,可以通过同时监测长期均衡关系和动态关系来区分运行条件的变化和实际故障.进一步,他们提出火电运行过程是一个平稳特性和非平稳特性混合的复杂过程[97],应该分别提取这两部分特性并加以分析.基于上述考虑,他们将整个数据空间分成不同的子空间,在不同子空间中植入不同的相似度分析,实现了火电过程微小故障的检测.更进一步地,针对大规模发电系统,基于稀疏协整分析方法,提出了一种迭代的变量子块划分方法[55,99],将非平稳变量根据协整关系的强弱自动划分到不同的子块中,用于提取局部的非平稳特性,建立底层模型用于监测过程的局部状态;并且借助信息融合方法,建立全局模型以衡量不同子块间的相关关系.在燃煤发电装备热力系统中的大量实验结果验证了分块分层的非平稳过程表征模型在泛化能力、计算复杂度以及可解释性等方面的优势.在此基础上,结合对系统时变特性的分析,揭示了协整关系可能存在的时变性.对此,Yu等[100]建立了协整关系的快速增量学习策略,使得模型对于新模式具有快速适应能力.协整分析在非平稳过程的故障诊断中也起着重要作用.Sun等[101]提出了非平稳故障过程故障变量的稀疏性理念,建立了一种基于协整分析的稀疏重构策略,将最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,LASSO)融合到协整模型中用于在线隔离故障变量,在不需要任何历史故障数据的情况下对故障变量进行在线分离和诊断.Hu等[102]利用协整分析提取各个故障类之间的公共协整关系和每个类独特的协整关系,分别建立共性故障诊断模型和特性故障诊断模型,综合考虑双重诊断模型,提高了火电装备故障诊断的性能.
综上,典型的非平稳分析方法主要包含信号处理的方法、基于自适应更新和基于协整分析的方法.信号处理的方法能有效处理非平稳非线性信号,但只能对单个信号分析,对于多变量复杂耦合的非平稳发电装备适用性并不高.基于自适应更新的策略能够快速适应过程新工况,但是如果更新不当,可能错误地将故障数据用于模型更新,从而无法有效区分正常的变化和故障.基于协整分析的方法能够有效挖掘非平稳变量间的长期均衡关系,只需建立单一模型且模型长时间范围内保持有效,但是其对数据的协整假设在实际过程中可能无法满足.
2.2.2 时间驱动的多模式分析方法
针对燃煤发电装备非平稳过程的状态监测和故障诊断,另一经典的思路是基于工况划分的多模型方法.燃煤发电装备运行过程明显受到外界负荷需求的影响,往往不是运行在单一的稳定工况,而是在平稳态和过渡态之间不断交替运行,即工况始终在不断发生变化.因此,传统的基于单一稳态的单个多元统计模型将削弱不同工况下各自的统计特性,且忽略了过渡过程中变量的统计特性变化,势必会导致过程特性分析不准确,从而造成监测或者诊断性能的下降.近年来,已有不少学者针对多工况的过程监测和故障诊断进行了研究,提出了基于工况划分的多模型策略[103-108].其主要思路是进行多稳态工况数据的聚类,对聚类后的数据建立多个局部模型,通过多次建模将局部单工况过程扩展为多工况过程.该方法的首要问题即为如何检测稳态数据并将数据聚类成不同工况对应的多个子集[103].其中,大多数稳态检测方法都是在某一个数据窗口内计算数据的均值、方差以及回归斜率,然后利用统计检验的方法对所得结果进行置信度检验,将满足一定置信水平的数据划分为一个稳态,否则划分为动态过程[104].另一种常见的划分稳态的方法是利用Dorr等[105]提出的稳定性因子(Stability factor,SF)来判断测量变量的平稳性,并根据该因子判断过程数据是否处于稳态运行,从而将历史数据处理成稳态数据块的形式.赵春晖等[8, 57,106-107]建立了数据统计特征与过程内部运行机理的关联机制,指出可以根据过程变量相关关系的变化反推过程特性的变化,从而将运行状态分为不同模式.对此,他们建立了时间驱动的多模式分析与表征理论,提出了特性变化度量与模式划分策略,对非平稳变化特性与频繁状态切换问题进行了深入刻画.此外,高斯混合模型聚类方法同样适用于工况的识别和判断.孙贤昌等[108]以测试样本属于各个工况的概率为权重,将各PCA 模型中的贡献量融合为全局相对贡献量,生成全局相对贡献图,实现对多工况过程的故障诊断.
以上方法主要是针对稳态工况下的监控,没有考虑各稳定工况之间的特性变化和切换[109-111].对此,Zhao等[109]建立了一种软过渡PCA 模型(Softtransition multiple PCA,STMPCA)方法,克服了子PCA 模型建立中硬划分和聚类失误的问题.针对过渡区域,该算法利用0-1 模糊隶属度作为与过渡模式相邻的两个稳态过程的权重系数,通过基于欧几里得距离的加权平均综合了相邻两个过程的过程特征,增强了过渡监测模型的灵敏性.随后,Yao等[110]在此基础上采用了不同的相似度指标来分析各PCA 模型间的相似关系,进一步发展了软时段过渡方法.Wang等[111-112]建立了多种工业过程多模态及过渡问题的解决方案.以上方法都利用了多变量聚类的方法来进行工况划分.
2.2.3 条件驱动的多模式分析方法
本节以磨煤机为例介绍传统时间驱动分析方法的问题.输入磨煤机的给煤量设定值是根据负荷的变化而变化的,而给煤量设定值的变化会引起设备运行状态的相应改变,且状态变化频繁、无规律可循.以往多模态研究方法是时间驱动的.这种传统的时间轴分析方法,往往分析时间上的变化规律,采用聚类方法揭示过程运行工况的变化.从时间维度上来看,模式的变化更加繁杂,频繁的工况切换以及切换的初始和目标工况不同,给建模和理解带来很大困难,包括时间无序性和在线工况标签识别等最典型的问题.
考虑到操作工况的变化在时间上的无序性和重复性,浙江大学赵春晖研究团队[113-114]以发电装备的磨煤机设备为例,首次提出了条件驱动的多模式分析理论,将传统的时间轴上繁杂的变工况运行导致的模式变化转变为条件轴上规律性的多模式变化,消除了非平稳特性的影响,抓住了工况变化的本质,在磨煤机上进行了成功验证,并广泛适用于非平稳运行的连续生产工业系统,拓展了非平稳分析的理论方法体系.Zhao等[114]通过对运行工况变化的深入研究,提出了以下认知:1)虽然非平稳运行中操作条件(给煤量设定值)频繁切换,过程特性随时间非平稳变化,但过程特性在运行条件驱动下,随过程操作进程或过程机理特性的变化发生规律性的改变,呈现分模式性的变化规律;2)尽管运行条件(给煤量设定值)随时间发生变化,但潜在的变量相关性在相同的条件模式下相似,不同条件模式下则有显著的差异.在该认知基础上,根据变量相关性是否随条件变量的变化而改变,可以从条件有序的角度将整个过程分为多个条件模式.如图5 所示,时间上呈现非平稳变化的数据通过数据重组,转变为条件轴上有规律的数据分析单元,即条件片.以此最小分析单位作为基础,在相同的条件片下,过程特性近似一致;按照条件变量的变化,对不同条件片的过程特性相似性进行评估,从而将整个过程划分为不同条件模式段.条件模式这一全新概念的提出解决了工况变换的时间无序和在线监测时模态难以判断的问题.根据条件变量的指示,可以直接判断当前运行过程所处的条件模式.Zhao等[114]提出的多条件模式的表征理论方法,从根本上克服了以往时间驱动分析方法的保守性,增强了人们对条件驱动生产过程变工况和时变特性的理解,有利于不同模式内关键信息的分析与提取,显著提高了模型的精度.条件驱动的多模式分析思想为后续的状态监测、故障诊断等工况监控任务奠定了基础,开辟了一条新的研究道路.
图5 条件轴数据重组(从时间轴非平稳数据到条件轴不同条件片)Fig.5 Rearranging data according to condition axis(from nonstationary data on time axis to different condition slices on condition axis)
表2 总结对比了典型非平稳分析方法、时间驱动的多模式分析、最新兴起的条件驱动的多模式分析3 类非平稳工况监控方法.典型非平稳分析方法往往对过程数据具有较为严苛的要求,因此对于大范围非平稳运行且变量复杂耦合的百万千瓦超超临界机组适用性较差.时间驱动的分析方法旨在捕捉过程在时间轴上的变化进而将非平稳过程划分成不同的工况模式进行分析.发电装备工况复杂,其时间上的无序性和重复性使得现有方法所划分的模式往往不够准确且不具有清晰的物理意义.与时间驱动的分析方法相比,条件驱动理念将时间上非平稳变化的数据转变为条件轴上规则的分析单元,为后续的工况监控研究奠定了基础.对该类方法的研究还包括对多条件变量耦合影响下的条件模式的划分以及如何更好地对条件模式建模等.
表2 三类非平稳分析方法对比总结Table 2 Comparison and summary of three types of non-stationary analysis methods
燃煤发电装备亦具有与其他工业生产过程相似的运行特性.针对此类共性问题的已有研究方法可望直接运用于燃煤发电装备的状态监测和故障诊断,实现工况的有效识别.
2.3.1 非线性问题
非线性是工业过程的重要特性.事实上,虽然线性关系直观明了,但绝大多数的复杂工业过程变量间的关系都是非线性关系.运行工况的多变、设备的复杂耦合,使得燃煤发电装备的非线性特性更加显著.由于非线性特性的存在,传统的线性模型无法有效地对潜在的过程特性进行提取、分析和利用[115],在复杂工业过程中并不适用.
为克服线性工况监控方法的不足,在过去的几十年中,各种非线性方法[116-124]应运而生.最先用于建立非线性模型的是基于神经网络的方法[116].例如,Kramer[117]提出了利用自联想神经网络来提取数据的非线性主成分分量.考虑到自联想神经网络随着隐含层层数增加反向传播性能普遍下降,Tan等[118]提出了一个3 层输入训练神经网络,克服了这一局限性,使得神经网络更易于训练.Dong等[119]将主元曲线和神经网络相结合来解决非线性问题.这些基于传统神经网络的方法需要离线开发模型,并通过一些优化方法对模型进行训练.由于当时计算机性能差、数据量小以及传统神经网络技术的局限性,基于神经网络的方法没有得到广泛使用,逐渐没落.随后,基于核函数的方法被证实能有效解决非线性问题,因而得到了迅速的发展[27,120-122].其主要原理是使用核函数将数据从低维输入空间映射到高维特征空间中,再进行相应的线性计算,具有较高的运算效率.常用的核方法包括核主成分分析(Kernel PCA,KPCA)[120]、核偏最小二乘(Kernel partial least squares,KPLS)[121]、核独立成分分析(Kernel independent component analysis,KICA)[122]等.此类方法对核函数和相关参数的选择依赖较高,但现有的文献对这类问题的分析讨论较少.同时,基于核函数的方法受限于核函数的性质,有时并不能取得较好的在线监测结果.近些年来,随着人工智能算法的不断发展和算力的增强,不少基于深度神经网络的方法也运用到了非线性过程状态监测领域[28,123-124].特别是具有非线性降维功能的自编码网络[28]更是在故障检测领域得到了广泛的应用.Yu等[28]首先将自编码(Autoencoder,AE)网络应用于工业过程中,并考虑降噪功能,通过训练中心层较小的多层神经网络将高维数据转换为低维特征实现非线性特征的提取,建立了相应的监测模型以检测异常;通过结合降噪自编码(Denoising autoencoder,DAE)和弹性网(Elastic Net,EN),隔离出引起故障的关键变量.Zhang等[124]则提出了一种基于变分自编码器(Variational autoencoder,VAE)的非线性工况监控方法.通过在网络的隐含层中添加高斯分布约束,使得VAE 学习到的隐含层特征服从高斯分布.
对于燃煤装备运行过程而言,由于运行工况的变化其非线性特性会更加显著.一般来说,在考虑变工况特性的基础上,可以很好地将原有连续过程的非线性分析方法拓展到燃煤发电装备运行工况监控研究中.
2.3.2 线性非线性混杂问题
考虑到不同的工业过程中,往往包含不同程度的非线性关系,还可能同时包含线性和非线性关系[115].因此,在实际工程应用中,有针对性地选择合适的工况监控方法至关重要.然而,传统的工况监控方法要么基于先验知识判断,要么直接假设过程是单一线性或非线性的.然而这种假设没有严格依据支撑,先验知识的来源也可能是不可靠的,这直接导致所选择的方法可能并不符合所分析的实际过程,从而降低了模型精度和在线监测性能.因此,对实际过程线性和非线性关系进行准确判断十分必要.为此,Kruger等[125]提出了一种基于PCA 模型的非线性度量方法,通过估算不同样本区域的PCA模型的误差方差来实现线性与否的判断.Zhang等[126]基于皮尔森相关性和互信息定义了一种非线性系数,并利用该系数衡量系统的非线性程度.
然而,上述工作均采用单一的线性或非线性分析方法,即:如果判断大部分过程变量为非线性,则采用非线性方法;反之,如果判断大部分过程变量为线性,则采用线性方法.实际上,过程数据往往采集自不同的设备或部件,这些设备内部反应(运行)机理不同,设备与设备间的相关关系也极为复杂,从而导致过程变量间的相关性往往不服从简单的线性关系或者非线性关系,而是呈现出一种混合的相关关系.对于这种具有线性和非线性关系混合特征的工业过程,一方面,采用单一的线性分析方法不能有效解析非线性关系和捕捉状态变化;另一方面,单一的非线性方法无法有效解析其中隐藏的线性变量关系,亦无法直观显示变量之间的关联性.考虑到实际过程中混合变量相关性问题的普遍性,传统的过程监测方法无法有效匹配实际过程,因而会导致算法失效,从而产生错误的监测信息.为此,Li等[115]提出了一种线性评估方法,通过识别其中存在的线性变量关系实现了线性变量子组划分,并区分了线性和非线性变量;采用线性和非线性分析方法,分别对不同的变量关系进行建模,实现了对复杂工业过程的精细监测.
对于实际工业运行过程,由于线性非线性混杂,如何有效区分、抽取其中线性和非线性的不同特征,进行分别表征和监测也极具挑战.
2.3.3 大规模复杂系统问题
百万千瓦超超临界机组有两大主机、三大风机,还有磨煤机、给水泵等多种辅助设备,整个生产过程具有上千个测点,系统规模庞大、参数耦合严重.针对此类大规模复杂系统的工况监控问题,首先考虑的是如何对其建模.这里可以分为集中式建模和分布式建模两种策略.集中式建模的思想是将全流程大规模过程看成是一个整体,将其全部过程变量用于建立监测模型.然而这样很难从数目众多的数据中有效地提取出过程信息,以及变量间的相关关系,导致过程监测效果降低.对全流程的燃煤发电系统而言,集中式建模策略不仅会影响监测效果,还会带来大规模海量数据建模的困难.因此对燃煤发电装备通常采用分布式建模的方式,即对单个单元或相关关系较强的变量组单独建立监测模型.分布式建模的关键在于合理的过程分块,对此前人已经展开了相关的研究.MacGregor等[127]提出了一种多块偏最小二乘算法,该工作通过对局部和全局分别建立模型来考虑整体和局部之间的信息.Westerhuis等[128]通过对比一些分布式监测方法指出如果变量能够划分为具有一定意义的子块,那么针对每个子块可以采用PCA 或者偏最小二乘(Partial least squares,PLS)算法来建立监测模型.Qin等[129]分析了分块PCA 和PLS 方法并提出了一种统一多模块的建模策略.以上分布式监测方法通常是根据过程机理知识进行子块划分.在实际工业过程中,详细的过程知识通常难以获取.对此,Li等[115]建立了一种基于数据的分布式监测方法,提出了基于线性变量组划分的分层建模策略和分布式监测方法.Tong等[130]提出了改进的分块PCA算法,将整个系统划分为4 个不同的子空间,监测各个子空间中变量的变化情况.除了从数据驱动角度的分块,还需要综合考虑不同系统和设备机理和知识,将具有共同属性的设备归于同一子系统,在此基础上再进行变量级别的划分.此外,针对全流程大规模的监测诊断问题,前人已经做了一些研究[131-132],但是均基于平稳过程假设,如何将全流程非平稳系统划分为不同的子系统,进而实现分布式监测没有得到很好的解决.Zhao等[55, 98]根据协整关系的强弱自动划分不同的变量子块,并考虑了不同子块间变量的重叠性.针对非平稳过程的大规模问题的解决还有很多问题需要深入思考,特别是如何在兼顾对非平稳特性分析的基础上建立合适的分块方法.此外,对不同的应用目的,相应的分块思路和角度也应有不同的考虑.
2.3.4 动态性问题
对于发电装备来说,闭环反馈控制的使用导致装备运行具有典型的动态特性.比如,对于磨煤机来说,给煤量设定值的变化,引起其他参数的变化,而根据最终输出的发电功率反馈回来调节给煤量,并对其他参数产生时间上的延迟影响作用.动态特性是指工业过程数据具有的与时间相关联的特性[38],即时序相关性.受系统耦合和复杂的闭环反馈系统的影响,过程数据往往是强自相关或者动态互相关的,即呈现明显的动态特性.x(t)=[x1(t),x2(t),···,xm(t)]为当前时刻t的变量值,其中下标m为变量,其会受到过去一段时间变量值x(t-1)~x(t-d)的影响;同时也会对未来一段时间的变量值x(t+1)~x(t+d)产生影响,这里时滞参数d的大小由过程的性质决定.其中,时序相关性包含两部分:变量的自相关,即xi(t)与xi(t+k),k∈[-d,d]0的相关性;变量间的互相关,即xi(t)与xj(t+k),k∈[-d,d].
目前,对动态性的分析,主要是考虑如何提取过程测量数据中蕴含的时序相关特性,其中的主流是潜投影提取方法.概括说来,直接的动态潜投影方法包括两大类.第一类是多元统计分析方法的动态扩展[133-136],譬如,动态PCA (Dynamic PCA,DPCA)[133]、动态偏最小二乘(Dynamic PLS,DPLS)[134]等.它们利用历史样本拓展过程数据矩阵,然后将拓展后的数据矩阵直接带入到一些传统多元统计模型中进行分析[135-136],操作简单且便于实施,因而应用广泛.但是这些方法以不同的目标函数进行特征提取并不能保证实现过程动态性的有效表征.并且,它们依赖的动态扩展可能造成变量维度的大幅增加,无法实现数据的降维分析[133-136].针对上述问题,有学者提出了无需经过动态扩展,直接从原始变量中提取时序相关特征的方法[135-136],我们称之为第二类方法.譬如,动态潜变量模型(Dynamic latent variable,DLV)[135]、动态内部主元分析方法(Dynamic-inner principal component analysis,DiPCA)[136]等.这些方法都是为了找寻投影方向,使得投影后得到的特征与未来或者过去一段时间的数据具有较大的相关性,因此具有一定的对过去或未来数据的预测能力.在这些方法中,“动态特征”往往是指“时序相关性强” 或者“可预测性强”的特征,这些特征所携带的过程信息为动态信息,而那些不具有时序相关性的信息,如白噪声就认为是“静态信息”.
状态空间模型是从另一个角度来探究动态问题的方法.上述的DiPCA 等算法,两个重要的操作就是先降维,再提取时序关系,而状态空间模型很直接地将这两个操作表述出来,并且能够将过程数据的自相关和互相关特征同时进行建模.针对动态过程建模的情况,常常是基于子空间辨识的方法来分析状态空间方程,常用的方法有规范变量分析方法(Canonical variate analysis,CVA)[37, 137]等.为了解决非线性动态过程的建模问题,Pilario等[138]结合核技巧将状态空间方程扩展成非线性模型.基于CVA的方法求解简单且能够全面地分析过程变量的时序相关性.但由于CVA 在求解过程中涉及到对过程数据矩阵的求逆,当数据存在共线性问题时,其所求解将不稳定,从而影响提取的特征对过程时序性的表征能力.
上述的动态潜变量方法和状态空间模型虽然已得到广泛的应用,但是它们局限于模型训练数据所处的工况,无法识别出过程操作工况的切换,会将过程操作工况的切换错误地指示为故障.因此,近些年基于慢特征分析(Slow feature analysis,SFA)的动态过程识别方法逐渐受到学者的关注[139-140].SFA的目标是寻找一组投影方向,使得输出信号的变化尽可能慢.一般而言,特征中变化最慢的特征最能体现数据本质特性,而快速变化的特征可以认为是一些噪声.实际上,通过推导可以发现,SFA的目标函数最小化特征的变化速度可以转变为最大化特征的一阶自相关性,SFA 所找到的投影方向是使得过程数据一阶时序相关性最大的投影方向.对应变化速度慢的特征,其一阶自相关性大;相反,对应变化速度快的特征其一阶自相关性小.因此,从时序相关性的角度去衡量SFA 获得的特征,变化慢的特征是一阶时序相关的,也就是一种特殊的时序相关性[37].
基于动态性的分析,需要充分利用所提取出来的动特征以及其他信息对过程运行状态的变化进行指示.Shang等[141]和Zhao等[96]基于SFA 提出了动静特性协同分析的思想,同时提取了动态信息和静态信息,并分别建立不同的监测模型和定义不同的监测统计量.该思想通过动态和静态信息变化的精细解析,使状态变化的指示更加精细化.但是基于SFA 所定义的“静态”与“动态”对应的是原始特征与特征的差分,并不是由时序相关性来衡量,所以这与上面提到的CVA 等方法中的“动态”与“静态”是不一样的.如图6 所示,Zhao等[114]分析了发电过程在不同运行条件上的静动变化.对于不同的时刻,一方面过程可能处于不同的运行条件下,但显示出相同的过程动态特性.如图中的A点和C点,它们分别处于条件1 和条件3 处,但是显示出相似的过程动态特性(变化速度).另一方面,即使处于相同的运行条件下,过程可能在时间方向显示不同的动态特性.如图中的B、D、E、F四个不同的点.它们处于相同的运行条件下,但是具有不同的瞬时特性.B点是从条件1 变化到条件2,而D点则是由条件3 变化到条件2.E和F都运行在条件2 之下,但是它们具有不同的变化速度.
图6 不同运行条件上的过程动态变化示意图Fig.6 Illustration of process dynamics under different operating conditions
表3 对以上所述的动态建模方法进行了对比总结.由于百万千瓦超超临界机组频繁深度变负荷,其热力系统处于动态过渡工况的可能性大大增加,而时序相关性如果没有得到有效挖掘,正常的动态变化在某些特征参数上的反映与故障引起的变化非常相似,对实时的异常检测带来难度.因此,针对百万千瓦超超临界机组的状态监测需要兼顾全工况运行的动态变化特点,进行精细化分析和监测.
表3 动态潜投影建模方法比较Table 3 Comparison of dynamic latent projecting methods
2.3.5 旋转机械振动分析问题
在燃煤发电装备的众多设备中,有很多属于旋转机械设备,例如三大主机中的汽轮机和发电机.另外很多常见的辅机,例如各种泵机、风机、磨煤机等,也属于旋转机械.由于旋转机械上的振动信号具有易采集、灵敏性强、可识别度高的特点,目前,对旋转机械进行故障诊断最重要也是最有效的方法就是对其振动信号进行分析和处理.已有的基于振动信号的故障诊断方法大致分为两大类:对振动信号进行分析的方法和利用模式识别与机器学习的方法.
目前,对振动信号进行分析和预处理常见的方法主要有:傅里叶变换[142]、小波变换[143]、短时傅里叶变换[144]、经验模态分解[145]、包络谱分析[146]等.然后,针对处理得到的多个子信号在时域和频域计算统计特征,最终往往可以得到维度较多的统计特征.然而,并非所有提取到的特征都会受到故障的影响,唯有准确反映故障信息的关键特征才是对故障诊断有用的信息,方可用于旋转机械设备的故障表征.传统的基于振动信号的故障诊断方法将提取到的全部统计特征用于建模[147],特征冗余导致了能够反映故障信息的关键特征被掩盖,使得关键特征在故障诊断模型中并未发挥其全部的性能,影响了故障诊断的效果.同时,在关键特征的选取过程中,需要充分考虑特征间的相关性,既要选出能够反映故障信息的关键特征,又要避免发生诸如特征间存在耦合关系等特征冗余问题.
近年来,凭借着优越的性能,以机器学习算法为代表的新一代信息技术广泛应用到故障诊断领域,也为旋转机械设备故障诊断研究提供了新的思路和方向.目前,常用于处理旋转机械设备故障诊断的机器学习方法[147]包括:支持向量机(Support vector machine,SVM),人工神经网络 (Artificial neural network,ANN),决策树以及贝叶斯方法等.文献[148]将经验模态分解(Empirical mode de-composition,EMD)和神经网络相结合,利用神经网络对提取到的特征进行分类,为振动信号故障诊断提供了新的思路;文献[149]提出了一种结合主元分析和决策树的旋转机械故障诊断方法,通过主元分析对特征进行降维,然后利用决策树进行分类得到故障类别;文献[150]针对于旋转机械中的轴承设备,提出了一种基于贝叶斯方法的故障诊断方法.
对电厂旋转机械设备振动信号进行分析的主要目的是提取出振动信号中包含的有用信息.因为振动信号是由多种激励源共同作用的结果,信号中包含了很多其他设备引起的振动分量以及环境噪声.如果直接对振动信号进行建模,模型容易受到其他振动分量的影响,有用信息甚至会被噪声所掩盖,严重影响故障诊断的性能.如何解决振动信号预处理与特征提取时的特征冗余、模态混叠效应、泛化能力差等问题,结合机器学习等高级算法,兼顾不同场景下的迁移和适应问题,是今后旋转机械故障诊断需要深入研究的方向.
除了上述具有代表性的过程特性之外,发电装备还具有强耦合性、非高斯等特性.从已获得的研究成果来看,当前发电装备的工况监控技术主要面向的是工业过程的非平稳、非线性、动态性等单一过程特性,缺乏对复合特性的考虑.在实际发电设备中这些复杂特性往往是同时存在的,如何对复杂特性耦合情况下的发电过程进行有效的运行工况监测具有重要的研究价值.图7 展示了发电运行工况监控方法随时间的发展趋势,总结了从20 世纪90年代到现在,发电运行工况监控方法30 多年的发展历程,涵盖了信号分析方法、解析模型方法、多元统计分析方法以及近年来兴起的机器学习与人工智能的方法.从目前的研究情况来看,多元统计方法以其计算方便及解释清晰等优势在发电工况监控领域占有主导地位.随着人工智能技术的迅速发展,基于机器学习和深度学习的方法自从2000 年起也逐渐在发电装备的工况监控领域崭露头角.这些工作通过对发电装备特点特性的分析挖掘和对其中典型问题的研究,提出了具有针对性的解决方法,为后续研究奠定了很好的基础.
图7 发电设备运行工况监控方法发展趋势示意图Fig.7 Schematic of development trend of operation monitoring methods of power generation equipment
近年来,工况监控已经成为发电装备安全可靠运行的重要保证,并已经成为智能电厂发展水平的重要标志.应该指出,发电装备规模庞大、参数复杂耦合、设备部件众多、运行动态多变、故障因果不清、不确定性强等特点,导致工况监控的研究还有很多没有解决的难题以及需要重点关注的研究方向.
在检测到故障后,进一步确定故障传播路径,追溯根源故障变量,也是燃煤发电装备故障诊断中的重要内容,有助于现场操作人员快速定位发生故障的关键设备和部位.已有的故障监测和故障诊断的研究大多认为工业过程是平稳的,以此作为研究前提,忽略了非平稳特性在复杂工业过程中对追溯根源故障变量的不利影响.事实上,对于燃煤发电这样明显的非平稳过程,由于故障信息在流程中常依据变量间的因果关系进行传递,而非平稳特性造成的伪回归等问题不利于正确地提取变量间的因果关系.变量间正确的因果关系被非平稳趋势掩盖或扭曲,难以准确追溯故障的传播路径,进而不能保证根源故障变量定位的准确性.针对非平稳工业过程的故障根因追溯,现有的研究主要从两个方向展开.一方面,对非平稳时间序列本身进行处理,实现平稳化,如差分方法、符号化等[151],然后对平稳化后的时间序列进行因果关系分析.Staniek 等将数值序列转化为符号表示,借用传递熵的思路构建了抗噪能力强、适用于非平稳的符号转移熵(Symbolic transfer entropy,STE)[151].随后又有研究者将其拓展为适用于多变量的部分符号转移熵(Partial STE,PSTE)[152]和顺序转移熵(Partial transfer entropy on rank vectors,PTERV)[153].另一方面,建立时变的回归模型,实现非平稳时间序列的因果关系分析,如时变广义部分有向相干方法[154].Schäck等[155]假设回归模型中的参数是时变的,设计了鲁棒时变广义相干函数,利用卡尔曼滤波估计时变的回归参数,用频域格兰杰判断变量间因果关系.然而考虑到燃煤发电装备长期变工况运行,且子系统耦合严重,考虑非平稳特性的故障根因追溯依然困难重重.
此外,数据驱动的研究对于故障诊断方面的知识、经验资源利用率较低.构建具有预测功能和通用性的智能化故障诊断方法是目前国内外学者主要的研究热点与方向.区别于单纯利用数据驱动方法,目前的研究主要是将专家经验知识与数据分析结合,运用到燃煤发电装备重要设备的故障诊断.Agrawal等[156]提出了一种基于模型的残差评估方法,用于在线检测和诊断火电厂磨煤机中发生的主要故障.该方法利用先验知识,建立磨煤机动态数学模型进行残差生成;然后,利用专家知识构建模糊逻辑用于残差评估,以确定故障的类型和严重程度;最后,利用贝叶斯网络对故障原因进行追溯.随着人工智能技术的发展,以模糊逻辑为代表的传统知识驱动方法逐渐被知识图谱技术所取代.知识图谱技术[157]的本质是通过可视化方法表示知识并对知识间关系进行探索分析,能够揭示知识领域的动态发展规律并实现知识共享与重用.Yang等[158]将知识图谱和贝叶斯网络相结合,实现维护人员与贝叶斯网络的推理交互,最终确定故障原因.Zhang等[159]利用云边协同的思想,基于云端储存的列车运行故障数据与专家知识,设计了一种基于知识图谱的列车故障可视化分析方法,该知识图谱可以清晰地表达不同类型的列车,不同故障和故障原因之间的关系,可以有效地呈现和追溯列车运行故障的原因.刘鑫[157]对面向故障分析的知识图谱构建技术进行了研究,在分析总结国内外相关技术的研究发展的基础上,构建了故障本体可视化知识图谱工具,实现了故障信息动态检索,提高了故障诊断知识的利用率和共享程度,为故障预测诊断领域知识图谱构建提供一种可行的解决方案.基于知识图谱的工业设备故障诊断研究正在不断深入,学者们正在试图将工业设备维修专业领域的专家经验知识建设成知识图谱,运用语音识别技术、自然语言处理技术对用户查询意图进行解析,通过查询知识图谱给出相关故障维修指导.
受电网负荷调度指令变化、煤质波动、环境温湿度变化等外部扰动因素影响,燃煤发电装备运行状态可能并非处于最优区间,造成锅炉效率、汽轮机热耗率、环保装置投运成本等指标变差.因此,针对燃煤发电装备的工况监控不应该仅仅局限于对生产工况做出正常或异常的识别和判断,还应能对当前正常运行状态的优劣水平有进一步的分析.状态评价是对运行状态优劣等级的评估,隶属于广义上的工况监控范畴.国内的能源结构决定了火电厂在提高经济性的同时也要承担着节能减排的重任,因此建立一套客观公正且精确有效的装备运行状态综合评价系统是非常必要的,可以为国内发电企业进行装备运行维护、优化装备检修提供合理有力的依据.
目前,燃煤发电装备运行状态评价主要使用领域专家给出的评价标准或经验公式,不同专家对于相同问题的处理具有主观性,且差异性大;而且这些计算公式复杂,评价耗时耗力;此外,有些指标难以量化,仅能给出定性评价.对规模庞大、结构复杂、生产工况频繁变化、动态时变及数据间具有强非线性耦合的百万千瓦超超临界机组而言,现有运行状态评价模型往往得不到满意的结果,甚至会给出错误的评价和操作指导.
此外,虽然有人提出了基于机理模型的运行状态评价方法,但对于复杂的火电过程,建立机理模型显然是不切实际的.随着传感器技术和数据存储技术的发展,数据驱动的运行状态评价方法受到学者的关注.Liu等[160]开发了基于PCA的性能评估方法,该方法提供了基于负载矩阵的离线性能识别技术,但不能有效区分非平稳工况下的性能好坏.Zou等[161]开发了基于层次协整分析主成分分析(Cointegration analysis PCA,CA-PCA)的性能评估方法,解决了平稳性和非平稳性混合的问题.但是,当协整关系不显著时,这种方法无法达到良好的效果.除此以外,考虑到燃煤发电装备运行过程的时变特性,Zou等[162]还提出了动静联合的运行状态评价机制,可以更为精细地识别控制器调节作用、运行状态变化以及性能好坏等.然而上述基于数据驱动的方法解释性差,在样本数目少时,可能会出现病态的模型,且运行状态的好坏难以直接用数据划定.此外,机器学习、深度神经网络等人工智能方法还未应用于燃煤发电装备的运行状态评价中.
综上所述,基于专家经验与数据驱动的方法各有优劣,相辅相成.而在发电装备运行过程中,既有丰富的专家知识,又有庞大的测量数据,传统的单一评价方法难免厚此薄彼.针对装备复杂特性,融合专家经验和测量信号,利用人工智能技术,实现更全面更精细的智能化状态评价还有待进一步研究.
与基于模型的故障诊断方法相比,数据驱动的故障诊断方法直接从收集的历史运维数据中挖掘信息,建立基于数据的故障诊断模型,因而不依赖于任何复杂的领域知识,具有更强的泛化性.尤其是近几年来随着深度学习的快速发展,以自编码器、深度卷积网络、深度信念网络等为代表的深度学习方法能自动地从高维、冗余的数据集中提取有用的深度特征用以建立诊断模型,成为复杂工业过程故障诊断方法的主流之一,也逐步应用于发电装备的故障诊断.
尽管这些深度学习方法相对于传统故障分类具有更高的诊断准确率,但它们都需要大量的样本来训练网络,在数据集样本较小时,这些方法的准确率会大打折扣甚至难以奏效.而在实际工业场景中,目标故障案例往往没有或很少有可用的数据存储下来.为了克服某些故障样本采集困难的问题,可以采用迁移学习的方法,将从一些容易获得的历史故障(训练故障)中获取的知识应用到那些难以采集或采集代价昂贵的故障(目标故障)中.因此,Lu等[163]将具有最大平均误差项的深度神经网络集成在一起,提出了一种用于故障诊断的深度迁移学习方法,该方法不需要任何目标故障样本即可获得高精度的性能.Wen等[164]也利用稀疏自编码器对训练和目标故障进行深度域自适应.Chai等[165]基于对抗学习思想,提出一种用于跨域工业故障诊断的细粒度对抗网络方法.该方法同时从域层次与故障类层次进行深度域适应,相对于前述工作,能够对源域与目标域的条件分布进行更细粒度对齐,从而保证跨域诊断的有效性.此外,为提升模型精度、保证模型能在增量数据环境下有效更新,Chai等[166]提出一种具有双增量学习能力的斜随机森林算法,使模型在已有类别或新类别样本到来时能够有效更新.虽然上述工作对目标域内的故障样本没有要求,但深度迁移学习实际上解决的是训练域与目标域之间的域漂移问题,而无法解决零样本问题.
零样本故障诊断[167]是一项极具挑战性的故障诊断研究任务,在没有目标故障样本可用于训练的情况下实现建模.这种情形在工业领域是很普遍的,但之前尚未有相关的研究,这限制了传统的数据驱动方法在实际过程中的应用.Feng等[167]首次将零样本学习的理念引入到发电过程,提出基于故障描述的属性迁移方法来解决发电装备的零样本故障诊断任务.该方法使用人工定义的故障描述而非收集的故障样本来确定故障类别.定义的故障描述由故障的一些属性组成,包括故障设备和位置、故障影响,乃至故障的原因等.对于目标故障而言,其相关属性可以从同一发电装备的其余故障的描述中预先学习和迁移得到.接着,便可以在无需其他任何数据训练的情形下,基于定义的故障描述诊断目标故障.该方法还从理论上分析和解释了基于故障描述的方式进行零样本故障诊断的有效性和可行性.
考虑到实际工业过程中,故障工况的零样本、少样本问题非常常见,对于故障样本缺乏情况下的诊断问题,还有很多细节需要思考.故障描述本质上也是一种知识,结合知识和数据进行研究,将是未来的重点研究思路和可行方向.
目前国内外对电力行业的远程诊断都有相应的研究工作.远程状态监测与故障诊断的实现模式有简单离线远程状态监测与故障诊断、通过视频会议实现远程监测与故障诊断、基于客户机/服务器模式的在线远程监测与故障诊断和基于浏览器/服务器模式的在线远程监测与故障诊断等.但是,这些商业化远程诊断系统的设计理念、彼此间的性能和结构差异较大,功能单一.主流的远程诊断系统主要是通过设备监测系统的显示和定时巡查方式对目标对象的运行状态进行监视,且更加关注信号层面的监测,使得典型监测系统以安全保护为目标,通常在设备出现明显故障时报警,难以及时发现处在初期的设备异常.国外引进软件无法适应国内企业的生产管理模式,尤其是集团级生产流程.发电企业地域分散,如果不进行自主的技术创新,这些应用信息系统就将成为彼此相互隔离的信息“孤岛”,不仅要耗费大量的人力进行日常维护工作,也难以发挥应有的作用.
目前,我国在发电厂设备状态监测和故障诊断系统方面的研究发展比较快,各种类型的厂级设备状态监测软件陆续投入运行,一些电力集团公司也开始整合内部资源实施规模经营的管理战略.建立集团诊断中心运行平台,集中远程监测诊断设备状况,已经成为发电集团生产管理信息化建设的必然趋势.但这类软件的开发尚处于探索阶段,规模不大,且仅针对特定的监测对象进行设计和开发,如汽轮机轴系振动在线监测等,各个软件之间的关联度很小,相互之间的数据交换和共享功能较弱.国外发电设备生产厂商也纷纷建立状态监测诊断中心和推出远程诊断服务.由于生产管理模式的不同,国外监测诊断软件或运营商,有的提供监测和诊断服务但不向客户提供相关软件;有的提供监测和诊断服务的同时也提供部分相关软件,但服务的范围和软件的功能各不相同,一般也都是针对特定的设备或监测对象、系统封闭、独立运行的专用系统,所产生的数据不能共享.目前的一个发展趋势是建立数据中心平台,实现远程监控与中心数据平台的紧密结合.该模式有利于系统专家知识库的积累以及各监测终端的信息共享.同时各发电企业也已为集团级数据中心平台集成了必要的硬件设备、数据库系统、数据接口系统和管理软件.
本文介绍了燃煤发电装备变负荷深度调峰导致的非平稳运行特性和全流程复杂耦合特性,在此基础上总结了发电过程区别于一般连续过程的问题,对面向发电装备工况监控的数据驱动算法近30 年的发展进行了回顾和分析.同时,本文梳理了目前存在的问题,并进一步介绍了发电装备工况监控未来可能的发展方向.随着信息化和工业化的深度融合,应对互联网、大数据、云计算等信息领域新技术发展,推进火电行业的智能转型升级,是加快构建高效、清洁、低碳、可持续的电力工业体系的必然选择.在常规能源方面,以装备和设备状态监测与故障诊断为主的智能工况监控已成为推动智能电厂发展的关键技术,未来的发展趋势是全自主、闭环的工况监控系统,即在人员不参与的情况下完成持续的工况监控,形成智能化决策,需要时还可以无需或仅需少量人为干预,由诊断系统发出相应的控制命令,对装备施加适当的控制,快速修复某些故障影响,提高装备设备运行的透明化水平,保障装备的安全可靠运行.人工智能最新理论及其在工程科技领域的深入应用为解决燃煤发电装备的工况监控提供了新的手段和新的思路.