冯泽磊,吴美凤
(国电南京自动化股份有限公司,南京 211153)
自1985起,我国电力行业可靠性管理相关工作已开展30多年,形成了较为完善的政策体系和标准体系。通过对火电、水电、蓄能水电、核电、燃气轮发电及风电等发电能力进行可靠性评价[1],科学、经济地发挥了供电设备潜力,不断向用户提供质量合格的电力,确保电力系统的安全。近5年来,整个电力系统的可靠性状态有非常大的提高,发电机组等效可用系数增长近10%[2],在电网运行时由于非调度原因导致的故障停机次数下降了50%,煤机年平均停机次数为0.4[3]。
火电机组仍是当前发电主力,截至2018年3月底,火电装机容量达11.06亿kW,占全部装机容量的62.24%。火电机组设备系统规模大、设备联系紧密、管路复杂、生产环境恶劣,其设备的可靠性和可利用率一直是发电企业重大研究课题。
火电机组运行状态管理是将机组的状态数据按照管理要求,在规定的报送时间按审核程序上报后,由监督人员进行统计和确定。当前的管理方法主要存在3点问题:(1)原始数据量大,人工监视、收集、填报信息耗时且工作强度大,存在漏报和误报等情况;(2)信息收集滞后,电厂在机组出现故障后不能及时汇报,给调度和电力平衡带来压力[4];(3)数据填报准确性不足,根据填报反馈信息无法直接确诊机组停机原因[5],为后续原因分析和统计带来干扰。
图1 某600 MW机组停机数据对比Fig.1 Data comparision of a 600 MW unit
针对以上问题,可利用互联网技术开发大数据平台,实现对火力发电机组进行集中监控、管理、诊断和分析。大数据平台通过对机组基础数据进行收集、存储,形成私有云共享数据仓库,实时处理在线数据,给出高准确性的分析、判定结果,辅助指导生产各环节。平台通过完善设备台账,不断积累设备的可靠性数据,为科学分析各设备的可靠性提供充分的依据,同时为总结事故经验、研究事故发展规律、寻找电力设备的薄弱环节和潜在的危险点[6],进一步提高电厂的可靠性管理水平提供参考。
SRT大数据管理平台最底层为可采集与存储的数据源层,包括生产数据(如分散控制系统(DCS)数据、监控信息系统(SIS)数据等)、经营数据(如管理信息系统(MIS)数据、企业资源计划系统(ERP)数据等)以及外部数据(如天气、煤/气价等),这些实时数据均可通过平台中的数据采集模块(ECell)进行实时采集(支持各种数据通信协议),同时通过数据抽取、转置、加载工具(ETL)进行结构化与非结构化数据的抽取;将各种数据源采集或抽取后使用平台自身的数据预处理服务(包括编码、清洗、关联以及状态感知)进行预处理;预处理完毕后根据数据特征存储于平台各数据库,整个平台包含时序数据存储、非结构化数据存储以及结构化数据存储等;同时提供分布式协调服务、分布式消息缓存等服务。计算服务由云计算平台提供,包括事件统计(SEvent)、统计计算(SReal)和自由模型计算等服务。各业务应用服务均部署于大数据平台的数据层之上,支持移动端展示和数据共享。
目前大数据技术在电力行业的应用已逐渐深入,差分整合移动平均自回归模型(Armia回归模型)、灰色投影、随机森林算法和长短期记忆神经网络[7]在电力负荷预测中已得到广泛应用,模糊原理、Petri 网络、遗传算法也被应用于电力系统故障诊断[8]。但各种模型与算法在火电系统状态管理上的相关研究和应用较少。本文针对10~1 060 MW的230台火电机组进行研究,其中600 MW以上机组共计58台。原始数据被采集到大数据平台,采用专业化数据清洗、分析软件、构建合适的数学模型对机组启停和降出力进行监控,对非计划停机和降出力进行标记管理,并进行可视化呈现。允许专家通过专网远程验证以及用户自查,实现设备状态监测和性能分析,为生产、检修提供指导,为技术监督提供分析参考,为领导经营决策提供数据支持。
根据电力可靠性管理技术标准[1],使用状态下的设备分为可用和不可用,根据设备执行预定功能的状态又分为运行和备用两种,其中不可用状态分为计划停运和非计划停运(以下简称非停)。发电企业主要关注停机事件、降出力事件和非计划降出力事件,以体现设备“带病”运行的情况,以便及时对设备进行检修,将安全隐患消灭在初期,避免非停给企业带来的电量、经济、信誉损失甚至安全事故。
根据近几年火电机组非停事件统计,导致非停的原因主要出自锅炉系统、汽轮机系统、发电机系统和热工系统,其中出自锅炉系统的约占60%,出自汽轮机系统的约占10%,出自发电机系统的约占10%[9],且绝大多数非停事件体现为突然跳闸和紧急停运。通过对历史事件的对比分析,非停在数据上的特征是功率值陡降且停机前5 min内数值较高。如图1所示,对某600 MW机组多次停机事件停机前20 min和停机后10 min的数据进行分析和特征提取,数据的采样周期均为30 s。
图2 机组停机前功率在正常停机/非停下的分布情况Fig.2 Distributions of power before shutdowns under normal start/shutdown and unplanned start/shutdown
可靠性管理采用历史判定事件为训练数据集,取停机前20 min的数据作为散点并针对一系列的散点进行分析,采用已验证的非停、正常停机事件作为目标集进行学习。
为了让数据更具代表性、丰富性,以容量等级为样本分组依据,对58台600 MW等级机组停机数据进行特征提取,对该容量等级的机组展开个性化数据挖掘,经验证数据有较好的适用性。对机组停机前15 min,10 min,5 min,2 min,1 min和0 min的数据进行对比,发现非停前的负荷较正常停机时的偏高(如图2所示),此现象在停机前2 min时尤为明显,此时两组数据出现了明显的分层。取经过清洗的停机前2 min的负荷进行分类、边界描述,最终确定非停识别标准值和非停识别待定值。当负荷大于非停识别标准值,则判定为非停事件:取停机时间点向前10 min的数据,连续2个数据呈递减规律则递减序数记录加1,当递减序数小于额定陡降特征值,则认定为非计划停机。
机组降出力指的是机组达不到最大容量运行或备用的状态(不包括按负荷曲线正常调整出力)。机组降低出力可分为计划降低出力和非计划降低出力[1]。一般情况下,在电网负荷减少时,为了保持电网频率保持稳定,需要降低发电厂输出功率,这部分按照负荷调度曲线调整出力属于正常调整。计划降低出力机组按计划在既定时期内降低出力,比如季节性或月度调整。本文主要关注因为辅机设备故障或设备缺陷等不能预计的原因导致的非计划降出力事件。
采用历史判定事件为训练数据集,如图3所示,对典型非计划降出力事件进行特征提取,取经过验证的机组正常运行数据,确定机组能长时间持续正常运行的功率低值下浮指定量为绝对降出力阈值。取降出力门槛前20 min内负荷最大值为辅助验证点。将经过验证的机组降出力事件作为目标集,给出特征参数额定最大差值和降出力阈值。
降出力识别的具体流程是当机组功率低于降出力阈值时,对数据清洗确认数据有效,取辅助验证点计算负荷差值,差值大于额定最大差值,标注此刻为降出力开始,持续监视负荷测点负荷,直至负荷在90 min内未降至停机阀值并最终回升至稳定运行负荷,认为降出力结束,对完整降出力事件进行记录,非计划降出力事件判断结果如图3所示。
图3 某600 MW机组降出力事件案例Fig.3 A derating output case of a 600 MW unit
经过1年的运行调整,状态管理模块具有良好的适用性。基于历史数据,平台1 h内高效监控、统计50台机组100 d的运行状态,对于实时数据设备状态变化在10 min内给出判定意见,处理周期短、时间延迟小,基本可以做到数据实时采集、实时清洗、快速判定。
选取专家提供的某月非停与降出力报告与SRT大数据平台分析结果进行对比,非停报告中该月非停事件共10次,见表1。平台非停统计共计9次与非停报告匹配,成功6次,4次四管泄漏非停未能成功判定,额外挖掘高概率非停事件3次,其中除了对锅炉系统非停的命中率为20%,对其他系统的命中率均为100%,结果可靠。经过进一步分析确认,锅炉系统四管泄漏漏判率较高,因为现场运行情况复杂,运行情况并非绝对稳定,在发生较小流量的泄漏时,单从参数上很难完成泄漏事件判断[4]。另一方面,四管泄漏事件发生至机组停机可能是一个缓慢的过程,基于功率值的特征值无法体现其与正常缓慢停机的区别,需补充分析量进一步提取新特征。降出力报告中降出力事件共计6次,均由锅炉系统引起,其中由于煤仓蓬煤、负压异常、燃烧调整造成的4次事件由平台进行了准确统计。平台漏判的两次主要是引风机失速和抢风,考虑进一步引入引风机特征信号作为判据。
表1 专家月报告与平台统计结果比较Tab.1 Comparison of expert monthly report and platform data
通过建立数据中心构建非停和降出力模型的方式,远程监督设备运行情况并进行可靠性统计。使用软件平台对非计划降出力进行自动识别,采用7×24 h专业化应用程序辅助人工监督,在海量数据情况下减少人工识别成本,提高业务效率,提升判定准确性和决策可靠性,为设备全自动信息化监管提供良好基础。后续平台会根据判断结果对非停和降出力的原因进行分析,进一步深化状态管理应用。