摘要:故障预警作为风力发电机组预防性维修的一种手段,正逐步被风机运维人员所采用。现阐述了预警实施工作的具体步骤和流程,指出针对不同类型的风电场,需采取相应的预警策略。预警的前提是明确风机故障原因和失效模式,通过评估预警的必要性、数据质量,选择合适的算法进行预警,最终实现预警闭环。同时还介绍了预警经济性的量化评估。
关键词:风力发电机组;预警策略;数据质量;预警经济性
中图分类号:TK83 文献标志码:A 文章编号:1671-0797(2022)05-0048-04
DOI:10.19514/j.cnki.cn32-1628/tm.2022.05.013
引言
大力开发和利用风能是实现碳达峰、碳中和任务的重要手段。当前,风电机组装机规模日益扩大,风电机组故障集中分布于变桨、主轴、齿轮箱、发电机、变频器、液压刹车系统。
一些传动链故障停机时间和备件采购周期长,需要采用大型机械设备如吊车等进行相应的维修[1-2],这样不但增加了风电机组的运行维护费用,而且影响了风电机组的发电量,从而降低了风电机组的经济性。为降低运维成本,提高运维效率,风电场运维人员开始采用预防性维修策略,通过故障预警,在风机设备还没有发生故障或故障尚未造成损坏的前提下开展维修和检查。
1 针对不同类型的风电场采取相应的预警思路
针对未出质保的风电场,风机服役时间较短,设备健康度通常较好,可以获得大量的风机健康数据,运维人员也有足够的精力开展预防性维修,业主会及时发现设备缺陷,并要求主机厂家进行维修、更换,预警的结果也会得到较快反馈,预警工作开展较为顺利,这类风电场可以作为预警业务的优先开展对象。
针对投运时间较长,特别是故障率较高的风电场,风机健康度不够理想,风电场运维人员疲于处理故障,这类风电场应优先考虑开展专项治理,在确定故障根因的基础上,采取技改、设备精维护、大部件更换等手段,降低风机运行安全风险,提高设备可利用率,预警应该有所取舍,将预警重点放在齿轮箱、发电机、变桨系统等资产价值较高的大部件上。
2 确定故障原因和失效模式
预警的目的是在故障发生前识别设备的异常状态,提前进行检查和处理,避免设备健康状态逐步劣化造成故障停机,产生发电量损失。预警是针对特定的故障开展的,只有在确认失效模式、掌握故障产生的原因之后,才能有针对性地采取预防手段,否则即便识别出了设备异常状态,但由于无法找出异常原因,也就没有办法进行处理,设备健康状态仍然会继续劣化。
故障原因分析可借鉴相关的方法和工具,例如根因分析(RCA)方法[3]、FEMA方法、头脑风暴、鱼骨图、5个Why等,从人、机、料、法、环等角度分析故障原因,鱼骨图法如图1所示。
在确定故障原因和失效模式之后,建议抽取几台风机进行数据验证,通过分析故障前后时刻的数据,掌握设备缺陷发展过程的数据特征,明确分析故障以及进行预警时需要用到哪些测点的数据,为后续预警工作打好基础。
3 确定预警的必要性
在开展预警工作之前,需向现场详细了解历史故障逻辑和原理、故障发生的原因、故障处理方式和处理效果、是否已进行相应技改,必要时进行现场踏勘和检查。需要提前搜集的资料主要包括故障处理手册、历史运维记录、更换台账、损坏记录、技改方案、现场缺陷照片等。
如果设备劣化过程是渐变的,例如齿轮箱润滑油变质、轴承磨损等,需要一个时间过程才能发展成故障,则可以进行预警;如果设备劣化过程是短暂或者是瞬间的,例如叶片遭到雷击损坏、PT100接线松动,则预警较为困难,重点应加强日常巡视检查;如果故障发生的季节性比较明显,例如春季柳絮堵塞齿轮箱散热片,导致齿轮箱油温高故障,则建议提前采取措施统一处理,或采取技改措施。
另外,风机SCADA系统包含非停机告警,例如东汽FD77B风机发电机前轴承温度大于100 ℃会报警但不停机,大于110 ℃才会故障停机。非停机告警也属于预警的一种,且阈值通常由主机厂、大部件供应商提供,现场应对非停机告警引起重视。非停机告警阈值往往与故障停机阈值较为接近,如果告警时间与停机时间较为接近,告警后在很短时间内会报停机故障,则需要根据现场实际需求开发出能够增加时间提前量的预警。
在完成需求调研,掌握故障原因、失效模式,确定预警的必要性之后,需要将以上信息进行汇总,形成预警可行性分析报告(或者需求确认单),和现场人员确认之后再开展后续预警工作。
4 数据来源和数据质量评估
预警的分析对象是风机各系统(部件)的数据,通过数据反映出部件异常情況,故获得完整、有效的数据是开展预警工作的前提。
4.1 确定预警数据范围和数据颗粒度
对风电机组进行故障预警,首先需要确定预警需要用到哪些数据以及数据类型(遥测、遥信),如果是遥测数据,则需要确定颗粒度(毫秒级、秒级、10 min数据);如果是遥信数据,则需要确定是故障类遥信(故障、告警、提示)还是普通遥信以及时间范围等。
确定预警数据范围的方法有两种:一种是经验法,根据专家经验确定需要用到哪些数据测点,该方法的优点是“短、平、快”,缺点是过分依赖专家经验,可能会漏掉一些测点;另一种是机器学习方法,即分析数据之间的相关性,该方法结果准确,但用时较长;也可以上述两种方法同时使用,互为补充。
关于数据颗粒度,根据经验,温度类故障预警数据一般要求10 min数据,压力类故障、变桨系统故障一般要求秒级甚至更高颗粒度数据。
4.2 确定数据来源和导出方式
根据测点需求,确定数据来源,数据通常来源于风电场SCADA系统、大数据集中监控平台、风机后台、振动监测系统等[4],同时还要确定数据导出是否方便快捷,单次最多能够导出的日期范围和数据量,以及数据导出是在线实时导出还是人工手动在后台服务器导出。
4.3 数据质量评估
评估测点是否完整、有效,是否包含脏数据,数据格式是否友好,建议通过编程自动化方式评估和筛选数据,一方面评估数据完整性和有效性,另一方面通过程序自动剔除脏数据,并将数据转化成标准格式,成为可用、好用的数据,该步骤往往耗时较长。数据的完整性、有效性还会影响后续预警方法的选择。
5 预警算法选择
预警算法主要分为两大类:专家规则法、机器学习法。专家规则法利用专家的经验和案例识别设备的异常状态,机器学习法通过人工智能手段识别设备异常状态。在实际使用中有时采用两种方法相结合的预警算法。
5.1 专家规则法
专家规则法主要有阈值法、同工况对比法、原理法。
(1)阈值法:根据前期积累下来的大量历史数据分析经验、运维经验,结合部件失效原理,设定一个预警阈值,一定时间段内超过该阈值一定次数则发出预警。该方法的优点是使用简便,不需要分析海量的数据,缺点是难以覆盖不同工况、不同运行环境、不同品牌风机。
(2)同工况对比法:在相同工况下,将目标风机和相邻风机进行对比,或将同一风机和该风机历史同期数据进行对比。该方法优点是容易理解,缺点是风机工况有无数种,相同工况的前提有时无法实现,预警时效性差。
(3)原理法:基于风机自身特性进行判断,例如冬天时舱内温度应高于舱外温度等。该方法优点是简便准确,缺点是应用面较窄,只能对特定情况进行分析。
5.2 机器学习法
通过统计学的方法,构造相关机器学习的算法模型,通过编程自动化的方式进行离线或在线训练和测试,输出并展示预警结果。常用的机器学习方法有非线性状态估计、LightGBM、神经网络、深度学习等,不同的方法有不同的优缺点。机器学习数据运算量通常较大,使用时需要评估服务器、内存等硬件能否支撑算法正常运行。
5.3 两种算法相结合的预警方法
在具体实施中,可采用两种算法相结合的预警方法。例如,使用机器学习的方法得到预警结果时,可采用专家规则的方法对预警结果进行解释。算法没有绝对的好坏之分,同一种算法有时也可适用于多种类型的故障预警,风电机组的运行环境和工况是复杂多变的,算法的学习和积累是一个长期的过程。确定预警算法后,需要将方法汇总成预警原理说明书,并和风电场现场讨论和确认。
6 预警算法执行
根据选定的预警算法进行模型训练,得到预警结果。在使用机器学习算法时,需将数据分为训练样本和测试样本,以非线性状态估计算法为例,训练样本为风机历史健康数据,测试样本为风机历史告警数据或故障数据。模型训练和测试的工作量通常较大,针对测试样本,算法的测试结果需要具备准确性和时效性,准确性是指训练出的模型在测试时能够达到预期的准确率,时效性是指预警结果相对于故障的发生有一定的时间提前量。
7 预警结果展示和推送
预警结果通常包含风机号、异常信息、最早发现的异常时间、最近异常时间、导致异常的可能原因、建议措施、优先级、可视化图表显示和说明等8个部分内容。其中“导致异常的可能原因”和“建议措施”一般根据异常数据特征,结合运维经验、故障处理手册、RCA根因分析报告给出。异常原因和建议措施可按照优先顺序排序,优先级可以根据紧急程度分为3类:需要立即处理(48 h内上风机处理)、需要尽快处理(2周内上风機处理)、下次爬风机处理(6个月内上风机处理)。表1给出了不同异常类型和对应的处理方式。
在对预警结果进行展示时,通常需要搭配预警时刻的图形和图表,图形和图表能够反映设备异常时刻的数据特征,方便运维人员直观地分析设备异常原因,并评估异常严重程度。预警信息可视化展示也是预警实施过程中的重要步骤。
针对设备健康度和设备异常评估,还可以采用设备劣化度、寿命预测的分析方法。劣化度在一定程度上表征了机组当前运行状态相对于故障状态的劣化程度,劣化度计算公式为当前监测参数的测量值与故障停机阈值的接近程度,并且在计算时应加入监测参数的趋势变化[5]。寿命预测可采用威布尔分布方法,威布尔分布广泛应用于失效数据分析,也用于寿命数据分析。根据威布尔分布可以预测未来一段时间之内大部件失效的数量,运维人员可根据预测结果提前采购备件,并对不同供应商的设备可靠性进行评价。
预警开发人员需要和现场运维人员建立起联动机制,将以上预警结果整理成固定的格式,定期推送给风电场,并接收现场人员对预警结果的反馈。如果是在线预警,风电场运维人员可以实时收到预警信息。
8 预警结果现场反馈和验证
风电场收到预警结果后需要采取行动并给予反馈,反馈的内容应包括上机检查日期、检查结果、修复方式、异常的根本原因,必要时补充现场照片。
预警开发人员在收到反馈后,需要结合数据进行两方面验证:
(1)验证预警结果是否真实有效。如果现场仔细检查后并未发现设备异常,需要不断优化、调整、修改预警参数和方法,且预警方法优化、迭代是一个长期的过程。
(2)验证设备异常是否得到解决。现场运维人员根据预警结果,完成异常设备的维修和处理,预警开发人员需要对维修后的设备数据进行验证,通过数据判断设备异常情况是否已经消失,如果后续仍然出现预警,预警开发人员需要提醒运维人员继续进行维修和检查,直至找到设备异常的真正原因,确保设备异常情况消失。
预警开发人员需要将新出现的设备異常原因、解决方式补充到专家知识库、故障处理手册中,最终实现预警案例闭环。
9 预警经济性计算、预警方法推广
风电场完成预警缺陷处理,能够避免风机缺陷继续劣化导致故障停机,具有一定的经济效益。不同类型的预警会产生不同的经济效益,有必要对预警创造的潜在经济价值进行量化,具体量化方法可采用如下公式:
预警带来的潜在经济价值=电量损失+大部件费用+
人工费用+吊装费用
式中:电量损失是指故障的历史平均停机损失,通过预警避免了发生故障停机,从而避免了产生电量损失;大部件费用是指通过预警在塔上更换小件就能解决问题,避免了日后更换大部件所需的费用;人工费用是指节省的运维人员维修费用;吊装费用是指节省的设备吊装、安装费用。
预警模型完成批量实施和验证后,以此为基础,可以将预警成果进行推广,评估预警算法模型是否适用于其他风电场不同品牌的风机。
10 结语
本文探讨了风力发电机组故障预警策略,即基于已知的故障原因和失效模式、完整有效的数据,选择准确的预警算法,并根据现场反馈不断优化算法,评估预警带来的经济效益。本文对详细的预警步骤进行了归纳和总结,可以为今后风力发电机组故障预警工作的开展提供指导。
[参考文献]
[1] 张文秀,武新芳.风电机组状态监测与故障诊断相关技术研究[J].电机与控制应用,2014,41(2):50-56.
[2] 杨军,梁振飞,田力勇.风电机组在线故障诊断系统应用案例分析[C]//中国电机工程学会清洁高效燃煤发电技术协作网2010年会论文集,2010:546-550.
[3] 彭效然,黎燕航.基于根因分析方法的风电场故障处理应用[C]//第七届中国风电后市场交流合作大会论文集,2020:121-123.
[4] 杨力.风机实时故障检测与预警研究[D].成都:电子科技大学,2021.
[5] 马良玉,王兵树,高建强,等.生产过程轻微和早期故障智能诊断的一种新方法[J].中国电机工程学报,2002,22(6):115-118.
收稿日期:2022-01-04
作者简介:李琰(1988—),男,河北石家庄人,硕士研究生,工程师,主要从事风电后市场服务产品及技术改造产品的研发、推广工作。