风电机组齿轮箱的多变量时间序列故障预警

2019-08-01 01:54刘帅刘长良甄成刚
计算机应用 2019年4期
关键词:风电机组

刘帅 刘长良 甄成刚

摘 要:针对风电机组故障预警中,原始动态时间规整(DTW)算法无法有效度量风电机组多变量时间序列数据之间距离的问题,提出一种基于犹豫模糊集的动态时间规整(HFS-DTW)算法。该算法是原始DTW算法的一种扩展算法,可对单变量和多变量时间序列数据进行距离度量,且精度与速度较原始DTW算法更优。以子时间序列相似度距离为目标函数,使用帝国竞争算法(ICA)优化了HFS-DTW算法中的子序列长度和步距参数。算例研究表明与仅DTW算法和非参数最优的HFS-DTW算法相对比,参数最优的HFS-DTW可挖掘更多的多维特征点信息,输出的多维特征点相似序列具有更丰富细节;且基于所提算法可提前10天预警风电机组齿轮箱故障。

关键词:风电机组;故障预警;犹豫模糊集;帝国竞争算法;动态时间规整

中图分类号:TP206.3

文献标志码:A

文章编号:1001-9081(2019)04-1229-05

Abstract: For wind turbine fault warning, original Dynamic Time Warping (DTW) algorithm cannot measure the distance effectively between two multivariate time series data of wind turbines. Aiming at this problem, a DTW algorithm based on Hesitation Fuzzy Set (HFS-DTW) was proposed. The algorithm is an extended algorithm of the original DTW algorithm, which can measure the distance of both univariate and multivariate time series data, and has higher accuracy and speed compared to the original DTW algorithm. With the sub-sequence similarity distance applied as cost function, the length of sub-sequence and step parameters in HFS-DTW algorithm were optimized by using Imperialist Competitive Algorithm (ICA). The study shows that compared to the only DTW algorithm and the HFS-DTW algorithm with non-optimal parameter, the HFS-DTW with optimal parameter can mine more information on multi-dimensional feature point, and the output multi-dimensional feature point similar sequence has more details. And based on the proposed algorithm, the wind turbine gearbox fault can be warned 10 days in advance.

Key words: wind turbine; fault warning; Hesitant Fuzzy Set (HFS); imperialist competitive algorithm; Dynamic Time Warping (DTW)

0 引言

依据《中华人民共和国国民经济和社会发展第十三个五年规划纲要》,国家发改委、能源局积极引导风电产业。截至2018年6月底,我国风电装机超过1.7亿千瓦,所贡献电力约占全国总电力近4.8%。由于“抢装”潮在各地泛滥,部分地区的风电规模已经超出2020年规划目标。

大量新风场的部署、建成标志着漫长运维工作的开端;若按5年质保期算,后续几年将有大批已安装的风电机组相继出质保期。这两项因素给风电机组运维工作带来巨大压力,但目前精准的预测性风电运维技术、通用的运维平台尚未成熟,日益增长的运维需求和较为滞后的运维技术发展之间的矛盾愈加凸显。基于数据采集与监控(Supervisory Control And Data Acquisition, SCADA)系统的风电机组故障预警技术不仅具有良好的现场实施条件,而且无需加装额外传感器,是降低风场运营成本的首选,也是学者研究的重点、热点内容。

基于SCADA数据的风电机组故障预警的技术路线大致上可以分为两种:一种是残差类,利用现场数据与所建立模型預测数据形成的残差序列来判断机组是否存在潜在故障;一种是算法类,采集现场运行数据后使用统计方法或其他算法直接得出机组是否存在潜在故障。

在近年研究中,残差类故障预警技术有:戴巨川等[1]基于SCADA数据使用有限元仿真方法获得塔架模态频率及其相应振型,得出了风电机组振动极大值出现在风轮运行频率与塔架固有频率接近时的结论;孙鹏等[2]基于SCADA数据建立了神经网络状态参数预测模型,采用模糊综合评判对筛选出的预测模型的异常辨识结果进行融合;尹诗等[3]采用非线性状态估计技术作为数据挖掘方法,使用SCADA数据建立了机组变桨控制系统故障模型;Bangalore等[4]提出了一种基于停机成本预防性维护调度问题的数学模型,其优点在于考虑了基于年龄和基于条件的故障率模型,并通过案例研究验证了维护管理模型的优势;de la Hermosa[5]提出了一种基于模糊聚类和Mahalanobis距离的预警和故障检测方法,并已实际应用。此类故障预警技术对模型的训练数据要求较高,不同的训练数据所获得模型在预警能力上差别较大,往往需要针对具体机型具体分析,甚至同型号机组的模型都不同,需要单独调试。

算法类的故障预警技术研究有:刘帅等[6]提出一种基于群体多维特征相似性的故障预警策略,以多个风机之间的SCADA数据为研究对象,采用分级时间滚动窗口技术预警潜在故障,并以齿轮箱故障验证了所提算法的有效性;Herp等[7]基于贝叶斯框架预测风力机轴承故障,提出了在线预测风电机组状态的统计方法,实验结果表明可以通过样本模型和描述状态转换概率的危险率函数来计算潜在故障;Wang等[8]提出了一种基于主成分分析(Principal Component Analysis,PCA)和多选择标准的变量选择算法,其结果可确定故障发生的相应时间和位置,优点在于可估计故障的严重程度。

从以上分析可知:国内外的风电机组故障预警技术路线大体相同,而研究方法多样化,侧重点各不相同,但从多变量时间序列角度出发的故障预警技术尚缺乏研究。

为有效处理风电机组中SCADA数据中大量的多变量数据,本文提出了一种基于犹豫模糊集的动态时间规整(Dynamic Time Warping based on Hesitant Fuzzy Sets, HFS-DTW)算法,所提算法能够发掘多变量数据的内在隐含信息,达到预警风电机组潜在故障的目的。

1 相关算法

1.1 动态时间规整

动态时间规整(Dynamic Time Warping, DTW)算法是Itakura[9]于1975年研究语言识别问题时所提出,现如今在相似度度量[6]、语音识别[10]等方面研究较为充分。DTW算法是一种突破时间尺度的序列匹配算法,该算法原理是将两个时间序列之间的元素按照最短累积距离路径一对一或一对多匹配,其优点在于解决了传统欧几里得距离只能使用相同时刻元素一对一匹配的限制。

其中:c(k)=(ap,bq)是最短累积距离路径中的路径元素; p和q是第k个路径元素的角标;d(c(k))是路径元素之间的欧氏距离;w(k)是路径的权重。

在选择最短累积距离路径过程中,至少需要满足3个约束条件:1)单调性。最短累积距离路径元素的角标总是不小于前一个元素的角标。

2)连续性。最短累积距离路径相邻元素的角标增量必须在集合{0,1}之内取一元素。

3)有界性。最短累积距离路径元素的起始与结束分别对应了两个时间序列的首尾。

1.2 犹豫模糊集

犹豫模糊集(Hesitant Fuzzy Set, HFS)[11]是Torra于2009年提出的一种模糊集理论,Xu等[12]在2011年对其中的距离算法进行了充分研究与拓展,在多属性评价、系统决策等方面犹豫模糊集应用场景较为丰富;Gou等[13] 研究了描述人们在决策过程中主观认知的犹豫模糊语言术语集。犹豫模糊集是对模糊集的拓展,将其中隶属度的个性化问题模糊化,使得一个元素属于一个集合的隶属度成为几个可能的值,其优点是可以反映多个决策者的不同偏好。

1.3 帝国竞争算法

2007年Atashpaz-Gargari等[14]提出一种启发式算法——帝国竞争算法(Imperialist Competitive Algorithm, ICA),通过建立多个国家,模仿帝国竞争、殖民地分配以及革命等多种历史行为,完成对定义域内的最优值搜索。较先前的粒子群算法、遗传算法在搜索最优值速度与精度方面均有较大程度提高,并在仓储调度[15-16]、参数优化[17]等方面有相关应用研究。

其算法流程大体如下:1)随机初始化各个国家,并选出区域内的帝国主义国家及其附属殖民地;

2)各帝国主义国家吸引其附属殖民地向其移动,然后在帝国内重新选出帝国主义国家和殖民地;

3)帝国之间排序,将末尾帝国内的殖民地以一定概率分配给相邻更强大的帝国,各帝国重新排序且帝国内重新排序;

4)不断重复步骤2)~3),直至仅剩一个帝国,其中的帝国主义国家所代表的参数即为当前最优值。

2 本文改进算法

本文提出的HFS-DTW算法[18]将犹豫模糊集的概念引入原始DTW算法,克服其处理多变量时间序列方面的不足;同时,改进算法的速度与精度比原始DTW算法都有提高,在特定情况下亦可退化为原始DTW算法。算法详情如下:

除了原始DTW算法的基础约束条件外,改进的HFS-DTW仍需满足额外的3个条件:

1)正整数。l和ls都必须为正整数。

2)边界性。l和ls需要额外满足如下不等式约束:

3)完整性。X和Y的每个元素在运算中至少使用一次。

3 算例研究

虽然SCADA系统所记录的数据属性和数据格式不尽相同,但都可以将这些SCADA数据归为多变量数据。基于SCADA数据的风电机组故障预警实质上是对多变量数据的分析、处理,以达到从多变量数据中發现异常的目的。

本文采用与文献[3]相似的群体多维相似性故障预警策略,使用本文算法替换原故障预警策略中的“主成分分析+DTW”部分,并与原算法预警结果对比,研究所提算法的故障预警效果。

3.1 风电机组故障预警策略

由于风电机组SCADA原始数据中含有较多异常值、错位数据,需要对数据进一步处理。文献[3]中对SCADA数据预处理后,进一步使用高斯混合模型(Gaussian Mixture Model, GMM)提取机组的统计学特征作为相似度分析算法的输入数据(多维特征点),最终通过机组之间的相似度评判机组是否存在潜在故障,其预警策略总结为图1。

由图1中右侧的数据类型可知:从多维特征点到多维特征点相似序列共经过两个算法(主成分分析及原始DTW算法),首先经过主成分分析获取多维特征点中的主要特征,然后使用DTW算法匹配不同机组的多维特征点,生成多维特征点相似序列。本文HFS-DTW更适合多变量数据的相似性距离度量,可替代图1中“相似度分析”的两个算法(PCA+DTW),衡量上述多个机组的多维特征点之间的相似度。

3.2 故障预警策略参数设置

所使用的算例数据来自于福建近海某风场,其风电机组额定发电功率为2MW,切入风速为4m/s,切出风速为25m/s。相似风电机群编号为12、13、14号,在算例研究中共约使用约25400行数据(数据时长从2016年1月至7月),14号风机在7月13号因齿轮箱故障停机,7月18号维修结束重新上网发电。

数据预处理阶段的参数设置与文献[3]相同。由于HFS-DTW中参数的要求必须是整数,且在参数的定义域内存在最优值,所以采用帝国竞争算法进行参数寻优。寻优策略为参数个性化寻优,即两两机组之间的算法参数具有独特性,分别对每两机组间HFS-DTW算法寻优。参数l和ls的定义域范围分别为[1,50]和[1,25],目标函数为两时间序列的前300个序列值的距离,参数优化结果如表1。

3.3 故障预警策略结果

3.3.1 仅DTW算法

原风电机组故障预警策略中,除去主成分分析方法,仅余DTW算法,可得如图2所示的结果。

图2中的4类线型表示不同的多维特征点相似度序列。从图2依x坐标轴横向,可以看出两两风机之间的多维特征点相似序列的趋势较为相近,但同一个多维特征点序列纵向对比,相似度并不高。将上述多维特征点相似序列作为输入,使用熵权法做最终处理可得图3。

分别分析每个子图中相似关系趋势:图3(a)12号与13号风机相似关系整体起伏较大,第20步至40步之间幅值较大;图3(b)12号与14号风机中可观察到两机组的相似关系在第40步至第50步之间相似度较低,暗示潜在故障;图3(c)13号与14号风机的相似关系较为平稳,波动范围较为稳定,波动周期在变小,但无法辨别是否存在潜在故障。综上,无法在14号风机故障明显表现之前确定是否存在潜在故障。

3.3.2 本文HFS-DTW算法(无参数优化)

HFS-DTW算法参数未优化时,在符合算法约束下,随机选择子序列长度为l=5,步距为ls=2。使用本文HFS-DTW算法替代原故障预警策略中的主成分分析和原始DTW算法,首先使用多维特征点作为输入,可得机组多维特征点相似序列,如图4所示;然后使用熵权法综合多个多维特征点相似序列,得到两两风机相似关系,如图5所示。

图4中的4类不同颜色不同线型表示不同的多维特征点相似度序列。以图4每个子图纵向观察,多维特征点之间有小部分相似性或趋势相似性,细节、信息量较仅DTW算法和文献[3]中更充分、丰富。

图5中:图5(a)整体上看12号与13号风机的相似性关系波动性周期及波动范围变化较小,趋势较为平缓,可判断其相似关系较为稳定;图5(b)12号与14号风机相似关系变化较为平缓,虽然第5步时峰值达到63.97,但直观上较难判断是否两机组间相似性发生变化;图5(c)13号与14号风机相似关系在前40步相似关系较为平稳,并无较大波动,但40步之后趋势与图5(b)12号与14号机组相似关系较为同步,可判断两机组之间相似性发生改变,两机组中有一台(14号)存在潜在故障。综上,无参数优化的HFS-DTW算法展现了一定的多变量距离度量能力,但故障机组的判断依然需要详细对比才能得到与文献[3]相同的结论。

3.3.3 本文HFS-DTW算法(已参数优化)

本文HFS-DTW算法使用表1所列优化参数,替代原故障预警策略中的主成分分析和原始DTW算法,可得图6机组多维特征点相似序列,使用熵权法后得到图7两两风机相似关系。

图6中为经HFS-DTW算法所得4类多维特征点相似序列,以每个子图横向观察或以每类多维特征点纵向观察,多维特征点之间都有部分相似性,细节丰富且波动较为频繁,信息量较仅DTW算法、无参数优化的HFS-DTW算法和文献[3]算法更丰富,验证了所提算法在多变量数据距离度量方面的有效性。

图7中:图7(a)12号与13号风机的相似性关系波动性周期及波动范围变化较小,可判断其相似关系较为稳定;图7(b)12号与14号风机相似关系在第50步以后出现较大波动,峰值达到8.2,可判断12号与14号机组中有一机组存在潜在故障;图7(c)13号与14号风机相似关系在前50步相似关系较为平稳,并无较大波动,但50步之后趋势与图7(b)12号与14号机组相似关系较为同步,达到了极值4.7。综合以上分析,在第59步时(2016年7月3日)可作出14号风机的预警报告,此时距离发生故障10d。

横向对比几种算法的预警结果,仅DTW算法的相似性波动剧烈,不易确定潜在故障机组;无参数优化的HFS-DTW算法相似关系较平缓,无劇烈变化,需要详细分析才能得出与文献[3]中相同的结论;而参数优化过的HFS-DTW算法(图7)与前三者相比相似关系图更直观,更容易判断潜在故障风机。但本文HFS-DTW算法的提前预警时间不如文献[3]算法长,本文算法依然存在改进空间。

4 结语

使用本文基于犹豫模糊集的动态时间规整(HFS-DTW)算法,经帝国竞争算法调优参数,处理了风电机组多维特征点,预警了机组潜在故障。本文HFS-DTW算法比原始DTW算法更适于度量多变量时间序列之间的距离,能获取到多变量时间序列中的更多本质特征。通过福建某风场运行数据的案例研究,可得到如下结论:1)HFS-DTW算法可替代“仅DTW算法”“主成分分析+DTW算法”两种方案,验证了所提算法的优异性,达到了改进算法的目的;

2)使用首段子序列相似距离作为目标函数,以帝国竞争算法优化HFS-DTW参数后,预警结果更清晰,可读性更高;

3)可提前10d报告潜在故障,给现场运维工作留有较大时间裕度,达到了风电机组故障预警的目的。

参考文献(References)

[1] 戴巨川, 袁贤松, 刘德顺, 等. 基于SCADA系统的大型直驱式风电机组机舱振动分析[J]. 太阳能学报, 2015, 36(12): 2895-2905. (DAI J C, YUAN X S, LIU D S, et al. Vibration analysis of large direct drive wind turbine nacelle based on SCADA system[J]. Acta Energiae Solaris Sinica, 2015, 36(12): 2895-2905.)

[2] 孙鹏, 李剑, 寇晓适, 等. 采用预测模型与模糊理论的风电机组状态参数异常辨识方法[J]. 电力自动化设备, 2017, 37(8): 90-98. (SUN P, LI J, KOU X S, et al. Wind turbine status parameter anomaly detection based on prediction models and fuzzy theory[J]. Electric Power Automation Equipment, 2017, 37(8): 90-98.)

[3] 尹詩, 余忠源, 孟凯峰, 等. 基于非线性状态估计的风电机组变桨控制系统故障识别[J]. 中国电机工程学报, 2014 34(增刊1): 160-165. (YIN S, YU Z Y, MENG K F, et al. Fault identification of pitch control system of wind turbine based on nonlinear state estimation[J]. Proceedings of the CSEE, 2014, 34(S1): 160-165.)

[4] BANGALORE P, PATRIKSSON M. Analysis of SCADA data for early fault detection, with application to the maintenance management of wind turbines[J]. Renewable Energy, 2018, 115: 521-532.

[5] de la HERMOSA G-C R R. Wind farm monitoring using Mahalanobis distance and fuzzy clustering[J]. Renewable Energy, 2018, 123: 526-540.

[6] 刘帅, 刘长良, 甄成刚, 等. 基于群体多维相似性的风机齿轮箱预警策略[J]. 仪器仪表学报, 2018, 39(1): 180-189. (LIU S, LIU C L, ZHEN C G, et al. Fault warning strategy of wind turbines gearbox based on group multi-dimensional similarity[J]. Chinese Journal of Scientific Instrument, 2018, 39(1): 180-189.)

[7] HERP J, RAMEZANI M H, BACH-ANDERSEN M, et al. Bayesian state prediction of wind turbine bearing failure[J]. Renewable Energy, 2018, 116: 164-172.

[8] WANG Y, MA X, QIAN P. Wind turbine fault detection and identification through PCA-based optimal variable selection[J]. IEEE Transactions on Sustainable Energy, 2018, 9(4): 1627-1635.

[9] ITAKURA F. Minimum prediction residual principle applied to speech recognition[J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1975, 23(1): 67-72.

[10] 解本铭, 韩明明, 张攀, 等. 飞机牵引车语音识别的动态时间规整优化算法[J]. 计算机应用, 2018, 38(6): 1771-1776, 1789. (XIE B M, HAN M M, ZHANG P, et al. Optimization algorithm of dynamic time warping for speech recognition of aircraft towing vehicle[J]. Journal of Computer Applications, 2018, 38(6): 1771-1776, 1789.)

[11] TORRA V, NARUKAWA Y. On hesitant fuzzy sets and decision [C]// Proceedings of the 2009 IEEE International Conference on Fuzzy Systems. Piscataway, NJ: IEEE,  2009: 1378-1382.

[12] XU Z, XIA M. Distance and similarity measures for hesitant fuzzy sets[J]. Information Sciences, 2011, 181(11): 2128-2138.

[13] GOU X, XU Z, LIAO H. Hesitant fuzzy linguistic entropy and cross-entropy measures and alternative queuing method for multiple criteria decision making[J]. Information Sciences, 2017, 388/389: 225-246.

[14] ATASHPAZ-GARGARI E, LUCAS C. Imperialist competitive algorithm: an algorithm for optimization inspired by imperialistic competition[C]// CEC 2007: Proceedings of the 2007 IEEE Congress on Evolutionary computation. Piscataway, NJ: IEEE, 2007: 4661-4667.

[15] 呂聪, 魏康林. 柔性车间调度问题的协作混合帝国算法[J]. 计算机应用, 2018, 38(7): 1882-1887. (LYU C, WEI K L. Cooperative hybrid imperialist competitive algorithm for flexible job-shop scheduling problem [J]. Journal of Computer Applications, 2018, 38(7): 1882-1887.)

[16] 杨小东, 康雁, 柳青, 等. 求解作业车间调度问题的混合帝国主义竞争算法[J]. 计算机应用, 2017, 37(2): 517-522, 552. (YANG X D, KANG Y, LIU Q, et al. Hybrid imperialist competitive algorithm for solving job-shop scheduling problem[J]. Journal of Computer Applications, 2017, 37(2): 517-522, 552.)

[17] 刘帅, 刘长良. 基于帝国竞争算法的主汽温控制系统参数优化研究[J]. 系统仿真学报, 2017, 29(2): 368-373. (LIU S, LIU C L. Cascade PID parameter optimization of main steam temperature control system based on imperialist competitive algorithm[J]. Journal of System Simulation, 2017, 29(2): 368-373.)

[18] LIU S, LIU C. Scale-varying dynamic time warping based on hesitant fuzzy sets for multivariate time series classification[J]. Measurement, 2018, 130: 290-297.

猜你喜欢
风电机组
关于风电机组润滑部位及用油选择的探讨
基于S能量熵的直驱式风电机组故障诊断方
数据挖掘在风电机组运维成本控制中的应用
基于实践应用的风电机组测试与认证教学改革
风力发电机组电气与控制系统快速检修思路探索
风电工程风电吊装技术要点分析
风电机组典型事故及预防措施分析
韭菜坪风电场运行分析
风电机组振动监测与故障诊断研究
风电机组塔架优化设计系统分析