唐明珠 匡子杰 吴华伟 胡嘉豪 毛学魁 彭巨
摘 要:针对风力发电机组变桨系统故障诊断模型参数难以优化问题,提出了基于状态转移算法优化多类最优间隔分布机(multi-class Optimal Margin Distribution Machine optimized by the State Transition Algorithm,mcODM-STA)的风电机组变桨系统故障诊断方法. 该方法选择风电机组功率输出作为主要状态参数,利用Pearson相关系数对风电数据采集与监视控制系统中风电机组历史运行数据进行相关性分析,剔除与功率输出状态参数相关性较低的特征,对余下特征进行二次分析,减少样本特征. 将数据集分为训练集和测试集,训练集用来训练所提故障诊断模型,测试集用来进行测试. 利用国内风電场实际运行数据进行实验验证. 实验结果表明,与其他多种参数优化方法相比,所提方法故障诊断准确率和Kappa系数更高.
关键词:多类最优间隔分布机;状态转移算法;故障检测;风电机组;SCADA 系统;进化算法
中图分类号:TK83 文献标志码:A
Fault Diagnosis of Wind Turbine Pitch System Based on Multi-class Optimal
Margin Distribution Machine Optimized by State Transition Algorithm
TANG Mingzhu1,KUANG Zijie1,WU Huawei2?,HU Jiahao1?,MAO Xuekui3,PENG Ju4
(1. School of Energy and Power Engineering,Changsha University of Science & Technology, Changsha 410114,China;
2. Hubei Key Laboratory of Power System Design and Test for Electrical Vehicle,Hubei University of
Arts and Science,Xiangyang 441053,China;3. State Grid Beijing Haidian Electric Power Supply Company,Beijing 100195,China;
4. Inner Mongolia Qingdianyun Power Service Co,Ltd,Baotou 014030,China)
Abstract:Aiming at the problem that the parameters of fault diagnosis model are difficult to be optimized of wind turbine pitch system, a fault diagnosis method of wind turbine pitch system based on multi-class optimal margin distribution machine optimized by the state transition algorithm (mcODM-STA) is proposed. In this method, the wind turbine power output is selected as the main state parameter, and Pearson correlation coefficient is used to analyze the historical operation data of wind turbine in wind power data acquisition and monitoring control system, and the features with low correlation of power output state parameters are eliminated. The remaining features are analyzed twice to reduce the sample features. The data set is divided into training set and test set. The training set is used to train the proposed fault diagnosis model, and the test set is used for testing. The operation data of a domestic wind farm is used for experimental verification. Experimental results show that the proposed method has higher fault diagnosis accuracy and Kappa coefficient than other parameter optimization methods.
Key words:multi-class optimal margin distribution machine; state transition algorithm;fault detection;wind turbines;SCADA systems;evolutionary algorithms
风力发电机组通常运行在复杂多变的不稳定自然环境中,常年受到阳光、雨水、风沙等侵蚀,存在许多故障隐患,其主要零部件运行于高空,一旦风电机组因故障而引起长时间停机,将严重影响发电量和花费大量成本来维护检修及更换零件,引起巨大的经济损失[1].
变桨距系统是风电机组中的重要部分,及时有效地对变桨系统进行状态监测和故障诊断具有重要意义. 近年来基于机器学习的风电机组故障诊断方法获得广泛应用,利用风电数据采集与监视控制系统(Supervisory Control and Data Acquisition,SCADA)中数据构建风电机组变桨系统故障诊断模型[2]. 基于机器学习的故障诊断方法有:神经网络方法[3]、支持向量机、大间隔分布机等. 文献[4]针对风力发电机组的故障诊断,提出一种基于数据驱动的深层神经网络方法,该方法不需要物理模型经验和预先筛选数据对风电机组进行故障诊断,诊断准确率高. 文献[5]利用人工神经网络对风力发电机主轴承进行早期故障预测获得了较好的诊断效果. 文献[6]提出一种基于雷达图和支持向量机的方法对风电机组变桨系统进行故障诊断与预测,提升了预测精度.
大间隔分布机(Large Margin Distribution Machine,LDM)是由Zhang等人[7]于2014年提出的分类学习算法,其思想在优化最小间隔最大化超平面的基础上,平衡分类样本均值与方差,充分考虑样本的间隔分布,相较于支持向量机拥有更好的分类效果和泛化性能. 文献[8]针对大型风电机组数据分类不平衡和误分类不平等代价等问题,提出了代价敏感型大间隔分布机,在解决这些问题的同时提升了故障诊断准确率. 文献[9]提出了多类最优间隔分布机(multi-class Optimal Margin Distribution Machine,mcODM).
在基于机器学习对风电机组进行故障诊断的过程中,选择机器学习算法的最优参数以提高故障诊断性能,利用进化算法优化故障诊断模型超参数. 文献[10]提出了一种新的BP神经网络(Back Propagation Neural Network,BPNN)异常识别模型,并与遗传算法相结合,为风电机组的异常识别取得了良好的效果. 文献[11]采用粒子群优化算法对多类最小二乘支持向量机进行特征参数优化,实现了拥有较高准确率的风电机组变桨系统故障预测.
状态转移算法(State Transition Algorithm,STA)是一种适用于优化大规模复杂问题的智能随机全局优化算法[12],该算法的4个状态转移算子通过交替轮换的方式进行全局搜索,可快速获得全局最优解. 针对结构复杂、故障多样的风电机组变桨系统,利用状态转移算法对其进行故障诊断模型参数优化是具有相当优势的.
本文针对风电机组变桨系统故障诊断模型参数难以优化问题,提出了基于STA优化的多类最优间隔分布机故障诊断模型,以提高故障诊断性能.
1 多类最优间隔分布机
设一个特征的集合为X = [x1,…,xk],其对应的类别标签集为Y = [K],其中[K] = {1,…,k};给定一个训练集S = {(x1,y1),(x2,y2),…,(xm,ym)};定义一个映射函数φ,通过核函数κ将样本集映射至高维空间φ:X→H,对应权向量为ω1,…,ωk. 对每个权向量ωl定义一个记分函数ωT
lφ(x),每个样本的特征值和其对应的标签,会使得该样本的记分函数值达到最大,即h(x) = argmaxl∈Y ωT
lφ(x),从而引出间隔定义:
γh(x,y) = ωT
yφ(x) - ωT
lφ(x) (1)
当计算产生一个负间隔时分类器分类错误.
用γ表示间隔的平均值,最优间隔分布机可表示为:
Ω(ω) - ηγ + (ξ2
j + ε2
j)
s.t. γh(xj,yj) ≥ γ - ξj
γh(xj,yj) ≤ γ + εj,?j (2)
式中:Ω(ω)是正则项;η和λ是平衡参数;ξj和εj分别是间隔γh(xj,yj)与间隔均值γ的正、负偏差;(1/m)(ξ2
j + ε2
j)为方差.
对ω进行缩放,间隔均值可以固定为1,样本(xj,yj)与间隔均值的偏差为γh(xj,yj)-1,该最优间隔分布机可改写为:
Ω(ω) +
s.t. γh(xj,yj) ≥ 1 - θ - ξj
γh(xj,yj) ≤ 1 + θ + εj,?j (3)
式中:τ∈[0,1)是平衡两种不同偏差的参数(大于或小于间隔均值);θ∈[0,1)是零损失参数,它可以控制支持向量的个数,即解的稀疏性;(1 - θ)2是将上述第二项成为0~1损失的替代损失.
对于多分类问题,正则项Ω(ω)=‖wl‖2
H/2,结合间隔定义,mcODM表达式为:
‖wl‖2
H +
s.t. ωT
yjφ(xj)-ωT
lφ(xj)≥1-θ-ξj
ωT
yjφ(xj)-ωT
lφ(xj)≤1+θ+εj,?j (4)
式中:λ、τ和θ是平衡参数.
2 状态转移算法
状态转移算法表达形式如下:
xk+1 = Ak xk + Bkuk
yk+1 = f(xk+1) (5)
式中:xk = [x1,x2,…,xn]T为当前状态;Ak或Bk为状态转移矩阵;uk为历史状态和当前状态的函数;f(·)是适应度函数.
状态转移算法包含旋转变换算子、伸缩变换算子、平移变换算子和坐标变换算子.
1)旋转变换算子为:
xk+1 = xk + αRr xk (6)
式中:α > 0为旋转因子,是一个正常数;Rr∈Rn × n是一个随机矩阵,其中的元素在[-1,1]上服从均匀分布;‖·‖2为向量的二范数. 旋转变换算子在以α为半径的超球内进行搜索,是有着局部搜索能力的搜索算子.
2)平移变换算子为:
xk+1 = xk + βRt (7)
式中:β > 0为平移因子;Rt∈R的取值范围为[0,1],满足均匀分布. 平移变换算子作为启发式搜索算子,能沿着直线从点xk-1到点xk以β为最大长度进行搜索.
3)伸缩变换算子为:
xk+1 = xk + γRe xk (8)
式中:γ > 0为伸缩因子;Re∈Rn × n是一个对角矩阵,它的元素取值为非零,且服从高斯分布. 伸缩变换算子属于全局搜索算子,能将xk中的每个元素伸缩到(-∞,+∞)整个范围内,实现整个空间的搜索.
4)坐标变换算子为:
xk+1 = xk + δRa xk (9)
式中:δ > 0为坐标因子;Ra∈Rn × n是一个稀疏随机对角矩阵,它的元素取值非零,且服从高斯分布. 坐标变换算子能够沿着坐标轴方向搜索,是一种启发式搜索算子,具有较强的单维度搜索能力.
3 风电机组变桨系统故障诊断
在风力发电机组变桨系统的故障诊断工作中,SCADA数据包含着能有效反映变桨系统特性的状态参数,但SCADA系统具有特殊性,涉及到变桨系统的参数不仅复杂多样,而且相互间存在强耦合性. 因此,在进行故障特征选择时,优化模型复杂度,减少计算时间和计算量,选择有效的状态参数,考虑冗余项,删除多余特征,避免模型过拟合是有必要的. mcODM-STA的风电机组变桨系统故障诊断方法流程如图1所示.
3.1 数据清洗与预处理
风力发电机组变桨系统的数据包含了机组正常运行时刻、变桨系统故障时刻的传感器监测数据. 由于实际运行工况中存在不稳定环境因素、传感器异常等影响,导致出现信息处理出错、数据缺失、数据异常等问题,因此,需要对获取的原始数据的所有变量进行去除“0”值、空值和归一化等清洗与预处理.
根据变桨系统的机理分析可知,当变桨系统故障时,最终影响的主要状态参数是机组的功率输出. 因此进行特征选择时,可通过Pearson相关系数[13]将其他风电机组运行参数与机组功率输出做相关性分析,删除与变桨系统相关度较低的参数. 为进一步降低样本规模,减少模型计算复杂度,避免模型过拟合,将第一次筛选出来的状态变量进行了第二次Pearson相关性分析,以更精确地删除部分相关性较高的参数和剔除冗余量.
3.2 改进多类最优间隔分布机
mcODM中有3个参数需要优化,分别为间隔方差平衡参数λ、间隔偏离平衡参数τ和不敏感损失参数θ,每个参数所表示的作用以及取值范围如表1所示.
在使用STA优化mcODM模型参数过程中,以模型输出的多分类测试的准确率作为适应度值,决定选择和更新当前最优解. 若准确率高于当前最优状态的准确率,新的参数将被作为更优解,若准确率低于当前最优状态准确率,则放弃该状态向量,进行下一轮迭代.
改进的多类最优间隔分布机的适应度函数的构造以及当前最优状态解的选择和更新伪代码如算法1所示.
算法1 改进多类最优间隔分布机参数设置
1:Best←Best0(λ0;τ0;θ0)
2:repeat
3:if α←αmin then
4:α←αmax
5:end if
6:λ←Best(1)
7:τ←Best(2)
8:θ←Best(3)
9:mcODM←(λ,τ,θ,訓练集)
10:accuracy(mcODM)←测试集
11:funfcn←accuracy(mcODM)
12:Best←伸缩变换(funfcn,Best,SE,β,γ)
13:Best←伸缩变换(funfcn,Best,SE,β,α)
14:Best←伸缩变换(funfcn,Best,SE,β,δ)
15:α←
16:until 达到最大迭代次数或精度满足要求
17:输出Best
3.3 故障诊断性能评价标准
为验证改进的多类最优间隔分布机在风电机组故障诊断中的有效性,将改进的多类最优间隔分布机同采用网格搜索法(Grid Search Algorithm,GS)、遗传算法(Genetic Algorithm,GA)和粒子群优化算法(Particle Swarm Optimization Algorithm,PSO)优化的多类最优间隔分布机分别应用到由变桨主电源故障、桨叶伺服器驱动温度超限故障、变桨系统急停故障、变桨系统超级电容电压过低故障组成的三类(变桨主电源故障、桨叶伺服器驱动温度超限故障、变桨系统急停故障)、四类(变桨主电源故障、桨叶伺服器驱动温度超限故障、变桨系统急停故障、变桨系统超级电容电压过低故障)的多类风电机组变桨系统故障中.
将总体分类准确率作为评价指标,同时引入Kappa系数作为另一项评价指标控制实验结果的偏向性. Kappa系数表达式如下:
k = (10)
式中:p0為每一类正确分类样本数量之和除以总样本数,即总体分类准确率;pe为所有类别分别对应的“实际数量与预测数量的乘积”的总和,除以“样本总数的平方”.
4 实验分析
4.1 数据描述
实验采用的是风电场一年内实际运行的数据. 该风电场共有33台1.5 MW变速变桨风电机组,每台机组通过传感器与监控中心相连,数据采样间隔为2 s,采集数据储存于数据库中,部分原始数据如表2所示.
4.2 选择样本特征
将上述状态参数的原始数据先做数据清洗,剔除包含“无数据”和所有状态变量都为“0”的值的变量,归一化处理后,利用Pearson相关系数分别与输出功率做相关性计算,各参数与功率输出相关性计算结果如表3所示.
从表3的相关性结果可以看出,这些状态参数中,部分变量与输出功率的相关性较低. 根据Pearson相关系数的性质,剔除相关系数绝对值小于0.55的中等程度相关的变量,保留其他绝对值大于0.55的变量作为该故障的主要影响因素(如表3中加粗的部分)并进行第2次Pearson相关系数的计算,找出相关性较大的冗余参数,对样本容量进行约简. 状态参数间相关性计算结果如表4所示.
分析表4的部分计算结果可以得出,不同部位的相同状态参数之间的相关性也很高,如叶片1偏角和桨距角1的相关系数接近1,变桨电机温度2和变桨电机温度1相关系数同样接近1,由于这些状态参数在反映变桨系统的运行状况时,作用基本相同,因此,结合表3和表4的相关性结果,剔除冗余参数,将余下的状态参数构建样本特征集.
4.3 实验结果
实验中的4种变桨距系统故障数据如表5所示.
当实验总样本为变桨主电源故障、桨叶伺服器驱动温度超限故障、变桨系统急停故障三类故障时,图2为总体故障诊断准确率盒形图,表6为Kappa系数值对比结果.
由图2和表6可知,基于状态转移算法的改进多类最优间隔分布机对于三类风电机组变桨系统故障的诊断准确率最高,Kappa系数值也高于其他3种故障诊断方法.
当实验总样本为变桨主电源故障、桨叶伺服器驱动温度超限故障、变桨系统急停故障、变桨系统超级电容电压过低故障四类故障时,图3为总体故障诊断准确率盒形图,表7为Kappa系数值对比结果.
由图3和表7可知,基于状态转移算法的改进多类最优间隔分布机对于四类风电机组变桨系统故障的诊断准确率最高,Kappa系数值也高于其他3种故障诊断方法.
5 结 论
针对风力发电机组变桨系统故障诊断模型参数难以优化问题,使用状态转移算法对多类最优间隔分布机的3个参数进行优化,将改进的多类最优间隔分布机同采用网格搜索法、遗传算法和粒子群优化算法的多类最优间隔分布机进行对比,实验数据选择多种不同类型的变桨系统故障样本,分别组合成三类、四类的形式,评价指标为总体分类准确率和Kappa系数. 对比结果表明,改进的多类最优间隔分布机对于多类变桨系统故障的诊断性能强,相对于其他三种调参方法生成的模型,拥有更高的总体故障分类准确率,Kappa系数值更高,表明了基于改进多类最优间隔分布机的风电机组变桨系统故障诊断方法的良好的性能.
在风电机组的故障诊断工作中,由于机组的工作环境、负载等多种因素的影响,其运行工况复杂多变,导致很多情况下难以达到对整机的故障诊断要求. 因此,针对变工况条件下风力发电机组整机的状态监测与故障诊断研究,能有效降低机组故障发生率,提高机组运行稳定性.
参考文献
[1] CHEN J C,WANG F,STELSON K A. A mathematical approach to minimizing the cost of energy for large utility wind turbines[J]. Applied Energy,2018,228:1413—1422.
[2] 熊中杰,邱颖宁,冯延晖,等. 基于机器学习的风电机组变桨系统故障研究[J]. 太阳能学报,2020,41(5):85—90.
XIONG Z J,QIU Y N,FENG Y H,et al. Fault analysis of wind turbine pitch system based on machine learning[J]. Acta Energiae Solaris Sinica,2020,41(5):85—90. (In Chinese)
[3] 袁小芳,王耀南,孙炜,等. 一种用于RBF神经网络的支持向量机与BP的混合学习算法[J]. 湖南大学学报(自然科学版),2005,32(3):88—92.
YUAN X F,WANG Y N,SUN W,et al. A hybrid learning algorithm for RBF neural networks based on support vector machines and BP algorithms[J]. Journal of Hunan University (Natural Sciences),2005,32(3):88—92. (In Chinese)
[4] YU D,CHEN Z M,XIAHOU K S,et al. A radically data-driven method for fault detection and diagnosis in wind turbines[J]. International Journal of Electrical Power & Energy Systems,2018,99:577—584.
[5] ZHANG Z Y,WANG K S. Wind turbine fault detection based on SCADA data analysis using ANN[J]. Advances in Manufacturing,2014,2(1):70—78.
[6] XIAO C,LIU Z J,ZHANG T L,et al. On fault prediction for wind turbine pitch system using radar chart and support vector machine approach[J]. Energies,2019,12(14):2693.
[7] ZHANG T,ZHOU Z H. Large margin distribution machine[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York,USA:Association for Computing Machinery,2014:313—322.
[8] TANG M Z,DING S X,YANG C H,et al. Cost-sensitive large margin distribution machine for fault detection of wind turbines[J]. Cluster Computing,2019,22(3):7525—7537.
[9] ZHANG T,ZHOU Z H. Multi-class optimal margin distribution machine[C]//Proceedings of the 34th International Conference on Machine Learning. Sydney:Proceedings of Machine Learning Research,2017:4063—4071.
[10] ZHANG Y Y,ZHENG H B,LIU J F,et al. An anomaly identification model for wind turbine state parameters[J]. Journal of Cleaner Production,2018,195:1214—1227.
[11] LIANG T,ZHANG Y J. Variable pitch fault prediction of wind power system based on LS-SVM of parameter optimization[C]// Proceedings of 2017 Chinese Intelligent Automation Conference. Singapore:Springer,2017:303—312.
[12] ZHOU X,YANG C,GUI W. State transition algorithm[J]. Journal of Industrial Management Optimization,2012,8(4):1039—1056.
[13] KALAISELVI B,THANGAMANI M. An efficient Pearson correlation based improved random forest classification for protein structure prediction techniques[J]. Measurement,2020,162(10):1—9.