王 宇,李玉鹏,赵志华
(中国矿业大学 矿业工程学院工业工程系,江苏 徐州 221116)
机械产品被广泛应用于各种复杂、严苛的环境中,功能和结构趋于复杂化[1]。机械产品在其生命周期内,在外界环境(如:温度、湿度)的压力下,功能模块可能出现性能退化,当退化达到一定程度时,将导致相关功能故障、失效,最终影响产品的正常使用[2],甚至带来重大经济损失[3]。复杂机械产品的可靠性和维护效果是满足企业实际生产需求的重要保障,为了防止其在运行过程中出现急剧退化、降低维修成本、保障正常运行,产品性能退化评估显得尤为重要[4-5]。
作为产品健康运作和剩余寿命评估的关键步骤,产品性能退化评估成为近年来的一个研究热点。当前,性能退化的评估方法主要分为基于内部机理分析的评估方法和数据驱动的评估方法两类。
基于内部机理分析的评估方法采用多学科理论技术对产品内部功能模块相互耦合关系进行建模,从而反应其行为变动和性能变化。Hanachi等[6]提出一种基于物理模型的性能退化监测建模方法,通过热损失指数和功率损耗指数两个性能指标表征燃气轮机发动机的性能退化程度;Zhao等[7]对直齿圆柱齿轮构建分子动力学模型,探索了齿根裂纹萌生与扩展的机制,分析了导致齿轮断齿的裂纹特性和行为,为研究风力机齿轮工况更为复杂的断齿机理提供参考;Wang等[8]基于有限元法对光伏组件的物理场进行模拟,将获得的模组温度和湿度作为失效物理模型,从而构建性能退化率,并结合输出功率建立了考虑环境因素和耦合影响的输出功率退化模型,来评估光伏组件的退化程度;李慧乐[9]将车桥耦合振动理论引入桥梁疲劳分析,建立了考虑列车与桥梁之间动力相互作用的桥梁疲劳损伤及剩余寿命评估框架,提出一种基于车桥系统随机振动分析的桥梁疲劳可靠度的评估方法。基于内部机理分析的产品性能退化评估方法可以对产品各系统和功能模块作出详细的物理解释,但是其通常需要充分的先验知识和多学科知识,需要耗费大量的人力、时间成本,建模过程较为复杂且难以根据特定的机械产品精确地建立物理模型。因此,基于实时监测数据的智能学习技术成为复杂机械产品性能退化评估与预测的有效方法[10]。
数据驱动的产品性能退化评估方法通过分析产品的运行状态信息来评估退化程度[11]。复杂机械产品在运行过程中,大量的温度、压力、振动传感器等信息采集设备可持续采集和记录产品功能模块状态数据[12],例如风电机组、航空发动机等,机械产品各子系统、功能模块或部件的状态信息均可通过传感器采集。Wang等[13]提出一种滚动轴承性能退化的健康监测与评估体系,分别利用卷积神经网络和长短时记忆网络提取局部鲁棒特征、序列信息和学习特征,定义H统计量来评估滚动轴承的健康状况;邓超等[14]基于维纳过程对机电设备进行多性能的退化预测,利用逼近理想解法和马氏距离对装备的运行状态进行评估;Zhang等[15]提出一种基于多特征融合的滚动轴承性能退化评估方法,利用谱回归对表征轴承正常状态的静电监测系统特征参数集进行降维处理,消除冗余,根据处理后的特征,建立高斯混合模型评估轴承的健康状况,并将贝叶斯推断得到的距离值作为评估性能下降的定量指标来提高静电监测系统的早期退化检测能力;杜海涛等[16]基于退化数据建立Gamma模型来表示产品的累积退化量,并结合退化对产品功能的影响程度来衡量产品的退化风险。Wei等[17]利用变分模态分解将电流信号分解为多个模态分量,利用随机森林算法对各模态分量的时域和频域特征进行分类,将变分模态分解和随机森林结合有效地评估主轴的性能退化。数据驱动的产品退化评估方法通常对产品多元性能监测参数进行特征提取和降维,构建模型。采用关键性能退化参数的失效阈值表征产品的退化程度,没有考虑产品功能模块监测参数之间的相关关系,且评估过程中一般假设退化规律已知,过程较为复杂。
在许多实际工程问题中,产品功能模块性能状态可由一个或多个性能监测参数表征,且功能模块之间存在不同程度的相关关系。产品功能模块之间信息流、能量流和物料流等不同形式的交互,使得性能监测参数之间存在非线性的相关关系,会对退化评估、可靠性分析等结果产生显著影响。因此,对产品性能进行退化评估时需考虑性能参数间的相关关系。产品性能存在退化趋势时,其运行过程中相关参数的实时监测数据相对于正常状态往往会产生偏离[10],数据驱动的退化评估方法重点识别并分析原始监测数据中少数发生偏离的数据,以达到退化评估的目的。离群点检测是数据挖掘领域的关键问题之一,其目的是发现较剩余对象存在异常的小规模目标群[18],来揭示系统的异常状态和行为[19]。离群点凭借其独特的机制和有价值的信息在专家系统和智能系统中发挥着重要作用[20],已经广泛应用于入侵检测[21]、图像处理[22]、医疗[23]、设备健康监测[24]等领域;同时,离群点检测方法的研究相对较为成熟,可以处理数值型[25]、字符型[26]、混合型[27]等不同类型的数据。基于邻域粗糙集的离群点检测[20,28]方法可以有效地揭示样本数据点之间的相关关系,离群点的离群得分可用于表征产品性能的退化程度。因此,产品性能退化评估从本质上可以看作是一类离群点检测问题。
综上所述,本文将离群点检测引入产品性能退化评估,首先基于邻域粗糙集理论和功能结构关联性确定性能监测参数之间的相关关系;然后基于信息熵表征某一特定性能监测参数的不确定性程度,结合性能监测参数之间的相关关系所包含的知识构建退化评估指标,最终得到每个监测参数的退化得分;最后,采用主成分分析法对性能监测参数赋予权重,从而得到功能模块的综合退化得分。
粗糙集能够对知识进行分析与推理,有效处理各种模糊、不一致、不完备的信息,不需要先验知识,基于问题本身的数据集潜藏的规则,提炼出有价值的信息,并简化处理信息[29],将粗糙集理论引入产品性能退化评估问题可提高推理效率。邻域粗糙集不同于传统粗糙集,可以同时处理连续和离散数据集。
在信息系统IS=(U,Q,V,f)中:U={u1,u2,…,un},表示对象的非空有限集合;Q表示属性的非空有限集合;V表示属性的值域;f作为一种映射关系反映对象集合之间的值,表示为:f(ui,q)∈Vq,∀q∈Q。距离是两个数据系统中构造邻域粗糙集的基本工具。
对于任意集合U的对象,基于距离函数的邻域定义为:
N(ui)={y∈U|d(ui,uk)≤r}。
(1)
其中:当r≥0时被称为邻域半径;N(ui)表示基于距离公式与对象ui距离不超过r的元素,任意对象的邻域均由距离函数和邻域半径共同决定和表示,用于描述对象在距离上的不可区分性。集合U中对象的邻域关系表示为:
NR={(ui,uk)∈U×U|d(ui,uk)≤r}。
(2)
基于离群点检测的产品性能退化评估方法主要分为两个步骤:①挖掘性能参数间的相关关系;②构建评估产品功能模块的退化指标,具体内容如图1所示。
(3)
为了降低性能监测参数间相关关系对退化评估结果的影响,本文同时基于邻域粗糙集理论及产品功能结构关联性确定性能监测参数之间的相关关系。
(1)基于邻域粗糙集理论
从数据挖掘的角度,基于邻域粗糙集理论可以有效地揭示数据点之间的客观关系。性能监测参数pi在第j个监测时间段内的邻域为:
i,k=1,2,…,n,j=1,2,…,m。
(4)
性能监测参数之间的邻域关系记作:
(5)
(2)基于功能结构关联性
产品功能模块之间通常在功能、结构等方面存在一定的相关关系。产品的内部结构很大程度上取决于产品的设计原理和所要实现的功能,根据其工作原理的不同改变产品内部结构,从而使产品的外部造型产生差异。产品在运行过程中,各功能模块之间不是孤立存在的,功能模块之间的信息流、能量流和物料流等会使性能监测参数之间存在不同程度的相互影响关系,这一部分参照产品的设计原理或由相关设计人员给出,即
N(pi,pk)=
(6)
则性能监测参数之间的关联性记作:
LRj={(pi,pk)∈P×P|N(pi,pk)=1}。
(7)
综上所述,同时考虑基于邻域粗糙集理论和功能结构关联性确定性能监测参数之间的邻域关系和关联性,性能监测参数之间的相关关系表示为:
CRj={NRj∪LRj}。
(8)
假设性能参数之间的相关关系所包含的知识为:
(9)
信息熵用来度量信息量的不确定程度,基于性能参数相关关系的信息熵能够很好地描述相关关系中知识的不确定性,即
(10)
为了探索某一特定性能参数pi对整个产品性能参数集P中信息量不确定性的影响程度,首先从P中移除某一产品性能参数pi,然后按照式(3)~式(8)重复以上步骤,获得(P-{pi})之间的相关关系CRj′(pi)。参照式(9),假设剩余性能参数相关关系所包含的知识为:
l′=1,2,…,n-1。
(11)
则基于剩余产品性能参数相关关系的信息熵可表示为:
(12)
基于剩余产品性能参数(P-{pi})相关关系的信息熵INEj(pi)完全参照基于性能参数P相关关系的信息熵INEj的表达式,能够很好地反映pi的不确定性程度。系统总是朝着熵增或不变的方向发展,当移除某一性能参数pi后,若INEj(pi)相比INEj减小,则说明pi有较高的不确定性偏离大多数值;若INEj(pi)相比INEj增大或不变,则pi有较低的不确定性偏离大多数值。为此,构建相对信息熵来反映INEj和INEj(pi)之间熵的变化,即:
RINEj(pi)=
(13)
基于参数相关关系的相对信息熵RINEj(pi)可以同时测量某一产品性能参数pi的不确定性和偏离大多数值的程度,RINEj(pi)值越大,pi的不确定性和偏离程度越大。但对于产品性能的退化评估,基于性能监测参数相关关系的相对信息熵是充分非必要条件。为此,引入基于性能参数相关关系的相对基数来改进这一参数:
(14)
(15)
DNDj(pi)能够更好地反应某一产品性能参数pi在监测时间段内偏离正常范围的程度,即退化程度。综合考虑多个监测时间段,产品性能参数的退化得分被定义为:
(16)
产品运行过程中,功能模块的性能通常可以由一组可持续动态监测的性能参数集合来描述,且不同功能模块的性能处于不同的退化状态中。每个功能模块的性能状态可以由一个或多个性能参数直接或间接反应,由于各性能参数对相应功能模块功能实现的贡献大小不同,当产品的退化程度由多个性能监测参数反映时,采用单个关键性能参数对产品进行退化评估可能会忽略其他性能参数蕴含的信息,导致评估结果不够准确。因此,基于主成分分析法对性能监测参数赋予权重,全面考虑产品各功能模块对应的多个性能监测参数从而得到各功能模块的退化得分。
假设产品C包含A个功能模块,每个功能模块Fa(a=1,2,…,A)可由一个或多个性能参数表征其功能的实现,则产品功能模块退化得分
a=1,2,…,A。
(17)
式中Na、DDpi(Fa)和Gpi(Fa)分别表示与第a个功能模块对应的性能监测参数的总个数、退化得分和权重。基于离群点检测的产品性能退化评估方法伪代码如下:
算法1基于离群点检测的产品性能退化评估方法。
输入:产品性能监测参数原始数据集n×m;
输出:产品各功能模块的退化得分。
//数据标准化处理
1:For i=1 to n
2:For j=1 to m
4:End for
5:End for
//产品性能监测参数的相关关系CRj
6:For i=1 to n
8:LRj←{(pi,pk)∈P×P|N(pi,pk)=1}
9:CRj←{NRj∪LRj}
10:End for
//计算功能模块退化程度
11:For i=1 to n
13:DNDj(pi)←
14:End for
15:For j=1 to m
17:End for
18:For i=1 to A
20:End for
风电机组通过风轮把风作用在桨叶上的力转化为自身的转速和扭矩,通过主轴、增速箱、联轴器和高速轴将扭矩和转速传递到发电机,实现风能到机械能再到电能的转换。风电机组由传动系统、偏航系统、刹车系统、支撑系统、冷却润滑系统和电控系统6大系统组成,通常运行在变风载、大温差、高海拔、强沙尘、台风等恶劣的工况下,随着运行时间的增加,机组会出现不同程度退化,极大地影响使用寿命[30]。当各子系统功能退化到一定程度将造成机组停机,机组停机时间过长则会严重影响发电量,且其安装、维护困难,运营成本、维护费用高[31]。因此,对风电机组各系统功能模块的退化评估极为重要,企业可根据评估结果对相应的功能模块按退化程度显著程度采取维护、保养、维修或更换等措施,从而保证机组的正常运行。本节将以风电机组性能退化评估为例验证所提方法的有效性。
表1 R80711风电机组性能监测参数
续表1
续表1
R80711风力发电机组性能退化评估具体步骤如下:
步骤1首先取1 000条数据(1月份)计算R80711风电机组性能监测参数之间的相关关系。
(1)基于邻域粗糙集理论的性能监测参数邻域关系随运行时间与所取参数值确定,如某时段内的参数邻域关系如表2所示。
表2 基于邻域粗糙集理论的R80711风电机组性能参数邻域关系
(2)基于功能结构关联性的性能监测参数相关性不随运行时间而变化,如表3所示。
表3 基于功能结构关联性的R80711风电机组性能参数关联性
续表3
由式(8)得出的性能参数相关关系随运行时间与所取参数值确定,如某时段内的参数相关关系如表4所示。
表4 某时段R80711风电机组性能参数相关关系
步骤2各性能参数退化得分如表5所示。
表5 R80711风电机组各性能参数退化得分
步骤3主成分分析法确定各功能模块相应性能参数的权重如表6所示。
表6 R80711风电机组各性能参数权重
续表6
步骤4根据式(17)得到各功能模块的退化程度,如表7所示。
表7 基于离群点检测的R80711风电机组各功能模块的退化得分
为直观地看到各功能模块的退化得分,将表7的结果绘制成点线图,如图2所示。
如图2所示,桨叶的退化得分最高,为0.706 572 5;其次为变矩器,退化得分为0.670 305。风力发电是将风的动能转变成机械动能,再将机械能转化为电力动能,当风吹向浆叶时,桨叶上产生气动力驱动风轮转动,从而将风的动能转变为机械能;变矩器的作用是保证在风轮转速变化时,发电机的输出轴转速恒定。因此,在该月检修中应重点关注桨叶和变矩器。
(1)首先选取不同时段内的R80711风电机组运行状态对其各功能模块进行退化评估。表8所示为R80711风电机组各功能模块(变矩器、齿轮箱、发电机、轮毂、机舱、变速箱、转子轴承和桨叶)在不同月份的退化得分。为了便于比较各功能模块在不同时段的退化得分,将表9的结果绘制成点线图,如图3所示。
表8 不同时段R80711风电机组各功能模块的退化得分
风电机组属于寿命长、高可靠性的复杂机械产品,在其生命周期内,各功能模块的退化程度应趋于稳定(如图3),1~2月份各功能模块的退化得分波动略大,2月之后各功能模块的退化得分趋于稳定,波动较小,该结果与现状相吻合,一定程度上说明了所提方法的可行性。
(2)基于邻域粗糙集理论从数据挖掘的角度揭示了性能参数之间的邻域关系,基于性能参数邻域关系的R80711风电机组各功能模块的退化得分如表9所示。
表9 基于性能参数邻域关系的R80711风电机组各功能模块的退化得分
将表7和表9的结果乘以104绘制成点线图(如图4),以比较基于性能参数相关关系和邻域关系的R80711风电机组各功能模块的退化得分。
如图4所示,基于性能参数相关关系和邻域关系求得的R80711风电机组各功能模块的退化得分排序相同,即桨叶、变矩器、变速箱、齿轮箱、发电机、轮毂、转子轴承、机舱,但是基于性能参数邻域关系求得的各功能模块的退化得分小于基于性能参数相关关系的评估结果,会导致评估信息不准确,高估产品的可靠性。基于离群点检测的产品性能退化评估同时考虑性能参数之间的邻域关系和功能结构关联性导致的参数相关关系,评估信息更加全面,结果也更接近实际情况。
(3)数据驱动的产品退化评估方法通常对产品多元性能监测参数进行特征提取和降维,构建模型,通过单个关键性能退化参数(即任何一个性能参数退化至阈值时产品即发生失效)表征产品的退化程度。文献[5]定义性能指数来量化风电机组性能状态的异常程度,通过分析性能异常点,基于高斯Copula熵估计互信息值来衡量性能监测参数与性能指数之间相关性的强弱,互信息值越大,说明该性能监测参数与性能指数的相关性程度越高,以确定关键性能参数,并将其映射到风电机组对应的功能模块,从而表征功能模块的评估结果。当产品功能模块的退化表征在一个参数上时,采用单个关键参数反应该功能模块的退化较为合理,但实际中存在多个性能参数的产品功能模块(如表1),齿轮箱、发电机和桨叶均对应多个性能监测参数,现将采用单个关键参数和考虑多性能参数得到的齿轮箱、发电机和桨叶的退化得分进行对比,如图5所示。
桨叶的性能状态表征在2个性能参数上,除1月份外,其他各月份采用单个关键性能参数和考虑多个性能参数得到的退化结果相差不大;发电机的性能状态表征在5个性能参数上,采用单个关键性能参数得到的退化结果明显大于考虑多个性能参数得到的退化结果。由于各功能模块的退化趋势不一定一致,当表征功能模块退化程度的性能参数较少时,采用单个关键性能参数和考虑多个性能参数得到的退化结果可能相差不大,但当表征功能模块退化程度的性能参数较多时,采用单个关键性能参数得到的结果往往会大于考虑多个性能参数得到的退化结果。因此,对于具有多个性能退化参数的产品功能模块而言,是否考虑多个性能参数对于评估结果影响很大,基于单个关键性能参数评估得到的功能模块退化得分高于综合考虑多个性能参数得到的结果,采用单一性能参数会人为放大产品功能模块的退化程度,低估产品的可靠性,不符合实际情况。
(4)基于近邻度的方法在模式识别和数据挖掘中得到了广泛的讨论和应用,Chen等[32]将粗糙集粒度技术与离群点检测相结合,提出一种基于邻域的离群点检测方法。分别基于该方法与本文所提方法对R80711风电机组各功能模块进行评估,评估结果如图6所示。
本文所提方法考虑了性能参数之间的相关关系,且得到的评估结果位于[0,1]之间,可直接根据各功能模块的得分来判断其退化程度;基于邻域的异常点检测方法直接对未经处理原始数据进行计算,存在误差,得到的评估结果根据对象所取数值大小而定,无法直接根据对象的得分反应退化特性,且该方法计算较为简单,忽略了实时监测数据中存在的其他信息,导致评估结果不够全面。
本文将产品性能退化评估描述为基于异常定义区分的离群点检测问题,提出基于离群点检测的产品性能进行退化评估。基于邻域粗糙集理论、产品功能结构关联性,对产品运行状态实时监测数据进行分析,挖掘产品性能参数之间的相关关系,由此构建相应的退化指标用于鉴别相关功能是否存在退化乃至故障风险。考虑到实际应用中,产品功能模块的性能状态可能表征在多个性能监测参数上,且各参数对相应功能模块功能实现的贡献大小不同,利用主成分分析法对性能监测参数赋予权重,从而得到产品各功能模块的退化程度。以R80711风电机组为例,通过对比分析验证了所提方法的有效性。该方法不需要先验知识,用时少,有助于实现实时诊断、评估。但是,产品性能状态受运行工况的影响,如何在识别、划分运行工况的基础上,将离群点检测引入产品性能退化评估是下一步的研究方向之一。