大数据背景下相似性设备剩余寿命预测研究进展＊

2020-03-02 02:48朱晓燕陈志强

科技促进发展 2020年12期

■ 朱晓燕陈志强

中国科学院大学经济与管理学院北京 100190

0 前言

制造业是国家强盛的基础，我国作为世界公认的制造业大国，在载人航天、高铁装备、北斗卫星导航等领域取得了突出成就，然而与世界先进水平相比，我国制造业仍然大而不强。当今世界正经历新一轮科技革命和产业变革，我国制造业正处于由大变强、爬坡过坎的关键阶段，必须努力实现制造业质量大幅提升。故障预测与健康管理(Prognostics and health management,PHM)作为设备质量管理的核心技术，主要包括剩余寿命预测和维修方案两部分[1]。准确预测设备剩余寿命将为决策者提供充足的准备时间和洞见，更好维持设备高效稳定运行，避免设备突然失灵造成巨额失效损失。

根据预测过程中所运用的知识和技术，可以将设备剩余寿命预测方法分为3 类：基于失效机理的剩余寿命预测方法、基于数据驱动的剩余寿命预测方法和基于失效机理与数据驱动相融合的剩余寿命预测方法[2][3]。基于失效机理的剩余寿命预测方法通过研究设备失效背后的物理原理，构建数学模型进行剩余寿命预测。由于不同设备有着完全不同的失效机理，且很多情况下设备的失效机理难以获知，所以该方法不易推广。基于数据驱动的剩余寿命预测方法不需要对设备的失效机理进行物理分析，直接从数据中总结设备的失效规律，基于统计学、机器学习、相似性等知识和技术构建预测模型。

在工业大数据的时代背景下，基于数据驱动的剩余寿命预测方法能够精准预测设备剩余寿命,受到研究者越来越多的重视[3]。基于数据的剩余寿命预测方法可分为：基于统计学模型的剩余寿命预测方法、基于机器学习模型的剩余寿命预测方法、基于相似性的剩余寿命预测方法等[3][4]。基于统计学的剩余寿命预测方法根据设备历史数据建立概率模型，有着严谨的数学推导，可以有效刻画模型的不确定性，同时也需要满足较强的假设条件。基于相似性和基于机器学习的剩余寿命预测方法是新近兴起的剩余寿命预测方法，均不需要假设设备的退化模型，可以针对各种类型数据进行建模，具有应用灵活且易于推广的特点。

基于相似性的剩余寿命预测方法由辛辛那提大学Wang 等[5]最先提出，具有鲁棒性强、精度高的特点[6][7]。该方法的核心思想是：在相似的工况环境下工作的同类型产品将具有相似的失效机理。随着大数据和物联网技术的发展，设备各方面的运行数据可以通过传感器实时获取并记录，因此决策者可以得到失效设备完整生命周期的运行数据，以及当前服役设备的实时运行数据。那么根据相似性剩余寿命预测方法的核心思想，当前服役设备的剩余寿命可以通过分析该设备运行数据与已失效设备的历史运行数据之间相似性，找出其中相似性高的已失效设备，进而基于它们的失效数据估计当前设备的剩余寿命。

文献中针对基于统计学模型和机器学习模型的剩余寿命预测方法的综述较多[1][8]-[11]，而基于相似性的剩余寿命预测方法的文献综述较为匮乏。针对这一现状，本文将从健康指标(health index)构建、相似性度量选取、数据融合等方面，对基于相似性的设备剩余寿命预测方法进行梳理总结，比较分析其相应性质，并最终探讨该方法的未来研究方向。

1 基于相似性的设备剩余寿命预测方法

1.1 基本框架

基于相似性的设备剩余寿命预测方法由Wang 等[5]在2008年参加PHM 数据挑战赛提出的。该类方法不需要假设设备退化模型，可以对设备的剩余寿命进行实时预测，是一种简便实用的剩余寿命预测方法。基于相似性的剩余寿命预测方法的基本思想为同批次或同规格的同类型的设备，如果在相同或相似的工况下进行相似的工作，则它们的失效机理将具有相似性。因此基于相似性的剩余寿命预测方法一般需要满足如下前提条件：

（1）存在失效设备和服役设备两类设备，这两类设备来自同批次或者是同规格，且两类设备在相同或者相似的工况下运行；

（2）所有设备的运行数据都可被传感器实时监测，已失效设备全生命周期的运行数据已被实时监控并保存，服役设备的运行数据被实时监测并记录；

（3）已失效设备和服役设备的退化过程是连续的，且不考虑设备维修、中途更换等因素。

基于相似性的剩余寿命预测方法的基本框架如图1所示。基于相似性的剩余寿命预测方法主要可以分为3个步骤[12]。首先针对失效设备和服役设备的运行数据构建健康指标，健康指标可以直接反映设备的退化状态和退化轨迹，通过健康指标可以构建失效设备退化轨迹数据库，同时得到服役设备截止当前的退化轨迹；其次，选取合适的相似性度量，分析服役设备与失效设备之间退化轨迹的相似性，选取其中相似度高的失效设备作为预测服役设备剩余寿命的设备集合，其中每个设备都可获得一个针对服役设备的剩余寿命估计；最后，通过选取合适的权重函数或运用其他方法，结合各失效设备与服役设备之间退化轨迹的相似程度，整合得到当前服役设备剩余寿命的预测结果。

图1 基于相似性的剩余寿命预测方法基本框架

1.2 健康指标构建

在基于相似性的剩余寿命预测方法中，健康指标用以刻画设备的退化轨迹和退化状态，是准确预测设备剩余寿命的基石。健康指标可分为两种，直接健康指标和间接健康指标[13][14]。直接健康指标，又称物理健康指标，是有明确物理含义的信号，可以直接观测获取，比如叶片的蠕变长度、锂电池的容量退化、轮盘裂纹扩展的长度等。而间接健康指标，没有明确的物理含义，是通过数学方法从高维的设备运行数据中提取得到。大多数情况下，直接健康指标不易获得，因此学者对如何从设备运行数据中提取间接健康指标进行了大量研究[15]-[19]，主要运用到回归、降维、聚类、人工神经网络等方法。

在大数据背景下，设备通常装有众多传感器，因此设备运行数据维数较高，可以从中提取单个或者多个健康指标刻画设备的退化轨迹。根据模型中健康指标的数量，可以将基于相似性剩余寿命预测方法分为基于单健康指标和基于多健康指标的相似性剩余寿命预测方法。

1.2.1 单健康指标构建

单健康指标构建过程旨在从高维的设备运行数据中提取出一维的健康指标，用来反映设备的退化状态。Wang 等[5]最先采用多元线性回归方法构造健康指标，因为多元线性回归方法能有效地融合多传感器数据且最大限度地保留其原有的退化模式，所以被广泛应用于单健康指标的构建中[20]-[23]。然而多元线性回归方法在运行数据量纲和类型不一，运行数据存在多重共线性的条件下，模型误差较大。

对高维运行数据进行降维是构建单健康指标的常用方法，相比于多元线性回归方法，聚类方法更加灵活且容易与其它算法相结合。汤燕等[24]和Liu 等[25]运用主成分分析(Principal Component Analysis, PCA)对设备运行数据进行处理，并选取其中的第一主成分作为健康指标。张秋雁等[26]先通过PCA 对运行数据进行降维，然后用反向传播(back propagation,BP)神经网络训练得到健康指标，并将之应用于NASA 涡扇发动机仿真数据集。结果显示结合PCA 和BP 神经网络构建健康指标的方法精度高于传统的线性拟合方法。谷梦瑶等[27]综合使用主成分分析、支持向量数据描述(Support Ⅴector Data Description)和负向转换函数将多个退化数据合成为一个健康指标，并运用该方法实时预测陀螺仪的剩余寿命。

机器学习算法包含丰富的模型库，拥有处理大量、复杂数据的能力，因此也被广泛应用于单健康指标的构建中。Hou等[28]运用无监督机器学习方法—受限玻尔兹曼机(restricted Boltzmann machine)构建健康指标，并将基于相似性剩余寿命预测方法与双向长短期记忆人工神经网络相结合预测设备的剩余寿命。Liao 等[29]利用改进后的受限玻尔兹曼机和自组织映射提取健康指标。张妍等[30]用Relief 算法对多退化指标进行筛选，进而通过PCA 算法对筛选出的退化指标降维。Shi等[31]通过层次聚类构建健康指标，该方法不需要设置初始值，在失效状态数据缺失的情况下仍具有很强的鲁棒性。

此外，武斌等[32]通过相关性分析选取与设备寿命状态变化趋势相关性最大的传感器数据作为健康指标，应用于轴承寿命加速实验数据，精度相比传统方法有提高。Liang 等[33]和Liang 等[34]等根据设备的正常状态和运行状态之间偏移距离和偏移角度合成健康指标，并应用于涡扇发动机退化数据集，该方法能很好处理传感器数据的非线性和物理差异。

1.2.2 多健康指标构建

基于多健康指标的相似性剩余寿命预测方法采用两个及以上的健康指标刻画设备的退化状态，相比基于单健康指标的相似性剩余寿命预测方法，多健康指标相似性剩余寿命预测方法面临更多的挑战，因此研究也相对较少。具体来说，根据何种标准从设备运行数据中提取出多个健康指标，如何构造多健康指标的相似性度量，以及服役设备的剩余寿命估计最后如何进行融合都是研究者需要解决的新问题。梁泽民等[35]通过Spearman 相关系数从设备运行数据中筛选出多个健康指标，然后针对每个健康指标采用基于单健康指标的剩余寿命预测方法分别得到相应的剩余寿命预测值，最后再基于各健康指标的Spearman 相关系数对所有的剩余寿命估计融合得到设备最终的剩余寿命预测值。侯晓东等[36]根据单调性、相关性、预测性、鲁棒性等指标从设备运行数据中筛选出多个健康指标，采用与梁泽民等[35]相似的策略预测服役设备的剩余寿命。侯晓东等[37]通过设备故障事件和运行数据的关联规则筛选出多个健康指标，在对每个健康指标实施基于单健康指标的剩余寿命预测方法，最后利用熵权法对由各个健康指标得出的剩余寿命预测进行融合。新方法最终应用于T/R组件的剩余剩余寿命预测问题，结果表明新方法预测精度优于基于单健康指标的剩余寿命预测方法。

以上方法虽然解决了基于单健康指标的相似性剩余寿命预测方法在构建健康指标过程中数据不同质、健康指标没有确切物理含义的问题，并将问题转换为同质的剩余寿命估计的融合，但该类方法需要针对多个健康指标分别计算相似性设备剩余寿命估计，大大增加了计算量。

1.3 相似性度量选取

相似性度量用于衡量服役设备与失效设备间退化状态的相似程度，是基于相似性剩余寿命预测方法的核心。利用相似性度量可以计算得到服役设备与已失效设备间退化轨迹的相似度，从而将其中相似程度高的失效设备在相似退化状态下的剩余寿命作为服役设备剩余寿命的估计，最终服役设备的剩余寿命预测值将通过融合这些估计得到。

在已有研究中，大部分基于相似性的剩余寿命预测方法采用欧氏距离作为相似性度量[5]-[7],[27]-[29],[35]-[49][52]。退化轨迹间的欧式距离越小，代表设备的退化状态越相似。虽然欧式距离计算简便，且具有很好地解释性，但是欧氏距离没有考虑退化轨迹走势的相似性，因此一些研究者将角度相似性引入相似性度量加以改进。Liu等[25]同时采用欧氏距离和余弦距离衡量相似度，并将该方法应用于涡轮切割工具退化数据集，结果证明新提出的方法优于最小二乘支持向量回归预测方法。张秋雁等[26]将采用余弦相似度分析服役设备与失效设备间退化轨迹的相似性，并将之应用于NASA 涡扇发动机仿真数据集。Liang 等[34]将欧氏距离和余弦距离的乘积作为新的相似性度量。

其他研究者针对各自健康指标的特殊性质提出新的相似性度量，汤燕等[24]采用归一互相关算法度量设备间的轨迹相似度，最终加权得到剩余寿命预测值，并将该算法应用于转盘轴承寿命数据集。Zio 和Di Maio[40]采用基于模糊逻辑(fuzzy logic)的隶属度函数作为相似性度量。Liu等[41]采用Minkowski距离度量轨迹相似度，将相似性剩余寿命预测方法应用于砷化镓基半导体激光器的剩余寿命预测。Zhang 等[42]基于相空间重构构建退化指标，使用归一化互相关系数作为相似性度量，具有线性变换不变性，对噪声不敏感。谷梦瑶等[43]将退化指标构造灰色生成率序列，通过灰色相似关联度计算各轨迹相似度，利用群体一致性算法对各退化指标相似度加权，最终得到设备剩余寿命预测值，能较好融合多源的退化数据，克服量纲、数量级的影响。Li 等[44]将相似性剩余寿命预测方法应用于接触电阻退化数据，采用模糊相似度度量轨迹相似度，分析了不同隶属函数对剩余寿命预测结果的影响。Xue等[45]构造了一种截尾广义钟型函数作为相似性度量，对高噪声数据有良好的预测精度。You 和Meng[46]提出一个拓展的相似性测度，在度量失效设备与服役设备的相似程度时，赋予新近的衰退变量采样值更大的权重，据此对欧式距离进行了拓展。任博等[47]考虑退化指标的新老程度，引入衰退系数对欧氏距离进行改进作为相似性度量，并运用于风电机组轴承数据。Khelif等[48]提出了基于实例学习方法的相似性度量，新度量在考虑全部历史失效数据的基础上，给予新近数据更大的重要性。

1.4 数据融合

在分析服役设备与失效设备的相似性之后，所有与服役设备相似度高的失效设备都可得到一个关于服役设备剩余寿命的估计，数据融合就是将这些估计融合得到服役设备的剩余寿命预测值的过程。数据融合最常用的方法是基于服役设备与失效设备的相似程度构造权重函数，将所有估计值融合成一个的服役设备的预测值。Wang 等[5]对与服役设备相似度高的失效样本赋予相同的权重，从而服役设备的剩余寿命即为全部相似度高的失效设备剩余寿命估计的算术平均,文献[36][37]也采取相同的方法。而其他的研究者根据失效设备与服役设备相似度大小赋予各失效样本不同的权重，Zio 和Di Maio[40]以基于模糊逻辑的相似性度量计算设备间的相似度，然后根据相似度大小赋予估计值不同的权重。You 和Meng[7]、任博等[47]在相似度大小的基础引入控制系数，赋予相似度大的设备更大的权重。雷从英等[49]采用单调递减函数结合相似度大小构造设备剩余寿命预测值的权重函数。

上述方法只能得到关于服役设备剩余寿命的点估计，不能反映预测值的不确定程度和置信度，不少研究者对该项不足进行了改进。张妍等[30]通过核回归方法拟合退化轨迹，并采用核密度估计方法拟合剩余寿命分布，可以得到服役设备剩余寿命的区间估计。刘畅等[51]基于欧氏距离构造了新的退化轨迹相似性度量，并基于各失效设备与服役的相似性和所得预测值，同样采用核函数拟合剩余寿命预测值的分布。Baraldi 等[52]将相似性剩余寿命预测方法与信任函数理论(belief function theory)相结合，其中信任函数理论可以刻画设备剩余寿命预测值的不确定性。该方法应用于沸水反应堆冷凝器中过滤器的退化数据，结果表明新提出的不确定性处理方法的鲁棒性和精度均优于核密度估计和均方差估计方法。

2 拓展研究

除了对健康指标、相似性度量和数据融合方法的研究，一部分研究者针对不满足基本假设的工业生产实际，对基于相似性的剩余寿命预测方法进行了拓展。

传统的基于相似性的剩余寿命预测方法假定设备是单失效模式，且工况是基本一致的，因而没有考虑设备运行过程中存在多种工况和设备具有多种失效模式的情况。李琪等[23]在构建健康指标之前，先对设备运行数据进行工况特征提取，然后对失效设备构建分工况的相似性剩余寿命预测模型，最后根据服役设备的工况特征找到对应模型进行剩余寿命预测，该方法应用于NASA 涡扇发动机仿真数据集中，拥有更高的精度。雷从英等[49]在考虑了设备具有多种失效模式的情况，提出按设备失效模式分别进行相似性剩余寿命预测，最后将各失效模式下的剩余寿命预测值加权平均得到最终的预测值，改进后的方法被应用于陀螺仪退化数据上。

大多数基于相似性的剩余寿命预测方法，在预测过程中只将失效设备与服役设备进行相似性匹配，而没有利用中止运行设备和经过预防性维修设备的数据。尤明懿[50]提出两种新的相似性剩余寿命预测框架，将未失效的历史样本设备纳入模型，从而服役设备的剩余寿命预测值将同时与历史失效设备和历史未失效设备进行匹配。该方法提高了信息的利用率，在历史失效样本较少情况下，能极大提升预测精度；同时数值实验显示，在数据有限的情况下要防止过拟合导致的预测方法泛化能力不足的问题。

3 结论与未来研究方向

本文总结了基于相似性的剩余寿命预测方法的基本假设和基本框架，并根据基于相似性剩余寿命预测方法的预测步骤，从健康指标构建、相似性度量选取、数据融合3 方面对现有研究进行了梳理和总结，比较分析了各步骤中模型和方法的优劣和适用情况。此外还对基于相似性的剩余寿命预测方法的拓展研究进行总结分析。

已有研究表明，基于相似性的剩余寿命预测方法不需要假定设备的退化模型，在存在大量失效设备运行数据的情况下，具有预测精度高、鲁棒性强的特性。然而基于相似性的剩余寿命研究方法在理论和工程实践上仍存在很多不足，本文最后探讨其未来可能的研究方向，总结如下：

（1）基于相似性的剩余寿命预测方法性质的系统化研究。相比于其他的数据驱动的剩余寿命预测方法，基于相似性的剩余寿命预测方法的理论基础还较为薄弱。大部分方法是针对特殊案例提出的，而没有对方法本身的普遍性质进行研究。因此有必要进一步研究不同模型对剩余寿命预测值的影响，从而帮助决策者根据具体情况快速选择合适的模型。

（2）基于多健康指标的相似性剩余寿命预测方法的研究。随着工业4.0 时代的到来，设备监控数据迎来爆发式增长。从设备的运行数据中可以找出多个刻画设备退化状态的指标，采用基于多健康指数的相似性剩余寿命预测方法将利用更多的有用信息，提高预测精度。同时正如在前文中提到的，现有的基于多健康指标的相似性剩余寿命预测方法存在计算花销大的问题，因而更加精简、计算效率高的多健康指标模型和算法有待进一步研究。

（3）与机器学习算法相结合的研究。作为人工智能的核心，机器学习算法被广泛应用于自然语言处理、计算机视觉、信息搜索、自动驾驶、生物信息学等领域。借助大数据技术，机器学习算法能高效利用各种类型、超大规模的数据，通过计算的手段，学习经验来改善算法的性能。通过将机器学习与基于相似性的剩余寿命预测方法相结合，将提高相似性剩余寿命预测方法处理数据能力和效率，进而提高预测精度。