赵江平,丁 洁,陈敬龙
(西安建筑科技大学 资源工程学院,陕西 西安 710055)
化工企业的生产特点决定了化工设备可靠性的重要性,准确预测设备可靠性趋势,制定合理的预防性维修计划,才能保障设备长期稳定运行[1]。对化工设备进行可靠性分析时,大多数学者采用威布尔分布模型来描述化工设备的寿命。裴峻峰等[2]将威布尔分布应用于往复式压缩机寿命建模,对压缩机维修周期进行了分析;徐子军[3]使用威布尔分布拟合离心泵各单元故障分布,预测了离心泵系统可靠性。但前者所研究的内容都是基于样本数据足够丰富,而在化工企业实际生产运行中,数据样本常常呈现出小样本的特征,且较少有人将小样本数据分析方法应用到化工设备的可靠性评估中。因此,小样本条件下的化工设备寿命分布及可靠性预测存在很大的困难。
对小样本数据分析的研究在机械、航空等行业已有大量研究。宋明顺等[4]采用灰色估计法与贝叶斯方法对小样本机械系统进行可靠性估计;金星等[5]通过蒙特卡罗模拟对小样本条件下的近似服从威布尔分布的设备寿命进行了评估;马宪民等[6]使用粒子群算法估计了矿用减速器可靠性寿命。但大量的研究表明,以上方法都或多或少有其应用的局限性。Bayes方法受验前信息影响较大;应用蒙特卡罗模拟法的前提是必须要保证现场数据样本服从的分布模型是高度精确的[7];粒子群算法和灰色估计法在小样本的情况下预测精度不高。所以当故障样本为小样本时,通过建立化工设备可靠性模型,研究1种精度较高的参数估计方法,对于预测设备可靠性非常重要。
近年来,支持向量机(SVM)作为1种高度适用于小样本情况的机器学习规律理论,在两参数威布尔分布参数的估计中得到了广泛的应用[8]。支持向量回归(SVR)在SVM的基础上引入了损失函数,使支持向量机的应用拓展到了回归分析的领域。由于SVR具备SVM适合于小样本数据的特点,即同样适合于对历史故障数据积累不足的化工设备可靠性分析。此外,虽然灰色估计法的预测精度不高,但研究表明其在小样本数据下可以获得精度较高的位置参数估计值,故可通过GM(1,1)模型将三参数威布尔分布的参数估计转化为两参数威布尔分布的参数估计问题[9]。本文以某化工企业压缩机投运以来的部分故障数据为实例,建立了三参数威布尔模型,用GM(1,1)和SVR对威布尔分布参数进行估计,并与单独使用灰色估计法及最小二乘法的估计结果进行对比,以此来验证GM-SVR模型参数估计在化工设备可靠性预测中的有效性。
在化工企业生产运行期间,随着科学技术不断发展,化工设备更新换代速度快,许多设备在短周期运行中根本没有发生故障,这使得同型号设备的故障数据更少;此外,由于企业管理的不足,我国不少化工企业(尤其是中小型企业)的维修报告、调度中心运行报告、台账系统等记录表易出现缺失的情况,导致积累的故障维修历史数据不足。综上所述,对在役化工设备维修情况调研获得的故障寿命数据极有可能呈现出比较典型的小样本特征。
威布尔分布函数是由物理学家Weibull在研究链的强度中提出的1种分布函数,在工程应用中常用来拟合机械、电子、化工等设备的寿命分布。三参数威布尔分布模型的分布函数F(t)和失效率函数λ(t)的表达式分别为[10]:
(1)
(2)
式中:t为失效时间,h;η为尺度参数,η>0;m为形状参数,m>0;r为位置参数。形状参数m的取值大小不同,则对应的设备失效类型也不同。当m<1时,为早期故障期,随着设备的持续运行,失效率逐渐降低,设备的可靠性程度越来越高;当m=1时,设备处于偶然故障期,此时的失效率是1个常数,即此时的失效率服从指数分布;当m>1时,设备处于耗损故障期,随着运行时间的增加,设备逐渐出现老化和劣化。由此可见,威布尔分布可以很好地描述各种失效模式,故可以使用三参数威布尔分布作为化工机械设备的失效分布函数,可靠度函数R(t)为[10]:
(3)
为了能够准确获得某个设备的失效率模型,根据该设备运行中产生的故障样本数据建立威布尔分布模型。具体实现方法是用平均秩次法或中位秩法计算出F(ti),采用相关系数优化法计算三参数威布尔分布的位置参数r,再将威布尔分布模型线性化,然后采用拟合方法识别分布参数。目前的参数估计方法有灰色估计法、最小二乘法、极大似然估计法等方法。但这些方法对于小样本参数估计的精度不高。灰色估计法在小样本的情形下对形状参数m和尺度参数η的估计精度不高,但是对位置参数r的估计精度较高。故本文先使用GM(1,1)模型对位置参数r进行求解,在r已知的基础上,再利用SVR估计形状参数m和尺度参数η。
在对威布尔分布参数进行回归分析时,必须计算样本的经验分布函数。设某化工设备失效样本数量为n,失效样本的运行时间分别为t1≤t2≤≤tn(完全样本),相应的累计失效概率(经验分布函数)为F(t1)≤F(t2)≤≤F(tn),当数据样本为小样本时,工程上常使用中位秩公式或平均秩次法对第i个产品的累计失效概率F(ti)进行计算[11]。
平均秩公式为:
(4)
中位秩公式为:
(5)
灰色GM(1,1)模型主要用于复杂系统某一主导因素特征值的拟合和预测,预测过程中所需信息较少,迭代快,精度高。在化工设备运行过程中,引起其失效的因素有很多,这使得可靠性预测和风险研究存在一定的灰色问题,这种情况下,可以依据故障数据建立灰色预测模型。灰色GM(1,1)模型的微分方程为[12]:
(6)
对式(6)进行变形可得:
(7)
令
则式(7)变形为:
xi=b+cexp(-aτi)
(8)
将(xi,τi)视为一般时间序列,灰色GM(1,1)的时间响应模型为:
(9)
式(6)与式(9)具有相似性,则通过一次对GM(1,1)模型的求解,即可得到参数a,u,c的估计值,使用最小二乘法计算灰色模型的参数:
(10)
式中:
(11)
由于本文所研究的故障样本较少,尺度参数η和形状参数m的估计效果一般,故只保留位置参数r的估计值,并应用支持向量机对η和m进行估计,令t=x-r,式(1)变形为两参数威布尔分布:
(12)
2.3.1 威布尔分布模型线性化
分别对等式(12)两端取2次对数得:
(13)
令
(14)
式(13)可以简化为y=wx+b,对参数η和m的估计转化为对参数w和b的估计。如果把x和y看作SVR模型中的训练样本,T={(xi,yi)};i为样本序号;n为样本数量;i=1,2,,n;xi为输入变量;yi为相应的系统输出变量,就可以使用SVR对其进行回归分析。
2.3.2ε-支持向量回归机方法
ε-支持向量机估计回归函数(ε-SVR)是通过引入ε线性不敏感损失函数,将回归问题转化为最小化结构风险函数的问题。即寻找1个使风险最小的最优超平面f(x)=wφ(x)+b=0,w为权值系数,b为偏差,φ(x)为非线性映射[13]。
为了使f(x)平坦,引入松弛变量ξi,ξi*和惩罚参数C建立优化模型如下[14]:
(15)
由于高维空间的内积运算极其复杂,引入核函数k(xi,yi)来替代内积运算。对于线性样本,本文采用线性核函数k(x,y)=x·y作为训练核函数。式(15)是凸二次规划问题,求解该优化问题是通过求解它的Lagrange对偶问题而得到的。引入Lagrange函数构造并求解[15]:
(16)
2.3.3 参数选择
(17)
2.3.4 误差分析
为了验证模型的拟合精度,有必要对数据的拟合效果进行误差分析。本文使用相对均方根误差(NRSME)及拟合优度(R2)对数据拟合效果进行误差分析[17]。
相对均方根误差的计算公式为:
(18)
拟合优度(R2)的计算公式为:
(19)
由于某化工企业进行了搬迁,导致某压缩机机组部分运行的台账及设备维修记录丢失。不考虑预防性维修,只对泄漏、停机、断裂等严重影响设备运行的故障进行统计。收集到10台同型号的压缩机故障数据如表1所示,将其故障时间数据(完全样本数据)按从小到大的顺序排列,假定该组故障时间数据服从三参数威布尔分布,采用式(4)和式(5)计算各失效时间点对应的累计失效概率,记于表1中。
将失效时间ti及其对应的累计失效概率F(ti)作为GM-SVR模型的2组初始样本集T1={ti,F1(ti)}和T2={ti,F2(ti)}。使用GM(1,1)模型对初始样本集进行参数估计,保留位置参数r的估计值,按式(14)对初始样本集进行处理,分别得到SVR模型的2组训练样本集T1′={xi,F1(xi)}和T2′={xi′,F2(xi′)},将样本集输入SVR进行训练,采用交叉验证和网格搜索法对拟合过程中的参数进行优化选择。参数寻优结果及可靠性分布参数估计值如表2所示。
表2中的误差分析结果表明,2种经验公式的拟合优度均大于0.98。一般当R2≥0.9时,就可以说明拟合精度较高。由此可见,该组故障数据与中位秩、平均秩
表1 压缩机故障记录及其累计失效概率Table 1 Operating record of compressor and cumulative failure probability
表2 GM-SVR模型估计结果Table 2 Estimation results of GM-SVR
之间存在明显的线性关系,所以接受该压缩机失效寿命数据服从三参数威布尔分布的假定。当选择平均秩公式时,相对均方根误差及拟合优度均优于中位秩公式,故选择平均秩公式作为该压缩机寿命数据的经验分布函数更合适。
为检验GM-SVR模型的有效性,将使用平均秩公式的训练样本分别运用最小二乘参数估计法(LSR)、灰色估计法(GM)进行参数估计,计算得出不同方法下的威布尔分布参数估计结果,分别对其进行误差分析,对比估计效果。估计结果及误差分析分别如表3、表4所示。
表3 各拟合方法参数估计值Table 3 Estimated results of parameters of each fitting method
表4 各拟合方法误差分析Table 4 Error analysis of each fitting method
通过表3和表4对比参数估计及误差分析可以看出,使用灰色估计法和GM-SVR这2种方法所得的尺度参数η和形状参数m的估计值基本一致。GM-SVR的NRSME值为0.045 0,灰色估计法的误差为0.050 7,说明GM-SVR可以实现GM(1,1)的参数估计效果,而且精度高于GM(1,1)。由此可见,在小样本条件下,GM-SVR的参数估计精度有明显优越性,而LSR是最差的。图1为3种估计方法的威布尔分布函数与该压缩机机组平均秩拟合曲线对比图,从图1中可以更直观的看出GM-SVR对整体数据有明显的拟合优势,可以有效地应用于小样本故障数据下的压缩机可靠性预测。
图1 3种方法的拟合对比Fig.1 Comparison of the three fitting methods
根据式(3)及GM-SVR模型估计参数,可得该组压缩机可靠度函数为:
通过压缩机的可靠性模型,可以计算出该型号压缩机的平均无故障时间为:
由可靠度函数R(t)可以得出该型号压缩机的动态可靠性曲线,如图2所示。由图2可知,可靠度随着运行时间的增长逐渐下降,当运行了19 118 h后,其可靠度明显下降。根据可靠性曲线可以预测每个运行时间点的可靠度,本例中,预测设备运行34 177 h后可靠度为22%,企业可根据自身工艺情况对风险的接受程度决定是否采取预防性维修。
图2 压缩机动态可靠性曲线Fig.2 Reliability dynamic curve of compressor
1)通过实例应用证明,三参数威布尔分布可以用作化工设备的可靠性建模。通过分析故障样本数据,可以为预测设备可靠度及制定设备维修策略提供依据,同时也为化工企业的风险评估提供数据支持,具有工程应用价值。
2)GM-SVR模型可以有效地应用于小样本数据条件下的化工机械设备可靠性分析,该方法的估计精度要高于传统最小二乘估计法和灰色估计法。在参数估计过程中,利用程序实现回归分析,可以提高参数的估计精度和设备可靠性分析的效率。