跨座式单轨车载空调系统故障时间序列预测方法研究

2022-04-21 07:21杜子学蒋大卫
关键词:系统故障残差神经网络

杜子学,蒋大卫,吴 晶

(1. 重庆交通大学 轨道交通研究院 重庆 400074; 2. 重庆交通大学 交通运输学院 重庆 400074;3. 重庆市轨道交通(集团)有限公司 重庆 400042)

0 引 言

车载空调系统是城市轨道车辆的重要部分,通过除湿、降温处理车厢内空气,给乘客一个良好的乘车环境。重庆单轨3号线采用CK22/BPG-E03型变频空调机组,机组结构为顶置式,出风、回风在底板下部[1]。重庆单轨3号线自开通至今,发现空调系统故障数据中,幅流风机故障达72.12%,空调机组故障达26.27%,且故障主要集中在7、8、9月, 尤其9月故障数激增,而1、2、3、12月故障数较低。说明车载空调系统故障的出现与季节温度存在一定联系。初步分析认为空调故障季节性波动,主要是环境温度升高且地下隧道空间限制,造成通风量有限,热空气无法及时排除,导致制冷剂散热不良,使空调系统长时间高负荷运转产生故障。

学者们提出了一些针对空调系统故障预测的方法,王辉等[2]采用ARMA模型对飞机空调系统故障进行短期变化的预测;陈维兴等[3]针对机坪地面空调间歇故障问题,提出改进Apriori算法,实现了延误维修预测。通过对故障时间序列的预测分析,可以更合理制定维修策略,优化零备件采购,选择高可靠性产品,从而有效控制维修成本,并对短期的维修成本预测提供参考,空调系统故障数预测对控制轨道车辆运维成本具有重要意义。

随着预测理论发展,单一预测模型如GM(1,1)模型、BP神经网络、ARIMA模型难以满足含有多影响因素的复杂问题的需求。利用多个单一模型进行组合预测,成为现今众多学者的研究重点。赵鹏等[4]根据城市轨道交通客流以“周”为单位的周期性波动规律,采用季节ARIMA模型对未来10天内进站量进行短期预测;聂淑媛[5]根据房价序列存在明显的季节特征和典型的波动聚集性,使用X-12季节调整方法进行处理,建立ARIMA和AR(2)-GARCH(1,1)复合模型对北京市新建住宅价格指数序列进行拟和预测;翟静等[6]研究了ARIMA与BP神经网络的组合,建立预测模型在粮食产量时序预测问题上进行应用;刘天等[7]研究并比较了GM(1,1)、ARIMA模型及其组合模型在病毒性甲型肝炎发病数时间序列预测的应用;张忠林等[8]提出了一种BP神经网络补偿灰色周期外延模型用于预测就诊人数,相比单一模型提高了预测精度。目前,对时间序列预测的诸多研究均显示出组合预测模型的优势,克服了单一模型预测的缺陷,也提高了预测精度。

为深度挖掘跨座式单轨空调系统故障数据的变化规律,合理预测故障数量,笔者根据空调故障时序的明显季节特征和波动聚集特征,采用BP神经网络对X12-ARIMA模型的残差进行修正,提取序列的非线性特征,将X12-ARIMA模型所得结果与BP神经网络修正结果相加得到改进后模型预测结果。基于重庆单轨3号线空调系统7年逐月故障数据,对比改进模型与X12-ARIMA模型、BP神经网络模型及ARIMA-BP组合模型的故障数预测值,并根据多个模型评价指标选出最优预测模型。

1 预测方法

1.1 X12-ARIMA模型

1.1.1 Census X12季节调整法

X12季节调整法的基本分解模型包括加法模型和乘法模型。空调故障时间序列数据的季节成分较为稳定,故选用Census X12中的加法模型对跨座式单轨空调系统故障数进行季节调整[9]。X12-ARIMA模型是将具有季节特征的时间序列通过Census X12进行季节调整,把故障次数时间序列分解为趋势循环要素、季节变动要素和不规则变动要素,在此基础上采用ARIMA模型进行建模,模型如式(1):

B=BSF+BSA

(1)

式中:B为故障次数原始数据;BSF为季节变动因子,BSF=T+C+I,T为趋势变动因素,C为循环变动因素,I为不规则变动要素;BSA为剔除季节因子后的故障时间序列。

1.1.2 ARIMA模型

ARIMA模型作为一种现代统计分析方法,广泛应用于各个领域[10-11]。ARIMA(p,d,q)模型中,p为自回归项数,q为滑动平均项数,d为使之成为平稳序列所做的差分次数,模型可以表示为:

(2)

式中:yt为当前值;μ为常数项;γi为自相关系数;εt为误差;θi为偏自相关系数。

ARIMA模型变量主要借助内生,不依赖于其他外生变量[10]。基于ARIMA模型的时间序列预测方法的建模主要有4个步骤:①判断序列是否平稳:若序列非平稳,可采用取对数、一般差分、季节性差分使序列转变为平稳序列,并用单位根检验(ADF检验)判定序列是否平稳;②模型参数定阶:依据平稳化处理后的序列的自相关图和偏自相关图,初步确定模型中的p、q的值;③模型诊断:通过Box-Ljung-Q统计量进行模型残差诊断,若残差为白噪声序列,则可以采用该模型进行预测;④模型选择:若存在多个符合建模条件的模型,则根据相应准则选择最有效的模型。

1.2 BP神经网络模型

作为一种多层前馈网络,BP神经网络的主要特征是训练网络时误差逆向传播,信号前向传递。标准的BP神经网络有3层(图1) :一个输入层、若干隐藏层和一个输出层。 同一层神经元之间并无联系,不同层的神经元则前向连接[10]。数据通过输入层的m个节点输入,经由激活函数沿网络正向传递,经过各个隐藏层节点,到达输出层。若此时结果不理想,则将输出值与实际值的误差反向传播,重新调整每一层的权值与阈值,重复多次可使网络不断优化,保证输出数据的准确。

图1 3层BP神经网络结构Fig. 1 Three-layer BP neural network structure

Yt=F(Yt-1,Yt-2,…,Yt-m)+ei

(3)

式中:Yt-1,Yt-2,…,Yt-m为输入变量;Yt为输出量;F(·)是由BP神经网络决定的激活函数;ei是随机误差。

经大量数据训练后,建立输入和输出数据间的数学关系,并推导未来值。

1.3 组合模型

组合模型是根据历史数据,利用原理和方法不同的多个单一预测方法分别建立模型,并根据各子模型的精度进行权衡,赋予不同模型一定权重[6]。组合模型的难点在于最优组合权重的确定,若权重不合理,可能预测效果比单项模型更差[12]。线性组合预测模型是目前使用最广泛的模型,如式(4):

(4)

式中:n为单项模型种类;Fit为第i种预测方法在第t期的预测值;ωi为第i种预测方法的权重。

采用方差倒数法计算权重,即依据相对误差指标对模型赋予合适的权重。在方差倒数法中相对误差越大,模型预测精度越小,赋予权重越小,反之亦然,如式(5)、式(6):

(5)

(6)

式中:di为第i个单项模型的误差平方和。

1.4 X12-ARIMA-BP模型

步骤1利用X12-ARIMA模型对原始时间序列建模,得到原始序列的拟合值Z1i和预测值F1i,将拟合值与原始数据相减得到残差εi=Yi-Z1i。

步骤2应用残差序列εi建立BP神经网络,经过大量数据训练,建立函数关系,并得到残差序列的拟合值Z2i和预测值F2i。

步骤3X12-ARIMA-BP模型的最终拟合值为Zi=Z1i+Z2i,预测结果为Fi=F1i+F2i。

1.5 预测评价方法

分别利用X12-ARIMA模型、BP神经网络模型、组合模型和X12-ARIMA-BP模型,对7年故障数据的前6年的空调系统逐月故障数进行拟合,预测第7年的逐月故障数,并与第7年的实际值进行比较。采用平均绝对误差(MAE)、平均绝对误差百分比(MAPE)、均方误差(MSE)作为评价指标。

2 故障数拟合与预测

重庆单轨3号线(跨坐式单轨)2013—2019年空调系统故障累计报告4 644例,月平均报告55.29例,空调故障整体呈逐年略微下降趋势(如图2)。2013—2019年各月均有故障报告,故障数据含有明显季节高峰,7、8、9月故障数相对较多,占总数的41.19%。选取2013年1月—2018年12月,共72个月的故障数据建立预测模型,2019年1—12月的数据作为检验数据,验证模型的精确度。

图2 重庆单轨3号线空调系统2013—2019年故障时间序列Fig. 2 Fault time series of air conditioning system of Chongqingmonorail line 3 from 2013 to 2019

2.1 基于X12-ARIMA模型的故障数拟合与预测

借助EViews7.0软件,将故障次数的原始数据分离出季节因素序列(无量纲)如图3, 剔除季节因素的故障时间序列(无量纲)如图4。

图3 故障数的季节因素序列Fig. 3 Seasonal factor sequence of fault data

图4 剔除季节因素的故障时间序列Fig. 4 Fault time series excluding seasonal factors

2.1.1 剔除季节因素的时间序列建模预测

对剔除季节因子的时间序列进行平稳性检验,单位根统计量ADF值为-1.085 428,该统计量对应概率值为0.248 8>0.050 0,序列非平稳需先进行一阶差分,一阶差分后的自相关与偏自相关如图5。差分后序列满足平稳性条件,根据图5在q阶与p阶之后出现拖尾特征,可初步判定ARIMA模型的p=0~6,q=0~7,共55个ARIMA模型(p取值有7个,q取值8个,共56个组合,去除p=q=0的组合)。经过逐一试验,其中50个模型存在参数不显著的情况。根据AIC(赤池信息准则)、SC(施瓦兹准则)、H-Q(汉南-奎因准则)最小准则和残差白噪声要求选取最优模型。

图5 一阶差分后时间序列的自相关与偏自相关Fig. 5 Autocorrelation and partial autocorrelation of time series afterfirst order difference

图6 ARIMA(6,1,0)模型的残差检验Fig. 6 Residual test of ARIMA (6,1,0) model

通过比较,结合模型简洁的原则得到最优的模型为ARIMA(6,1,0)模型,经过参数估计与校验,模型的AIC值为7.37,SC值为7.60,模型的决定系数R2=0.55,残差序列经检验为白噪声序列(自相关与偏自相关系数如图6)符合建模要求。ARIMA模型的公式为:

Δyt=-0.238 0-0.791 6Δyt-1-0.774 5Δyt-2-

0.558 2Δyt-3-0.545 7Δyt-4-0.609 9Δyt-5-0.444 0Δyt-6+εt

(7)

2.1.2 季节因子的时间序列预测

由图3可知:相同月份的空调系统故障数的季节因素序列波动较小。根据“近大远小”原则,将历史故障数据中每年同时期季节分量按一定的权重求和,可得本年当期空调故障数的季节周期分量[12],即:

BSF(i,j)=αBSF(i-1,j)+α(1-α)BSF(i-2,j)+…+α(1-

α)n-1BSF(i-n,j)

(8)

式中:BSF(i,j)为第i年第j月的月故障季节周期分量;α为加权系数。

由文献[13]可知,若月故障季节周期分量波动不大,α取值在0.1~0.5之间,笔者取α=0.5。

2.1.3 X12-ARIMA模型预测结果

将2.1.1节和2.1.2节得到的空调系统故障数据分量的拟合值和预测值按式(1)进行计算,最终对2019年1—12月空调系统故障次数进行预测。

2.2 BP神经网络模型拟合预测

2.2.1 数据预处理

在建立BP神经网络模型前,运用MATLAB的Mapminmax函数对数据进行归一化处理。从图2可看出空调系统故障数据包含季节波动性,每月故障差异较大,但年故障数存在一定规律,因此采用滞后项预测法。

为充分利用数据,选取每相邻12个月的数据作为输入,下1个月的数据作为输出,即取2013年1—12月的数据作为输入,2014年1月的故障数据作为输出。应用2013年1月—2018年12月数据生成60组训练序列,其中随机选取48组序列进行神经网络的训练,剩下的12组序列进行模型检验。

2.2.2 网络参数设置

采用每相邻12个月的数据预测下1个月的数据,故输入层节点数为12,输出层节点数为1。

隐含层节点数通过经验公式确定:

(9)

式中:h为隐含层节点数,通过试探性实验确定h=9;m、n为输入层与输出层节点个数,m=12,n=1;a为1~10之间常数。

在BP神经网络中,激活函数的选择对BP网络预测结果有直接影响。隐含层激活函数经试验确定为双曲正切S型传输函数,输出层的激活函数为线性传输函数。设置目标误差为0.001,最大训练周期为1 000,学习速率为0.01,当误差小于0.001时学习终止。构建3层BP神经网络对空调系统故障数进行建模并预测。

经过数据预处理并确定网络参数后,使用MATLAB软件建立BP神经网络预测模型,采用的算法为Levenberg-Marquardt算法,经过5次迭代训练后达到学习终止条件。

2.3 变权组合模型

利用建立的X12-ARIMA模型及BP神经网络模型,计算得到2种模型的残差。按公式依次计算出残差序列的方差为4 339.455 7、12 410.306 6,根据方差倒数法得到两种模型的权重依次分别为0.740 924 34、0.259 075 66,该变权组合模型的表达式为:

Xt=0.740 924 34X1t+0.259 075 66X2t

(11)

式中:Xt为组合模型的拟合值,X1t为X12-ARIMA模型的拟合值,X2t为BP神经网络模型的拟合值。

2.4 X12-ARIMA-BP模型

由X12-ARIMA模型与BP神经网络模型预测结果可知,分别使用单一模型,预测误差较大。为此,将X12-ARIMA模型的拟合值与空调系统故障数实际值作差求得残差序列,并将残差序列作为BP神经网络的输入。选取每相邻12个月的数据作为输入,下1个月的数据作为输出。

经过大量实验,最终取隐层节点数为5,目标误差为0.001,学习率为0.01,最大训练周期为1 000,当误差小于0.001时学习终止。隐层激活函数采用对数S型传递函数,输出采用线性函数。采用MATLAB计算残差BP模型的拟合值与预测值。

将X12-ARIMA模型的拟合值和残差BP神经网络模型的拟合值与预测值分别相加得到改进X12-ARIMA-BP模型的拟合值与预测值。

2.5 预测结果对比与分析

4种模型拟合预测后的预测结果如表1,拟合结果与预测结果对比如表2。

表1 4种模型预测结果Table 1 Prediction results of four kinds of models

表2 4种模型拟合与预测结果对比Table 2 Comparison of fitting and prediction results of four kinds of models

由表1、表2可知:

1)不同模型的拟合结果表明,BP神经网络模型拟合效果最差,平均绝对误差百分比为22.87%,平均绝对误差为11.1764。除BP神经网络模型外,其余3种模型拟合结果相近,其中X12-ARIMA平均绝对误差最小,为6.138 2,均方误差也最小为72.324 3,X12-ARIMA-BP模型的平均绝对误差百分比最小为13.41%。综合来看拟合精度最高的是X12-ARIMA模型,平均绝对误差百分比为13.98%,其次为X12-ARIMA-BP模型。

2)从预测对比结果看,X12-ARIMA-BP模型的平均绝对误差百分比与平均绝对误差最小,其平均绝对误差百分比为18.54%,平均绝对误差为6.868 6,均方误差为78.433 2,略大于变权组合模型。相比其他3种预测模型,X12-ARIMA-BP模型的预测效果最佳。

3 结 语

对轨道交通线空调系统故障数进行分析与预测,有助于提高轨道交通公司的预防性维修水平,也有助于合理制定维修策略和零件采购方案,从而有效控制成本。针对轨道交通线空调系统故障数时间序列的预测问题,在分析故障数的周期性波动规律及变化趋势的基础上,结合季节调整法建立X12-ARIMA模型并进行了时间序列的拟合与预测,在此基础上采用BP神经网络模型对X12-ARIMA模型的残差序列进行拟合并预测,将两个模型预测值相加得到改进X12-ARIMA-BP模型的预测值。以重庆轨道交通3号线空调系统故障时间序列进行模型参数标定,利用构建的改进X12-ARIMA-BP模型进行预测,并与X12-ARIMA模型、BP神经网络模型、ARIMA-BP变权组合模型的预测效果进行对比。实例分析得出,改进X12-ARIMA-BP模型的平均绝对误差与平均绝对误差百分比均为最小,因此作为预测未来短期跨座式单轨空调系统故障数的模型,该模型有效。

改进的X12-ARIMA-BP模型能够较好地预测未来短期跨座式单轨空调系统故障数,但仍存在一定的局限性。该模型的平均绝对误差百分比为18.54%,预测精度尚有提升空间,且由于原始数据基数较小,导致一部分的相对误差较大,降低了整体精度,今后可以考虑采用其他模型对残差进行优化,以提升模型的预测精度。

猜你喜欢
系统故障残差神经网络
多级计分测验中基于残差统计量的被试拟合研究*
基于神经网络的船舶电力系统故障诊断方法
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于人工智能LSTM循环神经网络的学习成绩预测
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
MIV-PSO-BP神经网络用户热负荷预测
融合上下文的残差门卷积实体抽取
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
小电流接地系统故障定位技术研究
110维保过程中几种常见问题的处理方式