民航事故征候预测模型对比研究

2021-10-20 00:25超,刘
沈阳航空航天大学学报 2021年4期
关键词:关联度灰色精度

董 超,刘 杰

(昆明理工大学 公共安全与应急管理学院,昆明 650031)

当前人们出行方式多元化,越来越多的人选择快速的民航交通运输,然而民航作为高风险行业始终是大众和媒体关注的焦点,民航事故的发生不仅造成人员伤亡和财产损失,更会造成人们的恐慌,安全和效益始终是我国民航发展需要考虑的问题。2018年中国民航运输航空百万小时重大事故率十年滚动值为0.013,远低于同期世界平均水平0.153;2006年至2018年的数据统计表明,民航运输总周转量、旅客运输量、民航货邮运输量、运输机场旅客吞吐量、运输机场起降架次年平均增速分别为12.15%、12.17%、7.24%、12.22%、10.46%;2010年至2018年我国运输航空机队年平均引进飞机247架,年均增长率为11.05%。然而民航业快速发展的同时,事故征候数却在以年均15.73%的水平增加[1]。

事故致因理论表明,关注和减少未遂事故的发生有助于避免更大的灾难事故,统计事故征候数可评估航空公司安全状况水平,对事故征候数进行预测和研究,有助于科学制定民航发展规划。陈芳等[2]利用ARIMA模型和BP神经网络进行月度事故征候率预测指导安全绩效水平的制定;甘旭升等[3]和梁文娟等[4]分别针对损坏飞机万时率和某航空公司月度飞行事故征候万时率,利用ARIMA模型和SVM模型的组合进行了预测分析,结果表明组合预测比单一模型预测精度高;王永刚等[5-7]分别用灰色马尔科夫、灰色理论结合神经网络、最优变权组合模型预测,研究表明组合模型预测事故征候更精确;孙瑞山等[8]改进了灰关联度分析,利用三角模糊数预测机组失误导致事故征候的预测区间,该方法可用于短期预测;王燕平等[9]基于飞机起降架次进行事故征候预测,表明利用起落架次这一指标预测的可行性;陈芳等[10]、单晶晶等[11]、郭九霞等[12]分别使用弱化缓冲算子处理预序列结合离散灰色模型、SVM和RBF神经网络、GBO-Markov 组合模型,进行民航不安全事件的预测。

以上学者的研究大多数是以提高预测精度为目的而选择相应的预测模型,通过耦合不同的数学模型大幅度提高预测的精度。对于数据量少且短期的预测适宜用灰色模型、马尔科夫、回归分析及其组合模型等;而对于具有大量数据、明显时间序列特征的预测,学者们倾向于SVM、神经网络和ARIMA等的组合预测。实际预测过程中,与预测变量事故征候相关的众多因素却较少用于预测,环境因素的不断变化会影响预测变量,寻找影响事故征候的主要因素并协助预测,有助于提高预测精度。鉴于此,依据官方公布的民航行业发展统计公报,选取与事故征候相关的16个因素并提取相关数据,首先进行灰色关联分析,然后选择关联度较高的影响因素,建立GM(1,N)预测模型进行预测,同时使用GM(1,1)模型和多元线性回归对比预测精度,拟通过3种方法的对比研究找到更加有效和准确的方法预测事故征候。

1 灰色模型和回归分析理论

1.1 灰色理论

1982年我国学者邓聚龙发表的两篇灰色系统理论论文标志着灰色系统学科的诞生。灰色系统是指信息部分明确、部分未知的系统,研究针对广泛存在于生活中的少量样本和缺乏有效信息的不确定性问题[13]。灰色理论被广泛应用到经济、石油、农业、航空等科学研究领域并取得了丰硕的研究成果。

1.1.1 灰色关联分析

灰色关联分析同数理统计的相关分析法相类似,都是进行系统特征分析,不同的是灰色关联分析更适用于较少数量的分析样本,并且数学计算模型通俗易懂,计算量小。灰色关联分析考察不同序列曲线的相似程度,序列的曲线越相似,序列间的关联度越大[14]。

灰色关联分析过程如下:

(1)确定参考序列和比较序列

设参考序列为X0(k)=(x0(1),x0(2),…,x0(n)),比较序列为Xi(k)=(xi(1),xi(2),…,xi(n)) ,其中k=1,2…n;i=1,2…m;式中n为参考序列元素个数;m为比较序列的个数。

(2)无量纲化处理参考序列和比较序列

(1)

(3)求参考序列与比较序列的差

(2)

(4)计算两序列最大差和最小差

(3)

(5)计算灰关联系数

(4)

式中0<ρ<1,一般取ρ=0.5。

(6)计算关联度

(5)

(7)优劣势排序

比较序列和参考序列的关联程度主要依据计算的关联度大小排序描述,ri越大,说明比较序列和参考序列曲线形状越接近,通过排序即可得到优劣次序。

1.1.2 GM(1,1)模型

GM(1,1)模型计算过程中不涉及预测变量的其他相关变量,仅需要对原始数据序列进行检验或者处理,这种特性使GM(1,1)模型得到了非常广泛的应用[15]。具体建模过程如下:

(1)建立预测变量的原始序列

X0(t)=(x0(1),x0(2),…,x0(n))

(6)

(2)对预测变量的原始序列执行一次累加(1-AGO)

(7)

得到1-AGO序列X1(t)={x1(1),x1(2),…,x1(n)},其中x0(1)=x1(1)

(3)对原始序列X0(t)进行光滑性检验

(8)

若原始序列X0(t)满足式(9),则原始序列为准光滑序列,可以建立GM(1,1)模型。

(9)

(4)建立GM(1,1)模型

(10)

(5)构造数据矩阵B和数据向量Y

(11)

Y=[x0(2),x0(3),…,x0(n)]T

(12)

(6)使用最小二乘法计算参数a和b

(13)

(7)求解预测模型的时间响应方程

(14)

(8)构建还原模型

(15)

(9)模型精度的残差检验

设ε(t)为残差序列,φ(k)为相对误差序列,则ε(t)和φ(k)可以用来检验建立的预测模型精度,如式(16)和(17)所示。

(16)

(17)

1.1.3 GM(1,N)模型

预测变量往往与其他变量存在关系,GM(1,N)模型的引入很好地利用了这一特点,N为内在的因素数量,它比仅仅从单一序列进行建模的GM(1,1)更科学合理[16]。具体建模过程如下:

(1)构建GM(1,N)模型

(18)

(2)使用式(13)计算参数a和bi,此时B和Y分别为

(19)

(20)

(3)GM(1,N)模型的近似时间响应式

(21)

(4)累减还原后得到预测模型

(22)

(5)同样利用式(16)和(17)进行模型精度的残差检验。

1.2 回归分析理论

(1)构建多元回归模型

假设因变量为y,t个自变量分别为x1,x2,…,xt,描述t个自变量和误差项ε影响因变量y的多元回归模型一般形式可表示为:

y=β0+β1x1+β2x2+…+βtxt+ε

(23)

式中,β0,β1,β2,…,βt为回归模型的参数;ε为误差项。

(2)估计的多元回归方程

(24)

(3)参数的最小二乘法估计

(25)

(26)

(4)回归模型精度的残差检验

设ε(t)为绝对误差序列,φ(k)为相对误差序列,则ε(t)和φ(k)可以用来检验建立的回归预测模型精度。

(27)

(28)

2 民航事故征候的灰色预测和多元回归预测

本文从民航业发展公报中提取了2010-2019年与事故征候(A)相关的16个指标:A1运输总周转量(亿吨公里),A2旅客运输量(亿),A3货邮运输量(万吨),A4运输机场旅客吞吐量(亿),A5运输机场货邮吞吐量(万吨),A6运输机场起降架次(万),A7运输机队(架),A8运输机场(个),A9定期航班航线(条),A10航线里程(万公里),A11运输飞机平均日利用率(小时),A12营业收入(亿元),A13严重事故征候万时率,A14航班正常率,A15旅客投诉(件),A16并固定资产投资(亿元),将考察的各指标依次编号为A1-A16并进行数据建模分析。事故征候与各考察指标的关系见图1所示,从中可以明显看出与事故征候呈线性关系的指标。

图1 事故征候和考察指标的关系

2.1 灰色理论分析

2.1.1 事故征候与各指标的灰色关联分析

以事故征候(A)为参考序列,A1-A16各指标为比较序列,利用Python编程语言依据式(1)-式(5)进行灰色关联度分析。由计算结果可知,事故征候与航线里程、运输机队规模、旅客运输量、定期航班航线数量、运输机场旅客吞吐量、运输机场起降架次关联度较高,分别为0.951 6、0.945 5、0.944 1、0.943 4、0.942 0、0.932 3,进行灰色预测时,优先使用关联度较高的指标进行预测。

2.1.2 GM(1,1)模型预测事故征候

将2010-2019年事故征候数作为原始序列,利用式(7)进行一次累加得到1—AGO序列,通过式(8)进行光滑性检验,结果显示序列通过光滑性检验可以用来建立GM(1,1)模型,由式(11)、(12)、(13)可得:

将a、b和a/b的值代入式(14),可得GM(1,1)预测模型的时间响应方程:

代入式(15)进行预测计算,利用式(16)和(17)进行模型精度的残差检验,结果显示平均相对误差为7.48%,具体计算结果见表1。

续图1

2.1.3 GM(1,N)模型预测事故征候

由灰色关联分析可知,在统计的16个指标要素中与事故征候关联度达到0.9以上的有9个,使用这9个指标数据,建立灰色GM(1,N)预测模型,通过计算发现当5≤N≤10时,即建立GM(1,5)- GM(1,10)模型后计算预测结果误差很大,故只建立GM(1,2)、GM(1,3)、GM(1,4)模型用于研究。以GM(1,4)为例说明建模计算过程,将事故征候作为特征序列,航线里程、运输机队规模、旅客运输量作为相关因素序列。GM(1,2)、GM(1,3)数学建模过程类似。

特征序列和相关因素的1-AGO序列分别为:

X1(1)=(221,451,746,1 048,1 372,1 766,2 285,2 872,3 440,4 010)

X2(1)=(276.5,625.56,953.57,1 364.17,1 827.89,2 359.59,2 994.39,3 742.69,4 580.67,5 528.89)

X3(1)=(1 597,3 361,5 302,7 447,9 817,12 467,15 417,18 713,22 352,26 170)

X4(1)=(2.68,5.61,8.8,12.34,16.26,20.62,25.5,31.02,37.14,43.74)

X1(1)的紧邻均值生成序列Z1(1)(k)为:

Z1(1)(k)=(336,598.5,897,1 210,1 569,2 025.5,2 578.5,3 156,3 725)

利用式(19)和(20)构建B和Y,使用式(13)计算参数a和bi,则有:

代入B和Y可得:

a=1.212 2,b2=0.679 3,b3=0.998 1,b4=-566.361 6

将a和bi的值代入式(21)可得GM(1,4)的近似时间响应式

代入相关数据进行预测计算,利用式(16)和(17)进行模型精度的残差检验,结果显示平均相对误差为15.90%,其它模型具体计算结果见表1。

2.2 多元回归模型预测

相关性分析表明,事故征候和指标间存在线性关系,所以对事故征候和其他16个指标利用SPSS软件执行多元线性回归分析。为避免自变量间多重共线性的问题,得到向后筛选策略共经过7步完成回归方程的建立,回归拟合情况最优,调整R2为0.966,回归方程的自变量为A7运输机队规模,A12营业收入,其拟合预测直线方程为:

各预测模型的平均相对误差分别为7.48%、15.52%、27.86%和15.9%,计算结果显示平均相对误差为4.62%,具体计算结果见表1。

表1 各预测模型结果及误差

2.3 模型拟合效果比较

通过灰色模型和多元回归模型得到2010-2019年事故征候数,模型曲线拟合情况见图2,3种模型的拟合预测结果和平均相对误差见表1,发现多元回归的平均误差为4.62%,远优于GM(1,1)和GM(1,N)模型,而GM(1,2)模型的平均相对误差在GM(1,N)灰色预测模型中最小,GM(1,4)模型对2016-2019年的事故征候拟合精度较高。

图2 预测模型拟合情况

3 事故征候的预测

预测模型的价值在于对未来的预测,因此使用拟合精度最高的多元回归模型预测2020年和2021年的事故征候数。由民航业发展统计公报统计可知,运输机队规模(A7)2019年较2018年增长了4.92%,近8年统计数据表明,运输机队规模年平均增长率为10.19%。营业收入(A12)方面,2019年较2018年增长了4.76%。近8年统计数据表明,营业收入年平均增长率为11.61%。分别以上一年度增长率和年平均增长率计算2020年和2021年运输机队规模和营业收入,将以上指标数值代入回归模型方程,可得2020年事故征候数预测在616~645之间,而2021年事故征候数预测在650~711之间,事故征候数将随着民航业的不断壮大发展而呈上升趋势。

4 结论

(1)多元线性回归模型拟合精度很高,适宜对事故征候进行预测,拟合模型相关指标未来的数值可以通过结合上一年度的增长率和近几年平均增长率估计得到,从而预测出事故征候未来的数值区间。鉴于此,依据该模型预测得到2020年和2021年事故征候的预测区间分别为616~645和650~711,事故征候数呈现上升趋势,仍需要重视行业的安全。

(2)GM(1,1)模型预测过程简单,仅需要对预测的变量准确统计,短期预测较为准确。GM(1,N)模型预测过程中,需要执行变量间的灰色关联分析,从关联度大的指标中选取不同的因素进行建模比较,从而找到预测精度更高的模型。GM(1,4)在短期预测中精度更高,但前提是需要有准确的相关因素数据作为支撑。实际利用GM(1,4)模型时,相关因素的预测可以结合历史平均水平或者将来期望的水平。

(3)从GM(1,N)和多元回归拟合预测的分析过程来看,影响事故征候的指标主要是运输机队规模、运输机场、旅客运输量、航线里程、营业收入。因而,在制定民航发展规划时,考虑用这些主要影响指标制定事故征候的红线水平数量具有重要的指导意义。同时,历史统计表明事故征候的变化呈现曲线上升趋势,进一步提高模型预测精度可以从多元非线性拟合的角度出发进行预测,以提高模型的适用性和精度。

猜你喜欢
关联度灰色精度
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
基于不同快速星历的GAMIT解算精度分析
数字化无模铸造五轴精密成形机精度检验项目分析与研究
基于熵权TOPSIS法和灰色关联度分析的藤茶药材等级研究
浅灰色的小猪
中国制造业产业关联度分析
中国制造业产业关联度分析
灰色时代
她、它的灰色时髦观
谢文骏与刘翔110m栏分段成绩与总成绩的灰色关联度对比分析