一种基于MLP神经网络的大额损失飞行事故预测模型

2016-12-15 01:09于洪霞
上海电力大学学报 2016年5期
关键词:大额赋值权值

于洪霞, 李 兴

(1.上海电力学院 数理学院, 上海 201399;2.华泰财产保险有限公司 电商事业部, 上海 201315)



一种基于MLP神经网络的大额损失飞行事故预测模型

于洪霞1, 李 兴2

(1.上海电力学院 数理学院, 上海 201399;2.华泰财产保险有限公司 电商事业部, 上海 201315)

运用多层感知器(MLP)神经网络方法构建了大额损失飞行事故的预测模型,并利用CASE数据库中抽取的飞行事故案例进行了检验.预测效果检验表明,所构建的模型具有较好的拟合程度和预测效果.机身价值和机龄是大额损失飞行事故的重要影响因素.

大额损失飞行事故; 分类变量; 多层感知器; 神经网络方法

飞行事故对民航企业及全社会都会产生重大的负面影响.除了发生全损事故外,当由于自然灾害或意外事故等原因造成大额损失时,负面影响依然严重.因此,国内外的众多研究人员在民航事故统计及预测相关领域已开展了各种研究.

罗晓利[1]对中国民航1990~2003年间152起飞行事件进行了统计研究;杜红兵和李珍香[2]对世界及国内进近着陆运输飞行事故原因及预防对策进行了研究;王永刚和吕学梅[3]进行了民航事故症候数据的关联度分析;SALAM R G[4]应用随机模拟研究了事故的发生概率和损失程度,并建立了评估模型.于洪霞等人[5]运用Logistic回归分析研究了全损飞行事故的影响因素并构建了预测模型.

神经网络方法是一种模拟生物神经系统,具有学习功能的方法.它是一个由大量神经元广泛相互连接而成的非线性复杂网络系统,能够深入挖掘隐藏在影响因素背后数据之间的复杂关系,近年来已广泛地应用于各种复杂系统的预测,比如地震灾害易损性估计[6];丁松滨和王飞[7]运用神经网络研究了飞机的飞行事故万时率.

Rumelhart等人提出了多层感知器(Multilayer Perceptron,MLP)方法,主要用于解决非线性可分数据的多类别分解问题.本文将运用神经网络方法中研究比较成熟的MLP方法构建了大额损失飞行事故的预测模型,进而将结果与已有全损飞行事故的研究成果进行了对比分析.

1 数据来源及样本数据诊断

本文选取的数据来自于Airclaims公司的CASE世界航空事故赔案数据库.CASE数据库中包含8 000余条自1952年以来的飞行事故案例,满足本研究所需的数据基础.

本研究中大额损失的定义采用的是CASE数据库中的定义:损失金额大于等于100万美元或损失比例大于等于机身价值的10%,两者满足一条即归类为大额损失.从更新日期为2008年6月14日的CASE数据库中检索到的世界民航国内、国际定期客货航班发生在起飞、航路和降落过程中的非全损事故损失记录共计230条,其中大额损失事故有169条,占比73%,非大额损失(小额损失)事故有61条,占比27%.数据简要统计汇总如表1所示.

表1 数据损失程度统计

为进行Logistic回归分析,首先要将样本数据转化为分类变量数据.转化后的数据包括4个自变量:航班类型,分为两组(在国际间执行的航班赋值为1,在某国家内执行的航班赋值为0);飞机制造商,分为3组(波音赋值为1,空客赋值为2,其他制造商赋值为3);机身价值,分为3组(大于3 000万美元时赋值为1,在1.0×107~3.0×107美元之间时赋值为2,小于等于1 000万美元时赋值为3);机龄,分为3组(大于25年赋值为1,在15~25年之间赋值为2,小于等于14年赋值为3).另外,还包括一个因变量,即损失程度,大额损失赋值为1,小额损失赋值为0.

2 基于MLP神经网络的预测模型

2.1 MLP神经网络建模

2.1.1 网络结构参数设定

对于网络结构中具体参数的设定如下.

(1) 输入层节点数 输入层起缓冲存储器的作用,把数据源加到网络上.在本模型中,取11.

(2) 隐含层数 文献[8]和文献[9]提出,具有一个隐含层的网络可以用任意精度去逼近一个复杂的系统,因此只考虑具有一个隐含层的神经网络模型.

(3) 隐含层内节点数 由于节点太少不能充分表达系统中的非线性关系,节点太多又会发生过度拟合的问题.通过对不同的节点数进行试验,最终选择了5个节点.

(4) 输出层节点 选择的输出层节点为1个,选取的是因变量等于1时的拟概率,在0~1之间.

2.1.2 MLP神经网络模型构建

根据上文讨论,输入层有11个节点,隐藏层有5个节点,输出层有2个节点,假设输入层与隐藏层之间的权值V=(vji)11×5,B=(b1,b2,b3,…,b5)为隐藏层节点的偏置权值,b为输出层神经元的偏置权值.隐藏层与输出层之间的权值为W=(wj)5×1,隐藏层的激活函数为f1(·),输出层的激活函数为f2(·),则隐藏层的输出为:

输出层神经元的输出为:

其中,激活函数都取Sigmoid函数,即:

S型函数具有可微分性,更接近生物神经元的信号输出形式,饱和非线性特征,增强了网络的非线性影射能力.计算的风险等级在(0,1)之间,所以选用S型函数.

2.1.3 MLP模型的训练

模型的训练类型选用批处理,优化算法选用梯度下降法.网络经过训练后达到一定的稳定状态,形成11×5×1的网络模型,各权值取值如表2和表3所示.

表2 输入层与隐藏层各权值取值

表3 隐藏层与输出层各权值取值

2.2 模型预测效果

通过对230条数据进行准确率判断,结果如表4所示.由表4可知,模型对样本数据分类情况的综合预测准确率为71.3%,而且大额损失预测准确率也在76.9%,表明预测结果较好.

表4 样本数据预测分类情况

注:分类临界值为0.600.

表5为各因子标准化重要性排序,可以看出,机身价值与机龄两个因素对大额损失有重要影响.

于洪霞等人[5]指出,全损飞行事故的影响因素中机龄和航班类型因素具有统计学意义.机身价值和飞机制造商不具有统计学意义.将大额损失飞机事故影响因素与全损飞行事故的影响因素对比可以得出以下两个结论.

(1) 全损飞行事故与大额损失飞行事故中相同的影响因素是机龄.老龄飞机发生全损和大额损失飞行事故的概率较高,而且机龄越老,全损和大额损失的概率越高.这个结论提醒我们应更加关注老龄飞机.

(2) 机身价值在大额损失事故的影响因素中具有统计学意义.随着技术的发展,飞机的价值越来越高,本研究提醒民航运输企业有必要对高价值飞机提高风险意识.

表5 各因子标准化重要性排序

3 结 语

综上所述,本文所构建的模型预测效果较好,可以为民航企业安全预算、投资决策和安全管理等方面提供科学参考.

[1] 罗晓利.1990~2003年中国民航152起小于间隔飞行事件的分类统计研究[J].中国安全科学学报,2004,14(12):26-30.

[2] 杜红兵,李珍香.进近着陆运输飞行事故原因及预防对策研究[J].中国安全科学学报,2006,16(6):118-122.

[3] 王永刚,吕学梅.民航事故症候的关联度分析和灰色模型预测[J].安全与环境学报,2006,6(6):127-130.

[4] SALAM,ROMEL G.Estimating the cost of commercial airlines catastrophes—a stochastic simulation approach[C]∥Casualty Actuarial Society Forum Casualty Actuarial Society.Arlington,Virginia,2003:379-422.

[5] 于洪霞,季建华,李兴.一种基于Logistic回归的全损飞行事故分析与预测[J].中国安全科学学报,2010,20(3):34-38.

[6] 成小平,胡聿贤,帅向华.基于神经网络模型的房屋震害易损性估计方法[J].自然灾害学报,2000,9(2):68-73.

[7] 丁松滨,王飞.基于BP神经网络的民航安全预测方法研究[J].中国民航学院学报,2006,24(1):53-56.

[8] CYBENKO G.Approximation by superpositions of a sigmoidal function[J].Mathematics of Control,Signals and Systems,1989,2(4):303-314.

[9] HORNIK K,STINCHCOMBE M,WHITE H.Multilayer feed forward networks are universal approximators[J].Neural Networks,1989(2):359-366.

(编辑 胡小萍)

Analysis and Forecast Model of Major Loss Flight AccidentsBased on MLP Neural Networks Method

YU Hongxia1, LI Xing2

(1.SchoolofMathematicsandPhysics,ShanghaiUniversityofElectricPower,Shanghai201399,China; 2.EcommerceBusinessUnit,HuataiP&CInsuranceCo.Ltd,Shanghai201315,China)

Multilayer Perceptron(MLP) neural networks method is applied to build a forecast model of major loss flight accidents.Then the model is tested with sample data in CASE accident database.The results demonstrate that the model is adequate,effective.The model indicates that hull value and aircraft age are significantly effective factors to major loss flight accidents.

major loss flight accidents; categorical variables; multilayer perceptron(MLP); neural networks method

10.3969/j.issn.1006-4729.2016.05.019

2015-09-09

简介:于洪霞(1978-),博士,讲师,辽宁朝阳人.主要研究方向为最优化理论及应用.E-mail:yuhongxialx@aliyun.com.

X928.03;O212

A

1006-4729(2016)05-0504-03

猜你喜欢
大额赋值权值
L-代数上的赋值
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
银行大额存单的蝶变
强赋值幺半群上的加权Mealy机与加权Moore机的关系*
算法框图问题中的易错点
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
利用赋值法解决抽象函数相关问题オ
大额存单“拼息”