袁乐平,张文东,赵力梵,崔湘奇
(中国民航大学 安全科学与工程学院,天津 300300)
民航系统是1个复杂的社会技术系统,其涉及人、设备、环境和管理等多方面的因素,不安全事件的产生通常是系统内部以及外部诸多因素共同制约和影响的结果。事故预防是民航安全管理的首要任务,导致事故发生的因素同样存在于征候中[1],深入挖掘事故/征候中各因素的关联关系,有利于了解事故发生的演变过程和致因因素。
机组威胁与差错管理(TEM)模型是由机组资源管理逐渐发展而来,包含威胁、机组差错、非预期航空器状态在内的一整套管理系统[2]。国际民航组织(ICAO)在DOC 9868文件Training(PANS-TRG Third Edition,2020)的附件C中对TEM模型有详细描述,并将其应用于航线运行安全审计(LOSA)及空管正常运行监测过程等[3-4],国际航空运输协会(International Air Transport Association,IATA)在2020年航空安全报告中运用TEM模型进行数据分析[5]。将TEM模型应用于民航事故因素提取,能够完整覆盖民航运行过程中的各项复杂风险因素。
关联规则作为1种典型的数据挖掘方法,可深入挖掘事故影响因素之间的联系[6]。随着各行各业事故安全领域数据量和事故属性维度的增加,多维多层关联规则的研究和应用日渐广泛。刘文恒[7]利用Apriori算法对公路穿村镇路段交通事故致因的关联规则进行挖掘,筛选二项集、三项集以及四项集规则结果,分析事故致因因素之间的内在关系;况宇琦等[8]基于Apriori算法,提出1种适用于多维多层关联规则挖掘的模式,挖掘塔式起重机事故属性与致因间多维多层的关联规则。Chen等[9]利用Reason模型结合经典关联规则算法设计多维关联规则算法,挖掘出影响船舶连锁事故的人为因素。2021年,Ashraf等[10]收集美国加州机动车辆管理局的自动驾驶汽车碰撞报告,应用决策树和关联规则方法提取自动驾驶汽车碰撞前的碰撞规则。国内外学者研究表明,关联规则能够有效地挖掘事故报告中的安全信息,但多应用于道路交通运输领域,民航领域则相对较少。
本文以2014—2020年的619起民航事故/征候报告为基础,借鉴ICAO DOC 9868文件附件C、IATA航空安全报告以及已有的威胁与差错文献[11-12],通过改进传统的单维关联规则,实现对多维多层的民航事故/征候案例关联规则挖掘,从而探究威胁、机组差错、非预期航空器状态、结束状态等相关因素之间的关系,为减少民航不安全事件的发生提供有效决策依据。
机组威胁与差错管理是1个概念性的框架,其从动态的角度记录复杂环境中飞行安全、航空器状态和机组人员表现之间的内部关系,揭示飞行事故/征候产生的原因和具体过程。从飞行机组角度看,威胁和差错管理模型有3个基本组成部分:威胁、差错和非期望的航空器状态。威胁和差错是日常机组资源管理的内容,管理不当易造成非期望的航空器状态,不适当的非期望航空器状态管理则又可能导致不安全的后果。非期望的航空器状态管理与威胁和差错管理同样重要,是保持飞行运行安全裕度的最后机会。
Apriori算法由Agrawal等[13]于1993年提出,是研究关联规则最具代表性的方法。该算法涉及2个基本指标:支持度与置信度。算法包含2个阶段:第一步,扫描整个事务数据库,找到所有支持度大于最小支持度的频繁项集;第二步,以第一步中的频繁项集为基础产生满足最小置信度的关联规则(形如A⟹B的蕴含式)。为了使关联规则的相关性更强,引入提升度,关联规则相关指标含义解释[14]如表1所示。
表1 关联规则相关指标含义Table 1 Indicators related to association rules
Apriori算法挖掘的是单层单维关联规则,民航不安全事件数据所包含的因素维度多样、层次复杂,为提高多维多层关联规则挖掘效率,进行如下改进:
1)基于维约束的关联规则挖掘。对于多维关联规则,可指定挖掘不同维度之间的关联规则。例如,挖掘谓词“结束状态”与“机组差错”、“威胁”等其他因素的关系。
2)精简关联规则。在数据较大的关联规则挖掘过程中,产生的大量关联规则使得分析和利用这些规则变得较为困难。因此,需要对冗余关联规则进行删除[15]。方法:存在规则R1:A⟹B与规则R2:C⟹D,若A⊂C,B⊂D,且Lift(R1)>Lift(R2),则规则R2是规则R1的冗余规则,并删除规则R2。
综上,民航不安全事件关联规则挖掘流程如图1所示。
图1 民航不安全事件关联规则挖掘流程Fig.1 Mining process of association rules of civil aviation unsafe incidents
针对事故信息挖掘的特征,通过维度选择,对民航不安全事件进行3方面的挖掘:1)事件严重性相关因素挖掘;2)TEM模型因素关联挖掘;3)结束状态致因因素挖掘。
为了直观地了解民航不安全事件中各因素间的层次关系,构建机组威胁与差错管理模型,如表2所示。
根据事件性质,增加结束状态和事件等级维度,见表3。事件等级主要参照《民用航空器事件调查规定》(CCAR—395—R2)和《民用航空器征候等级划分办法》(AC—395—AS—01)进行分类。
表2 机组威胁与差错管理模型Table 2 Flight crew threats and errors management model
分析2014—2020年的航空事故调查报告,提取每篇事件报告所涉及的TEM模型因素,整理出民航事故/征候的TEM模型因素的布尔矩阵数据集,有效数据619条。
表3 结束状态与事件等级Table 3 End states and incident level
3.3.1 民航不安全事件严重性关联挖掘
通过Python的efficient_apriori包导入apriori函数,导入包含“结束状态”、“TEM因素”、“事件等级”的民航事故/征候布尔矩阵数据集,进行关联规则挖掘。设置最小支持度为0.002 5,最小置信度为0.5,最小提升度为1.5,删除冗余规则,按照置信度排序,得到事件严重度关联规则,见表4。
表4 事件严重性关联规则Table 4 Association rules of incident severity
由表4中的规则1,2,3,5可知,航空器在飞行中损坏,与气象和鸟类/外来物有关,置信度分别为0.96,0.86,造成的事件等级多数为运输航空一般征候。此外,规则4,6显示:结构失效和起落架/轮胎故障与运输航空一般征候也有较大关系,置信度分别为0.84,0.79。
规则8表明,驾驶舱/客舱/货舱起火或冒烟多造成运输航空严重征候,置信度为0.62,提升度为4.80。
规则9表明,偏离跑道/滑行道易造成通用航空征候,通航机组及相关部门应关注此结束状态。
规则10表明,航空器在飞行中失控的结束状态,易造成一般飞行事故,提升度为5.48。机组人员与相关安全管理人员须关注这一结束状态。
3.3.2 TEM因素关联挖掘
导入只包含TEM因素的布尔矩阵数据集进行关联规则挖掘,设置最小支持度阈值为0.03,最小置信度阈值为0.6,最小提升度为1,删除冗余规则,按照置信度排序,得到6条TEM因素关联规则,见表5。
表5 TEM因素关联规则Table 5 Association rules of TEM factors
由表5中的规则3,4可知,飞行员之间沟通差错和简令与标准操作程序遵守/标准操作程序交叉检查置信度分别为0.71,0.66。由此可以推断,机组人员之间缺乏足够的沟通交流,易造成标准操作程序遵守不严格或交叉检查不足。同时,错过或省略简令,也会造成程序执行错误。
从规则1,2,5,6可以看出,缺乏/不足的飞行培训与手动操纵/飞行控制差错之间有着比较显著的影响,表明足够的培训时长和健全的培训系统,是提高机组人员手动驾驶能力的关键。其中,规则1,2表明航空器操作状态与手动操纵/飞行控制关系较大。规则5,6涉及到的安全管理、标准操作程序遵守/标准操作程序交叉检查,也是造成不安全事件发生的重要因素。
总体而言,机组人员的手动驾驶技能、航空公司与相关部门的飞行培训和安全管理、机组人员的沟通交流和程序执行是造成民航事故/征候的比较显著的TEM因素。
较高的支持度与置信度说明规则具有更高的可用性和确定性,但能看到的规则也越少,通过降低阈值,可以得到TEM因素中更广泛的关联信息。设置最小支持度为0.01,最小置信度为0.3,最小提升度为1,删除冗余规则,过滤出二项集关联规则,通过Python调用networkx和matplotlib.pyplot包,建立关联共线网络,如图2所示,网络的边颜色深浅表示相邻结点之间的置信度大小,边的颜色越深,相关性越大。
图2 TEM因素关联网络Fig.2 Association network diagram of TEM factors
3.3.3 结束状态致因因素挖掘
设置最小支持度为0.005,最小置信度为0.3,最小提升度为1,删除冗余规则,过滤二项集规则,挖掘出“结束状态”中每个属性的关联致因因素的共线网络,如图3所示。
图3 结束状态致因关联网络Fig.3 Associated network diagram of end states cause factors
由图3可以看出,“结束状态”的属性表明事件的性质或状态,事件的子图直观地表现出影响不同事件的相关机组威胁与差错的关联因素。各子图以networkx库的spring_layout的网络布局分布,中心结点代表结束状态,周围节点为TEM模型的各项因素,边颜色的深浅表明TEM因素与“结束状态”的置信度大小,颜色越深,相关性越大,反之亦然。
总体而言,造成航空器不安全结束状态的首要原因是人为差错。
1)偏离跑道/滑行道、飞行中失控、可控飞行撞地、重着陆、擦尾事件与手动操纵/飞行控制关系较大,其中偏离跑道/滑行道与手动操纵/飞行控制为强相关,置信度为0.88,提升度为5.13。相关管理部门与航空公司需要加强机组人员手动驾驶方面的应急处置能力,加大对这几类事件的针对性培训与模拟机训练。
2)机场外着陆与迫降主要与发动机故障/动力装置故障有关,针对此类事件,需要提高机组人员对于机械故障的应急处置能力,加强对航空器的维护与维修。
3)跑道外接地主要与标准操作程序遵守/标准操作程序交叉检查关系较大,应对此类事件,机组人员须严格遵守相关检查单和手册的要求,及时准确地进行交叉检查和有效的沟通交流,避免错、漏、忘。
4)造成飞行中损坏的主要原因是气象,机组人员须在飞行前了解相关地区的气象预报,做好应对突发气象的应急处置准备,避免或减少航空器飞行过程中受气象原因导致的损坏。
5)地面损坏主要是由于地面车辆的交通碰撞或剐蹭航空器,也与地面运行:标准操作程序及检查相关。航空公司或地面部门应制定详细的地面车辆管理规定或条例,例如规定地面运行车辆与航空器的合理安全距离等,并督促相关人员严格遵守,避免由于相关管理标准的缺失或不足造成航空器的损坏。
1)利用机组威胁与差错管理模型提取民航不安全事件的特征,通过关联规则挖掘民航不安全事件中的规律,从总体上找到影响民航运行安全水平的重要因素。
2)研究发现,航空器在飞行中失控最容易造成一般飞行事故的发生;机组人员的差错为不安全事件的首要原因,程序遵守与检查和飞行员的手动操纵控制是最需要关注的2个差错;研究获得不同结束状态的直接原因组合,其中偏离跑道/滑行道与手动操纵/飞行控制的关系最为显著。
3)关联规则可以有效利用航空事故调查报告数据,为民航不安全事件案例的分析提供新的方法和思路,为机组资源管理和民航安全管理提供针对性的决策参考。本文研究重点主要在于民航不安全事件关联规则的挖掘以及挖掘信息分析与可视化处理,未来可结合自然语言处理技术,提高自动化关联规则挖掘效率。