王欣宇方, 邓安仲, 李胜波, 缪剑刚
(陆军勤务学院,重庆 401330)
机场工程是重要的一类基础设施,机场道面是其重要的组成部分。机场道面按照用途可分为跑道、滑行道、停机坪等主要类型,是供飞机起飞、着陆和停放的场所,是直接与飞行相关的机场外场设施,我国的机场以刚性道面为主[1]。机场道面的体量大、地位重,由于长期暴露在较恶劣的自然环境中,导致设施病害多发、工程寿命较短。因此机场一般常设维管分队,作为管理者,与机场道面(管理对象)一并构成了一个机场维护管理的子系统。针对该子系统的维护管理制度通常为机场道面检查和维修机制,事实上是有效连接、处理该子系统“管理者”和“被管理者”,使其发挥更好功能的一种办法,管理者通过检查发现被管理者存在的与飞行保障要求不相适应的问题,并通过维修来改善这些问题。
由于飞机的结构特点、发动机性能、起降性能、暖机特性、飞行科目和环境影响等原因,飞机对机场道面的要求非常高,损坏的道面容易导致飞行事故,因此道面检查和维修机制有着频繁检查、及时维修和工程量小的特点。当前众多机场通过建立信息管理系统来缓解机场道面体量大与管理制度要求高之间的矛盾。机场飞行区图形化管理信息系统[2],具有可视化的优势,缺少对维修决策的支持。机场道面管理系统[3]是基于资产管理软件进行的信息化应用,缺少对机场管理特点的分析。凌建明[4]研究的机场管理系统,涵盖了机场道面调查与测试、分析与评价,以及维修对策选择与优化等内容。张献民[5]实现了机场道面信息的三维场景显示与属性信息查询、场道PCN、PCI计算、场道剩余使用寿命预测、维修辅助决策等功能。但是这些机场道面的信息系统,多关注现状的展示、道面检测、寿命预测,缺少与机场道面管理业务的结合,收集的数据也缺少进一步的挖掘分析。
当今信息化条件下,在组织运行的过程中,常常面临数据爆炸、知识却贫乏的问题,即淹没在数据中,却不能制定合适的决策。数据挖掘DM(Data Mining)正是将杂乱的数据转化为有序的知识[6]。数据是对客观事物属性、关系的抽象表示,而知识=数据+处理+理解与推理+解决问题的方法,是经过广泛、深入、长期的实践,被组织消化吸收而得到的,并且可以成为决策的根据。数据挖掘正是加快“消化吸收”效率的有效工具,关联规则挖掘[7-8]就是数据挖掘中典型的一类方法。王观虎[9]通过采集道面状况指数、平整度指数、摩擦系数等指标,基于灰色定权聚类,对机场道面的使用性能进行了评价,但是这种评价仅适用于宏观的整修决策,对日常的维修决策难以应用。赵鸿铎[10]将4种道面性能属性评价指标,以及4类道面管理需求属性作为输入端,8种不同的维护管理策略作为输出端,通过C5.0算法训练了决策树,得出了机场道面维护辅助决策模型;同样,该模型也是针对宏观的大面积场坪而言,训练样本不易获取。张绍阳[11]采集路面病害、建设信息、运营信息等形成数据仓库,通过关联规则算法,发现沥青混凝土路面病害和影响因子之间的关联,这种方法注重于考察路面建设和使用者对病害的影响,是多维度的关联规则挖掘,缺少对道面不同病害类型的分析。龙小勇[12]收集了北方多个机场的道面病害类型和损坏程度等数据,采用关联规则挖掘技术挖掘了道面病害之间的关联知识,具有较大的借鉴意义,但是其不足之处在于,数据挖掘的模型并没有与道面检查及维修机制很好地结合,对多个机场的数据进行人为的收集显得并不可复制,并且忽视了不同机场之间建设年代、等级规格、使用频次、环境条件等因素的影响。
本文基于关联规则挖掘的方法,构建了机场道面病害恶化规律挖掘模型,并将该模型与道面检查和维修机制相耦合,通过实例分析与结果讨论,得到了机场道面的恶化规律,并进行了新机制效果的预评估,为进一步提升机场道面管理系统的智能化水平提供了具体途径。
关联规则挖掘最早的应用场景是购物篮分析,每当人们提到这种数据挖掘方法,通常举例:“沃尔玛把啤酒和尿布放在一起进行销售”,它的挖掘结论形如{啤酒}=>{尿水},含义是如果一个顾客购买啤酒,那么他很可能也会购买尿布,诸如此类的信息可以用于指导商品摆放和定价。最终目标是在事物数据库中,得出形如式(1)的表达式:
X=(s,c)>Y
(1)
事物数据库是指每发生一次事件都有一条记录的数据库,式(1)中X、Y为项的集合,项为事物数据库中,最小且不可分割的单元,例如啤酒、尿布。s是指支持度,为数据库中X和Y同时出现的事物个数,记为:
s=sup(X=>Y)=sup(XY)
(2)
当s为小数时,视为X和Y同时出现的事物数除以事物总数A。它为一个概率值,表示XY出现的概率即:
rsup(X=>Y)=sup(XY)/A=P(XY)
(3)
c是指置信度,表示在出现X时,也出现Y的概率,也就是一个事物,包含X的情况下,也包含Y的条件概率:
c=conf(X=>Y)=P(Y|X)=
P(XY)/P(X)=sup(XY)/A/sup(X)/A=
sup(SY)/sup(X)
(4)
有了明确的关联规则参数的定义,但是并不能立刻运算,因为如果直接进行暴力循环运算,运算量过大很难实现,因此Rakesh Agrawal和Ramakrishnan Srikant在1994年提出了Apriori算法。其核心原理是,如果一个项集是非频繁的,那么它的所有超集也是非频繁的。因此在指定最小支持度后,某个项集如果小于最小支持度,那么它的超集都不必再进行计算,从而大大减少了计算量。
机场道面病害是一个典型的“购物篮”,由于水泥混凝土热胀冷缩的要求,机场道面一般按照5 m×5 m或者4.5 m×4.5 m的规格进行分仓,根据经验来看,道面病害通常出现在一块分仓板上。不同病害发生的道面板,距离较远并且相对独立,类似于每个顾客的采购行为,每块道面板出现的病害情况,类似于顾客采购的不同物品。
对发现的病害进行的记录,实际上构成了机场道面病害事务数据库,板块的编号为该数据库中事务的唯一ID。式(1)中的X、Y,为水泥混凝土板道面病害中常见的6种类型{边角剥落,板间错台,表面剥落,板块断裂,表面裂缝,灌缝料损坏}的子集,显然它们是不相交的。支持度s为X和Y同时出现的板块总数,置信度c为一个板块包含X的情况下,也包含Y的条件概率。在机场道面病害恶化规律挖掘模型中,支持度s表示病害X的频繁程度,置信度c表示在病害X发生的情况下,病害X、Y共同发生的机率。
如果置信度达到规定的限额,本文定义恶化率t:
t=P(X|Y)=P(XY)/P(Y)=
sup(XY)/sup(Y)
(5)
图1可以较好地表明支持度s、置信度c、恶化率t之间的关系,只有当支持度s、置信度c,分别达到最小支持度和置信度的要求时(一般来说都是较高的值),才可计算恶化率t,其意义为病害Y恶化为病害X的机率。从图1中可以看出,阴影部分为病害XY共同出现的板块个数,阴影部分占板块总数A的比例为支持度s,占具有病害X板块个数的比例为置信度c,占具有病害Y板块个数的比例为恶化率t。对于道面全寿命周期来说,病害Y是早期的病害,病害X是相对晚期的病害。XY较少,并且出现病害X时,都出现了病害Y,因此本文认为病害X是由病害Y发展演变而来,病害Y是病害X的早期征兆。
图1 项集关系图
当X为多个病害时不适合使用恶化率t。为便于说明,将关联规则形式改为XY=>Z,其中X、Y均为单个病害。这种形式的关联规则,只能说明病害X、Y都发生时,将较大可能出现病害Z,但不能认可XY=>Z的恶化率t,下面用反证法的思路进行说明。证明:
a.假设认可XY=>Z的恶化率t,即XY=>Z满足最小置信度。
b.在道面恶化的逻辑上,Z将以一定的概率恶化为X和Y,等价于Z将先以一定的概率恶化为X或Y,等价于认可X=>Z或Y=>Z的恶化率t,等价于X=>Z或Y=>Z满足最小置信度。
c.但是X=>Z或Y=>Z并不一定满足最小置信度。
证明完毕。因此,认可XY=>Z的恶化率t的前提,必须是X=>Z和Y=>Z满足最小置信度。
机场道面病害恶化规律挖掘模型流程如图2所示,主要由输入、算法处理和规则解释共3部分组成。在输入端,需要输入道面病害数据,并设定最小支持度和最小置信度。算法处理包括Apriori算法、Eclat算法、FPGrowth算法等,不同的算法区别主要体现在面对不同数据结构时,所需的算力的不同,也就是计算时间的不同。在面对本文所涉及的0~1稀疏矩阵时,各算法所需时间相差不大,因此选用Apriori算法。在分析关联规则结果是否满足需求后,再调整最小支持度和置信度,最后输出关联规则结果并进行解释,得到对机场道面维管作业有用的知识。
图2 机场道面病害恶化规律挖掘模型流程
原有的机场道面检查和维修机制如图3左侧的细线所示,主要包括如下几个流程环节:①在飞行前、飞行中、平时巡检时发现道面损坏并上报。②审核维修任务、确认不存在重复申报等情况。③任务分配安排,确定人员、工具、材料等情况。④维修日程安排,确定具体道面病害的维修计划。⑤维修小组赴现场进行维修。⑥维修完成后,进行相应的记录,并由审核人员确认任务完成情况。
图3 机场道面病害恶化规律挖掘模型与检查、维修机制的耦合
原有机制通常是经验驱动的,检查发现病害后通过经验判断制定维修任务安排。将机场道面病害恶化规律挖掘模型与原机制耦合后,可得到一个数据驱动的新机制。新机制是数据驱动的,在原机制的基础上增加了2个提取数据环节、1个数据库、1个数据挖掘环节、1个知识库,并删减1个原有环节。
提取的数据1包括:道面板损坏的发现时间、损坏的类型、损坏的程度、损坏的位置。原有机制该4类数据同样需要采集,不清楚检查发现的损坏情况,就无法进行维修,通常维管分队有专用的道面损坏情况记录本,需要手写进行记录。实际工作中时间、位置容易发生错误,并且极其耗费精力。建议开发基于数据库的简单工单管理系统,检查时携带PC端电脑,现场由系统自动记录时间,仅需进行位置、病害类型、程度这3个数据的现场记录。
提取的数据2包括:道面板维修的维修人员、开始时间、完成时间、维修方法、工程量。原有机制也要求手写记录,同样依托工单管理系统,维修工作实施环节中领取工具、材料记为开始时间,归还工具、剩余材料记为完成时间,维修人员自动记录,仅需进行维修方法、工程量这2个数据的现场记录。并且,由于引入了工单管理信息系统,维修工作记录环节可以去除。
知识库1包括:道面板损坏类型的占比、容易并发的损坏类型、道面恶化的阶段和道面恶化的概率。可用于道面维修优先级的决策,制订诸如恶化概率高的道面先维修、处于损坏后期造成事故概率大的道面先维修等策略,从而更加合理地利用维修资源,而不是按原有机制进行无差别维修。
以我国西南地区的A机场为例,该机场道面在1.5 a内,出现病害的道面板共202块,记录的道面病害事物数据如表1所示。
表1 机场道面病害事物数据库Table 1 Database table of airport pavement diseases板块编号边角剥落板间错台表面剥落板块断裂表面裂缝灌缝料损坏1111010200000130010004100000
列入病害事物数据库的板块,均为在检查时发现病害的板块。因此,将块板编号作为病害事物编号,本文将其暂按1-202进行排序。一次板块的病害事物包括6种病害类型,以1作为出现该病害,0作为未出现该病害。其中,出现板间错台和灌封料损坏时,将其归入板缝两侧出现病害的板块,如果板缝两侧未出现或均出现病害,统一归入飞机常年起飞/垂直起飞方向的板块。可以看出该数据库是一个逻辑稀疏矩阵。
对道面病害类型的频数进行分析,得到图4。可以看出202条记录中,有118次与灌缝料损坏有关,占58%,说明灌缝料损坏是机场道面的高发病害类型。其次可以看出病害的发生数与病害的严重程度成反比,一定程度上体现出道面损坏由量变到质变的过程。202个机场道面板块,共出现了274次病害,说明一个板块上容易出现多种病害类型,将出现1种病害类型的称为1类板块,出现2种的称为2类板块,以此类推并统计每种类型中6种病害出现的频数,得到图5。
图4 机场道面损坏形式频数图
图5 机场道面损坏并发频数图
由图5可以看出,并发4类病害的板块,边角剥落、板间错台、表面裂缝均为5次。并发3类病害的板块,其高发类型是边角剥落和表面剥落,均达到了9次,占3类病害总板块数的90%。并发2类病害的板块,其高发类型是边角剥落,达到了22次,占2类病害总板块数的59%。1类损坏的板块中,有100块(66%)是灌缝料损坏,说明灌缝料这种病害相对独立发生,并且在短期内(例如此次的试验数据,1.5 a内)不易引发其他类型的板块病害。
根据道面病害恶化规律挖掘模型,使用R语言编程,对病害数据进行挖掘。如表2所示。
表2 道面病害关联规则Table 2 Association rules of road diseases规则编号XY支持度/%置信度/%恶化率/%1板块断裂板间错台2.4871.4325.002板间错台,表面裂缝边角剥落2.4883.33—3板间错台,表面裂缝表面剥落2.4883.33—4边角剥落,表面裂缝表面剥落4.4675.00—5表面裂缝表面剥落9.9068.9740.006板间错台,表面剥落表面裂缝2.4871.43—7边角剥落,板间错台表面裂缝2.4862.50—8边角剥落,表面剥落表面裂缝4.4660.00—9板间错台板块断裂2.4825.0071.4310边角剥落灌缝料损坏8.9136.0015.25
由工作经验可知,机场道面病害中板块断裂、板间错台等病害占比较低,因此最小支持度设定为2%,最小置信度设置为60%。将得到的8条关联规则列入表2的前8条。可以看出在这样的最小支持度和置信度下,无法得到X=>Y形结论中,Y为板块断裂和灌缝料损坏的结论。经分析认为,板块断裂本来就是较低发的病害,而灌缝料损坏发生得过于频繁,这2点均有可能影响规则的置信度。因此将置信度降低为25%,得到了与这2种病害有关的2条规则,将其列入表2的后2条。由表2分析可得以下几点结论:
a.在针对各类病害认可的最小支持度和置信度设定下,可以看出道面病害恶化可分为3个阶段,如图6所示,第1阶段是灌缝料损坏,第2阶段是边角剥落、表面剥落等病害多发、并发,第3阶段是板块断裂。
图6 道面病害恶化图
b.灌缝料损坏有15.25%的可能性将恶化为边角剥落(规则7,灌缝料损坏=>边角剥落t=15.25%)。其置信度虽然只有36%,但支持度比较高,达到了8.91%。当机场道面灌缝料损坏后,雨水、风沙、种子等外界不利因素很容易影响板间的地基,从而导致在机轮等荷载作用下,容易形成应力集中,造成道面板边角的剥落。
c.第2阶段中边角剥落、表面裂缝、表面剥落、板间错台这4类病害多发、并发。规则2表明,出现板间错台、表面裂缝时,并发边角剥落的置信度为83.33%。规则3、4、5表明,出现相应的病害时,并发表面剥落的置信度分别为83.33%、75%、68.97%,其中,表面剥落演变为表面裂缝的恶化率为40%。规则6、7、8表明,出现相应的病害时,并发表面裂缝的置信度分别为71.43%、62.50%、60.00%。可以看出,板间错台并没有出现在并发病害中,说明这种病害对于道面状况来说更为少见和不利。并且由于表面裂缝=>表面剥落恶化率的存在,本文认为在第2阶段中,边角剥落、表面剥落对于道面健康状况来说是属于较轻的病害,而表面裂缝较重,板间错台最重,这与板块损坏规律的先验知识也是相符的。
d.由规则1,板块断裂=>板间错台t=25%可知,当道面板出现板间错台病害后,演化为板块断裂的可能性为25%,这一规则的置信度为71.34%。而对于规则9可以看出,板间错台=>板块断裂支持度s=2.48%、置信度c=25%、恶化率t=71.34%,板间错台时,也出现板块断裂病害的支持度、置信度均较低,因此难以相信板块断裂是导致板间错台的主要因素。事实上,板间错台多是由地基病害造成的,而并不是板块断裂。相反,板间错台确容易导致板块断裂(经验结论、关联规则结论)。根据规则9,也可以侧面得出指标恶化率的使用,必须要在相对较高的置信度的条件下进行。
通过将机场道面病害恶化规律挖掘模型与检查、维修机制进行耦合,得到了优化后的机制。表3从维护管理水平、工作量、成本等3个角度出发,根据得到的A机场道面病害恶化规律知识,针对机制的各流程环节,预评估机场道面检查、维修机制的优化效果。
表3 机场道面检查、维修机制的优化效果预评估Table 3 Pre-assessment of optimization effect of airport pavement inspection and maintenance mechanism优化机制相比于原有机制对维护管理系统说明水平提高有利基于道面病害恶化三阶段发展规律,有针对性的对初期病害道面板进行检查发现道面损坏工作量增加不利发现道面病害后,需要将板块位置、病害类型、损坏程度录入信息系统成本增加不利道面病害记录,需要投入信息化的硬件、软件,但是属于单次投入任务分配安排水平提高有利在病害初期有效进行预防性维修,对恶化率高的病害提升维修的优先级工作量减少有利改变以往经验驱动的做法,可根据得到的道面恶化规律知识分配安排任务维修工作实施水平提高有利合理的维修计划及决策,利于实施流水施工等更为科学的施工组织形式工作量减少有利改变以往无差别维修的做法,部分病害可集中打包处理,减少了反复修的情况维修工作记录—有利删除了该环节,将其融入维修实施过程,通过管理信息化进行维修记录注: 变化不大的机制流程环节未列出。
从表中可以发现,优化机制可以有效提高维护管理水平,并降低维护管理工作量。不利之处在于:①要求更高的人员素质,但可以通过加强培训进行解决。②信息化设备、软件的新增,虽可兼容于其他信息系统和硬件,但该项成本的投入是单次的。因此总的看来优化机制对维护管理系统是有利的。
a.本文将关联规则挖掘方法引入机场道面病害规律分析。建立了机场道面病害事务数据库,研究了关联规则挖掘方法,构建了道面病害恶化规律挖掘模型,指出使用支持度s表示某项病害的频发程度,置信度c表示某项病害与其他病害并发的机率,定义了恶化率t,认为可用其表征初期道面病害向晚期病害转化的机率,并对其特性和适用范围进行了说明。
b.本文将道面病害恶化规律挖掘模型,及机场道面检查、维修机制进行了耦合。指出了规律挖掘模型输入端的数据来源环节,以及得到挖掘规律后的知识应用环节,在实例分析的基础上,对机制的优化效果进行了预评估,认为优化机制在少量增加工作量、单次投入成本的基础上,可以有效提高维护管理的水平与机制运转的效率。
c.本文通过实例分析与讨论,得到了A机场道面恶化的3个阶段。并认为对于该机场来说,出现灌缝料损坏时要及时维修,因为该病害有15.25%的机率恶化为边角剥落,一旦出现边角剥落,就很容易步入多类病害多发并发的第2阶段;当道面步入恶化的第2阶段后,对于非重点部位也应尽量控制住边角剥落、表面剥落的状态,因为表面剥落将有40%的概率恶化为表面裂缝,此类病害对飞机使用较为不利;如果出现板间错台需要及时维修,否则有25%的机率恶化为板块断裂,大大增加造成不可逆损失的风险。