基于数据挖掘的民用机场水泥道面维护辅助决策模型

2019-01-08 07:43赵鸿铎马鲁宽
同济大学学报(自然科学版) 2018年12期
关键词:民用机场道面数据源

赵鸿铎,马鲁宽,唐 龙,李 萌,杜 浩

(1.同济大学 道路与交通工程教育部重点实验室,上海 201804; 2.中国民航机场建设集团有限公司,北京 100101;3.上海机场(集团)有限公司虹桥国际机场公司,上海 200335; 4.上海同科交通科技有限公司,上海 200092)

目前,机场道面管理系统[1-5]在机场得到广泛应用,其核心功能和最终目标是辅助机场管理人员制定合理的道面维护计划.因此,准确有效的道面维护决策模型成为机场道面管理系统的核心要素.

美国联邦航空管理局(Federal Aviation Administration,FAA)以道面状况指数(pavement condition index,PCI)为指标,提出了机场道面全寿命分析方法[6].但该方法的正确性依赖于道面性能预估模型.因此,研究者提出了一系列的道面性能预估模型和对应决策方法[7-11].然而,机场道面维修决策涉及方面广、影响因素多、现场状况复杂,大部分决策模型的工程应用性并不强,在实际工程中,主要还是依据专家知识和工程经验进行决策[12].但是,专家知识和工程经验法的决策过程难以在计算机中表达和实现,而且决策的正确性过于依赖决策者的工程经验和业务水平,主观不确定性极强[13],难以满足机场道面管理系统智能化辅助决策的要求.

近年来,随着数据挖掘的发展,基于数据挖掘的专家知识系统广泛应用于交通工程领域[14].特别是针对公路路面管理,研究者们利用数据挖掘对专家经验进行分析,建立了多个专家知识系统[15-17].例如,Sarasua和Jia探索了将地理信息系统(GIS)技术与数据挖掘、专家系统集成用于路面管理[18];Soibelman和Kim讨论了通过数据挖掘来构建工程建设过程中的决策知识[19];Zhou等[13]对美国北卡罗来纳州公路管理系统中的历史数据进行挖掘,建立了路面维修决策树并结合地理空间信息进行了优化.但如何利用数据挖掘分析现有的机场道面维护决策数据进而辅助机场道面进行维护决策的相关研究还较少.

鉴于此,本研究基于我国民用机场水泥道面历史决策数据,考虑道面维护决策的影响因素,分析确定了民用机场水泥道面维护决策的属性,归纳了民用机场常用水泥道面维修措施,进而利用数据挖掘中的C5.0决策树算法训练了决策树,从而建立了民用机场水泥道面维护辅助决策模型,并开展了评价和应用[20].

1 数据挖掘

数据挖掘(data mining,DM)指从大量数据中搜索隐藏于其中有特殊关系的信息和知识的过程,是数据库知识发现的核心[21-22],如图1所示.利用数据挖掘,研究者可以从已积累的机场水泥道面维护决策历史数据中发现有意义的新的关系、趋势和模式,实现该过程的基本方法是回归学习[13].回归学习可从大量的经验数据中归纳抽取出一般的规则和模式,其涉及的算法大部分来自于机器学习(machine learning,ML)领域[22].目前,在回归学习中,最新的分类算法是C5.0决策树算法.C5.0由C4.5改进而成,其分类的依据是信息增益(information gain),根据信息增益最大的字段对样本数据进行分割,此外,为了提高分类精度,需要对决策树各叶子进行裁剪或合并,最后确定各叶子的最佳阈值.与C4.5相比,C5.0在分类过程中增加了Boosting算法,使得结果更加准确[23].本研究采用的算法即C5.0决策树算法.

图1 数据挖掘-数据库知识发现的核心步骤Fig.1 Data mining-the core steps of database knowledge discovery

2 维护决策数据源

自2002年起,同济大学依据相关机场道面评价管理规范[24]对国内多个民用机场开展了道面检测和评价工作.根据检测和评价结果,机场场道管理部门制定并实施了对应的维护措施.汇总上述机场道面检测、评价和维护措施历史数据,并对其按属性分类,形成结构化数据表,如图2所示.本研究选取其中26个民用机场的356组有效的水泥道面相关数据作为维护决策数据源,其特征如图3所示.图中,数字为对应属性值的数据量,矩形大小代表对应属性值的占比.

从道面功能分区来看,数据源对应的道面涵盖了跑道、平滑道、联络道、机坪4大类,基本呈现平均分布;从所属机场来看,主要包括支线机场、干线机场和国际枢纽机场,按照飞行区等级划分,4D和4E级机场较多;从使用情况来看,大部分道面使用年限在5~20年左右,年起降架次一般在1~20万左右;从道面厚度来看,道面板厚度在32~40 cm,差异较小;从道面性能来看,道面整体性能较高,PCI等级以优为主,结构性能基本都满足使用要求,只有极少数道面结构承载力不满足通航要求.

图2 水泥道面维护决策数据结构Fig.2 Data structure of cement pavements maintenance decision-making

图3 水泥道面维护决策数据源的数据分布特征Fig.3 Data distribution characteristics of cement pavement maintenance decision-making data source

3 维护辅助决策模型构建

3.1 维护决策属性

在工程应用中,民用机场道面维护决策的影响因素根据来源可分为道面性能客观因素和管理需求主观因素;根据维修决策的影响关系,又可分为直接影响因素和间接影响因素,具体如图4所示.根据图4影响因素的划分,在民用机场道面维护决策过程中,涉及的变量属性对应可分为道面性能属性和管理需求属性.

图4 民用机场水泥道面维护决策主要影响因素Fig.4 Key influential factors of civil airport cement pavements maintenance decision-making

3.1.1道面性能属性

根据道面性能客观影响因素,水泥道面性能属性主要包括道面损坏状况、道面结构性能和使用性能.其中,评价道面损坏状况的指标为PCI,表征道面结构性能的指标主要包括道面等级序号(pavement classification number,PCN)、板底脱空率、接缝传荷能力、道面剩余寿命和结构适应性厚度,评价道面使用性能的指标包括道面抗滑性能和道面平整度.据此,利用356组历史维护决策数据,分析上述道面性能属性评价指标间的关系,以确定最终的维护决策所需考虑的道面性能属性及其评价指标.

(1) 道面损坏状况

在维护决策属性中,道面损坏状况是最主要的道面性能属性.PCI检测方法简单,且能有效表征道面的损坏状况,因而长期以来被国内外学者选定为道面维护决策的重要参数.因此,本研究选择PCI作为维护决策道面性能属性的评价指标之一.

分析356组历史决策数据,PCI与道面结构性能和使用性能评价指标间的相关性结果如表1.由表1可知,相关系数均小于0.3,表明PCI与道面结构性能和使用性能评价指标间基本不存在相关性,即除道面损坏状况外,维护决策中仍需考虑道面结构性能和使用性能.

表1 PCI与道面结构性能和使用性能指标间的相关性Tab.1 Relationships between PCI and pavement structure performance (and service performance) variables

(2) 道面结构性能

分析356组历史决策数据,道面结构性能指标间的相关性结果如表2.其中,鉴于数据源中道面结构适应性厚度差异较小,本研究并未考虑道面结构适应性厚度.

表2 道面结构性能指标间的相关性Tab.2 Correlation of pavement structure performance variables

由表2分析结果可知,PCN与剩余寿命中度相关,板底脱空率和接缝传荷能力中度相关.此外,数据源中PCN与板底脱空率分布较为均匀.因此,为了减少后续模型构建的冗余数据,加快计算速度,本研究增选PCN和板底脱空率作为维护决策属性中道面结构性能的评价指标.

(3) 道面使用性能

工程实践中,道面抗滑维修一般采用道面除胶,该措施相对比较固定,因此本研究在维护决策属性选择时并未采用抗滑性能.道面平整度直接关系到乘客舒适度,当道面平整度无法满足使用要求时,工程中一般采用道面加铺措施进行维护,该措施能恢复道面平整度,同时能适当提高结构承载力;但该措施成本高、工程规模大、延误影响大,其必要性和时机选择非常重要,因而在决策时需要慎重考虑.因此,本研究选用道面平整度来评价道面使用性能.

3.1.2管理需求属性

根据图4道面管理需求主观因素,本研究将维护决策属性中的管理需求属性划分为可用资金、许用延误、期望效益和工程安全.鉴于数据源中管理需求主观因素数据缺失,本研究以管理需求主观因素中的间接因素为依据,对356组历史维护决策数据进行归类,同时结合工程需要给出了管理需求属性等级,并提出了相应的等级划分标准,结果见表3~6.

表3 可用资金等级及建议划分标准Tab.3 Available funding and proposed criteria

表4 许用延误等级及建议划分标准Tab.4 Allowable delay and proposed criteria

3.2 维护决策措施

分析356组历史维护决策数据,最终归纳了8类民用机场常用水泥道面维护措施,结果如表7所示.

表5 期望效益等级及建议划分标准Tab.5 Expected benefit and proposed criteria

表6 工程安全等级及建议划分标准Tab.6 Engineering safety rating and proposed criteria

表7 民用机场水泥道面维护措施分类Tab.7 Classifications of civil airport cement pavements maintenance measures

3.3 维护决策树

根据归纳的8类民用机场常用水泥道面维修措施以及8种属性指标,训练维护决策树的输入数据如表8所示.基于356组历史维护数据,利用数据挖掘软件Clementine实现C5.0决策树算法.首先,本研究通过Clementine软件的样本集分割功能,取数据源的80%即285组数据作为训练集;此外,修剪纯度的置信度取值为75%,并采用了全局修剪的方法;最终,生成的决策树如图5所示.

表8 训练维护决策树的输入数据表Tab.8 Input data table for training the maintenance decision-making tree

对比传统专家经验决策树,本研究生成的决策树主要有以下特点:

(1) 传统决策树为了应用方便,一般较简洁,分枝数量少;而该决策树分枝较多,其优点是更适合复杂道面决策问题,更接近工程实际,且能借助计算机实现决策过程,分枝过多并不影响工程应用.

(2) 传统决策树往往一个属性指标只出现在一个分枝结点上,即只作为一次分枝标准;而在该决策树中,板底脱空率、PCI等属性指标多次出现在各个分枝结点上,被多次作为分枝标准重复使用,每次分枝都是单独的迭代算法,不受前一次分枝影响.因此这种算法更能提高模型决策准确度.

(3) 传统决策树是基于专家经验给出的,是一种基于力学-经验法的总结,因此不存在违背常识理解的问题;而该决策树完全基于经验法训练生成,其形状完全取决于样本数据特征,因此会出现一些难以理解的分枝.例如“28<脱空率<49,PCI≤86”,期望效益等级是按机场管理者要求的期望效益顺序排列的,而其分枝标准却是等级B和等级A、C、D,这显然不符合工程常识.

1日常养护;2日常养护+注意板底脱空;3针对性修复;4更换嵌缝料+注意脱空观测;5注浆修复;6针对性修复+注浆修复;7限制运行;8加铺图5 民用机场水泥道面维护决策树Fig.5 Maintenance decision-making tree of civil airport cement pavements

综上所述,由数据挖掘获得的决策树能满足实际工程的复杂问题要求,且生成的决策规则可以在计算机中直接应用,从而实现了道面智能化辅助决策的目标.但这种方法是完全基于样本数据特征的经验法,决策树分类结果有反常识性错误,需要结合工程实际给予修正.

4 模型评价与讨论

4.1 模型评价

为了评价本研究构建的民用机场水泥道面维护辅助决策模型的准确性,选择训练集外的20%数据源即71组数据作为检验集,输入数据类型与训练集相同,如表8所示.利用图5生成的决策规则预测决策措施,并与实际决策措施进行对比,最终结果如表9所示.从整体上看,共发生了10个与实际决策不同的结果,即模型决策的准确性达到85.9%.进一步分析发现,在10个不同的决策结果中,涉及日常养护和针对性修复措施的结果共8个,这是由日常养护和针对性修复措施在维护决策中比较难以区分造成的.另外,由于日常养护和针对性修复措施对机场运行影响较小,上述决策结果的差异是可以被允许的.因此,本研究构建的水泥道面维护决策模型具有较高的准确性和应用价值.

表9 本研究与机场管理部门决策结果对比Tab.9 Comparison of decision-making between proposed model and airport management department

4.2 讨论

决策树是从机场管理部门的决策数据中挖掘知识,并用于道面维护决策的.因此,一般情况下本研究基于C5.0决策树算法构建的决策模型能为道面决策提供技术上合理可行的维护措施.但随着数据源的变化,该方法构建的决策树会发生变化,进而会得到不同的决策模型.例如,在本研究中,决策模型的决策树是基于356组历史决策数据得到的,如果扩大数据源、改变训练集比例或者改变修剪纯度的置信度,则会得到不同的决策树.因而,通过数据挖掘得到的决策树并非是完全准确的,其结果还需要进一步地修正.但是,在道面维护决策中应用数据挖掘的方法,能够极大地提升大面积道面维护决策的效率,进而缩短项目周期;同时,对于大规模的道面网络,该方法可以避免较多的人工决策失误;此外,该方法形成的维护决策规则可以在计算机中实现,这为道面智能化辅助决策提供了可行的方案.

5 应用案例

选取上海浦东国际机场部分道面(见表10),对其年度维护计划进行辅助决策分析.

表10 选取的上海浦东国际机场道面(2005年修建)Tab.10 Selected pavements of Shanghai Pudong International Airport

根据上海浦东国际机场道面管理系统数据库中存储的道面检测数据,得到道面性能属性指标值;由2017年的机场相关信息数据,依据管理需求等级及建议划分标准,可得到对应的道面管理需求属性;最终决策属性值如表11所示.利用本研究维护决策模型得到维护措施,结果如表12所示.8个区域的PCI均在98~100之间,用现有的以PCI为决策指标的决策模型开展决策,其结果基本无差异;相反,本研究决策模型充分考虑了除PCI外的道面结构性能和使用性能以及管理需求,表12中的决策结果更加符合工程实际.

考虑到工程实际,该决策结果并非最终的道面维护措施,道面管理者需要结合现场和航班情况,进一步确定维修措施以及施工时间,并以此对决策树模型的决策结果进行修正.

表12 上海浦东国际机场道面维护决策结果Tab.12 Maintenance decision-making results for selected pavements of Shanghai Pudong International Airport

6 结论

本研究基于我国26个民用机场水泥道面的356组历史决策数据,分析确定了4种道面性能属性和4种管理需求属性,同时归纳了8类民用机场常用水泥道面维护措施,并利用数据挖掘中的C5.0决策树算法训练了决策树,从而建立了民用机场水泥道面维护辅助决策模型,并对模型开展了评价和应用,结论如下:

(1) PCI与道面结构性能和使用性能评价指标间基本不存在相关性,维护决策模型中需考虑道面结构性能和使用性能属性.

(2) 对于维护决策属性,推荐PCI、PCN、板底脱空率和平整度作为道面性能属性评价指标;建议管理需求属性选用可用资金、许用延误、期望效益和工程安全.

(3) 与传统专家经验决策树相比,基于数据挖掘生成的决策树更适合复杂道面决策问题,决策结果更接近工程实际,且能在计算机中实现智能化辅助决策.

(4) 本研究构建的决策模型准确率达85.9%,与原有模型相比,其决策结果较为合理,工程应用性较强.

本研究将数据挖掘应用于民用机场水泥道面维护决策中,为智能化辅助决策提供了可借鉴的方案,但限于历史决策数据和数据挖掘方法的不足,后续仍需在决策数据积累、数据挖掘方法选择和优化上做进一步研究,以提高决策模型的广泛适用性.

猜你喜欢
民用机场道面数据源
通航机场跑道道面承载能力分析
民用机场不停航施工安全管理及应急处置措施研究
民用机场全面预算管理问题分析与优化思考
利用属性集相关性与源误差的多真值发现方法研究
Web 大数据系统数据源选择*
湿滑跑道飞机着陆轮胎-水膜-道面相互作用
浅析民用机场预算管理的问题与应对策略
大中型民用机场供配电现状浅析
公路飞机跑道沥青道面受力分析与承载能力检测方法
基于真值发现的冲突数据源质量评价算法