李慧敏,孙佳斌,李 锋,汪伦焰,袁晨晖
(华北水利水电大学 水利学院,河南 郑州 450046,E-mail:lifeng9406@126.com)
跨流域调水工程是解决缺水地区水资源紧缺问题的有效途径,工程本身具有运输线路长、跨越地域广、工程复杂等特点;一旦发生险情事故,对国民经济和社会安全影响巨大。当前,大多数调水工程都采用了明渠输水,以南水北调中线工程为例,全长 1276.41km,其中明渠工程 1102.94km,约占整个调水工程的86%,因此明渠工程事故的快速处置决策对保障调水工程的正常运行至关重要。
案例推理(Case-based Reasoning)的核心思想是依据目标案例(当前事故)情景和案例库中源案例情景的映射关系,筛选出与目标案例较为接近的源案例,并参照源案例的处置方案为当前事故的应急决策提供支持[1]。目前,国内针对工程事故的应急决策方法进行了相当多的研究。李锋刚[2]从不同维度研究了案例相似性的度量,提出了一种多策略相似性检索技术。Fan等[3]通过构造新型的混合相似性度量方法,为瓦斯爆炸的应急决策提供帮助。Liao等[4]以案例推理(CBR)技术为基础,设计了有效处理突发环境事件应急方案生成方法。靖可等[5]通过分析基于案例推理的应急救援决策机理,结合整体优势度对决策方案进行调整和学习。王兴鹏等[6]借助CBR理论构建地铁工程事故的案例表示模型,并利用两级检索策略来提高案例检索的效率。李磊等[7]通过引入CBR技术,提出了铁路行车事故属性缺失时的全局相似度计算模型。董银杏等[8]通过构造全局相似度计算模型建立了基于案例推理的燃气突发事件应急决策方法。
当前,研究人员主要对跨流域调水工程的风险预测、预防开展了研究[9,10]。而对调水工程事故发生后的及时响应、快速处置的应急决策研究相对较少。因此,本文以跨流域调水明渠工程事故的应急决策为研究对象,结合案例推理技术,为此类事故的应急决策提供一种新思路、新方法。
在对多个调水工程项目进行实地调研的基础上,根据跨流域调水明渠工程事故的特点,将描述此类事故状态的特征属性分为4部分:
(1)事故特征信息。包含事故类型和险情部位两类属性。
(2)气象条件。包含天气、温度、风向、风力以及能见度。
(3)故障点信息。包含发生时间、死亡人数、受伤人数、损坏程度、受影响渠段的长度、输水运行状况等具体信息。
(4)周边环境状况。包含渠段特性、抢险道路状况、与居民区距离、附近居民人数、次生灾害情况、有无公共建筑物等信息。
案例推理技术的应用是在案例合理表示的基础上进行的,案例表示是否能够准确、精炼地表达事故的信息,将会对案例检索的效率和品质产生影响。案例表示法主要分为框架表示法[11]、XML表示法[12]、本体表示法[13]等。本文应用框架表示法对明渠工程事故进行表述。框架表示法是以数据框架的形式对案例进行表述,一个框架由多个槽组成,而槽可由槽名及槽值构成,或者由多个侧面组成,每个侧面又包含侧面名称和侧面值。跨流域调水明渠工程事故案例表示可分为3个框架:
(1)案例(事故)情景特征表示框架(见表1)。
表1 跨流域调水明渠工程事故案例情景表示框架
(2)应急救援方案表示框架(见表2)。
表2 跨流域调水明渠工程事故案例应急救援方案表示框架
(3)应急救援方案处置效果表示框架(见表3)。
表3 跨流域调水明渠工程事故救援方案处置效果表示框架
案例检索环节在案例推理理论中至关重要,一般由属性相似度和结构相似度两部分组成。随着系统中案例数量的增长,仅凭案例间的属性相似度和结构相似度来计算案例间的整体相似度,将会导致检索的速率和准确性下降,因此需要通过改善检索策略来提升案例检索的效率和实用性[6]。
由于跨流域调水明渠工程事故的特征属性类别和数量比较繁杂,从存储大量源案例的案例库中逐个计算相似度会降低检索算法的时效性,因此通过构造两级检索策略来提高案例检索的效率,该检索流程如图1所示。
图1 案例检索流程
(1)一级检索:快速检索。挑选具备高辨识度的特征属性作为一级检索属性,据此筛选出符合条件的源案例,并将源案例整合为案例集。本文选择事故类型和险情部位作为一级检索属性。
(2)二级检索:模糊匹配。将通过一级检索获取的源案例与目标案例进行整体相似度计算,进而筛选出与目标案例相似的源案例,本文选取气象条件、事故基本信息、故障点信息和周边环境状况的子属性作为二级检索属性。
借助模糊层次分析法,利用同层次指标间两两比较相对重要性来确定权重[14]。
(1)构建层次结构模型。根据表 1的案例情景表示框架,构建如图2所示的明渠工程事故层次结构模型。
图2 跨流域调水明渠工程事故层次结构模型
(2)构造模糊判断矩阵。设某层指标集为A={A1,A2,…,An},通过专家对A1,A2,…,An相互之间的重要度进行比较,可得指标集A的模糊判断矩阵R为:
式中,rij表示为元素ri与元素rj的重要性比较结果,可按表4进行取值。
表4 模糊标度及含义
若模糊判断矩阵 R=(rij)n×n,对于任意的 i,j,k,k=1,2,3,…,n,都满足 rij=rik-rjk+0.5,则称其为模糊一致判断矩阵,若不满足,则通过式(1)求得模糊一致判断矩阵Rij′。
(3)计算各属性指标权重。结合求排序向量的最小二乘法的方式,可求得指标权重为:
式中,wi表示第i个指标的权重,α=2(n-1)/5。
案例间整体相似度是在两级检索策略的基础上,结合案例间的结构相似度和局部属性相似度得来。由于跨流域调水明渠工程事故现场环境复杂,可能会出现部分事故属性值缺失的情形,这里采用结构相似度来解决该类状况所引起的整体相似度计算方法不适用的问题[15]。
3.3.1 案例间结构相似度计算
先分别计算目标案例X与源案例Y的非空属性构成的集合A与B,然后计算C=A∩B和D=A∪B,再计算最后定义目标案例X与源案例Y的相似度S为:
3.3.2 局部属性相似度计算
明渠工程事故案例的属性值类型包含模糊语言型、数值型、枚举型、符号型及区间型,其计算方法分别为:
(1)模糊语言型。运用标度变换法将语言变量转化为三角模糊数再采用式(4)和式(5)将其规范为
式中,Tα、Tβ分别表示属性值为效益型、成本型。
接着将三角模糊数(xij, yij, zij)转变成区间数,并利用区间型相似度计算方法得出模糊语言属性间的相似度,
(2)数值型。采用基于海明距离公式计算属性间相似度。
式中,xj、yij分别表示目标案例X和源案例Yi关于属性 j所对应的数据(下同);min(j)、max(j)表示属性j的最小值和最大值。
(3)枚举型。此种属性在一个存在一定等级关系的数据集合中取值,其相似度计算公式为:
式中,g为属性j取值的等级个数。
(4)符号型。采用如下计算公式:
(5)区间数型。当整理的数据不是精确值时,需采用区间数对属性的具体信息进行描述[15]。计算公式表示为:
式中,[a1,a2]和[b1,b2]为属性对应的区间值,
3.3.3 整体相似度计算
整体相似度是在一级检索的基础上,结合二级属性的局部属性相似度和结构相似度得来。
(1)一级检索属性。根据两级检索的定义可知,一级检索的相似度计算公式为:
式中,t=1,2;分别表示事故类型和险情部位属性。
(2)二级检索属性繁多,属性值类型不同,且不同属性的重要度各不相同。计算公式为:
式中, Sim2(X , Y)为源案例Y与目标案例X的二级检索属性相似度值为案例X与案例Y各自的一级属性i下第j指标的二级属性相似度;wi为赋予一级属性i的权重;wij为赋予一级属性i下的二级属性指标j的权重。
(3)计算目标案例与各源案例的整体相似度。由于要考虑属性值缺失的情况,因此引入结构相似度,案例的整体相似度为:
基于案例推理的应急决策流程如图3所示。
图3 基于CBR的跨流域调水明渠工程事故应急决策流程图
以某跨流域调水明渠工程事故作为目标案例。设案例库中存储了6个历史案例,组成源案例集合Y={Y1,Y2,Y3,Y4,Y5,Y6},目标案例 X 与源案例Y的事故情景属性值如表5所示,且源案例Y所对应的处置方案、方案处置效果评价内容分别如表6和表7所示。
由于事故的“发生时间”采用24h制来描述,因此需要对“发生时间”的属性值进行量化,提高属性相似度计算的科学性。其中“8~12点,14~18点”定义为“1”,12~14 点定义为“2”,“6~9 点,18~20点”量化为“3”,“20~24点,24~6点”量化为“5”[15]。
根据表5可知,在进行两级检索时,源案例Y2、Y3、Y5与目标案例X的一级检索属性(事故类型和险情部位)完全一致,进入案例集进行二级检索。利用模糊层次分析法计算得到事故的一级属性即气象条件、故障点信息和周边环境状况的权重,如表8所示。同理,可求得一级属性指标下的二级属性指标权重,如表9所示。
表5 案例Y与当前明渠工程事故X属性值
表6 案例Y的应急救援方案
表7 案例Y的救援方案处置效果
表8 一级属性指标判断矩阵
表9 一级属性指标下二级属性指标权重
根据式(4)~式(9),参照案例间属性相似度计算方法,计算目标案例X与源案例Y2、Y3以及Y5的属性相似度,如表10所示。
表10 目标案例X与源案例{Y2,Y3,Y5}的属性相似度
由于源案例Y2缺失风力大小的属性值,源案例Y3缺失影响渠段长度的属性值,源案例Y5缺少死亡人数与受伤人数两项属性值,同时目标案例X中缺少受伤人数的具体表述,因此根据式(3)得到案例X与案例Y2、案例Y3及案例Y5的结构相似度分别为S2=0.889、S3=0.867、S5=0.908。根据式(10)~式(12)计算得到案例的整体相似度 sim(X,Y2)=0.739、sim(X,Y3)=0.618、sim(X,Y5)=0.532。设定相似度阈值为0.6时,则可以得到符合阈值要求的源案例集{Y2,Y3}。
由表10可知,源案例Y2在损坏程度、影响渠段长度、输水运行状况、抢险道路状况、与居民区距离、附近居民人数等属性上比源案例Y3更相似于目标案例X,并且源案例Y2在输水运行状况、抢险道路状况这两个关键属性上与目标案例 X完全一致,而源案例Y3在这两个属性的相似度为0。虽然源案例Y3在温度、风向、风力、发生时间、次生灾害、有无公共建筑物等属性上与目标案例X更为相似,但是由于这些属性的影响因子较低,赋予权重较小,所以导致其整体相似度低于源案例Y2。
同时,结合表6、表7进行综合分析可知,源案例Y2的险情状态更为严重,所采取的救援方案对边坡失稳的处置更为严谨有效,救援效果也更满意;源案例Y3的受损程度则较轻,及时进行处理即可,采取的措施较为简便,处置效果较好;通过以上分析可知,目标案例X与源案例Y2的情景更为相似,源案例Y2的处置措施也更加适用于目标案例X的事故情景,因此,可采用该救援方案作为参考来保障目标案例X险情的有效处置。
采用框架表示法对跨流域调水明渠工程事故案例进行结构化表示,能够有效降低存储案例的信息模糊性,进而提升案例表述的精准度。也为明渠工程事故在信息化系统中的存储提供参考。在两级检索策略的基础上,针对不同类型的属性值,设计了相应的属性相似度计算方法,并通过引入结构相似度,解决了属性值缺失导致相似度计算不合理的问题,进而提升整体相似度计算方法的实用性。通过对具体事故的案例分析,证明了本文所提出的整体相似度计算方法可以高效地实现跨流域调水明渠工程事故案例的匹配检索,为明渠工程事故的应急决策提供了一种新思路。