基于改进云相似度量度方法的大坝综合健康诊断

2023-12-01 05:55方国宝杨明化何金平
三峡大学学报(自然科学版) 2023年6期
关键词:云滴评语大坝

高 全 方国宝 杨明化 何金平

(1.长江勘测规划设计研究有限责任公司, 武汉 430010;2.国家大坝安全工程技术研究中心, 武汉 430010;3.武汉大学 水利水电学院, 武汉 430072)

大坝是组成水利枢纽的主体建筑物,大坝安全是涉及国家经济建设和人民生命财产的重大公共安全问题,大坝健康状态诊断是保障大坝安全的重要手段.大坝健康诊断主要以监测资料为基础,监测信息中蕴含着大量的不确定性,这直接决定着大坝健康诊断的不确定性.

目前,大坝健康诊断方法主要采用基于单个测点监测资料的经典监测数学模型,如统计模型、确定性模型和混合模型[1];经典监测模型本质上属于基于效应量与环境量确定性因果关系的数学模型,因而没有或较少考虑大坝健康诊断中普遍存在的不确定性问题.近些年来,一些学者将模糊数学、数据融合理论等现代数学理论引入到大坝健康诊断研究之中,开展了基于多个测点、多种效应量监测资料的大坝健康诊断模型研究[2].这些模型虽在一定程度上考虑了监测信息的不确定性问题,但大多只考虑了不确定性某一方面的特性,如不确定性的模糊性特性或随机性特性.

大坝监测信息中蕴含的不确定性,是集模糊性和随机性于一体的复合不确定性问题.现有的大坝健康诊断方法难以描述这种复合不确定性,有必要寻求新的理论和方法作为研究监测信息复合不确定性问题的技术支持.李德毅院士等在传统模糊集理论和概率统计理论的基础上提出的云模型(cloud model)[3],可较好地描述概念或变量的随机性、模糊性及其关联性,实现定性与定量不确定性之间的映射和转换,是一种专门研究复合不确定性问题的理论.

云模型在数据挖掘、模式识别、系统评估等领域中有着广泛的应用[4-7].对于发生结果的定性分析,如挖掘数据结果的分类与聚类、模式识别相似性判断、评估结果评判等,面对同类概念的不同语言值的多个云模型时,必须考察这些云模型之间的关联性和相似性,这就牵涉到这些云模型之间的相似程度的量度等问题,需要采用云相似度进行量度.目前关于云模型这些方面的研究尚不够深入,这限制了云模型在大坝健康诊断中诊断结果云模型的综合评判.本文从云模型的包络特性出发,通过分别计算两云模型的内外包络曲线的重叠面积占比为基准,取其均值作为云相似度的量度进行改进,解决了综合评价中的区间约束和半云问题,为基于云模型的的大坝健康综合诊断提供了合理的评判准则,具有良好的适用性.

1 云模型理论

1.1 云模型的概念

设U是一个用精确数值表示的定量论域,C是U上的定性概念,若定量数值x∈U是定性概念C的一次随机实现,x对C的确定度μ(x)∈[0,1]是一组有稳定倾向的随机数,即[3]

则x在论域U上的分布称为云模型,简称云(cloud),记为C(x);每一个x称为一个云滴(cloud drop),大量云滴组成云模型.

云模型用期望Ex、熵En和超熵He3 个数字特征来整体表征一个概念,记作C(Ex,En,He),如图1所示.其中:期望Ex是云滴在论域空间分布的中心值,是最能够代表定性概念的点;熵En是定性概念不确定量的量度,由概念的随机性和模糊性共同决定,不仅反映了云滴的离散程度(概率),也反映了定性概念的亦此亦彼性(模糊性);超熵He是熵的不确定性量度,即熵的熵,由熵的随机性和模糊性共同决定,主要反映定性概念中不确定性的凝聚性.

图1 正态云C(0,2,0.2)的云数字特征和云图对应的期望曲线及内、外包络曲线

1.2 云模型的包络特性

最基本、最典型的云模型类型是正态云模型,根据式(1),设U是一个用精确数值表示的定量论域,X⊆U,C是U上的定性概念,若在U中的定量值x(x∈X)是C的一次随机实现且满足条件x~N(Ex,E'2n),其中E'n~N(En,H2e),且x对C的确定度满足:

则称C(x)为正态云.对于每个固定的μi,对应云滴的期望值为Exi,进行拟合形成回归曲线,曲线上每个点就是(μi,Exi),可以将此曲线称为正态云的期望曲线:

期望曲线反映数据集在空间随机分布的统计规律,是云滴集合的骨架,所有云滴都在期望曲线附近随机波动,参见图1.云滴的波动表征数据样本对概念的确定度的不确定性,云滴越离散,概念的不确定程度越大.根据“3En规则”可知,99.7%的云滴落在两条曲线之间,这个区域称之为包络区域,这两条曲线分别称外包络曲线y1和内包络曲线y2.

通过内外包络曲线及包络区域,涉及3个数字特征,相比期望曲线,它既能全面地表现云滴的分布规律,也能表现云图的整体结构,对云模型的内涵外延进行双重把握.根据曲线特点,要求0<En/He<1/3,云滴的数据分布特征才呈现正态分布,研究不确定性概念才有意义.

2 改进的云相似度算法

在基于云模型的大坝健康诊断中,以云模型表征大坝性态,需要对诊断结果云模型对比诊断基准云模型进行分析来综合诊断大坝健康状态.因此,需要量度诊断结果云模型与诊断基准云模型之间的相似度,以相似度作为评判准则,实现大坝健康综合诊断.

2.1 现有云相似度算法存在的不足

云模型相似性度的度量方法有一定程度的研究,其中应用较为广泛的算法主要有3类:第1类从云滴的角度出发,以随机云滴之间的距离来衡量云相似度[8](similar cloud measurement,SCM);第2类从表征云模型数字特征出发,计算数字特征组成的特征向量的夹角余弦来衡量云相似度[9](likeness comparing method based on cloud model,LCM);第3类从云模型的几何特性出发,求解期望曲线所围公共面积占比来衡量云相似度[10](expectation based cloud model,ECM).这3类算法的基本原理和其优缺点见表1.此外,这3类算法均未考虑半云模型相似度和云模型的区间一致性约束等问题,无法适应大坝健康诊断中信息不确定性的评判、诊断基准云为半云模型等需要.其它计算方法均在这3类方法基础上进行改进,包括基于外包络曲线的云相似度算法(maximum boundary curve based cloud model,MCM)等[11-14].

表1 3类云相似度计算方法的基本原理和优缺点

2.2 基于包络曲线的云相似度算法

在基于期望曲线的ECM 计算方法的基础上,充分考量超熵对概念共识的表征、云相似对计算表达式缺陷、半云模型云相似的计算以及区间一致性约束等问题进行改进,建立基于包络曲线的云相似度算法(overlap based envelope curve of cloud model,OECCM).该方法计算云模型的外包络曲线和内包络曲线在一致性约束下的分别对应的重叠面积,然后根据JaccardSimilarity相似原理计算相似度,取两个相似度的均值作为云相似度.以外包络曲线为例,计算过程如下:

1)已知云模型Ci(Exi,Eni,Hei)、Cj(Exj,Enj,Hej),由式(4)和(5)可得两云模型的外包络曲线:

2)若两云模型的外包络曲线相交,根据“3En规则”,判断两云模型的包络曲线在并区间[min(Exi-3Eni,Exj-3Enj),max(Exi+3Eni,Exj+3Enj)]内交点情况;若为半云模型,则区间范围根据半云模型的实际边界确定,一般半云模型的“3En规则”区间为[Exi-3Eni,Exi],或[Exi,Exi+3Eni].

根据计算结果进行重叠面积划分,令y1i(x)=y1j(x),得到两云模型外包络曲线方程的交点,,其在区间内的交点情况及重叠面积划分见表2和图2.

表2 在区间内的交点情况及重叠面积划分

表2 在区间内的交点情况及重叠面积划分

注:上标1代表外包络曲线的情况,下文上标2为内包络曲线的情况.

?

图2 不同情况下云模型的外包络曲线重叠面积

3)计算外包络曲线y1i(x)、y1j(x)各自与横坐标的围合面积和,则:

同理有,和半云模型=/2.

4)分不同情况计算外包络曲线重叠面积.

情况1:重叠面积S1=0.

情况2:假设≤,两包络曲线的交点为,并基于“规则”对并区间端点的标准转换,见图2(a),则有重叠面积:

情况3:假设Exi≤Exj,两包络曲线的交点为,重叠面积由组成,见图2(b),根据情况2,同样基于“3En规则”对并区间端点的标准转换,令(Eni+3Hei)≤(Enj+3Hej),则有重叠面积:

情况4:在实际问题中,因为实际物理意义等约束条件,用半云模型表征一个完整的概念,因此即可根据半云实际重叠面积来计算,以半升云为例,计算方法同情况1、2、3.

对于情况2,重叠面积S11算法相同,而S12因区间影响而不同.假设Exi≤Exj,(Eni+3Hei)≤(Enj+3Hej),Exi+3Eni≤Exj,见图2(c),即有重叠面积:

对于情况3,重叠面积与算法相同,而因区间影响而不同.假设见图2(d),即有重叠面积:

5)根据JaccardSimilarity相似原理,计算基于外包络曲线重叠面积的相似度:

其中:S1为基于外包络曲线的重叠面积分别为两个云模型的外包络曲线与横坐标合围面积.

分析两云模型内包络曲线基本情况,在CD∈(0,1)前提下,两云模型内包络曲线见式(13),同理分别计算两个云模型的内包络曲线与横坐标合围面积与、基于内包络曲线的重叠面积S2,得到基于内包络曲线重叠面积的相似度(Ci,Cj)见式(14),交点对应重叠面积组成情况如图3所示.

图3 不同情况下云模型的内包络曲线重叠面积

根据基于外、内包络曲线重叠面积计算的相似度和,取其平均值作为基于包络曲线的云相似度,

3 算例分析与验证

为了验证本文提出的改进云相似度量度方法OECCM 的可靠性和有效性,通过相关文献中经典实例与不同算法进行对比试验,对比分析它们之间的试验结果.同时,利用OECCM 算法在半云模型中的优势,分析在综合评价中关于概念表征与结果度量的应用.

算例1:分析超熵He的取值对算法的影响,在保证期望Ex和熵En的值不变的情况下,研究随着超熵He值不断增大,云相似度的变化情况.已知云模型C1(1.0,2.0,0.2)、C2(1.0,2.0,0.4)、C3(1.0,2.0,0.6)与C'i(Exi,Eni,He)=(0,2.0,Xi),Xi=0.1,0.2,…,0.6(i=1,2,…,5,6)计算云相似度结果如图4所示,计算ECM、MCM、OECCM 度量方法下C2(1.0,2.0,0.4)与C'i(Exi,Eni,He)=(0,2.0,Xi)的云似度,如图5所示.

图4 OECCM 算法下超熵对云相似度的影响

图5 不同云相似度度量方法受超熵的影响程度

根据图4,保证期望Ex和熵En的值不变的情况下,随着超熵He的值不断增大,两云模型的云相似度不断降低,云相似度受超熵He影响越明显;不同云模型受超熵He变化的影响具有同一性,符合一般规律,受含混度影响灵敏度较好,方法合理.ECM 算法基于期望曲线,由期望Ex和熵En的值决定,不受含混度影响,影响曲线呈一条直线;MCM 算法基于外包络曲线,受超熵He影响较为明显,在期望Ex和熵En不变的情况下,超熵He小幅增大,云相似度显著增大,过于放大超熵对云相似度的影响,不符合基本认知规律.对比可知,OECCM 算法结果可靠.

算例2:选取3个经典云模型C1(3.000,3.123,0.781)、C2(2.000,3.000,0.750)、C3(1.585,3.556,0.889)来试验算法的分类效果,对比分析SCM、ECM及OECCM 算法的区分性.计算结果见表3.其中SCM 方法采用重复计算50次,取平均值作为云模型距离相似量度结果,重点比较不同云相似程度排序.

根据表3,采用OECCM 算法的评价结果与SCM、ECM 算法结果较为一致,POECCM(C2,C3)>POECCM(C1,C3)>POECCM(C1,C2),即云模型C2与C3的云相似度大于云模型C1与C2,评价结果合理.此外,试验SCM 算法,随着选取云滴数目的变化,云相似距离不稳定,对于最终相似程度缺少直接评价,还需要研究阈值确定两云模型的相似性,而OECCM算法不受云滴数目的影响,评价结果较为稳定、直接.OECCM 算法结果区分度较高,相比ECM 算法还考虑了超熵的影响,计算结果较为稳定可靠.

算例3:对长江三峡水库的诱发地震风险进行了多级模糊综合评价的实验数据[15]来验证基于包络曲线的云相似算法的可行性和合理性,以及在综合评价结果评判中的优越性.

水库诱发地震风险评价指标体系包括评语层和状态层等内容,水库的诱发地震风险评语集V由微小地震V1、有感地震V2、破坏性地震V3和中强地震V4构成,根据地震级别分别用对应的云模型表示:CV1(Ex1,En1,He1)=(1.300,0.830 0,0.02)、CV2(Ex2,En2,He2)= (3.600,0.762 8,0.02)、CV3(Ex3,En3,He3)=(5.350,0.450 8,0.02)、CV4(Ex4,En4,He4)=(6.000,0.450 8,0.02).三峡枢纽是全世界最大的水利工程,根据三峡地区的诱震环境条件,采用小区划方法,将三峡水库划分出1330个评价单元,分别对每个单元的诱发地震危险性进行评价,其中一个单元的综合评价结果云为CR(Ex,En,He)=(2.264 1,0.215 0,0.026 2),如图6所示.文献仅利用云数字特征的中心值来评价,评价结果没有充分利用云模型的性质,结果单一、缺少指向性,不利于指导工程实际.

图6 水库诱发地震风险综合评价结果云模型与评语集云模型的云图关系

本文利用云相似度的方法计算综合评价云与地震风险评语集中各云的相似度,来量度可能发生的诱发地震及对应震级的可能性大小.利用基于包络曲线的云相似度算法进行计算,CR与V1的关系按情况4中有两个交点的情况进行计算,CR与V2的关系按情况3中有两个交点的情况进行计算,计算结果见表4和图7.

表4 综合评价结果云模型与评语集云模型的云相似度

图7 综合评价结果云模型与评语集云模型的云相似度比较

根据表4和图7,该单元的地震风险结果云模型位于有感地震V2和微小地震V1之间,表明该单元存在发生微小地震和有感地震的可能,且发生微小地震的相对可能性为31.10%,远大于有感地震相对可能性8.96%,几乎不存在破坏性地震和中强地震的可能.本文方法评价结果基本一致,且更具体,有内涵.

4 基于改进云相似度量度方法的大坝综合健康诊断

4.1 基于云模型的大坝健康诊断模型

大坝安全多层次健康诊断的基础是评价指标集U对评价状态集V的隶属度μV(U).将精确的隶属度拓展为一组以μV(U)为中心值的具有稳定倾向性的随机数(即云滴),解决了模糊隶属度的确定性问题.基于云模型的大坝健康诊断建模思路为,充分利用云模型的理论在概念表征、定性定量转换以及对不确定性问题处理等方面的优势,构建诊断指标体系,建立云诊断集,获取底层云隶属度,通过云模型合并运算实现隶属云的递归融合,得到上层指标隶属云,根据云评判准则,实现大坝健康综合诊断[16].基于云模型的大坝健康综合诊断建模流程图如图8所示.

图8 基于云模型的大坝健康综合诊断建模流程图

4.2 诊断结果云图叠加结果评判

根据云模型的基本理论,隶属云通过正向正态云发生器可以生成N个云滴,表现为云图.云图在表征概念时给人以直观感受,符合人类的认知习惯.而云诊断集表征评语概念也为这种直观感受提供云参考图.

将指标诊断结果云图和诊断评语集云图进行叠加比较,可以直观地确定诊断指标(或大坝整体)的健康状态.某坝坝体及坝基部位的底层诊断指标“水平位移U111”诊断结果云为CV(U111)=C(0.741 0,0.063 4,0.007 1),将CV(U111)诊断结果云模型图和诊断评语集云模型图叠加,如图9所示.

由图可知,该大坝坝体及坝基部位底层诊断指标“水平位移U111”诊断结果云图位于诊断评语集云中的“基本正常”与“正常”之间,且更靠近“基本正常”.因此,可以直观地认为该坝坝体及坝基部位底层诊断指标“水平位移U111”的性态处于“正常”与“基本正常”之间,且偏于“基本正常”.

4.3 改进云相似度量度

仅通过隶属度云的云数字特征和云图无法给出大坝的具体性态结果,实现概念定量与定性的相互映射,完成诊断结果评判.可用通过云相似度来度量不同云模型的相关性,实现基于云模型的综合评价,基于云相似度的大坝健康诊断评判准则为:将诊断结果云模型与诊断评语集云模型进行相似度量度,计算诊断结果云与每个诊断评语云的云相似度,根据最大相似度原则来确定大坝健康状态.

提出用基于包络曲线云相似度计算方法OECCM 进行改进,充分考虑了各云数字特征的作用,将超熵纳入相似度的计算,解决了云模型区间约束以及综合评价中的半云问题,以基于包络曲线云相似度计算方法计算云相似度作为大坝健康诊断评判准则.

仍以底层诊断指标“水平位移U111”为例,诊断结果隶属度云为CV(U111)=C(0.7410,0.0063,0.0071),诊断评语云模型分别为CV1=C(1,0.103,0.013 1)、CV2=C(0.691,0.064,0.008 1)、CV3=C(0.50,0.003 9,0.005)、CV4=C(0.309,0.064,0.008 1)、CV5=C(0,0.103,0.013 1),其中CV1为半升云模型,CV5为半降云模型.按改进云相似度算法,分别计算诊断隶属云与各诊断评语集云之间的云相似度POECCM(C,Vi),计算结果见表5和图10.

表5 “水平位移U 111”诊断隶属云CV(U 111)与各诊断评语集云的云相似度计算

图10 “水平位移U 111”诊断云与诊断评语云的云相似度情况

根据最大相似度原则:

由表5可知,底层诊断指标“水平位移U111”的最大云相似度综合评判结果为:

云相似度最大诊断结果为“基本正常”,即该诊断指标健康状态为“基本正常”,与直观诊断结果一致.而根据云相似度结果数值大小,POECCM(C,V2)>POECCM(C,V1)>POECCM(C,V3)>POECCM(C,V4)>POECCM(C,V5).由图10可知,动态反映诊断结果处于“基本正常”中偏向“正常”状态.

5 结 论

本文通过分析传统云相似度的基本度量方法,针对各算法中存在的计算过程复杂、相似度结果区分度较差、云数字特征考虑不全面等方面的不足,提出了改进的基于包络曲线的云相似度算法(OECCM),并对计算原理和算法步骤展开详细研究.

1)算法从云模型的整体特性出发,基于内、外包络曲线对云图的整体和局部的把握,充分考虑了各云数字特征的作用,并在算法中解决了云模型区间约束及综合评价中的半云问题.

2)通过算例试验,改进的云相似度算法具有良好的敏感性、有效性以及合理性,计算结果具有显著区分性,为大坝健康诊断中诊断结果云的综合评判,建立云评判准则提供技术支持.

3)基于云模型的大坝健康诊断方法不仅给出了综合诊断结果和诊断结果云图,还通过云数字特征反映了详细的诊断结果期望中心值,以及诊断结果的可信度、稳定性及与实际情况偏离的程度,其比传统的评价方法给出的诊断信息更直观、更丰富、更有效,这正是基于云模型的大坝健康诊断方法的优越性.

猜你喜欢
云滴评语大坝
福建九仙山一次佛光的云滴粒子尺度分析*
流沙河语录及诸家评语
你不知道的雷雨知识
大坝:力与美的展现
云微物理特性及云滴有效半径参数化:一次降水层状云的飞机观测资料结果
云滴谱离散度对气溶胶间接效应影响的研究进展
怎样为作文写评语
作文评语探讨
如何写好作文评语
正式挡水的马来西亚沐若大坝