相似单元堤段模糊聚类分析

2018-06-08 03:09傅蜀燕林志祥高胜松
水利经济 2018年3期
关键词:堤段堤防定性

傅蜀燕,欧 斌,林志祥,3,高胜松

(1.南京水利科学研究院水文水资源与水利工程科学国家重点实验室,江苏 南京 210098;2.云南农业大学水利学院,云南 昆明 650201;3.云南省水利厅工程管理局,云南 昆明 650021;4.云南农业大学机电工程学院,云南 昆明 650201)

将堤防工程划分为若干单元堤段,再将相似性较高的单元堤段划为一类,实现堤防分类管理是提高堤防工程日常运行管理效率的有效方法。目前国内学者针对堤防分类方法开展了一些研究:马晓忠等[1]按地质情况和地理位置将堤防分为若干组合堤段,再将组合堤段按堤防工程的填筑情况和堤身结构划分为若干单元堤段,但分类依据不够细化;杨德玮等[2]细化了单元堤段的划分依据,但未考虑单元堤段的相似性归类,致使安全评价的工作量依然较大;张清明等[3]先按照堤防结构与外部环境拟定单元堤段,再选取不同指标对单元堤段进行聚类分析,但缺少对聚类结果优劣的判定分析。鉴于此,本文在现有单元堤段划分的基础上,采用模糊聚类方法对单元堤段的各类指标进行相似性度量,再进行聚类分析,通过调整阈值,优化分类组合并结合混合F统计方法和模糊划分熵进行验证,从而实现堤防工程单元堤段的最优分类。

1 堤防单元堤段划分准则

堤防工程可视作若干单元堤段组成。单元堤段划分的基本原则为:

a. 将历史曾经出险的险工段划分为一个单元堤段。

b. 未曾出险堤段,则根据堤防断面的主要特征(结构形式、地质条件、支护形式等),相同的堤段划为同一单元堤段[3-4]。

2 单元堤段指标分类

单元堤段包含众多属性指标,选取堤身土黏粒含量、堤身干密度、背水面坡比、堤基结构、堤防隐患情况等作为单元堤防划分的核心指标,其中前3项属于定量指标,后2项属于定性指标,定性指标按表1细分为4类。

表1 堤防定性指标分类

3 基于模糊聚类方法的单元堤段分类

在将堤防划分为若干单元的基础上,视每个单元堤段包含若干区分其特性的核心指标,如表2所示。

表2 单元堤段核心指标

表2中X1~Xn代表所有的单元堤段集合,C1~Cp表示单元堤段核心指标的集合。这些指标能够从不同角度描述单元堤段的特征,但也给聚类分析带来了一定困难,尤其是定量指标,它们的量纲和量级并不一致,如不加调整地使用,数值较小的指标容易被忽略,因此有必要对原始指标值进行处理。处理方式主要有两种:

a. 忽略量纲的差异,直接对各个定量指标的数值进行放大或缩小,使其量级大致相同,易于比较。

b. 对各个定量指标进行归一化处理,因归一化处理的目的是对单元堤段进行分类,并不比较优劣,所以可以不考虑定量指标是成本型指标还是效益型指标。

本文定量指标采用归一化处理方法[5]。

对于粗集决策表中定量指标和定性指标,需要采取合适的相似性度量公式构建模糊相似矩阵。单元堤段的相似性可以用它们之间的距离来衡量。对于定量指标,常用的距离公式有Minkowski距离、Manhattan距离、Euclidean距离、Mahalanobis距离、Chebyshev距离等。本文采用Euclidean距离公式,即

(1)

式中:dE为单元堤段之间关于定量指标的欧氏距离;cik、cjk分别为单元堤段Xi和单元堤段Xj第k个定量指标值;w为定量指标的个数。

对于定性指标,定义函数f(a,b)为

(2)

则单元堤段Xi和单元堤段Xj关于定性指标的距离为

(3)

式中:cik′、cjk′分别为单元堤段Xi和单元堤段Xj第k′个定性指标值;q为定性指标的个数。

由上述分析可知,单元堤段Xi和单元堤段Xj的相似性度量公式为

rij=r(Xi,Xj)=

(4)

由式(4)可建立n阶模糊相似矩阵为

(5)

模糊相似矩阵R只满足自反性和相似性,不具有传递性,可用平方法求传递闭包t(R),即R2=RR,R4=R2R2,……

经过有限次运算后,一定有R2k=R2(k+1),于是可以得到一个模糊等价矩阵t(R)=R2k。

然后设定模糊等价矩阵的阈值λ∈[0,1],若t(R)中rij≥λ,则单元堤段Xi和Xj可划分为同一类[6-7]。在聚类过程中,可以不断调整λ,直至得到比较合适的类别总数。

4 应用实例

4.1 工程概况

某堤防工程全长12.92 km,是流域平原区重要的防洪保护工程。堤防典型断面堤顶宽6 m,堤身平均高度12.5 m,临水侧坡比1∶2.5,背水侧受地形限制,坡比为1∶2和1∶2.5两类,堤身为壤土均质土堤。河道水位主要受径流影响,一般每年5—10月为汛期,11月—次年4月为枯季,水位变幅较大且呈现较明显的年周期变化,历史最高水位为 10.22 m。河道内广泛发育着谷内式松散沉积物,在底部有古长江沉积的圆砾、砾砂及少量中细砂及砂壤土、黏性土;上部为砂壤土、粉细砂、黏性土及淤泥质土;表层则为最近代泛滥沉积的粉土-黏性土,历经水流冲刷-沉积。由于水流缓慢、稳定,沉积的规律性、层次均较明显,夹层、互层状,薄层分布、水平层理发育是其主要特性。

4.2 核心指标分类

依据堤防单元堤段划分的基本原则,全长12.92 km堤防共划分为12个单元堤段,按照堤身土黏粒含量、堤身干密度、背水面坡比、堤基结构、堤防隐患情况等5类指标,单元堤段核心指标统计如表3所示。

表3 单元堤段核心指标统计

4.3 单元堤段聚类分析

对表3中定量指标和定性指标分别采用式(1)和式(3)进行归一化处理,然后采用式(4)建立单元堤段模糊相似矩阵R:

再对模糊相似矩阵R采用平方法给予改进:

对R4进行检验后知,其满足自反性、对称性,且R4°R4⊆R4,故R4满足传递性,因此R4是一个模糊等价矩阵。取λ=0.7,得到λ截距矩阵Rλ为

Rλ=(rij)=

据此获得该堤防的分类为{X1,X2,X4,X5,X8,X9,X10}、{X3}、{X6,X12}、{X7}、{X11}共5类,即原有的12个单元堤段被划分为5类。当取λ=0.80,得到堤防的分类为{X1,X2,X4,X5,X8}、{X3}、{X9,X10}、{X6,X12}、{X7}、{X11}6类。

为验证分类的优劣程度,先采用混合F统计方法(Mixed-F)确定最佳分类数[8],分类结果如表4所示。当分类数为6时,对应的Mixed-F值最大,说明该分类数为最佳分类数。进一步验证该分类的可靠性,采用模糊划分熵进行评价[9],文献中拟定某两类的重叠程度(Hij(U;c))达到0.75时,两类归为同一类,验证λ=0.80时,6类单元堤段(编号I~VI)之间的Hij(U;c)如表5所示。6类单元堤段的重叠度均较低,验证了该分类的可靠性。

表4 不同分类数对应的Mixed-F

表5 不同分类数之间的Hij(U;c)

5 结 论

在划分单元堤段的基础上,采用

模糊聚类方法对单元堤段的定性指标和定量指标进行相似性度量,构建单元堤段模糊相似矩阵,采用平方法计算出模糊相似矩阵对应的模糊等价矩阵。通过不断调整设置阈值,对单元堤段进行分类,再采用Mixed-F法和模糊划分熵对分类结论进行了验证,得到单元堤段划分为6类的最优分类方式,实现了减少堤防日常管理与安全评价工作量的目的。

参考文献:

[1] 马晓忠,彭雪辉,张友明,等.基于单元堤段洪泽湖大堤风险分析[J].水利水电技术,2015,46(4):143-147.

[2] 杨德玮,盛金保,彭雪辉.堤防工程单元堤安全等级评判及风险估计[J].水电能源科学,2016,34(2):77-81.

[3] 张清明,徐帅,周杨.堤防工程安全评价单元堤段选取方法研究[J].人民黄河,2012,34(1):16-18.

[4] 欧斌. 土质堤防渗流和稳定性状剖析与安全评测方法[D].南京:河海大学,2016.

[5] 肖汉光,蔡从中. 特征向量的归一化比较性研究[J].计算机工程与应用,2009,45(22):117-119.

[6] 罗兰星. 模糊聚类分析中传递闭包法及其应用[J]. 四川省卫生管理干部学院学报,2005,24(2):108-110.

[7] 周玉新,周志芳,孙其国.岩体结构面产状的综合模糊聚类分析[J].岩石力学与工程学报,2005,24(13):2283-2287.

[8] BEZDEK J C. Pattern recognition with objective function algorithms[M]. New York:Plenum Press,1981.

[9] 孙才志,王敬东,潘俊.模糊聚类分析最佳聚类数的确定方法研究[J]. 模糊系统与数学,2001,15(1):89-92.

猜你喜欢
堤段堤防定性
分裂平衡问题的Levitin-Polyak适定性
基于聚类算法理论的七八一七堤防单元堤段分类研究
去洞庭“心腹之患”须治“沙质堤坝”
沅江市堤垸警戒水位调整的必要性及调整值分析
当归和欧当归的定性与定量鉴别
紧邻堤防深基坑开挖方法研究与应用
2016年河南省己建成堤防长度
基于原位观测试验的甘肃省中小河流治理工程地质分析
河南省2014年已治理堤防长度
河南省2014年已治理达标堤防长度