兰玉廷
(新疆昌源水务库尔勒银泉供水有限公司,新疆 库尔勒 841000)
为保障水闸、大坝等水利工程安全可靠运行,要定期且准确观测和分析水工建筑物的沉降、裂缝、渗压等,以能够及时掌握工程健康状况与薄弱环节,为后期加固维修提供可靠资料[1- 3]。传统以人工定期观测方式为主,室外观测任务重、测量周期长、人为误差影响大,监测效率与精度无法保证[4]。随着信息化与智能化要求的提高,充分利用先进传感器、网络、数据库等信息技术进行各类水工建筑物的安全自动监测成为必然选择[5- 6]。
自动监测在观测频次、精度上的显著优势可以保证水闸工程安全状况的连续准确监测要求,能够长期记录各类监测数据,通过数据分析和比对,发现可能导致事故的异常参数并及时报警。在工程安全监测数据的在线分析时,通常是设定不同告警等级及相应的上下限阈值,当在线测量数据超出设定阈值范围时系统会执行相应的告警动作。另一方面,由于各类监测数据被长期保存至数据库,系统一般会提供历史数据的查询与数据变化趋势对比界面或分析工具,采用的是离线查询与分析方式。
本文将多通道数据流的在线相关分析与聚类方法应用于水闸工程安全监测领域,通过在线挖掘多个感兴趣测点通道数据流之间的联系来发现潜在的工程安全问题或传感器故障,以期丰富基于阈值判断告警等常用的在线安全监测手段。
水闸工程常态观测项目一般包括垂直位移、扬压力、伸缩缝、水位以及流量等,观测工作应按照规定的项目、测次、顺序和时间进行现场观测。为了改进以人工定期观测为主的水闸工程安全监测工作,前期针对某水闸工程,研究开发了基于网络的安全监测系统,从数据层面对系统结构进行了划分,如图1所示。数据采集层主要从工程安全监测数据采集箱和计算机监控系统中,汇集相关测点的实时数据,并通过数据发布接口提供给上层数据分析层调用和处理。数据服务层则通过开发功能服务及人机界面,供用户来观测系统中相关数据及分析结果。
图1 水闸安全监测系统结构
为能够进一步挖掘感兴趣测点通道数据流之间的联系,自动发现潜在的工程安全问题或传感器故障,本文重点研究多数据流的在线相关分析与聚类方法。研究内容处于系统的数据分析层,主要包括多数据流获取、数据流统计特征计算、在线相关分析与聚类3个过程。多数据流的分析结果可进一步交由监测预警模块进行推理及执行预警动作。
数据流是一种带有时间戳、按序到达、数值动态变化的无限数据序列[7]。通过在多个通道上按相同频率记录数据,并在时间轴上进行对齐,得到多通道数据流。由于数据流是按时间动态变化的,在线分析数据流时后到达数据的重要程度往往要高于先前到达的数据,因此引入衰减系数对数据流中的数据逐步遗忘。为提高计算速度与节省存储资源,只需计算和存储数据流的统计特征。
为从多通道数据流中发现数据流之间发展趋势的一致性,采用相关系数计算2个数据流的相关性[8- 9]。
水闸工程安全监测会涉及众多不同类型测点的数据流。为在线将相关度高的数据流自动分组,以发现可能存在的工程安全问题或传感器故障,采用基于密度聚类的DBSCAN算法[10- 11]对多数据流进行聚类分析。
对新疆巴音郭楞蒙古自治州孔雀河流域的某节制闸2块底板的扬压力以及翼墙与闸身、2块底板之间的伸缩缝进行监测。闸底板扬压力监测点共6个,建筑物表面伸缩缝监测共6处。除采集测压管水位、伸缩缝大小数据外,在每个伸缩缝测点处同时采集温度数据。此外,从计算机监控系统中采集上下游水位。因此,系统中供监测与分析的数据流的通道总数为20。不同通道名称的编码规则为YYL,FX,WD,SW分别代表扬压力,缝隙,温度和水位。
选择该水闸2017年5月1日—2017年10月31日共184d内存储于数据库的20个通道数据流进行在线回放分析。数据存储的频度是每个通道每小时记录1个数据点,因此待分析的每个通道的数据流的总长度为5016。本文主要进行2类多数据流的相关分析与聚类:水位数据流(包含扬压力与上下游水位)与伸缩缝数据流(包含伸缩缝温度与缝隙大小)。数据流统计特征计算公式中,衰减系数取0.99。聚类算法中阈值取1,邻域半径取0.9。当数据流相关系数大于0.9时,称数据流之间具有强正相关性,相关系数小于-0.9时,称数据流之间具有强负相关性。
在线检测结果见表1—2。表1显示了水位与扬压力数据流的在线相关分析与聚类结果,表2显示了温度与伸缩缝数据流的相关分析与聚类结果。
表1 水位与扬压力数据流相关系数矩阵
注:YYL表示扬压力,SW代表水位,1~ZH为测点。
表2 温度与伸缩缝数据流相关系数矩阵
注:WD表示温度,FX表示伸缩缝,1~6为测点。
从表1可以查看到任意2个水位数据流的相关系数。布置于水闸工程2个断面上的扬压力测管的水位,表现出较强相关性,属正常地下水渗透现象,并且与上、下游水位SW-ZQ和SW-ZH均不相关,表明水闸地基渗压大小与上下游水位无直接关系。因此可以看出,对扬压力测管水位与上下游水位数据流进行在线相关分析与聚类,可以有效判断水闸工程渗压情况及发现传感器故障。
表2显示了温度与各伸缩缝大小数据流的相关系数矩阵。可以看出,该水闸工程各个断面连接处的底板水平伸缩缝隙大小与温度多表现出强负相关特性,其余测点处水平伸缩缝隙大小表现为弱负相关特性,相关系数取值均落在(-1,1)。因此,对伸缩缝与温度数据流进行在线相关分析与聚类,可以挖掘出伸缩缝与温度的变化特性。对于所有被归类为噪声点的数据流,可被直接用于发现各类工程安全监测传感器的异常情况。
本文以新疆孔雀河流域某水闸为例,基于水闸安全监测多数据流在线相关分析方法,得到如下结论:
(1)6个监测点各扬压力测管水位表现出强正相关,反映出正常地下水渗透现象。各测管水位与水闸上、下游水位均不相关,表明水闸地基渗压大小与上下游水位无直接关系。
(2)6个伸缩缝测点处缝隙大小与温度表现出强负相关,受温度变化影响明显,缝隙大小则受温度影响较小。
(3)本文提出的多数据流在线相关分析法可以有效挖掘多个感兴趣测点通道数据流之间的联系,自动发现潜在的工程安全问题或传感器故障,丰富了水闸工程安全监测数据的在线自动分析手段。