李远辉,杨 勇
(1、广州地铁集团有限公司 广州510308;2、广东省建筑科学研究院集团股份有限公司 广州510500)
城市轨道交通在缓解城市交通压力方面发挥着重大的作用,在公共交通出行选择中所占比例也越来越高,国内对于城市轨道交通安全监测方面的研究也取得了一些成果。文献[1]以自动化监测系统为基础结合三维数值分析法研究基坑群开挖对临近既有地铁隧道的保护措施;文献[2]基于物联网设计一种远程地铁隧道断面监测与预警系统;文献[3]在对RIA/Silverlight 技术进行研究的基础上,设计开发了地铁施工监测预警WebGIS 系统;文献[4,5]重点实现监测数据呈现、数据自动分析和预警预测功能。大数据时代的城市轨道交通监测在于围绕“有数据、用数据、管数据”做文章,提高数据利用效益,让数据采集实时化、处理高效化、分析多维化、服务大众化。本文针对大数据在城市轨道交通监测领域应用中的关键技术和难点问题进行了研究,具体内容如下:⑴关于实时监测数据异常值的处理;⑵多维度数据的有效利用;⑶城市轨道交通安全监测数据的高效应用。
城市轨道交通安全监测涉及轨道检测、结构安全监测、周边环境监测及设备安全检测等,如果不能有效地对异常数据进行辨识、处理,将直接影响监测数据的精度和分析结果,甚至导致数据的缺失。针对监测数据信息量大、数据格式复杂、频幅分别广等特点,国内学者提出了很多处理方法,如小波分析、数据流理论、数据挖掘等,这些方法多集中在离线数据的处理上,在自动化实时监测上还缺乏相应的准确率和智能化。
实时监测数据异常数据的处理首先在于有针对性的识别,基于局部异常点挖掘算法,识别出“异常点”,这些“异常点”组成点集Y,在时空维度上来看点集Y内每一个数据都对应着一个固定监测点的特定时空刻度。在这一特定时空刻度来看这点集Y 是一个个孤立的数据,但监测的特殊性在于我们往往是通过数据的异常来感知结构或环境的异常,并在此基础上对建(构)筑物的安全状况进行分析,因此我们并不能简单地判断“异常点”一定无效或者错误,甚至进行剔除。
异常数据处理的其次在于分析处理,对筛选出的“异常点”作进一步辨别,这里要应用到一套候补机制,数据集Y 将被存储在候补区域待定。
第一步:分析“异常点”点集Y 对应测点集A,并判断“异常点”对应测点集A 内测点是否孤立。若集A内多个测点对应同一数据采集仪器,即同一采集周期同一仪器所测多个测点出现异常,则这些测点为关联测点,否则认为测点孤立。
第二步:若点集A 内存在孤立测点,识别出“异常点”之后自动触发计算机自动验证机制,并对该测点进行加密观测,此次监测数据记为A1 与数据集Y 进行比对计算,差值记为△A1。若△A1 小于测量极限误差,则可认为此测点两期之间没有变形,数据集Y 有效并录入数据库,并触发相应预报警机制。若△A1 大于测量极限误差,则数据集Y 内该数值初步判断为无效数据,A1 进一步与点集A 内对应测点最后一次有效数据A0 进行计算,差值记为△A0。若△A0 小于测量极限误差,则可认为此测点两期之间没有变形,从待定区域剔除“异常点”A1 为异常测值,并存储数值A1。若△A0 大于测量极限误差,则判断点集A 测点异常,发布测点异常预警信息。
若点集A 内存在关联测点,若关联测点数量小于周期测点1/3 时处理流程如上,若关联测点数量超过周期测点1/3,则对该测量周期所有测点进行重测,此次监测数据异常点集记为Y1,并与数据集Y 内对应关联数值进行对比计算,差值记为△B1。若点集Y1 对应测点集B 与点集A 一致,△B1 小于测量极限误差,则可测量正常,且数据集Y 有效并录入数据库,并触发相应预报警机制。若点集Y1 对应测点集B 与点集A 一致,△B1 大于测量极限误差,则数据集Y 内该数值初步判断为无效数据,Y1 进一步与点集A 内对应测点最后一次有效数据Y0 进行计算,差值记为△Y0。若△Y0 小于测量极限误差,则可认为此测点两期之间没有变形,从待定区域剔除“异常点”Y1 为异常测值,并存储数值Y1。若△Y0 大于测量极限误差,则判断点集A 测点异常,发布测点异常预警信息。若点集Y1 对应测点集B 与点集A 不一致,则可初步判断为测量过程受到重大干扰,两周期数据无效,需都剔除或重测,发布异常预警信息,查找干扰源并消除。异常数据剔除前后时序曲线对比图如图1 所示。
图1 异常数据剔除前后时序曲线图对比Fig.1 Comparison of Sequential Curves before and after Elimination of Abnormal Data
实时监测是城市轨道交通安全管控过程中一种重要的监督手段,对轨道交通运营过程中结构和设施的随机变化与异常波动实时监控,并在此基础上对轨道交通运营过程中异常趋势做出安全预警。
在时空的维度上物质是在不断运动的,物体的绝对位置存在不确定性,因此也就不可量测。但是具体到各个时刻,隧道内部结构之间的相对位置却是固定的、可量测的,这也是我们监测工作中通常采用独立坐标系统的重要原因。但是监测工作中总是存在各种各样的原因,导致测量的结果存在一定的误差,这是我们无法避免的。但通过对测量方法和测量工具的改进与创新,我们可以将误差限制在一个可控的范围内,这是我们监测工作的精髓,也是监测行业发展的重要体现。
监测工作的开展多以点代面,通过单个测点在时间维度上的变化来替代反映某片区域的变形情况。在实际监测过程中我们以测点相邻2 次观测数据的差值作为该测点对应时间段内的位移,并在此基础上展开数据分析。在隧道实时监测工作中时间刻度可以不断进行压缩,从月、周、日到小时、甚至分秒,采集频次的增加,产生了大量的数据,但是如何正确利用、有效利用、高效益利用却是重点。
在实时监测过程中时间刻度不断压缩,测点邻近时间段内产生的观测数据往往只存在微量变化,我们甚至可以近似认为这是测量过程中系统误差产生的,这样短期时间段内的数据一般不具备分析的价值和参考性,视乎这些数据都成为了无用的累赘,但当我们换一个视角,就会发现很多我们不曾注意的变化已经发生。文献[6]基于时序的变化对地铁沉降规律进行分析的方法值得借鉴,并在此基础上对不同时间尺度的变化展开研究。以隧道衬砌内力监测为例,从4 个测点的日变化曲线来看,10∶00~19∶00 时间刻度内存在显著变化,约在14∶00 达到最大。如果我们只是分析这段时间范围内的某些数据,可能会简单的得出如下结论:该隧道区域土层有变化或衬砌有变形(见图2)。但当我们在更长的时间轴上观察才会发现,隧道衬砌内力单日变化具有一定的规律性(见图3),并不只是某个测点某一天的特例。当然我们通过其他的试验也取得了相同规律的数据样本,并验证温度对结构内力影响的规律。
图2 衬砌内力日变化曲线Fig.2 Diurnal Variation Curve of Lining Internal Force
图3 加固前后衬砌内力变化曲线Fig.3 Internal Force Curve of Lining before and after Reinforcement
文献[7]就建筑健康评估影响因素提出基于“核心单元”和“辅助单元”的直接指标及间接指标,从另一个角度阐述了不同维度数据之间的相互影响,值得我们借鉴。通过不同的时间维度我们能发现历史背后的故事,通过不同的空间维度我们将发现数据隐藏的秘密。点是0 维,两个测点的联系构成1 维的线,三个不共线的测点构成2 维的面,面的上下拉升则构成3维的空间。测点是我们监测工作的基本单元,对于单个测点的数据分析我们已经具备相对完善的分析处理规程。单个测点的数据变化更能体现隧道结构长期而又缓慢的发展过程,但是隧道结构毕竟是三维的构造,它由不同的几何结构组成,存在不同的形变机理,并不能简单地以单点测量数据来代表隧道结构的安全状况。以图4 为例,测点D1-1~D1-6 就单个测点来分析变化量都在阈值范围内,但是当我们将测点两两相连计算它们的相对收敛情况时就会发现有4 条收敛线变形量超过阈值;再以6 个测点构成监测断面整体分析,可以较为清晰地看到隧道围护结构明显受到挤压,形变趋势显著。再结合邻近断面的数据分析,我们可以进行更多的分析,诸如隧道受挤压的主要区域、发展趋势、形变的方向、结构的安全性等等。如果我们纳入更多的有效数据,例如轨检数据、沉降变化、水位变化、温度、周边环境等信息,我们将能得出更全面、更精准可靠的判断。
图4 隧道断面图及同一断面位移观测时序曲线图Fig.4 Tunnel Section and Time Series Curve of Displacement Observation at the Same Section
城市轨道交通运营的安全由多个方面关键设备设施共同构建,主要包括车辆、信号、轨道、隧道结构等,文献[8]基于计算机技术的应用提出了跨平台地铁施工信息安全监测系统设计与开发。但基于大数据技术的城市轨道交通监管体系重点不在于掌握庞大的数据信息,而是对这些含有意义的数据进行专业化处理,在于打通现有各系统应用之间的专业壁垒,实现轨道交通路网运营安全评估与预警,为开展城市轨道交通行业网络化运营条件下安全保障方面的研究提供支撑,为解决多样化、规模化的突发事件提供科学依据,保障城市轨道交通长运久安。
城市轨道交通运营系统作为一个成熟的运营体系,它并不缺乏数据来源,也不缺少专业的能力。以广州地铁为例,其开展了列车在途监测与安全预警项目研究,在供电、消防等系统有SCADA、FAS、BAS 等系统对相关设备进行监控。但是大数据技术的关键在于提高对数据的“深度加工”,通过大数据技术深度挖掘海量数据之间的联系,以实现城市轨道交通运营数据的“增值”。
文献[9,10]分析了大数据在城市管理中的应用和前景,提出实现对现实城市中人和物的自动控制和智能服务的目标,为我们进一步的研究提供了新的方向。以客流信息为例,常规的应用模式这个是我们每天出行都会见到的:车站根据历史客流信息,判断出客流高峰,或者根据各入闸口客流量的差异,进行不同的客流指引或者限流,避免站台或站厅出现客流拥堵。那么客流信息是否还有其他的“剩余价值”呢?在回答这个问题之前我们要先明确潜在使用对象,也就是有哪些用户会需要这些?A 车站、B 车辆调度、C 乘客、D 第三份服务供应商……,其实这个选择题,A、B、C、D 都可以作为答案。对于A 车站而言,可以根据客流信息合理调配工作人员,保证员工的工作状态;对于B 车辆调度而言,可以根据客流信息调配车辆班次频率,平衡客流安全和经济之间的关系;对于C 乘客而言,可以根据实时客流信息判断出行时间和行程,合理分配时间;对于D 第三份服务供应商而言,可以根据客流信息调配维护工作时间,合理避开高峰客流期,提高工作效率和服务安全。以上这些都只是客流信息比较简单的应用,只是在于对数据多进行了一步的分布和利用,但是却极大地扩展了数据的应用群体和,潜在的提升了城市轨道交通运营的安全性。充分利用大数据技术,深入地挖掘数据,合理地利用数据、高效地使用数据,实现人与数据的有机交互、人与物的智能服务,将为城市轨道交通安全运营提供更高效、可靠的安全保障。
城市是人类文明的最大遗产和人类文化的最大成就,数据就是点缀其中的夜明珠,隐没在文明的钢铁丛林中,却照亮着城市经济的发展。但是孤立的数据只能成为丛林中一颗被隐没的沙子,只有将数据联系起来,有效地利用起来,数据才能产生价值。同时我们也要清醒的认知到:数据并不能代替所有的安全管控措施,加强管理、防患未然,仍是我们不破的方针。