谭光辉 汪忠新
(1.江西省交通投资集团有限责任公司项目建设管理公司,江西 南昌 330025;2.江西省天驰高速科技发展有限公司,江西 南昌 330000)
城市化进程的加快给城市交通带来了巨大的压力。因此,地下空间被充分利用,成为公共交通系统的重要组成部分。隧道作为一种典型的地下建筑,容易受到复杂外部负载和环境的影响,有时还会遇到地震、碰撞、爆炸等极端状况。隧道结构受损将造成巨大的经济损失甚至威胁公共安全。随着人工智能的快速发展,结构健康监测(structural health monitoring system,简称“SHMS”)被业内公认为是保证隧道结构稳定的可靠技术。目前,SHMS正从识别异常状态向及时预测和提供结构状态预警发展。结构力学行为的预测对于保证结构的长期安全运行具有重要意义。因此,本文研究以结构健康监测数据为驱动,准确预测隧道结构的力学行为。
传统的隧道力学行为预测研究主要集中于解析解和数值模拟。由于这类方法求解过程复杂,解析结果和数值结果难以直接应用于工程实践。近年来,出现了大量以监测数据为驱动的预测模型,如Bayes等统计模型,AR等时间序列模型和神经网络等深度学习模型。然而,上述模型在土木工程领域,特别是隧道工程领域的探索较少。与一般的监测数据不同,隧道结构实时监测数据表现出以下特征:一是时间序列具有显著的非平稳性和随季节变化的周期性;二是安装在不同位置的传感器所记录的监测数据具有大致相同或相反的演变趋势。若单独分析和预测每个传感器,无法充分利用数据中的信息。如果同时对所有传感器分析和预测,多重共线性将导致探索空间的结果具有不稳定性。因此,需要采取一种合理的方法,使其能在减少分析变量和数量的同时,最大限度降低原始数据中信息的损失。
AR模型建立在序列平稳的基础上,不适用于具有时变系数的非平稳时间序列数据。此外,该模型无法在不重建的情况下,将新获得的观测数据纳入模型提供预报。贝叶斯模型克服了上述局限性,为表征时间序列的不确定性和量化预测的不确定性提供了一个完美的工具。但它无法应用于多元时间序列的预测,因为该模型不能整合不同时间序列之间的关系。然而,深度学习模型具有处理非平稳时间序列数据和从多元时间序列中学习信息的优势,引发了众多学者的关注。其中,递归神经网络(RNN)有利于时变过程的预测和外推。近年来,RNN被广泛应用于不同领域,如交通堵塞状况预测、供应链管理、库存预测和天气预报等。在土木工程领域,已有文献报道有学者应用RNN方法预测隧道沉降和TBM扰动。
基于研究现状和工程需求,本文重点研究了基于SHMS实时监测数据驱动的改进,RNN模型对隧道结构的精确预测。利用自动编码器对大量的监测数据编码以学习其核心特征,并利用RNN模型对长期的历史行为和短期的历史行为集成建模。
本文首先介绍了该预测模型的框架和各个组成部分。然后,在南京定淮门隧道SHMS的监测数据上进行了实验,并与一些经典基线方法进行了比较,验证了该模型的有效性。最后,对相关工作进行了总结。
本节介绍了结构响应预测问题的形式化定义,描述了通过自动编码器对原始数据进行特征提取的过程,并介绍本文提出的基于RNN改进的预测模型。
在多元时间序列预测中,给定一组观测的时间序列信号X={x1,x2,…xT},其中表示t时刻观测到的信号,m为传感器的总数。任务是预测xT+q的值,其中q表示对于当前时间T的预测时间步长。对应的预测值记为真值记为yT+q=xT+q。此外,对于每个任务,本文只使用{xd,xT-w+1,xT-w+2,…,xT}来预测yT+q,其中xd为在时间T+q提前一天(24小时)观测到的信号,w是窗口的大小。
在大规模的SHMS中,众多传感器监测同一类型的结构响应并生成大量的数据,每个传感器对应数据中的一个维度。然而,同时挖掘这些高维数据,不仅会消耗大量的系统资源,甚至会出现一些问题。一方面,原始高维数据中存在冗余信息,即多个传感器记录的结构响应具有大致相同的演化趋势。另一方面,高维数据中不同位置的结构响应,表现出相互依赖的特征。因此,降低高维数据的维数,发现数据的内在特征,提高特征表达能力至关重要。主成分分析(PCA)是最经典的降维方法,旨在找到数据中的主成分,并利用这些主成分来表征原始数据,从而达到降维的目的。然而,PCA是一种使用矩阵运算的线性降维算法。降维后数据的可解释性降低,将会导致原始数据的非线性相关性丢失。
自动编码器是一种能通过无监督学习方式学习输入数据高层表示的人工神经网络。自动编码器的体系结构如图1所示,其由输入层、隐含层和输出层三部分组成。输入层的维度与输出层的维度相同。原始数据先被输入层接收,然后在隐含层进行压缩。输入层和隐藏层之间的过程称为编码器。然后将隐藏层压缩的特征传输到输出层,重构原始数据。隐藏层和输出层之间的过程称为解码器。
图1 自动编码器的体系结构
编码器阶段计算为:
利用训练集对自编码器实施训练后,提取输入层和隐含层之间的权值,将原始高维数据压缩为高层表示。与PCA方法相比,自动编码器具有非线性特性,丢失的信息更少,降维后的数据具有较高的可解释性和聚类效果。
为了同时预测在不同位置相同类型的结构响应,本节提出了基于RNN-like模型的预测框架,如图2所示。预测窗口中的原始数据首先由训练好的自动编码器编码,随后将每个时间戳对应的特征放入RNN-like模型中,最后将目标预测时间戳前一天(24小时)的观测信号与RNN-like模型的最终输出结果相结合,生成预测结果。假设时间T+q是目标预测时间戳,生成预测结果的细节如图2所示:
图2 模型框架
首先,自编码器对从(T-w+1) 到T的原始数据进行编码,得到每个时间戳对应的特征向量。因此,RNN-like模型的输入为{eT-w+1,eT-w+2,…,eT},其中RNN-like模型一般被定义为一个递归函数F,计算每个时间戳t的隐藏状态即:
其中,函数F的实现取决于使用的RNN单元。目前有三种类型的RNN-like模型:RNN,LSTM,GRU。在这里使用了GRU,如图3所示。
图3 GRU的结构
GRU是在LSTM模型的改进版,可将遗忘门和输入门组合成一个更新门,并使用隐藏状态来传输信息。因此,比标准LSTM计算过程简单,但具有与LSTM类似的效果。t时刻GRU中循环单元的隐藏状态可表示为:
然后,将RNN-like模型计算得到的hT与xd结合生成预测结果其表达式为:
本文采用均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和皮尔逊相关系数(PCC)四种评价指标来衡量模型的有效性。表1展示了不同方法在测试集上的评估结果。分别设预测时间步长q={4,8,12},时间步长越大,预测任务就越困难。
表1 不同方法在测试集上的评估结果
由数据可知,本文所提出的预测框架在所有设置中表现均优于其他方法,证明了该框架在预测结构响应任务中的有效性。
为了保证基础设施的稳定性并预防结构灾害,本文提出了一种改进的预测模型来预先感知结构力学行为的异常变化。该模型考虑了多种内外因素对结构未来力学行为的影响,解决了多元时间序列的同时预测问题。该模型以数据为驱动,综合考虑了长期和短期历史行为的影响,并通过对多元时间序列组成的网络进行编码,实现了对多个位置结构力学行为的预测。同时,在水下隧道中的SHMS监测数据上实验后发现,本文提出的模型具有有效性。