张生杰, 谭 勇
(同济大学地下建筑与工程系, 上海 200092)
随着我国城市建设的不断进行,越来越多的城市开始进行大规模的地铁建设。城市地铁车站深基坑工程周边往往建(构)筑物、道路、管线等分布密集,一旦基坑出现工程事故,必将危及周边安全,甚至可能造成严重的财产损失和不良社会影响,因此,深基坑工程施工时的安全控制至关重要。对深基坑开挖过程中的变形做出可靠预测,是施工安全的重要保证。
围护结构的水平位移是深基坑变形的重要形式,能直接反映出基坑整体变形状态,水平位移过大还会导致基坑的坍塌。但围护结构的水平位移受到地质条件、开挖方式等多种因素的综合影响,实际变形机制远比理论中的复杂,地质条件的复杂性也使得地层的物理力学参数和力学现象呈现出很强的随机性和不确定性[1]。因此,要想准确地对基坑变形做出预测仍具有一定的难度。
传统基坑研究领域多采用有限元的方法对基坑变形进行分析,但是,此类方法存在2个较为显著的缺点:一是有限元模型中地层的力学参数大多进行归一简化,而实际土方开挖比模型中所模拟的分段分层开挖要更复杂,因此有限元模型并不能很准确地反映出真实的基坑开挖状态;二是有限元模型所模拟得到的基坑变形结果大多是对应较长区间时间范围内的数据,难以精确到每天的基坑变形,无法得到未来几天的基坑变形数据,对工程中变形控制的实际意义较小。
近年来,随着计算机计算能力的快速发展,神经网络模型得到快速发展,在地下工程领域也开始得到广泛应用。李彦杰等[2]基于遗传算法优化的BP神经网络建立基坑变形预测模型,对宁波市某基坑围护结构的水平变形进行预测,证明此模型有较强的泛化能力;胡冬等[3]根据灰色系统理论,建立了基坑变形的GM(1,1)模型,模型预测结果与实测值吻合较好;渠孟飞等[4]利用支持向量机对基坑变形数据进行预测时指出,不断加入最新监测数据可以取得更好的预测精度;王兴科等[5]采用小波去噪分离基坑变形的趋势项和误差项序列,并采用支持向量机对趋势项序列进行预测,采用混沌BP神经网络对误差项进行预测,将预测结果进行叠加得到变形预测值。然而,传统的神经网络模型或多或少都存在一定的局限性,比如BP神经网络、灰色预测模型和支持向量机等都是静态建模方法,对高度非线性和时间相关性的数据适用性较差[6],而基坑监测数据有着非线性的特征、良好的适应性和呈现时间序列的规律,所以需要使用一种考虑时间效应的算法模型。长短期记忆神经网络(LSTM)对非线性数据和时间序列具有独特的优势,因此袁志明等[7]、许宁[8]以为其基础对基坑变形进行预测,但是均没有说明建立模型的具体方法,模型的训练集和验证数据也过少,无法充分证明模型的可靠性。
基于上述基坑变形预测方法研究中的不足,本文以长短期记忆神经网络(LSTM)为回归算法,使用Python语言和Tensorflow 2.0框架建立基坑变形预测模型,用前期的基坑实测变形数据为训练样本,从而实现在正常施工和不考虑意外突发情况的前提条件下,对未来一段时间基坑围护结构水平变形的准确预测;同时,将LSTM模型得到的预测结果与BP神经网络和灰色预测模型的结果进行对比,以更好地验证LSTM模型的准确性,以期为工程中的变形控制提供参考。
LSTM最早由Hochreiter和Schmidhuber于1997年提出,并由Graves等[9]进行改进。该网络模型最初是为了解决循环神经网络(RNN)存在的梯度消失问题,因此LSTM也被当作是RNN的一种特例[10]。
LSTM的核心思想是通过记忆单元来存储输入的时序信息,记忆单元则使用“门”结构来筛选存储至记忆单元的信息,“门”结构有以下3种: 输入门、输出门和遗忘门。图1所示为一个LSTM细胞结构。
图1 LSTM细胞结构
1个LSTM细胞t时刻的输入为xt,t时刻的隐藏状态为ht,即为短期记忆;t时刻的细胞状态为Ct,即为长期记忆。ht和Ct2个参数会随着时间向下传递信息,σ为sigmoid函数,tanh为tanh函数,3种门在这个信息传递过程中的作用分别为[11]:
1)遗忘门,顾名思义即为要遗忘一些信息。遗忘门负责接收t-1时刻的细胞状态Ct-1传来的信息,并选择丢弃其中的一部分信息,所丢弃的通常是t时刻不再需要的信息,将保留下来的信息传递至当前t时刻的细胞状态Ct。从数学上来说,遗忘门将t-1时刻的细胞状态Ct-1乘上一个遗忘因子ft,遗忘因子是由t-1时刻的短期记忆ht-1和输入xt通过sigmoid函数共同决定的。
3)输出门,负责控制LSTM细胞的输出值。首先,通过一个sigmoid函数来决定t时刻的输入xt和t-1时刻的短期记忆ht-1中哪部分需要输出,得到Ot; 然后,再把Ot通过tanh函数处理,得到当前时刻的隐藏状态ht。
3种门结构都采用sigmoid函数作为激活函数,因此它们所接收到的信息都将映射到[0,1]。遗忘门处理上一时刻的长期记忆Ct-1,输入门处理当前输入xt和上一时刻的短期记忆ht-1,输出门控制最终的输出值,3种门结构的共同作用实现了LSTM细胞的长短期记忆时间效应。
在构建基于LSTM的基坑变形预测模型时,本文主要考虑了模型结构、网络层数、单元个数、优化算法、误差函数等因素。模型结构包括输入层、隐藏层和输出层,输入层主要负责对输入数据进行初步的处理,隐藏层则是模型结构中最主要的部分,具体来说隐藏层即是由LSTM细胞单元组成的网络结构,输出层负责输出模型预测的变形结果[12]。
Tensorflow 2.0为谷歌公司开发的最新版本的开源库,这是一种高度集成模块化的深度学习框架[13]。本文以Python 3.6语言为基础,配合Tensorflow 2.0框架,建立包含3层网络的LSTM基坑变形预测模型: 第1层为输入层,包含3个输入单元和64个输出单元;第2层包含64个输入单元和128个输出单元;第3层包含128个输入单元和1个输出单元。其中,第1层的3个输入单元代表的含义是使用过去3天的监测数据,即时间步长为3,去预测未来1天的变形数据,即第3层中的1个输出单元,中间的64个单元和128个单元代表的即为隐藏层中的LSTM细胞单元。
模型中其他重要的参数说明如下: 选择方根误差MSE为误差函数,Adam算法为模型的优化算法,tanh函数为模型的激活函数。模型采用单步迭代的方法对变形进行预测,具体训练步骤如下:
1)对监测数据进行预处理,将明显监测错误等异常数据剔除,并进行差分拟合使数据集平滑;
2)将数据转换成有监督的数据,并归一化到[0,1];
3)将数据集划分成训练集和测试集,分别对2类数据进行维度转换;
4)设置模型的迭代次数、验证集比例、批尺寸等其他参数;
5)将数据导入封装好的模型进行训练,期间模型会根据误差项对各项权重的梯度进行计算,并使用Adam优化算法更新权重,直到参数的选择满足精度要求;
6)对模型输出的数据进行反归一化,即为对应的变形预测值;
7)将模型保存为h5格式的文件,即为包含各项权重的模型文件,可用于同一基坑内其他测点的变形预测。
本文以江苏省南通市某地铁基坑监测数据为实例,该地铁车站为12 m岛式站台地下2层框架结构,位于市区主干道下且临近两侧分布密集建筑群,车站底板埋深16.75 m,净长180 m,净宽19.3 m。基坑标准段采用明挖顺作法施工,围护结构采用800 mm地下连续墙,竖向设1道混凝土支撑(0.8 m×1 m)和3道钢支撑(φ609 mm,厚16 mm),标准段基坑开挖深度为16.95 m,端头井基坑开挖深度为18.46 m,地下连续墙深均为39.2 m,基坑安全等级为一级,基坑环境保护等级为二级。
选取该地铁基坑测斜监测点CX14从2018年12月7日到2019年6月20日共196期的监测数据,该段数据完整地包含了CX14测点附近基坑开挖前、开挖过程中、浇筑底板后的地下连续墙水平变形量,数据的监测频率为1次/d,所用测斜仪型号为CA-CX-901F,测量精度为0.01 mm。因为在基坑的地下连续墙累计变形控制中,考虑的均为最大变形值,因此,本文中所涉及的地下连续墙水平变形值均为各测斜点纵向最大的水平变形值,该值出现的深度一般在基坑开挖面附近。
按照本文1.2节所描述的模型训练步骤,使用这196期数据进行模型训练,依据开挖工况,分为基坑开挖期、基坑浇筑底板后2种工况分别进行模型训练,得到用于2种工况下的地下连续墙水平变形预测模型。
2.2.1 建立3种变形预测模型
为了对比研究LSTM基坑预测模型的准确性,本文还同时建立了分别以BP神经网络和灰色理论为算法基础的另外2种基坑变形预测模型。BP预测模型和灰色预测模型2种模型同样采用CX14测斜点的196期数据作为原始数据集,文中涉及的基坑测斜点分布如图2所示。
BP神经网络是一种多层前馈神经网络,包括输入层、隐藏层和输出层,具有泛化能力强的特点[14]。本文同样基于Tensorflow 2.0框架,通过python 3.6语言建立基于经典BP神经网络的预测模型,模型共包含3层: 输入层、隐含层和输出层。其中,输入层输入的数据样本是3维列向量,隐含层的单元个数是64个,输出层为1维列向量。模型一些重要的参数说明如下: 输入层到隐含层的传递函数为sigmoid函数,隐含层到输出层的传递函数为purelin函数,优化算法采用的是动量梯度下降法。经过多次训练,得到效果相对更佳的BP预测模型。
灰色理论是通过建立灰色微分预测模型,对发展规律做出长期预测,该方法对样本的数量要求较低,模型的计算速度快[15]。一般来说,灰色理论适用于等序时间间隔的序列, 而本实例中的监测数据频率均为1次/d,所以是满足等序要求的。本文根据陈健[16]所研究的改进灰色模型理论,使用优化后的背景值构造等方法,通过python3.6语言,结合numpy和pandas数据处理库,建立灰色预测模型。
综上,现得到LSTM预测模型、BP预测模型、灰色预测模型3种基坑变形预测模型,选择同一地铁基坑的CX04测斜点,用这3种模型分别进行该测点基坑开挖期的地下连续墙水平变形预测,以对比它们的预测准确性。
图2 基坑测斜点分布
2.2.2 3种变形预测模型结果对比
CX04测斜点在基坑开挖之前共有40期监测数据,将这40期监测数据分别导入开挖期的LSTM预测模型、BP预测模型和灰色预测模型进行预测,得到了3种模型下CX04测点基坑开挖期44 d内的地下连续墙水平变形预测结果,如图3和图4所示。
图3 CX04开挖期地下连续墙水平变形预测值对比
图4 3种预测模型的绝对误差
结合图3和图4可以看出,灰色预测模型有一定的预测效果,但是在开挖期内误差波动较大,未呈现出误差变小的趋势,且部分点的误差较大,整体表现出较强的随机性;在开挖初期,BP预测模型较灰色预测模型预测效果更佳,误差呈现出逐渐减小的趋势,体现了BP神经网络泛化能力强的特点,但是在开挖后期,误差开始呈现出变大及不稳定的趋势,预测效果变差;LSTM预测模型的误差在整个开挖期内始终在-2.5~1.5 mm波动,整体误差平稳,趋势稳定,预测效果较好。
3种预测模型的绝对误差见表1。结合表1可以看到,3种预测模型精度最高的是LSTM预测模型,相较于BP预测模型,平均误差精度提高了19%,方差精度提高了43%;相较于灰色预测模型,平均误差精度提高了34%,方差精度提高了46%。进一步分析,基坑监测数据有着非线性的特征、良好的适应性和呈现时间序列的规律,BP神经网络、灰色理论都是静态建模方法,对高度非线性和时间相关性的数据适用性较差,而LSTM特有的记忆单元,对处理非线性数据和时间相关序列具有独特的优势,考虑了基坑变形的时间效应。因此,相比于BP预测模型和灰色预测模型,LSTM预测模型的预测效果最好。
表1 3种预测模型的绝对误差
2.3.1 CX04测点浇筑底板后变形预测验证
通过2.2节,初步验证了LSTM预测模型具有较好的准确性,为了进一步验证LSTM预测模型的稳定性和可靠性,本节将继续研究在CX04测点基坑浇筑底板后的地下连续墙水平变形预测效果。考虑到LSTM的预测精度相较于BP预测模型和灰色预测模型已经得到验证,本节不再进行多种模型预测结果的对比。
在CX04测点附近基坑浇筑底板前,共有84期监测数据,在此数据基础上,使用本文2.1节得到的基坑浇筑底板后的LSTM预测模型对地下连续墙水平变形进行预测,得到预测结果如图5所示,预测值与监测值的绝对误差如图6所示。
(a) 示意图
(b) 局部放大示意图
结合图5和图6可以看出,LSTM预测模型在CX04测点附近基坑浇筑底板后的地下连续墙水平变形预测中,误差完全控制在-0.75 mm以内,虽然因为模型的累计误差效应,预测误差呈现出逐渐增大的趋势,但是基坑不可能长期保持该施工状态,短时间内基坑就会封顶; 并且误差增长的幅度极其缓慢,仅为-0.01 mm/d,这样的误差累计对实际基坑工程来说可以说是微不足道的。因此,对实际基坑工程来说,LSTM预测模型是绝对可靠的。
2.3.2 CX11测点变形预测验证
为了充分说明LSTM预测模型的稳定性和可靠性,本文选择同一基坑的CX11测点再次进行LSTM模型预测效果的验证,同样分为基坑开挖期和基坑浇筑底板后,研究CX11测点附近基坑的地下连续墙水平变形的预测情况。开挖期的预测结果如图7和图8所示。
图6 CX04测点基坑浇筑底板后预测值与监测值的绝对误差
图7 CX11测点基坑开挖期地下连续墙水平变形值
图8 CX11测点基坑开挖期预测值与监测值的绝对误差
结合图7和图8可以看出,在CX11测点基坑开挖期内,LSTM预测模型的绝对误差值始终控制在-1.5~2 mm,并且围绕0线波动,与CX04测点的预测效果极为相似,证明了LSTM模型的预测效果具有稳定性与可靠性。
最后,验证一下CX11测点附近基坑浇筑底板后的地下连续墙水平变形预测效果。CX11测点在基坑浇筑底板前,共有116期现场监测数据,基于这116期数据,使用基坑浇筑底板后的LSTM模型,对该测点的地下连续墙水平变形进行预测,预测结果如图9和图10所示。
结合图9和图10可以看到,CX11测点基坑地下连续墙水平变形的预测值与监测值的绝对误差控制在-0.75 mm以内,这与CX04测点该工况下的预测效果极为一致,同样出现了误差逐渐增大的趋势,但是误差增长的趋势同样是完全可以控制的。结合上述CX11测点基坑开挖期的预测结果分析,足以充分证明LSTM预测模型具有极佳的稳定性,能够对同一基坑内任意位置测点进行稳定可靠的地下连续墙水平变形预测。
图9 CX11测点基坑浇筑底板后地下连续墙水平变形值
图10 CX11测点基坑浇筑底板后预测值与监测值的绝对误差
1)本文以某地铁基坑工程为实例,基于现场实测监测数据,训练得到基于LSTM算法的基坑变形预测模型,并使用该预测模型在正常施工以及不考虑意外事故的前提下,分别对基坑开挖期和浇筑底板后2种工况下的基坑地下连续墙水平变形进行预测,取得了较为准确的预测结果。
2)利用CX14测点完整施工周期内的监测数据,通过1.2节所描述的训练方法得到LSTM预测模型,同时使用同样的数据训练得到BP预测模型和灰色预测模型,对CX04测点附近基坑开挖期的地下连续墙水平变形进行预测,并对预测误差进行对比,得出LSTM预测模型相对另外2种预测模型预测精度更高的结论。
3)利用LSTM预测模型,对CX04测点附近基坑浇筑底板后,CX11测点附近基坑开挖期、浇筑底板后3种情况的基坑地下连续墙水平变形进行预测,得到了同样精确的预测结果,证明了本文所构建的LSTM预测模型具有可靠性与稳定性的特点。
4)以上分析思路和结论适用于在不考虑突发事故情况并严格规范施工前提下的基坑变形预测。在实际工程中,部分情况下施工流程并不一定是规范标准的,也有出现地下连续墙渗漏等意外事故的概率,这些因素都会影响基坑变形预测。鉴于基坑工程中的不确定性,基于LSTM的基坑变形预测模型要提高适用性,还需要更多实践的优化和改进。