深埋隧道TBM掘进参数LSTM时序预测模型及应用研究

2021-09-26 01:52邱道宏傅康薛翊国李志强李广坤孔凡猛
关键词:误差率时序围岩

邱道宏,傅康,薛翊国,李志强,李广坤,孔凡猛

(山东大学岩土与结构工程研究中心,山东济南,250061)

硬岩隧道掘进机(TBM)是一种广泛应用于隧道掘进的大型地下工程设备,相比于传统的钻爆法,具有开挖速度快、环境扰动小、施工质量高、隧道成型好、劳动强度低等优点[1],对于大埋深、高地应力隧道,TBM 工法更是首选的隧道开挖方式[2−4]。目前,TBM 已经应用于铁路、公路、大中型水电站、南水北调、西气东输、城市地铁和市政管道等工程。TBM 集成了自动化技术、计算机科学、系统科学和管理科学等多门学科,并正在将机器学习方法[5−9]引入该领域,以期建立岩机关系反馈模型,形成地下隧道机械化、智能化开挖综合解决方案。

在TBM隧道实际开挖过程中,TBM对不同地质条件的适应性较弱,要求施工人员技术水平和管理水平高[10],多数情况下TBM 的掘进参数调整要靠主司机的经验知识进行判断,而调整结果往往与地层条件契合度较低,导致TBM 在隧道开挖过程中不能很好地发挥其掘进效率上的优势,甚至出现刀具磨损过快、刀盘磨损、卡机等工程事故。因此,建立适合TBM 施工的岩机关系反馈模型并准确预测TBM掘进参数对TBM安全高效掘进至关重要,同时也是未来TBM 智能化掘进的重要基础。

在TBM 反馈模型领域,已有许多卓有成效的研究,主要可归纳为理论模型[11−12]、经验模型[13−15]和基于机器学习算法的智能模型3 类[1,5,10,16]。ROXBOROUGH 等[13−14]提出岩石强度与TBM 刀盘推力成线性比例关系。NELSON等[15]提出了贯入度指数(field penetration index,FPI)概念,将TBM 掘进的机械参数与隧道围岩的岩体参数建立联系,通过研究发现岩石强度与贯入度指数FPI成比例关系。近年来,马池帅等[16]提出一种基于TBM 掘进参数的现场岩石强度快速估算方法,对掌子面岩石强度进行实时评价。薛亚东等[17]综合考虑工程围岩的可掘性及TBM 的适应性,以施工速度为指标,建立了基于掘进性能的TBM 施工围岩综合分级方法,并给出了掘进参数在不同围岩等级中的经验值。ARMAGHANI 等[18]研究了TBM 通过花岗岩风化带的优化技术,建立了一种TBM 掘进速度的人工神经网络预测方法。LIU等[19]提出了一种将反向传播神经网络与模拟退火相结合的混合算法,通过TBM 掘进参数进行围岩地质参数的预测。GAO等[20]针对盾构机操作参数的适应性调整问题,对比了3种循环神经网络方法与3种传统非线性回归方法预测掘进参数的优劣,结果表明长短期记忆神经网络模型和门控神经网络模型具有较好的预测效果。侯少康等[21]基于吉林引松工程,通过TBM 上升段数据预测稳定段的掘进参数,并提出一种基于改进粒子群算法优化BP神经网络的TBM掘进参数预测模型。机器学习方法的应用大大提高了模型预测的准确性,但在TBM 掘进参数预测领域相关应用还较少,已有的预测模型准确性稍低,如何提高预测精度仍是迫切需要解决的问题。

在众多的机器学习方法中,LSTM网络得到了广泛应用,对于处理非平稳、长时间序列样本具有显著的优势。鉴于此,本文基于直径为7.8 m的深埋TBM 隧道现场掘进数据与地质数据,结合深度学习理论,建立了一种基于LSTM 网络的深埋TBM 隧道掘进参数时序预测模型,对模型的预测结果进行误差分析,并比较了该模型与传统回归模型的预测精度。

1 LSTM网络模型

TBM 掘进参数具有随时间连续变化的特点,在连续开挖状态下,TBM 相关掘进参数的变化幅度一般不会太大,相关掘进参数的实时数值均可通过TBM 主控室获得。在当前深度学习领域,经常通过循环神经网络(recurrent neural networks,RNN)对具有顺序关联的样本进行序列预测。研究发现,相较于传统的非线性回归方法如支持向量回归(support vector regression,SVR)、随机森林(random forest,RF)等,RNN网络往往具有更好的预测效果[20,22]。

1.1 传统RNN网络原理

RNN 网络是一类能够将先前的学习信息与当前的输入相结合,产生当前输出的神经网络,因此,RNN 网络的输出不仅由当前输入决定,而且与以前的输入有关,这使得RNN 网络成为预测非平稳时间序列最强有力的工具之一[20,22]。RNN网络的典型结构如图1所示,其中,xt为t时刻的输入,ht为t时刻的隐含层输出,U为输入层到隐含层的权值,W为隐含层之间的权值,V为隐含层到输出层的权值。

RNN网络可以视为相同结构网络的多重复制,每一个网络通过循环函数得到输出值和隐层值。隐层值传递到下一个网络中,该隐层值会与下一个时间点的输入值共同决定输出和新的隐层值。已知t时刻的输入xt,t-1时刻的隐含层输出ht-1,可得t时刻的隐层输出ht为[20,22]

式中:b为偏置。

根据ht计算t时刻的输出ot和分别为:

定义RNN 的最终损失函数L=则对于隐层输出的梯度为

通过δt可以得到参数矩阵的梯度:

通过上述公式推导可以发现:参数矩阵与每个节点的输出值有关,说明RNN 网络对于历史输出具有“记忆”能力。传统神经网络的主要缺点是难以进行时间序列样本的分类和预测,而RNN网络的链式结构揭示了网络与序列样本的密切关系,使得序列样本能够更好地被训练和预测[20,22]。

1.2 LSTM网络原理

传统RNN 网络可以保留之前序列样本的有效信息并对当前输出产生影响,然而当处理长输入序列样本时,传统RNN 网络的训练往往会出现梯度消失或梯度爆炸现象,导致网络训练效果较差。为了克服这一缺点,提高RNN 网络的性能,一些学者在传统RNN网络的隐层节点上引入了门操作,从而产生了一些RNN 的变体,如LSTM 网络和门控循环单元(gated recurrent unit,GRU)网络等[23−25]。

在实践中,LSTM 网络取得了较好的效果。LSTM网络中有3种类型的门:输入门(input gate)、遗忘门(forget gate)和输出门(output gate)。通过调整这些门的状态,可以控制LSTM网络隐含层之间的信息流向。目前应用最为广泛的LSTM模型隐含层细胞结构如图2所示[23−25]。图中,yt为t时刻的LSTM模型输出;z为LSTM模型输入模块。

图2 LSTM隐含层细胞结构[23−25]Fig.2 Cell structure of LSTM hidden layer[23−25]

其前向计算方法可以表示为[23−25]:

式中:下标i,f,c,o 分别代表输入门、遗忘门、细胞状态和输出门;W为对应的权重系数矩阵;σ为sigmoid函数。

LSTM模型训练过程采用的是与经典的反向传播(back propagation,BP)算法原理类似的随时间反向传播(back propagation through time,BPTT)算法,算法过程可以分为4步[23−25]:

1)按照式(8)~(12)给出的前向计算方法对LSTM细胞的输出值进行求解;

2)对每个LSTM 细胞的误差项进行反向计算,包括按时间反向和按网络层级反向;

3)根据计算后所得误差项对每个权重的梯度进行求解;

4)应用基于梯度的优化算法更新权重。

1.3 TBM掘进参数时序预测模型

关于TBM 性能预测的大量研究表明,影响TBM 掘进性能的因素主要包括2 个方面:一是表征TBM运行状态的机器参数,二是表征TBM施工围岩特性的岩体参数[16−17]。对于TBM 实际掘进来说,影响其运行状态的主要机器参数包括刀盘转速N、刀盘扭矩T和刀盘推力F[16−17]。在实际掘进过程中,TBM与围岩接触发生相互作用进而产生复杂的岩机关系,其中净掘进速度vPR、施工速度vAR和开挖比能ESE反映了岩机关系作用规律,这些指标对于规划工期、预估成本和指导施工具有重要意义[16−17]。因此,选择N,T,F,vPR,vAR和ESE这6个主要掘进参数作为研究对象,研究深埋隧道中LSTM模型在不同围岩等级下的预测精度。净掘进速度vPR和开挖比能ESE的计算公式如下[17−18]:

式中,vAR为施工速度,是指在一次掘进循环中,掘进长度与施工总时间的比值,mm/min;vPR为净掘进速度,指TBM 在一次掘进循环中,连续掘进的长度与本次掘进时间的比值,m/s;U为利用率,指TBM 在一次掘进循环中,掘进时间与总施工时间的比值,%,总施工时间包括掘进、检修、换刀、支护、换步时间等;ESE为开挖比能,MJ/m3,是开挖单位体积岩体所消耗的机械能;F为刀盘推力,kN;A为刀盘开挖面积,m2;N为刀盘转速,r/min;T为刀盘扭矩,kN·m。

根据TBM 掘进参数时间序列样本的特点,结合相关理论和公式,基于LSTM 网络的TBM 掘进参数时序预测模型如图3所示。图3中,X1,X2,…,XL为输入的时间序列样本;Y1,Y2,…,YL为相应的预测结果;SLSTM,L为隐含层第L个LSTM 细胞结构;CL−1为第L−1个细胞的状态;HL−1为L−1时刻的细胞输出。

图3 基于LSTM网络的TBM掘进参数时序预测模型Fig.3 Time-series prediction model of TBM tunneling parameters based on LSTM network

2 工程实例验证

2.1 工程概况及数据收集

以新疆某引水隧洞为工程背景,隧洞埋深为200~700 m,标段全长34.751 km,开挖断面直径为7 800 mm。TBM 掘进段围岩主要为华力西晚期侵入的片麻岩、花岗岩地层,部分地段围岩抗压强度达180 MPa。本标段TBM采用美国Robbins技术由北方重工集团有限公司设计、生产制造,型号为QJYC078 的硬岩掘进机,设备由主机和后配套组成,全长约175 m,总质量约1 400 t,其主要技术参数如表1所示。

表1 TBM主要技术参数Table 1 Specifications of TBMs

依照BQ法对本标段围岩等级进行分类,主要分为Ⅱ级、Ⅲ级、Ⅳ级围岩,并将Ⅲ级围岩又细分为Ⅲ-a与Ⅲ-b 两类。这4 类围岩中,Ⅱ级和Ⅲ-a 级围岩在掘进洞段中的占比较大,Ⅲ-b 级和Ⅳ级围岩占比较少。本文数据主要采集自(146+636.1)~(144+644.7)m的典型洞段,共收集Ⅱ级围岩时序掘进数据302 组,Ⅲ-a 级围岩时序掘进数据530 组,Ⅲ-b 级围岩时序掘进数据67 组,Ⅳ级围岩时序掘进数据49 组,所采集数据均为一次掘进循环过程的平均值。表2所示为训练集数据统计。

表2 TBM时序掘进数据训练集统计Table 2 TBM time−series tunneling data training set

2.2 LSTM模型应用

分别选择Ⅱ级、Ⅲ-a级、Ⅲ-b级和Ⅳ级围岩时序掘进数据序列最后的30组、50组、17组和14组数据作为测试集,剩下的作为训练集,输入LSTM模型。通过对训练集样本进行十折交叉验证,确定LSTM 模型相关参数如下:迭代次数设置为50次,初始学习率设置为0.005,10次迭代后学习率进行更新,学习率下降因子设置为0.2,设置LSTM网络每迭代5次进行1次验证。

2.2.1 LSTM模型预测结果

对于每一级围岩,将N,T,F,vPR,vAR和ESE作为LSTM模型的输入变量,依次取这6个参数之一作为LSTM模型的输出,模型预测结果如图5~8所示。

图5 Ⅱ级围岩掘进参数LSTM模型预测结果Fig.5 Prediction results of tunneling parameters of grade Ⅱsurrounding rock by LSTM model

图6 Ⅲ-a级围岩掘进参数LSTM模型预测结果Fig.6 Prediction results of tunneling parameters of grade Ⅲ-a surrounding rock by LSTM model

图7 Ⅲ-b级围岩掘进参数LSTM模型预测结果Fig.7 Prediction results of tunneling parameters of grade Ⅲ-b surrounding rock by LSTM model

图8 Ⅳ级围岩掘进参数LSTM模型预测结果Fig.8 Prediction results of tunneling parameters of grade Ⅳsurrounding rock by LSTM model

2.2.2 LSTM模型误差分析

为了评价LSTM模型预测结果的精度,选择相对误差率Er、拟合优度R2、平均绝对百分比误差(MAPE)和均方根误差(RMSE)这4个指标对模型进行评价。相对误差率计算结果如图9所示,R2,MAPE和RMSE计算结果如表3所示。

表3 LSTM模型预测结果误差分析Table 3 Error analysis of LSTM model prediction results

图9 LSTM模型预测结果相对误差率Fig.9 Relative error rate of LSTM model prediction results

从预测结果和误差分析来看,在各等级围岩中,LSTM模型对于6个参数均具有很好的预测精度,可以满足指导TBM施工的要求。

从图9可以发现,对于Ⅱ级围岩和Ⅲ-a级围岩,除vAR以外其余参数的相对误差率基本都在(−0.1,0.1)之间;对于Ⅲ-b级围岩,除vAR以外,其余参数的相对误差率基本都在(−0.05,0.05)之间;对于Ⅳ级围岩,除vAR以外,其余参数的相对误差率基本都在(−0.2,0.2)之间。通过对比相对误差率可以发现:vAR在各级围岩中预测准确率均为最低,其样本点波动性远远高于其他参数的波动性,其中,图9(b)中样本点8和图9(d)中样本点1 的vAR实际值接近0,导致相对误差率过大,失去误差分析的意义,因此不进行分析。考虑到现场实际情况,vAR不仅受岩机相互作用影响,还受到现场换步时间、检修时间、卡机脱困等施工管理因素影响,造成LSTM模型对vAR的预测准确性在6个参数中最低。

从表3可以发现:Ⅱ级围岩、Ⅲ-a 级围岩和Ⅲ-b级围岩各掘进参数的R2平均值分别为0.962 8,0.938 0,0.939 9,明显高于Ⅳ级围岩的R2平均值0.819 2,说明高等级围岩的稳定性较好,LSTM模型较好地反映了岩机相互作用规律,因而模型的拟合效果也较好;同样,在4类围岩中,Ⅳ级围岩各掘进参数的MAPE平均值最高,达13.12%,Ⅱ级围岩、Ⅲ-a级围岩和Ⅲ-b级围岩的MAPE平均值相差不大,分别为4.95%,7.81%和3.35%,说明低等级围岩稳定性差,岩机相互作用规律受到人为因素影响较大,因而预测误差较大。结合表2和RMSE指标可以发现:虽然Ⅳ级围岩参数N,T,F和vPR的取值范围要比其他3 类围岩的小,但是其RMSE却要比其他3类围岩的高,说明LSTM模型对Ⅳ级围岩参数N,T,F和vPR的预测误差较大。另外,Ⅳ级围岩掘进参数的波动范围较大,LSTM模型较难学习其中的规律性,这也是造成预测误差较大的原因。同时考虑到掘进段Ⅳ级围岩样本数量最少,所选样本可能存在较大的偶然性误差,这也是造成预测误差较大的原因。

3 与传统回归预测模型对比

3.1 传统回归预测模型

3.1.1 SVR模型

支持向量机(support vector machine,SVM)是针对模式识别问题在统计学习理论的基础上发展而来的机器学习算法。SVM 具有严格的数学理论基础,能较好地解决小样本、非线性、局部极小等问题,因此,在很多领域都取得了成功应用。在支持向量机的发展过程中,人们发现SVM 能够很好地应用于求解回归问题,因此,在SVM基础上,提出了支持向量回归(support vector regression,SVR)。SVR 实质上就是用非线性函数f(x)=ω⋅φ(x)+B拟合样本数据,即在约束条件下寻找最优拟合超平面,尽量使超平面与数据点间的距离最小。最终确定回归函数如下[26−27]:

式中:αi和α∗i为拉格朗日算子,B为阈值,K(xi,x)为核函数。由于SVR 强大的非线性回归能力,众多学者将其应用在时间序列样本的非线性回归预测问题上,取得了较好的效果[26−27]。

3.1.2 GRNN模型

广义回归神经网络(generalized regression neural network,GRNN)由SPECHT[28]提出,它是径向基神经网络的一种。GRNN 具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性,适用于解决非线性问题。GRNN 在样本数据较少时依旧有较好的预测效果,并且对于不稳定的数据也有较好的处理效果。

3.1.3 BPNN模型

误差反传神经网络(back propagation neural network,BPNN)是一种按误差反向传播算法训练的多层前馈网络[29]。BPNN能学习和储存大量的输入−输出映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BPNN对于各种非线性回归问题均由较好的拟合效果,在各个领域获得了广泛应用。

3.2 模型预测结果对比及误差分析

同样选择Ⅱ级围岩样本序列的最后30组、Ⅲ-a级围岩样本序列的最后50 组、Ⅲ-b 级围岩样本序列的最后17组和Ⅳ级围岩样本序列的最后14组时序掘进数据作为测试集,剩余时序掘进数据作为训练集输入SVR模型、GRNN模型和BPNN模型。对于每一级围岩,将N,T,F,vPR,vAR和ESE作为模型的输入变量,依次取这6个参数之一为输出变量,模型预测结果如图10~13所示。3 个模型在各级围岩下各掘进参数的MAPE如表4所示。

由图10~13和表4可知,SVR模型对于各级围岩下不同掘进参数的预测误差要明显小于GRNN模型和BPNN 模型的预测误差,SVR,GRNN和BPNN 模型的MAPE 分别为16.88%,29.47%和22.77%。可见:准确率从高到低依次为SVR模型、BPNN 模型、GRNN 模型。因此,选取SVR 模型作为代表模型进行误差分析。同样采用相对误差率Er(个别vPR实际值接近0,不进行分析)、拟合优度R2、平均绝对百分比误差(MAPE)和均方根误差(RMSE)这4个指标对SVR模型预测结果进行评价,结果见图14和表5。

表4 模型预测结果平均绝对百分比误差(MAPE)对比Table 4 MAPE comparison of model prediction results%

表5 SVR模型预测结果误差分析Table 5 Error analysis of SVR model prediction results

图10 Ⅱ级围岩掘进参数SVR,GRNN和BPNN模型预测结果Fig.10 Prediction results of tunneling parameters of grade Ⅱsurrounding rock by SVR,GRNN and BPNN model

图11 Ⅲ-a级围岩掘进参数SVR,GRNN和BPNN模型预测结果Fig.11 Prediction results of tunneling parameters of grade Ⅲ-a surrounding rock by SVR,GRNN and BPNN model

图12 Ⅲ-b级围岩掘进参数SVR,GRNN和BPNN模型预测结果Fig.12 Prediction results of tunneling parameters of grade Ⅲ-b surrounding rock by SVR,GRNN and BPNN model

图13 Ⅳ级围岩掘进参数SVR,GRNN和BPNN模型预测结果Fig.13 Prediction results of tunneling parameters of grade Ⅳsurrounding rock by SVR,GRNN and BPNN model

图14 SVR模型预测结果相对误差率Fig.14 Relative error rate of SVR model prediction results

从预测结果和误差分析来看,在Ⅱ级、Ⅲ-a级、Ⅲ-b 级和Ⅳ级围岩中,SVR 模型对于各掘进参数预测结果的平均相对误差率分别为(−0.2,0.2),(−0.3,0.3),(−0.3,0.3)和(−0.4,0.4),远高于LSTM 模型的平均相对误差率(−0.1,0.1),(−0.1,0.1),(−0.05,0.05)和(−0.2,0.2),说明LSTM 模型的预测准确率比SVR 模型的更高。由表5可知,SVR 模型对于Ⅱ级、Ⅲ-a 级、Ⅲ-b 级和Ⅳ级预测结果的R2平均值分别为0.373 2,0.341 9,0.536 0和0.393 6,远低于LSTM模型的R2平均值,说明SVR 模型的预测结果拟合度较差,不能准确反映掘进参数的变化趋势。对于4 类围岩,LSTM模型的MAPE和RMSE平均值分别7.31%和94.64,SVR 模型为16.88%和217.07,说明相对于传统回归神经网络来说,LSTM模型对于时间序列样本的预测准确率更高。

综合比较LSTM 模型和SVR、GRNN、BPNN模型的预测结果可以发现:LSTM模型几乎准确预测了各级围岩各个掘进参数的变化趋势,并且具有很小的预测误差;SVR 模型较准确地预测了参数的变化趋势,但预测误差较大;GRNN 模型和BPNN模型只能预测参数大致的变化趋势,并且预测误差过大。这是由于LSTM模型通过设置单元状态以及3种门操作(遗忘门、输入门、输出门)合理地权衡了前期数据与当前数据的输入权重,并随着新数据的不断输入改变单元状态的输出权重,从而使得输出结果具备较高的拟合优度以及准确性。

4 结论

1)提出了一种基于LSTM 网络的TBM 掘进参数时序预测模型。针对TBM 穿越深埋隧道片麻岩、花岗岩地层,通过LSTM模型给出了转速、扭矩、推力、净掘进速度、施工速度和开挖比能的时序预测方法。该模型在实际工程中应用效果较好,可为后续类似工程提供参考。

2)与传统回归预测模型相比,LSTM模型在各级围岩、各个掘进参数的预测精度更高。LSTM模型预测结果对不同围岩等级下TBM 设备操控参数的选取提供了指导。

3)围岩等级越高,LSTM 模型预测精度越高;对施工速度的预测精度在各级围岩中均为最低,对推力和净掘进速度的预测效果在各级围岩中最好。

4)LSTM 模型在TBM 掘进参数时序预测上具有较好的实际应用效果。后续若能对不同型号TBM、不同岩性地层的工程案例的更稠密的时序掘进数据(比如每分钟掘进数据均值)进行研究,扩充样本数据库,则可以获得更加全面的预测模型,更好地指导TBM 施工。同时,LSTM 网络在地层条件突变问题以及数据的噪声处理问题上尚存在不足,仍需进一步研究。

猜你喜欢
误差率时序围岩
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
不同围岩条件对隧道衬砌应力影响分析
清明
软弱围岩铁路隧道超前预加固适用性研究
高速公路隧道大断面V型围岩钻爆法施工技术
你不能把整个春天都搬到冬天来
矿山深部巷道围岩变形与应力分布数值模拟研究
生化检验全程中质量控制管理方式及应用意义
降低评吸人员单料烟感官评分误差率探讨
基于FPGA 的时序信号光纤传输系统