深度学习在实测沉降数据预处理中的应用研究

2021-09-29 12:36胡安峰李唐陈缘葛红斌李怡君

湖南大学学报·自然科学版 2021年9期

胡安峰李唐陈缘葛红斌李怡君

摘要：基于深度学习中的长短期记忆网络LSTM，通过搭建Seq2Seq模型，提出了可对实测沉降数据进行预处理的新方法. Seq2Seq可通过观测大量有效的测点数据来自动学习沉降发展规律，并在训练完成后能对异常测点沉降进行重新计算，可有效避免异常数据对后续沉降预测的干扰. 以某机场多个区域的实测沉降数据为背景，通过将Seq2Seq模型重计算出的沉降值与实测值对比，验证了该模型的可靠性. 结合超参数与数据集等参数分析，研究了提升模型学习能力的影响因素. 研究结果表明：在训练集选取40个测点、测试集选取15个的条件下，模型重计算值与实测值全过程平均误差3 cm. 增大训练集与数据特征，且减小训练集与测试集之间的偏差时，模型的精度提升明显，误差缩小到2 cm.

关键词：长短期记忆网络;深度学习;序列到序列模型;沉降预测;沉降数据预处理

中图分类号：U443.15 文献标志码：A

Deep Learning for Preprocessing of Measured Settlement Data

HU Anfeng1，2，LI Tang1，3，CHEN Yuan1，GE Hongbin4，LI Yijun1

（1. Research Center of Coastal and Urban Geotechnical Engineering，Zhejiang University，Hangzhou 310058，China;

2. Center for Balance Architecture，Zhejiang University，Hangzhou 310058，China;

3. Architectural Design and Research Institute of Zhejiang University Co Ltd，Hangzhou 310058，China;

4. Xiamen Iport Go Ltd，Xiamen 361012，China ）

Abstract：Based on Long Short Term Memory （LSTM） in deep learning，a new method for preprocessing the measured settlement data is proposed by building a Seq2Seq model. Seq2Seq can automatically learn the law of settlement development by observing a large number of effective measuring point data，and can recalculate the settlement of abnormal measuring points after training is completed，which can effectively avoid the interference of abnormal data on the subsequent settlement prediction. Taking the actual measured settlement data in multiple areas of an airport as the background，the reliability of the model was verified by comparing the calculated settlement value of the Seq2Seq model with the measured values. Combined with parametric analysis such as hyperparameters and data sets，the influencing factors on improving model learning ability are studied. The research results show that，under the condition that the training set selects 40 measurement points and the test set selects 15，the average error of the model recalculated value and the measured value in the whole process is 3 cm. When the training set and data features are increased and the deviation between the training set and the test set is reduced，the accuracy of the model is significantly improved and the error is reduced to 2 cm.

Key words：Long Short Term Memory（LSTM）;deep learning;Seq2Seq model;settlement prediction;preprocessing for measured settlement data

作為岩土工程的经典问题，预测地基的沉降过程是尚未完全解决的难题. 传统预测沉降的方法一般有三种：一是利用沉降的理论计算法，如各类分层总和法与固结理论[1-4]，但由于难以获取原状土参数以及施工现场的复杂性，计算出的结果往往和实际有一定差距. 二是有限元建模等数值方法[5-9]，除上述原状土体参数问题外，有限元法还存在模型参数选取偏经验化，迭代过程复杂耗时，易出现奇异点等多种问题，计算出的结果和实测值相比也不够准确. 与上述两种方法相比，第三种的曲线拟合法通过实测数据来推算沉降量与时间的对应关系，能更真实地反映地基的沉降规律[10]. 应用广泛的有指数曲线法[11]、双曲线法[12]、泊松法[13]和Asaoka法[14]等. 曲线拟合法是通过在实测曲线上采点来拟合曲线，从而预测后续的沉降. 为保证后续沉降预测顺利进行，实测数据的准确度就变得至关重要. 但在实际工程中，现场实测沉降数据常常存在诸多问题.

对于在建的大型地基处理项目，测点通常在千位数量级，由于人工误差、仪器误差等影响，一般很难保证所有测点数据都准确无误. 為避免异常数据对后续沉降预测的干扰，在使用曲线拟合法或其他预测方法之前，存在对实测沉降数据进行遴选及预处理的需求.

深度学习是近年来进行数据处理的高效方法，在沉降预测等岩土领域中的应用也较多[15-24]，但迄今为止，尚无文献研究过使用深度学习对沉降数据进行预处理. 本文结合以上研究，提出了一种利用深度学习作为沉降数据预处理的新方法. 由于深度学习是通过搭建神经网络来观察数据并发现其内在关联，因此对于数据的处理能力要明显优于其他方法[25-27]. 其中，长短期记忆网络LSTM[28-31]尤其擅长处理时间序列，这种带有记忆功能的神经网络，能自动地观察符合沉降发展规律的测点数据，学习良好的实测曲线具有的模式，然后将学到的映射关系应用到问题测点来重新计算全过程沉降值.

由于深度学习一般由多个处理层来组成计算模型，可学习具有多个抽象级别的数据表示[25]，在经过若干处理层的转换之后，模型可以学到非精细的模式和特征[26]. 因此，本文基于深度学习中的长短期记忆网络LSTM，通过搭建Seq2Seq模型[32-33]，提出了对实测沉降数据进行预处理的新方法. 在对比模型重新计算的全过程沉降值与对应的实测值后，验证了该数据预处理方法的可行性. 最后，还对Seq2Seq模型的超参数与数据情况等主要影响因素进行分析，探讨了模型的具体应用方法.

1 基于深度学习的沉降计算原理研究

如图1所示，深度学习处理问题的出发点与传统思维完全不同. 传统思维方法会事先建立从输入到输出的映射规则，而深度学习则首先通过输入与已知的输出标签来反向求解出这种映射关系，再对新的输入数据应用训练得到的模型来计算输出.

对于沉降计算问题，根据沉降计算理论，不论是式（1）的普通分层总和法还是式（2）的建筑地基基础规范修正式，关键都在于经验系数簇α的选取.

又对于式（3）太沙基一维固结理论，将其简化为式（4）. 若考虑非线性固结，则如式（5）（6）所示[34]，按应力和应变定义的固结度存在差异. 式（4）（5）（6）的重点在于函数簇f的选取. 因此，沉降计算在统计方法上可以看作对α和f分布的选取.

深度学习可通过多个处理层组成的神经网络模型，来学习沉降数据的发展规律，经过多个处理层的转换之后，理论上模型可以组合出任意函数分布[15]. 应用在沉降计算过程中时，网络参数会根据实测数据的输入（即土体参数）和答案（即实测沉降值），不断调整自身参数值，优化出最符合此现场沉降发展规律的α和f函数簇的分布. 并且深度学习优化出的α和f可以随时间变化，表现出高度非线性，这也符合在不同沉降发展阶段，α和f应取不同值的理论依据. 因而，深度学习契合沉降计算的要求.

深度学习最大的优势在于，除了经验系数α和f的选取完全来自于对数据模式的高效识别外，还在最初就考虑了各种不可控噪声对沉降的影响. 在数据量大的条件下，深度学习模型由于具有记忆和遗忘功能以及强大的学习能力，可以通过对多个良好测点沉降模式的学习来识别这些噪声，从而在异常数据处理时，除了经验系数之外还能考虑到噪声的影响. 其中，处理沉降发展曲线这种时间序列尤其适合LSTM.

2 LSTM与Seq2Seq模型

2.1 LSTM神经元内部结构

传统深度神经网络虽然能对数据进行逐层的特征提取，但无法考虑时间顺序，没有办法对时间序列进行有效的处理. 循环神经网络RNN正是为克服这个缺点而诞生的，也即RNN拥有一定的记忆功能. 具体的表现形式为循环神经网络会对前面的信息进行记忆并应用于当前输出的计算中，隐藏层之间的节点不再是无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出，还包括上一时刻隐藏层的输出.

长短期记忆网络LSTM是循环神经网络的主流实现，是一类用于处理时间序列的神经网络，其神经元内部结构如图2所示. 在t时刻，网络的输入有3个：当前时刻的输入值xt，上一时刻LSTM的输出值ht-1，上一时刻的记忆单元ct-1;输出有2个：当前时刻的输出值ht，当前时刻的记忆单元ct.

LSTM的关键在于如何控制记忆单元c，为此，LSTM设计了3个开关，即门控单元：输入门、遗忘门和输出门.

1）输入与门控单元.

输入：

at = tanh（Wa xt + Ua ht-1）（7）

输入门：

it = σ（Wi xt + Ui ht-1）（8）

遗忘门：

f t = σ（Wf xt + Uf ht-1）（9）

输出门：

ot = σ（Wo xt + Uo ht-1）（10）

其中，σ为sigmoid函数.

2）记忆状态单元的更新.

ct = it⊙at + f t⊙ct-1 （11）

3）输出.

ht = ot⊙tanh（ct）（12）

LSTM用遗忘门决定上一时刻的记忆单元ct-1有多少保留到当前时刻ct，用输入门决定当前网络的输入xt有多少保留到当前时刻ct，用输出门控制当前记忆单元ct有多少输出到当前ht.

2.2 全过程沉降重计算Seq2Seq模型

LSTM常常用来构建Seq2Seq模型，如图3所示. 在训练全过程沉降修正模型的过程中，输入是每个时刻的施工参数、土层参数，输出是每个时刻的沉降. 对于encoder部分，将训练数据按时序输入，得到encoder部分的最终记忆单元值cn和最终输出hn，再用cn和hn来初始化decoder最初的c0和h0. 训练的输入包括1）施工参数：时间、加载和卸载等;2）土层参数：各土层的压缩模量E、厚度h等.

对于decoder，再次将训练数据按时序输入，在每个时间点t，输入为xt，标签为yt . 训练标签为各时段对应的实测沉降值. 训练网络的目的是让LSTM每个时刻输出的ht与标签yt尽可能接近. 通过建立ht与相应时刻yt的损失函数MAE，利用梯度下降法训练网络，使损失逐步降低以达到预期值.

3 Seq2Seq模型的应用与验证

深度学习需要首先根据实际数据反演输入与输出的映射关系，脱离实际数据来讨论深度学习是无意义的，因此，直接将工程实测数据分析作为出发点是深度学习的必然要求.

3.1 工程背景

某大型机场填海面积26.0 km2，从某岛礁地基处理一期工程中2 000余测点的实测沉降曲线中可以看到，由于观测、仪器等误差，测得的部分测点沉降曲线不符合沉降理论的预期，违背沉降发展规律，集中体现在出现大幅波动的锯齿状曲线这一现象. 但从工程的实际情况来看，堆载测点并未卸载，应只有下沉，不可能出现回弹. 这说明测得的锯齿状曲线与测点实际的沉降发展曲线相比有很大的偏差. 除去观测误差的影响，现场实测曲线还存在某时间段数据缺失、测试员随意写入沉降数据等多种问题. 由于机场建设非常关注全区域不均匀沉降带来的影响，而问题测点的数量较多，因此需要对这些异常测点数据进行预处理.

3.2 模型的验证与应用

Seq2Seq模型训练与验证过程如图4所示. 首先需要人工对数据进行遴选，挑出符合经典沉降理论预期的优良测点数据作为训练集和测试集;然后定义网络超参数（非网络参数），对于上述Seq2Seq模型，即选取神经元数量;之后网络参数的调整过程是模型根据反向传播自动进行的，无需人为干预;模型训练完成后，如在训练集和测试集上都收敛，则可应用到异常测点数据处理，否则需要重新调整神经网络超参数或重新选取训练集与测试集，并再次训练网络.

模型训练完成后，在测试集所有测点上的全过程平均误差为32 mm. 图5为A区部分测点的实测与重计算对比图，从图5（a）（b）（c）曲线的前半段可以看到，由于前期的沉降过程差异较大，在数据不够充足的情况下，模型很难精准修正，所以前半段的平均误差达到53 mm. 到曲线后半段，模型能够发现沉降逐步偏向平稳的趋势，且精度提升明显，后半段平均误差为8 mm. 图5（d）全过程平均误差为9 mm，低于全部测试集测点的平均误差值32 mm，且全过程都较为准确. 图5表明，深度学习模型对各种沉降发展模式，即各种形状的实测曲线，都能做到较为精确的重新计算，而传统方法很难处理突变等复杂状况. 且深度学习模型计算后半段曲线的精确度明显高于前段，对于预测工后沉降来说，曲线后期的发展趋势显然更重要.

4 模型学习能力的影响因素

为探究模型学习能力的影响因素，也为证实前文所述深度學习的普适性，另选取该机场B区与C区的测点训练并测试模型，得到的结果与A区作为对比.

4.1 数据量

深度学习是数据驱动的科学，模型能否取得优异的表现，数据量的大小是决定因素之一.

如表1所示，模型在B区测试集上有91 mm的平均误差. B区误差偏大的原因是模型仅使用16个测点作为训练集数据，来重计算测试集的8个测点. B区的数据较少，严重限制了模型的泛化能力. 逐渐增大数据量后，模型的精确程度有了很大的提高，在C区测试集上误差缩小到22 mm. 从使用的数据量来看，B区与C区的结果均在合理范围内，这也反映了深度学习的普适性.

4.2 神经元数量

LSTM神经元的个数对模型的学习能力有很大影响. 神经元选取的数量需要逐步调试，数量过少会导致欠拟合，模型在训练集上都无法做到收敛;数量过多模型会出现过拟合现象，在测试集上的表现明显变差.

表2展示了神经元数量选取16、32、64、128、256对模型计算沉降值与真实沉降值之间平均误差的影响. 神经元数量越多在训练集上的表现越好，因为此时模型的学习能力变强. 在测试集上则存在一个极值点，神经元数量偏少时，模型学习能力不强，无法通过训练集数据学习到沉降发展的规律;数量偏多时，模型由于强大的拟合能力，开始过度关注训练集数据，将其中的异常噪声也进行学习. 模型在测试集上的表现是问题的核心，对于A区测点数据选取64个神经元，此时模型在测试集上表现最优.

4.3 数据分布

图6为B区测试集8个测点的实测与重计算沉降对比图. 图6中的主要误差都来源于测点B-52和B-53，而其他测点的重计算情况相对较好，这说明除了数据量对模型误差的影响外，还存在其他重要影响因素. B区训练集测点的淤泥层厚度、黏土层厚度见表3. 图7由表3数据绘制而成.

表3最后两行黑体字部分为测试集误差主要来源B-52和B-53的参数值，其余为训练集测点的参数值. 从图7可以看到，训练集测点的黏土层厚度大多数在10 m以上，而淤泥层的厚度在4 m以下，与B-52、B-53的土层厚度相差较大，由于训练集的数据分布与测试集差异很大，且数据量偏少，模型无法学习到淤泥层、黏土层厚度增大或减小造成的沉降具体增减量. 模型主要训练在黏土层厚而淤泥层薄的数据集上，B-52和B-53的黏土层厚度过小，因此计算出的最终沉降会偏小.

在数据较少的条件下，数据的分布会造成模型预测结果不够精确. 划分数据集时，应该尽量让训练集和测试集具有相同的数据分布. 将B-52或B-53中的任意一点加入训练集可以部分弥补训练集和测试集分布的偏差，尝试将B-52加入训练集后，模型在其余条件不变的情况下测试集误差减小至57 mm，相较之前有明显提升.

4.4 数据特征

图8为测试集测点C-16、C-22的沉降曲线对比图，其土层参数见表4.

C-16与C-22的土层参数相差不大，但C-16在沉降发展到350 d后误差明显变大. 这说明施工条件仅考虑加载，土层参数仅考虑压缩量较大的淤泥和黏土限制了模型学习能力. C-16显然是受到如渗透系数、排水条件等其他因素的影响. 在数据偏多的情况下，应该考虑更多的影响因素，加入更多的数据特征.

在加入渗透系数作为数据特征后，C-16的沉降对比曲线见图9（a），误差由之前的21 mm降低至10 mm，且曲线后段提升效果明显. C-22在考虑了渗透系数后，计算误差降低到2 mm.

5 结论

通过搭建Seq2Seq模型，首次提出了深度学习在实测沉降数据预处理中的应用方法. 在某机场不同典型区域A、B、C，通过对比模型在测试集上的重计算与实测沉降值，验证了深度学习对异常沉降数据进行预处理的可行性. 其中，Seq2Seq模型在A、C区域沉降数据的预处理中，将全过程平均误差分别控制在3 cm和2 cm，表明此方法对工程实测沉降数据预处理及后续预测具有较好的实用价值. 最后，还分析了超参数与数据集对模型学习能力的影响程度. 具体结论如下：

1）数据量对模型处理异常数据的能力起决定作用，模型输出误差随数据量增大明显变低. 样本数量作为统计方法的重要参数，是深度学习在岩土工程中的应用能否取得成功的基石. 增大样本数量时，模型在B、C区域测试集上的误差由91 mm降低至22 mm.

2）训练集与测试集的参数一致性对模型性能有很大影响. 在B区的测试过程中，B-52、B-53测点的淤泥层与黏土层厚度与训练集相差较大，导致模型测试与学习的内容不一致，造成B区的重计算精度明显偏低. 因此在划分数据集的过程中，应尽量保证训练集与测试集的数据特征分布大致相同. 具体操作时，多次随机选取训练集，分别训练完成后对测试集结果取均值，一般能弱化这种差异.

3）所选数据特征的代表性对模型输出精度影响较大. 若模型反复调试后，依旧达不到精度要求，应考虑所选输入是否具有代表性. 此时可根据具体数据状况逐步增加数据特征，直至模型的重计算值达到精度要求. 例如，相较于初次训练测试时仅考虑压缩模量与各土层厚度，增加渗透系数作为输入后，C区误差明显降低.

4）超参数的最优解会随具体数据集变化而不同，需根据具体的数据状况进行逐步调试，应避免过拟合与欠拟合现象发生. 神经元数量、学习率、优化器、数据批次、网络层数等是模型自身超参数，其调节一般都是试错的过程. 在算力充足的条件下，可对每个超参数设定一个数值或类型范围，对它们的组合全部进行训练. 训练完成后，在测试集上进行验证并挑选合理结果. 若时间有限，在固定其他超参数为默认值的条件下，可优先调节神经元数量与学习率，同样能够取得较为理想的结果.

参考文献

[1] 龚晓南，谢康和. 土力学[M]. 北京：中国建筑工业出版社，2018：110—127.

GONG X N，XIE K H. Soil mechanics[M]. Beijing：China Architecture & Building Press，2018：110—127. （In Chinese）

[2] 劉波，杨伟红，张功，等. 基于隧道不均匀变形的地表沉降随机介质理论预测模型[J]. 岩石力学与工程学报，2018，37（8）：1943—1952.

LIU B，YANG W H，ZHANG G，et al. A prediction model based on stochastic medium theory for ground surface settlement induced by non-uniform tunnel deformation[J]. Chinese Journal of Rock Mechanics and Engineering，2018，37（8）：1943—1952. （In Chinese）

[3] WANG Y，LI J P，LI L. Settlement of jacked piles in clay：Theoretical analysis considering soil aging[J]. Computers and Geotechnics，2020，122：103504.

[4] ZHOU Z，CHEN Y，LIU Z Z，et al. Theoretical prediction model for deformations caused by construction of new tunnels undercrossing existing tunnels based on the equivalent layered method[J]. Computers and Geotechnics，2020，123：103565.

[5] 盧健，姚爱军，郑轩，等. 地铁双线隧道开挖地表沉降规律及计算方法研究[J]. 岩石力学与工程学报，2019，38（S2）：3735—3747.

LU J，YAO A J，ZHENG X，et al. Study on the law and computational method of ground surface settlement induced by double-line tunnel excavation[J]. Chinese Journal of Rock Mechanics and Engineering，2019，38（S2）：3735—3747. （In Chinese）

[6] KUMAR B，SAHOO J P. Support pressure for circular tunnels in two layered undrained clay[J]. Journal of Rock Mechanics and Geotechnical Engineering，2020，12（1）：135—148.

[7] OBERHOLLENZER S，TSCHUCHNIGG F，SCHWEIGER H F. Finite element analyses of slope stability problems using non-associated plasticity[J]. Journal of Rock Mechanics and Geotechnical Engineering，2018，10（6）：1091—1101.

[8] LESTER A M，KOURETZIS G P，SLOAN S W. Finite element modelling of prefabricated vertical drains using 1D drainage elements with attached smear zones[J]. Computers and Geotechnics，2019，107：235—254.

[9] 冷伍明，陈琛，徐方，等. 深厚软土区超长桩基压缩变形测试及分析[J]. 湖南大学学报（自然科学版），2019，46（11）：87—96.

LENG W M，CHEN C，XU F，et al. Measurement and analysis of compression deformation of a super-long pile foundation in deep soft deposit[J]. Journal of Hunan University （Natural Sciences），2019，46（11）：87—96. （In Chinese）

[10] 潘林有，谢新宇. 用曲线拟合的方法预测软土地基沉降[J]. 岩土力学，2004，25（7）：1053—1058.

PAN L Y，XIE X Y. Observational settlement prediction by curve fitting methods[J]. Rock and Soil Mechanics，2004，25（7）：1053—1058.（In Chinese）

[11] 曾国熙，杨锡令.砂井地基沉陷分析[J].浙江大学学报，1959（3）：34—72.

ZENG G X，YANG X L. Analysis of sand well foundation subsidence[J]. Journal of Zhejiang University，1959（3）：34—72. （In Chinese）

[12] SRIDHARAN A，MURTHY N S，PRAKASH K. Rectangular hyperbola method of consolidation analysis[J]. Géotechnique，1987，37（3）：355—368.

[13] 宰金珉，梅国雄. 全过程的沉降量预测方法研究[J]. 岩土力学，2000，21（4）：322—325.

ZAI J M，MEI G X. Forecast method of settlement during the complete process of construction and operation[J]. Rock and Soil Mechanics，2000，21（4）：322—325. （In Chinese）

[14] ASAOKA A. Observational procedure of settlement prediction[J]. Soils and Foundations，1978，18（4）：87—101.

[15] ZHANG P，LI H，HA Q P，et al. Reinforcement learning based optimizer for improvement of predicting tunneling-induced ground responses[J]. Advanced Engineering Informatics，2020，45：101097.

[16] YE X W，JIN T，YUN C B. A review on deep learning-based structural health monitoring of civil infrastructures[J].Smart Structures and Systems，2019，24（5）：567—586.

[17] 薛亞东，高健，李宜城，等. 基于深度学习的地铁隧道衬砌病害检测模型优化[J]. 湖南大学学报（自然科学版），2020，47（7）：137—146.

XUE Y D，GAO J，LI Y C，et al. Optimization of shield tunnel lining defect detection model based on deep learning[J]. Journal of Hunan University （Natural Sciences），2020，47（7）：137—146. （In Chinese）

[18] 张士勇，夏定辉，唐辉. 深度学习小波神经网络模型在地铁沉降预测中的应用[J]. 测绘通报，2018（S1）：250—253.

ZHANG S Y，XIA D H，TANG H. Application of deep learning wavelet neural network model in subway settlement prediction[J]. Bulletin of Surveying and Mapping，2018（S1）：250—253. （In Chinese）

[19] POOY A NEJAD F，JAKSA M B. Load-settlement behavior modeling of single piles using artificial neural networks and CPT data[J]. Computers and Geotechnics，2017，89：9—21.

[20] NAM K，WANG F W. An extreme rainfall-induced landslide susceptibility assessment using autoencoder combined with random forest in Shimane Prefecture，Japan[J]. Geoenvironmental Disasters，2020，7（1）：1—16.

[21] MA Q W，LIU S H，FAN X Y，et al. A time series prediction model of foundation pit deformation based on empirical wavelet transform and NARX network[J]. Mathematics，2020，8（9）：15—35.

[22] CHEN R P，ZHANG P，WU H N，et al. Prediction of shield tunneling-induced ground settlement using machine learning techniques[J]. Frontiers of Structural and Civil Engineering，2019，13（6）：1363—1378.

[23] JEBUR A A，ATHERTON W，AL KHADDAR R M，et al. Settlement prediction of model piles embedded in sandy soil using the levenberg-marquardt （LM） training algorithm[J]. Geotechnical and Geological Engineering，2018，36（5）：2893—2906.

[24] TANG Y Q，XIAO S Q，ZHAN Y J. Predicting settlement along railway due to excavation using empirical method and neural networks[J].Soils and Foundations，2019，59（4）：1037—1051.

[25] LECUN Y，BENGIO Y，HINTON G. Deep learning[J]. Nature，2015，521（7553）：436—444.

[26] NGUYEN T T，NGUYEN N D，NAHAVANDI S. Deep reinforcement learning for multiagent systems：a review of challenges，solutions，and applications[J]. IEEE Transactions on Cybernetics，2020，50（9）：3826—3839.

[27] LUC P，COUPRIE C，LECUN Y，et al. Predicting future instance segmentation by forecasting convolutional features[C]//Proceedings of Computer Vision-ECCV 2018. Glasgow，United Kingdom，2018：593—608.

[28] YU Y，SI X S，HU C H，et al. A review of recurrent neural networks：LSTM cells and network architectures[J]. Neural Computation，2019，31（7）：1235—1270.

[29] GRAVES A，MOHAMED A R，HINTON G. Speech recognition with deep recurrent neural networks[C]//Proceedings of the 2013 IEEE International Conference on Acoustics，Speech and Signal Processing. Vancouver，BC，Canada：IEEE，2013：6645—6649.

[30] WU X，DU Z K，GUO Y K，et al. Hierarchical attention based long short-term memory for Chinese lyric generation[J]. Applied Intelligence，2019，49（1）：44—52.

[31] CHEN S，GE L. Exploring the attention mechanism in LSTM-based Hong Kong stock price movement prediction[J]. Quantitative Finance，2019，19（9）：1507—1515.

[32] SUTSKEVER I，VINYALS O，LE Q V. Sequence to sequence learning with neural networks[C]// Proceedings of the 27th International Conference on Neural Information Processing Systems. Santa Fe，New Mexico，USA，2014：3104—3112.

[33] WISEMAN S，RUSH A M. Sequence-to-sequence learning as beam search-optimization[C]//Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. Stroudsburg，PA，USA：Association for Computational Linguistics，2016：1296—1306.

[34] XIE K H，WANG K，CHEN G H，et al. One-dimensional consolidation of over-consolidated soil under time-dependent loading[J]. Frontiers of Architecture and Civil Engineering in China，2008，2（1）：67—72.