吴泽民,周临风,冷建成
(东北石油大学,黑龙江大庆 163318)
管道是油气资源的主要运输方式,在长期服役过程中由于受到环境载荷以及材料本身性能退化等因素影响,会产生结构损伤、变形甚至断裂失效[1],因此,非常有必要对这些高后果区管段以及超期服役管道实施在线监测,并利用监测数据预测管道的发展趋势以实现异常预警,确保在役管道的安全。
国内外学者在油气管道安全监测方面开展了大量研究,胡瑾秋等[2]通过引入数据自组织挖掘思想对设备退化状态进行预警,采用隐马尔科夫模型对设备状态进行评估,再进一步通过建立自组织预测模型进行退化过程预测;El-ABBASY等[3]采用人工神经网络(ANN)模型对管道状态进行预测,给出了油气管道的衰退曲线;谢丽婉[4]基于埋地聚乙烯管道,建立了模糊综合评价数学模型,通过将安全预警理论与风险矩阵相结合来确定管道的安全预警等级;温江涛等[5]引入深度迁移学习,实现了复杂环境下油气管道周边入侵事件的准确识别。
综上所述,目前应用传统预测方法对管道进行安全评价的研究较多,笔者基于地基沉降下的室内管道模型试验,曾提出利用BP神经网络和GM(1,1)组合模型进行管道监测部位的应力预测,但预测结果偏保守[6]。本文将深度学习中的长短期记忆网络(LSTM)引入到管道应力发展的趋势预测,为后续的在线安全预警提供指导。
循环神经网络(Recycle Neural Network,RNN)是ANN的一种改进,与传统的BP神经网络相比[7-8],RNN网络具有记忆功能,即考虑时间相关性的影响,通过收集数据序列的历史信息来计算当前输出,能够更深地挖掘数据的潜在规律,从而实现更准确的预测;但由于自身特殊的结构而会出现梯度爆炸或梯度消失问题,为此通过引入长短期记忆单元代替原来的隐含层单元就得到LSTM网络模型,其原理如图1[9]所示。
图1 长短期记忆网络原理示意Fig.1 Schematic diagram of LSTM network
图1中,长短期记忆单元包含记忆单元和3个门,分别为输入门、遗忘门和输出门,这些门控制着信息流入和流出记忆单元。
基于有限元分析结果[6],兼顾室内试验和现场安装需要,在管道关键部位表面安装4个振弦传感器和5个直角电阻应变片,具体布置见图2。其中,振弦传感器可以测量管道表面的轴向应变和温度,应变片同时测量轴向和周向应变。
图2 振弦传感器和应变片布置Fig.2 Arrangement of vibrating wire sensors and strain gauges
通过调节管道底部的升降支架进行不同基础沉降下的在线监测试验,具体试验过程见文献[6]。
2.2.1 基于LSTM模型的管道应力趋势预测
振弦传感器在现场施工中具有便于安装和适于长期监测等优势,但仅能测量轴向应变。由于薄壁管道可考虑为平面应力状态,因此,本文主要对室内直角应变片的监测数据进行应力分析。
对管道应力变化进行趋势预测需要基于前期监测的历史数据,利用LSTM模型可以考虑过去的监测数据和未来数据之间的时间相关性,进而实现管道的应力预测。其主要过程如下:首先,依据与等效应力相关的监测参数的个数来确定输入层节点数,根据输入层和输出层确定隐含层数目;然后,将应力监测数据分为训练集和预测集,并对数据作归一化处理,以消除量纲影响;最后,建立LSTM模型,选取激活函数进行训练,得到拟合结果。
具体来说,选择轴向应变、周向应变作为输入变量,输入节点数设为2;输出变量为等效应力,输出节点数设为1;基于输入层和输出层节点数,需要确定隐含层数目,即LSTM单元数目,通过经验公式[10]可进行初步估算:
(1)
式中,N为隐含层节点数;m,n分别为输入和输出层节点数;a为1~10之间的常数。
考虑到LSTM单元数目越多,神经网络的拟合能力越强,但计算时间也会增加;如果隐含层数目过少,长短期记忆网络的学习能力不强,基于式(1)代入不同的隐含层节点数,通过不断调整尝试使模型训练的均方根误差(RMSE)(见式(2))结果最小,进而确定最优隐含层节点数为5。
(2)
RMSE计算结果越小,说明预测值和实际值偏差程度越小,预测效果越好。
选取2019年4月25日~4月27日应变片3的应力监测数据作为基础数据建立LSTM模型,对2019年4月28 日~4月29日的应力进行预测。输入数据前需要对训练数据和测试数据进行归一化处理,目的在于消除量纲不同和数值差异的影响,其计算公式为:
xk=(x-xmean)/xvar
(3)
式中,xk为归一化之后的数据;xmean,xvar分别为数据的均值和方差。
将归一化处理之后的训练数据和测试数据输入LSTM模型进行训练,确定每次训练的轮次为500,初始学习率为0.01,求解器应用Adam优化算法,激活函数选择sigmoid,最后进行反归一化得到预测结果如图3所示。
图3 LSTM模型预测结果Fig.3 Prediction results of LSTM model
由图3可以看出,基于LSTM模型进行应力拟合和预测取得了较好效果,经均方根误差计算,其值为0.35 MPa,表明具有较高的预测精度。
2.2.2 基于粒子群算法优化的LSTM模型应力预测
在实际应用中,长短期记忆网络中的迭代次数、学习率等参数通常都是依靠人为经验来确定,具有随机性,进而会影响模型的拟合和训练效果。为此,本文提出应用粒子群算法(PSO)[11]对长短期记忆网络进行优化。
粒子群思想源于鸟类社会行为研究,即在距离食物最近的鸟所在区域,通过最简单的方法搜索食物,并通过个体间的协助和信息共享实现群体进化。一个粒子可以看作一个可能解,用位置、速度和适应度值进行描述,通过不断迭代寻找最优区域,从而在搜索空间中完成寻优过程,最终得到满足终止条件的最优解。
在搜索空间中,多个粒子构成一个群体,在第t次迭代后形成粒子的速度和位置,分别用Vi,t和Xi,t表示,在寻优过程中不断更新位置和速度,并形成两个最优解:一个是个体极值pbesti;另一个是全局最优解gbesti。在寻找最优解的过程中,粒子分别按照式(4)和式(5)[12]更新速度和位置。
Vi,t+1=ωVi,t+c1rand(pbest-Xi,t)
+c2rand(gbest-Xi,t)
(4)
Xi,t+1=Xi,t+λVi,t+1
(5)
式中,ω为惯性因子;c1,c2分别为个体和群体学习因子;rand为[0,1]间的随机数;λ为速度系数,一般取1。
取同样的监测数据,构建PSO-LSTM模型进行优化预测,首先仍然是将数据划分为训练集和测试集;其次,将LSTM模型中的学习率、迭代次数做为优化目标,设置最大迭代次数为10,个体和群体学习因子分别设为0.5和1,惯性因子设为0.6,粒子群规模设为5,定义适应度函数f[12]为:
(6)
式中,K为种群规模;yi为预测数据;y0为实际数据。
依据式(6)计算每个粒子的适应度值,根据初始适应度值确定个体极值和全局最优解;根据式(4)(5)对粒子的速度和位置进行更新;判断全局最优解是否满足最大迭代次数,若满足则输出最优结果,若不满足,重新计算适应度值,重复上述迭代过程。PSO-LSTM模型的适应度曲线见图4。
图4 PSO-LSTM模型适应度曲线Fig.4 PSO-LSTM model fitness curve
由图4可以看出,随着迭代次数的增加,适应度值趋于稳定,当迭代4次后达到最佳适应度值。优化后的LSTM模型迭代次数和学习率分别为272和0.003 9,将优化参数和测试数据输入到构建的训练模型中,反标准化得到优化后的预测结果见图5。可以看出,优化后的长短期记忆网络预测效果更接近于实际值。
图5 PSO-LSTM优化预测结果Fig.5 Prediction results optimized by PSO-LSTM
将基于同一监测数据的BP神经网络、长短期记忆网络以及优化后的LSTM预测结果应用均方根误差作为指标进行定量评价,计算结果列于表1中。
表1 三种模型应力预测结果对比Tab.1 Comparison of stress prediction results by three models
由表1可以看出,基于BP神经网络进行预测的均方根误差为0.81 MPa,而LSTM模型和PSO-LSTM模型进行趋势预测的均方根误差分别为0.35 MPa和0.29 MPa,说明优化后的LSTM模型能够很好地反映数据变化趋势,而且PSO-LSTM模型的预测曲线更接近真实应力变化,预测结果也比LSTM模型更精确。
需要说明的是,不同样本的选择有可能会对模型的预测结果及预测能力产生影响,下一步将讨论其相关性及样本-样本误差,并研究新的样本选择算法以确保所提模型的准确性和稳健性[13]。
(1)基于循环神经网络能够更深层次地挖掘监测数据特征和规律,与BP神经网络相比,所提出的LSTM模型预测应力趋势效果更好。
(2)提出了基于粒子群算法对LSTM模型进行优化的PSO-LSTM模型,结果表明,PSO-LSTM模型预测精度明显优于LSTM模型和BP神经网络结果,有望用于长期监测数据的趋势分析和安全预警中。
(3)在管道应力预测的基础上,下一步将通过指数加权移动平均控制图实现对管道应力预测数据的异常预警,并结合管道有限元模型开展异常数据的损伤程度评估及剩余寿命预测研究。