基于LSTM 的布里渊增益谱提取方法

2023-03-06 06:17尚秋峰李雪丽
光子学报 2023年1期
关键词:布里渊扫频畸变

尚秋峰,李雪丽

(1 华北电力大学 电子与通信工程系,保定 071003)

(2 华北电力大学 河北省电力物联网技术重点实验室,保定 071003)

(3 华北电力大学 保定市光纤传感与光通信技术重点实验室,保定 071003)

0 引言

分布式光纤传感器在传感距离、测量精度和空间分辨率等方面具有巨大的优势,已广泛应用于电力电缆、油气管道、交通运输等领域[1-7]。在众多分布式光纤传感器中,基于受激布里渊散射原理的布里渊光时域分析系统(Brillouin Optical Time-Domain Analysis,BOTDA)因其在超长距离对温度和应变的精确测量而备受关注[8-10]。然而,当进行长距离监测应用时,布里渊增益谱(Brillouin Gain Spectrum,BGS)在扫频范围内需要较多的采样点数来保证测量精度,这将导致测量精度和实时性之间的矛盾。

将机器学习和深度神经网络用于布里渊光纤传感系统是当今的研究热点之一。2017 年WU Huan 等[11]将温度提取作为一个监督分类问题,依据支持向量机(Support Vector Machine,SVM)模型的支持向量和超平面将布里渊增益谱划分为不同的温度类,具有更快的处理速度。2019 年WANG Jianjian 等[12]提出了将极限学习机(Extreme Learning Machine,ELM)用于温度提取,在每个扫频步长下该方法都比传统曲线拟合方法处理速度快。2020 年NORDIN N D 等[13]提出将广义线性模型(Generalized Linear Model,GLM)用于布里渊光时域系统进行快速温度提取。与传统的曲线拟合方法相比,广义线性模型在保持精度的同时将处理时间缩短了15 倍。最近,深度学习[14-15]作为最先进的机器学习工具在各种复杂数据分析中出现。与其他具有浅层架构的机器学习方法不同,深度学习由多个处理层组成,可以学习具有多个抽象级别的数据表示。AZARD A K 等[16]采用人工神经网络(Artificial Neural Network,ANN)对布里渊增益谱进行学习,在扫频步长较大的情况下取得了良好的测量精度。循环神经网络(Recurrent Neural Network,RNN)同传统神经网络一样,包含输入层、隐含层和输出层。与之不同的是,RNN 通过在网络隐层中添加时间隐含层来考虑序列特性,使得对序列数据处理具有更好的准确度[17]。然而,RNN 存在梯度消失的问题。针对该问题,HOCHREITER S 等[18]提出了长短期记忆神经网络(Long Short Term Memory,LSTM),作为循环神经网络架构的一种变体,该网络在保留RNN 优势的同时,克服了循环神经网络易出现梯度消失或爆炸等问题,常用于输入序列预测。

本文采用长短期记忆神经网络从校正的布里渊增益谱中获取光纤沿线的温度信息。当BOTDA 用于长距离监测时容易受到非本地效应[19]等多种因素的影响而产生畸变布里渊增益谱。本文首先采用谱线相减法将实验数据校正为洛伦兹谱,然后通过LSTM 对校正数据的剖面特征进行学习,进而高效地从洛伦兹谱中提取温度信息。仿真和实验研究了LSTM 网络在不同扫频步长情况下的性能。在长距离监测应用中,LSTM 网络对步长变化具有较好的鲁棒性,针对大频率扫描步长数据同样取得了良好的精度,有利于提高长距离温度监测系统的实时性。

1 实验系统

本文所采用的BOTDA 温度传感实验装置如图1 所示。窄线宽激光器输出中心波长为1 550 nm 的光信号,经光耦合器按50∶50 的比例分为上下两路。图1 中上支路光信号,经由微波源驱动的电光调制器调制,产生频率发生偏移的连续光信号,连续光信号经掺饵光纤放大器(Erbium-Doped Fiber Amplifier,EDFA)1放大进而补偿功率衰减。下支路光信号,经声光调制器调制成脉宽为200 ns 的脉冲光,经掺饵光纤放大器(EDFA2)放大后注入传感光纤。当待测光纤中相向传输的两路光的频差与布里渊频移接近时,受激布里渊散射效应(Stimulated Brillouin Scattering,SBS)最明显。携带受激布里渊散射信息的光信号,经环形器和光电探测器转化为电信号后,被采样率为100 MSa/s 的采集设备采集。实验采用全长为40 km 的单模光纤,将待测光纤中段约500 m 放置在恒温水浴箱加热,其余光纤放置在室温约25℃的环境中。实验温度范围设置为25~65℃,每隔5℃进行一次数据采集。扫频范围设置为10.8~11.4 GHz,步长设置为2 MHz。为了提高在每个扫频点的信噪比,每条迹线平均3 000 次。

图1 BOTDA 实验装置Fig.1 BOTDA setup for temperature sensing

2 布里渊增益谱提取算法

2.1 畸变校正

布里渊光时域分析系统在长距离传感光纤工作时,易受到非本地效应等[19-20]多种因素的影响,导致布里渊增益谱产生畸变。本文所采用的实验系统在进行长距离温度监测时有畸变现象,畸变布里渊增益谱如图2(a)所示。由于畸变现象的存在,光纤沿线布里渊频移(Brillouin Frequency Shift,BFS)的估计值会偏离实际值,导致检索BFS 时存在严重误差而无法正确获取温度信息。因此,对畸变布里渊增益谱进行校正十分必要。本文采用谱线相减法[21-23]对畸变布里渊增益谱进行校正。在进行网络测试之前,将畸变布里渊增益谱与基线(如图2(d)所示)相减,校正后的布里渊增益谱如图2(b)所示,呈现出了较好的洛伦兹形状。校正后的实验数据将用于LSTM 网络测试。

图2 畸变布里渊增益谱现象Fig.2 The phenomenon of distorted Brillouin gain spectrum

采用图1 所示的实验系统进行数据采集。在本文实验过程中,光纤长度为40 km,沿传感光纤的三维畸变布里渊增益谱如图2(c)所示。脉冲重复频率设置为1 kHz,脉冲1 和脉冲2 之间的时间间隔t=1 ms。相向传输的脉冲光与连续光沿光纤发生受激布里渊散射效应。如图3 所示,设脉冲1 进入光纤的时刻t0=0 ms,脉冲光遍历至40 km 处并携带受激布里渊散射信息返回,被光电探测器采集共花费2t1=0.8 ms。脉冲2 进入光纤之前的t-2t1=0.2 ms,光电探测器采集到的是未发生SBS 的连续光,截取此区域的数据构成了图2(d)中的三维基线(对应光纤长度200 m)。此区域基线与光纤沿线畸变布里渊增益谱中的基线(如图2(a)所示)保持一致。

图3 单模光纤受激布里渊散射示意图Fig.3 Single mode fiber SBS model

2.2 LSTM 算法原理

LSTM 网络是循环神经网络的一种高级变体,主要通过对隐含层的修改来实现很强的学习依赖性和长时间记忆大量信息的能力[24-25]。通过门结构单元来处理长时间滞后任务并使用加法格式更新存储单元状态。与其他深度学习模型一样,LSTM 网络的训练也是通过时间反向传播算法来实现。为了获得更好的训练效果,输出又作为输入循环训练。典型的LSTM 网络结构如图4 所示。

图4 LSTM 模型结构Fig.4 Architecture of LSTM model

LSTM 网络通过门结构单元结合求和逻辑运算来避免梯度消失或爆炸问题的出现。遗忘门可以理解为一种选择性遗忘策略,它决定了上一时刻单元状态有多少保留到当前时刻;输入门决定了当前时刻网络的输入有多少保存到单元状态。LSTM 单元状态计算公式为

式中,σ 为Sigmoid 函数;it、ft和ot分别为输入、遗忘和输出门控;Xt为第t个神经元的输入;Ht-1为第t−1 个神经元的输出;WXi、WXf、WXo和WXC分别为Xt对应的权重;WHi、WHf、WHo和WHC分别为Ht-1对应的权重;bi、bf、bo和bC分别为对应的偏置向量;Ct为第t个神经元的状态。

LSTM 网络反向传播的过程就是依据设定的输入和输出数据进行误差反向传递,采用梯度下降法迭代更新网络参数,最终学习到适合且稳定的网络参数。LSTM 算法包含Ht和Ct两个隐藏状态,首先计算隐藏状态的梯度误差,分别记为。其中,的梯度由本层的输出梯度误差决定,如式(6)所示。的反向梯度误差由前一层的梯度误差和从Ht传回的梯度误差两部分组成,如式(7)所示。依据可计算WHf的权重梯度,如式(8)所示,其他权重梯度计算与此类似。

式中,L为当前输出的损失函数,V为输出层的权重矩阵,t为当前序列预测输出,yt为序列输出,τ为输入总时刻数。

2.3 训练集生成

LSTM 网络训练和测试是独立进行的,要想取得较好的温度提取效果,必须对网络进行充分训练使其参数达到最优。然而,充分的训练需要丰富的BFS-温度对。布里渊增益谱的不同线宽、布里渊频移、扫频步长均需考虑在内。在实际应用中,进行大量的实验获取大量的数据以用于LSTM 网络训练,面临耗费大量时间的问题。由于沿光纤各个位置处的BGS 曲线呈现出洛伦兹形状,因此,本文采用洛伦兹函数仿真生成用于LSTM 网络训练的数据集,洛伦兹函数由式(9)给出。

式中,gB是布里渊峰值增益,v是扫频范围,vB是布里渊频移,ΔvB是BGS 的线宽。在本文的仿真过程中,由于BGS 是归一化的,故设gB=1。扫频范围设置为10.8~11.4 GHz,扫频步长设置为2 MHz,与实验过程中保持一致。温度范围设置为20~70℃,温度间隔为0.1 ℃。为了匹配BFS-温度对,需将BOTDA 温度传感系统获得的实验数据进行线性拟合,通过计算得出的BFS-温度系数为1.028 MHz/℃。布里渊增益谱序列数据作为模型的输入,温度作为LSTM 模型的学习输出。

3 结果与讨论

3.1 仿真结果

扫频步长是影响测量精度的因素之一,图5(b)15 MHz 的采样点数少于图5(a)2 MHz 采样点数,这将会导致有效信息的丢失。均方根误差(Root Mean Squared Error,RMSE)如式(10)所示。在1~15 MHz 范围内调节扫频步长,定量比较了LSTM 和ELM 在不同扫频步长情况下的性能,结果如图6 所示。当扫频步长为1 MHz 时,LSTM 直接预测温度RMSE 可达0.11℃。图6 显示出在任意扫频步长下,LSTM 精度均高于ELM,并且在大扫频步长下优势更显著。这将有效提高温度监测系统的实时性。

图5 不同扫频步长的布里渊增益谱Fig.5 BGS with different scanning step

图6 不同扫频步长的均方根误差Fig.6 RMSE at different frequency step

式中,Tm是测得的温度值,Tc是LSTM 或ELM 预测的温度值,N是BGS 的个数。

3.2 实验结果

采用2 MHz 扫频步长,对每条迹线平均3 000 次后,获得的40 km 单模光纤加温至55℃的三维BGS 如图7(a)所示,其中光纤中段约500 m 放在恒温水浴箱中加热,其余光纤放置在室温约25℃的环境中。从图7(a)中可以看出光纤加热区域与室温情况对比频率发生明显偏移,实验结果与BFS 和温度呈线性关系的理论相符。由于本文实验系统在进行长距离监测时沿整根传感光纤均有畸变,局部位置畸变情况如图7(b)所示,光纤沿线其他位置的畸变情况与此相似。图8(a)是对实验获得的畸变BGS 进行校正后的三维BGS,图8(b)是对图7(b)进行校正后的结果,从图8 可以清楚地看到校正后的布里渊增益谱呈现出了较好的洛伦兹形状,校正后的数据将用于网络测试。

图7 传感光纤加温至55℃的畸变布里渊增益谱Fig.7 Distorted BGS along the sensing fiber heated at 55℃

光纤中段1 km(包含加热区域500 m)在四种不同温度情况下,由LSTM 和ELM 提取的温度分布结果如图9 所示。从图9 中可以看出,两种算法均可以成功地获取光纤沿线的温度信息,包括不同位置的温度变化。图9(a)为LSTM 在不同温度数据情况下的测试结果,图9(b)为ELM 的测试结果。可见,在35℃、45℃、55℃、65℃不同温度情况下,LSTM 测试得到的结果波动均小于ELM,表明LSTM 比ELM 方法更加稳健。这是因为LSTM 采用深度网络体系结构学习到BGS 的特征表示以及长期依赖关系,使得该网络具有更好的效果。实验数据存在阶梯的原因是本课题组为了实现BOTDA 在监测温度的同时,利用光的偏振态变化监测振动信号,故实验系统未加扰偏器从而引起了偏振起伏,造成了温度测量数据的起伏。

图9 20~21 km 包含500 m 加热段的温度分布Fig.9 Tempreture distribution along the 500 m heated fiber from 20 km to 21 km

根据均方根误差来定量比较LSTM、ELM 及洛伦兹拟合(Lorentz Curve Fitting,LCF)的性能,RMSE将会受到实验所采数据好坏的影响。图10(a)为2 MHz 扫频步长下,计算得到的不同温度的RMSE 情况,LSTM 在2 MHz 实验数据下直接预测RMSE 达0.6432℃。从图10 中可以看出,每个温度点处LSTM 的RMSE 均小于ELM。图10(b)、(c)分别为4 MHz 和8 MHz 实验数据下的结果。随着扫频步长的增加,LSTM 方法的RMSE 增长趋势保持稳定,而ELM 方法呈现迅速上升状态,这表明LSTM 针对扫频步长变化具有较好的鲁棒性。此外,LSTM 在8 MHz 扫频步长下的RMSE 均优于其他两种方法,且与ELM 在4 MHz扫频步长下的结果相近,表明LSTM 在大频率扫描步长下取得了相当的精度,这将有效减少测量时间,有利于提高长距离光纤传感系统的实时性。

对于长度为40 km 的单模光纤,LSTM、ELM 和LCF 方法分别在2 MHz、4 MHz 和8 MHz 情况下的处理时间如表1 所示。从表1 可知,LSTM 表现出明显的时间优势。此外,由图10 可知,LSTM 算法在8 MHz步长下的测量精度与ELM 在4MHz 时测量精度相当。因此,在同等测量精度下,LSTM 相较于ELM 算法测量时间减少了一半。

图10 500 m 加热段不同步长情况下的均方根误差Fig.10 RMSE for the 500 m heated fiber at different frequency step

表1 沿40 km 光纤LSTM、ELM 和LCF 处理时间对比Table 1 Comparison of processing time using LSTM,ELM and LCF along 40 km fiber

4 结论

本文基于LSTM 对布里渊增益谱进行温度提取,该网络成功地获取了光纤沿线的温度信息。通过考虑布里渊增益谱的序列特征,LSTM 网络可以学习到BGS 的特征表示及长期依赖关系,从而建立与温度的映射关系。LSTM 网络针对扫频步长变化具有较好的鲁棒性,且在大频率扫描步长下具有良好的精度,有利于提高长距离光纤传感的实时性。与ELM 算法对比,训练良好的LSTM 模型在温度监测方面具有更高的精度。这些优点使得LSTM 协助布里渊光时域传感系统进行温度和应变监测十分高效。

猜你喜欢
布里渊扫频畸变
基于布里渊散射的光纤温度和应变快速感知
电力通信在5G网络使用700M频段的注意事项
正弦扫频速率对结构响应的影响分析
平行四边形晶格结构中布里渊区的研究
在Lightroom中校正镜头与透视畸变
带电等效阻抗扫频测试的互感器绕组及外绝缘隐患快速识别新技术的应用研究
一种线性扫频干扰信号的参数估计方法
面心立方、体心立方晶格第一布里渊区的画法
辐射诱导染色体畸变的快速FISH方法的建立
《癌变·畸变·突变》2014年第26卷索引