GPS 信号失锁下的列车组合定位方法

2020-08-25 13:29陈永刚
导航定位学报 2020年4期
关键词:时刻神经网络误差

王 妍,陈永刚

(兰州交通大学 自动化与电气工程学院,兰州 730070)

0 引言

在轨道交通系统中,列车位置的确定是列车运行控制系统的重要环节,是确保行车安全和提高运营效率的前提[1]。目前列车定位方法有轨道电路、应答器、惯性导航技术、卫星定位技术等,其中:惯性导航系统定位时不依赖外界输入信息,但是其因累积误差会随时间增大而无法单独长期定位;卫星定位虽然可以降低列控系统成本,但容易在隧道、峡谷等地方出现信号中断,甚至会失效[2]。由于2 者均不适合单独定位,但存在着很强的互补特性,所以本文将全球定位系统(global positioning system, GPS)与捷联惯性导航系统(strapdown inertial navigation system, SINS)进行组合,实现列车组合定位。

从数据融合技术的角度出发,组合定位的本质是根据一定的估计原则,采用某种统计最优的方法,用直接或间接的方式从不确定的量测值中,对列车的位置、速度等信息进行滤波估计[3]。在国内外列车定位研究中,常用的列车定位数据融合方法分为随机类滤波算法和人工智能类滤波算法。文献[4]采用扩展卡尔曼滤波对惯性测量单元和里程计信息进行融合并输出,利用航位推算来预测位置和方向;文献[5]使用容积卡尔曼滤波进行列车组合定位的数据融合,并结合加权奇偶矢量法提出新的完好性检测方法,提高了系统的鲁棒性和完好性;文献[6]以反向传播神经网络(back propagation neural network, BPNN)为基础,通过训练已有数据来预测数据缺失下系统的位置和速度;文献[7]使用基于遗传算法的小波神经网络来预测GPS 信号失锁时 SINS 的定位误差;文献[8]将装袋法(bagging)模型引入到BPNN 模型中来提高定位精度。装袋法是自举汇聚法(bootstrap aggregating)的简称。通过分析文献可知:①GPS/ SINS 组合定位系统使用卡尔曼滤波器进行数据融合的条件,是必须要能够正常接收到所有定位传感器的信息,当卫星信号短暂缺失时,卡尔曼滤波器便无法对GPS/ SINS 数据进行融合;②现有使用智能算法进行列车定位的方法,只考虑了惯导在某一时刻输入和其位置间的关系,未讨论整个信息间的逻辑关系,而且没有解决梯度反传过程,由于逐步缩减而产生的消失问题。

鉴于此,本文在GPS/SINS 列车组合定位系统基础上,结合长短时记忆网络(long short term memory network, LSTM)的时序性以及能够解决梯度消失问题的特点[9],以及灰色模型(grey model,GM)可解决“贫信息”“少数据”和“不确定性”的问题且预测效果较好的特点[10],提出了GM(1,1)-LSTM 组合模型,以提高卫星信号失锁下,GPS/SINS 列车组合定位系统精度。

1 GPS/SINS 组合定位系统

目前 GPS/SINS 组合是列车组合定位常用的1 种组合方式[11]。本文基于这种组合方式并以列车安全计算机为数据处理的硬件载体,通过GM(1,1)和LSTM 网络进行数据处理和分析,结构如图1 所示。图1 中HMI 表示人机交互界面,ATC 表示列车自动控制系统。

图1 列车组合定位系统

2 GM(1,1)-LSTM 算法模型

2.1 灰色GM(1,1)算法

GM(1,1)是以“部分信息已知,部分信息未知”的不确定性系统为研究对象,与GPS 失锁下信息缺失的定位系统特点相符,采用其算法对传感器数据进行粗预测以降低原始数据的误差,处理过程[10,12]如下:

1)生成累加序列。构建传感器原始序列为

对传感器原始序列累加,即

生成1 次累加序列为

2)建立x(1)(k)的 1 阶微分方程。对生成序列x(1)(k)进行微分方程拟合得

式中:P为灰系数;Q为灰作用量。

3)求解x(1)(k)的1 阶微分方程。若为参数系数,并存在

因此1 阶微分方程解得

4)还原数据得到传感器粗预测序列。经1 次累减得到传感器的粗预测序列为:

2.2 LSTM 算法

LSTM 是 1 种建立在循环神经网络基础上的深度神经网络,它继承了传统循环神经网络的优点,可以对整个信息间的逻辑进行学习,这样可以减少输入和输出权重的冲突以及扰动。

LSTM 的核心是,通过引入LSTM 特有的遗忘门、输入门和乘法输出门,可以获得更持久的记忆能力[9,13-16]。这一特点也使 LSTM 能够更加容易地解决梯度消失的问题。LSTM 隐藏层运算图如图2。

图2 LSTM 隐藏层运算图

具体步骤[14-16]如下:

1)决定丢弃经 GM(1,1)处理后,序列中的无用信息为

式中:ft为遗忘门输出;Wf 、bf分别为遗忘门的权重矩阵和偏移向量;σ是sigmoid 函数,为隐藏层输入向量;ht为隐藏层序列向量。图2 中yt为隐藏层输出向量。

2)将序列中有用的待更新信息存入当前状态,即

式中:it为输入门输出;Wi 、bi分别为输入门的权重矩阵和偏移向量;tan h 为双曲正切激活函数;为经过调整后的新内容。

3)更新当前状态为

4)状态输出为

式中:Ot为输出门输出;Wo 、 bo分别为输出门的权重矩阵和偏移向量。

3 基于GM(1,1)-LSTM 的定位信息处理

构建 GM(1,1)-LSTM 模型,输入层主要完成GM(1,1)粗预测和归一化处理,隐藏层主要进行数据融合,输出层主要提供预测结果。基本处理过程如下:将传感器原始数据输入给 GM(1,1),利用GM(1,1)进行粗预测处理,并归一化后形成 LSTM的数据集;其次将归一化后的训练集作为LSTM 输入,经 LSTM 处理后得到预测结果,完成列车定位的目的。列车定位信息处理如图3 所示。

具体实现步骤:

1)确定模型输入输出。假设列车在t时刻的位置特征连续n个时刻的列车位置表征数据作为网络输入,将t+1 时刻的位置表征数据A(t+ 1)作为输出。

2)数据集分割。将传感器数据集分为训练集、测试集。

图3 基于GM(1,1)-LSTM 的定位信息处理

3)GM(1,1)处理。GM(1,1)利用自身特点,处理传感器原始数据产生规则的序列,这样可以削弱传感器自身的物理特性和环境因素造成的非线性误差。

4)归一化。对输入给LSTM 网络的数据集数据进行归一化处理,以降低网络训练难度和解决数据量纲和数量级的不统一问题。

5)LSTM 网络的初始化及参数选取。给定均匀分布在[0,1]间随机数的初始权值矩阵D、学习率η、网络激活函数、隐含层层数、训练步长step及优化方法等。

6)网络训练。将归一化处理后的序列作为LSTM 网络的输入,用 LSTM 网络的实际输出与理论输出计算出均方误差,然后采用优化方法来对权值和偏置进行调整,减小网络误差,实现网络的优化。当满足预设均方误差值时,模型训练停止,这样就可以得到训练好的网络。

7)网络预测。将输入序列对应的理论输出序列输入给 LSTM 网络,得到下一时刻的预测值,并将该预测值与预测时刻前n-1 个时刻的理论输出组成新的数据,继续预测下下一时刻位置特征,依次类推得到预测序列。

8)反归一化。预测得到的位置特征,经反归一化得到与测试集相对应的预测结果。

4 实验与结果分析

4.1 确定模型参数及检验指标

1)确定输入输出。将当前t时刻的位置特征和t时刻前n-1 个时刻的位置特征作为网络输入,t+1 时刻的位置特征作为网络输出,建立t时刻前的位置与t+1 时刻的位置数据间的映射关系,实现对未来时刻列车位置特征的推算和预测。

设在t时刻的列车位置特征为

式中:a、w、llon、llat、titv分别表示列车在t时刻的5 个特征参数,即加速度、角速度、经度、纬度和时间间隔标识。titv指网络训练时可以取任意时间间隔的数据进行训练,打破了传统模型只能取固定时间间隔数据的限制。

2)数据归一化处理。为降低LSTM 网络的训练难度和减小由于数量级引起的网络预测误差,对GM(1,1)处理后的数据作归一化处理,即

式中:max、min 为 GM(1,1)处理后数据的最大值和最小值;x为 GM(1,1)处理后的数据;X为归一化数据。

用式(14)对预测的列车位置特征进行反归一化处理,得到最终预测结果。

3)确定步长(step)。与一般的神经网络相比,加入了时序step 概念的LSTM 网络处理单位从向量扩充到了张量。step 的大小会对网络误差产生不同程度的影响,它的大小与网络输入多少个时刻的列车位置特征对应,也就是输入n个时刻的列车位置特征,就对应的步长step 为n。

4)隐含层层数确定。LSTM 网络隐含层层数的多少,会影响训练速度,因此层数的确定显得至关重要。本文采用(n为输入层数,m为输出层数,a1∈[1,10])计算隐含层层数。隐含层层数不同,网络训练误差也不同,对比选择训练误差较小的隐含层层数[17]。

5)LSTM 网络激活函数的选取。激活函数的作用是通过给神经网络模型增加一些非线性因素,使其能够更好地解决较复杂的非线性问题[18]。LSTM常用的激活函数有3 种:Sigmoid、tan h 和ReLU。由于Sigmoid 函数具有软饱和性,会导致梯度消失的现象,使得网络训练无法收敛;tan h 较Sigmoid收敛得更快些,但并未解决Sigmoid 存在的软饱和性问题;ReLU 函数在x>0 时可以保持梯度不衰减,解决了Sigmoid 和tanh 因软饱和性产生的梯度消失问题。因此本文选取ReLU 作为LSTM 网络的激活函数。

6)LSTM 网络训练优化方法。为加快训练速度,本文采用自适应性矩估计(adaptive moment estimation,ADAM)优化方法,来更新网络参数,算法步骤如下[12]:

①梯度矩估计计算为:

式中:g t为t时刻的梯度;衰减率μ=0. 9;ν=0. 999。②无偏估计校正为:

③梯度更新为

式中η为学习率。

7)检验指标

①均方误差(mean-square error, MSE)为

式中:observedt为观测值;predictedt为预测值。

②最大误差(Maxerr)

③平均绝对误差(MAD)

4.2 仿真验证

列车从 34°22' 39''N、108°56' 01''E 出发,非匀速运行(初始速度为零),列车最高时速163 km/h,平均速度100 km/h,列车实际运行11.66 km,共运行420 s。相关参数设置:加速度计偏置误差10-4g随机游走;陀螺仪常值漂移0.1(°)/ h,随机游走GPS 的水平位置误差均方差为10 m,速度误差均方差为0.2 m/s。仿真时,去除列车运行360 s 后的GPS 数据,模拟GPS 信号失锁,因此将运行过程分为了GPS 信号有效和GPS 信号失锁2 个部分。本文用0~360 s 间的列车位置数据进行网络训练,并利用训练好的网络对 360~420 s 的列车位置进行预测。

本文从不同参数对模型预测性能的影响、以及模型输出对单个特征预测效果 2 个方面进行探讨。

利用GM(1,1)对经度、纬度、加速度、角速度等数据进行处理。以前 30 s 的经度、加速度数据为例,数据处理的结果如图4、图5 所示。

图4 GM(1,1)处理经度

图5 GM(1,1)处理加速度

对处理后的数据进行归一化处理,设定不同的隐含层层数,将当前时刻之前 5 个时刻的列车位置表征数据作为输入,将后一时刻的表征数据作为输出,完成LSTM 网络各项参数的训练。

不同神经元个数下的均方误差不同,图6 是当给定step 为5,隐含层神经元个数为 5~15 时,对应的网络均方误差。由图 6 可知,神经元个数在10~12 范围内时,均方误差都相对较小,尤其为12 时,网络的均方误差达到最小,训练达到最优效果。因此最佳神经元个数为12。

图6 不同LSTM 神经元个数的均方误差

不同step 下的均方误差也不同,图7 为神经元个数为14 时,step 为3~9 对应的网络均方误差图。

图7 不同Step 的均方误差

由图 7 可知,step 过大或者过小都会影响到LSTM 网络的训练效果,从 step 为 3 到 step 为 7均方误差逐渐减小,在 step 为 7 时,均方误差达到最小,之后误差又随之增大,因此最佳的step 应设置为7。

为了验证本文提出模型的可行性,采用GM(1,1)-ADAM 优化 LSTM 网络、GM(1,1)-LSTM网络、LSTM 网络和BP 神经网络分别对数据进行训练,其训练结果对比如图8 所示。

从图 8 中可以看出:GM(1,1)-ADAM 优化LSTM 网络、GM(1,1)-LSTM 网络、LSTM 网络和BP 神经网络均方误差分别在 120、138、154 和176 次时达到精度 1×10-4的要求;LSTM 网络的均方误差小于BP 神经网络;使用GM(1,1)预处理后的 LSTM 比未使用 GM(1,1)预处理的 LSTM 网络均方误差小;GM(1,1)-ADAM 优化LSTM 模型后,收敛速度和精度都比GM(1,1)-LSTM 网络有所提高。

根据上述参数分析,确定合适的网络结构,将7 个时刻的列车数据作为初始输入,通过递归的方法逐步预测列车在360~420 s 时,各个特征的预测结果,并与测试值进行比对运算,即可得到位置误差。但是在列车位置预测中,本文采用的经纬度并不能很好地反映空间上的位置误差,因此按文献[19]中的转化方法将其转化为空间上的误差,转化公式为:

本文为了更直观体现 GM(1,1)-LSTM 网络性能,将其与 GPS 信号失锁时,SINS 单独定位和GM(1,1)-BP 网络处理结果进行对比。图9 为SINS定位、GM(1,1)-LSTM 网络和 GM(1,1)-BP 网络处理结果的空间位置误差对比。由图 9 可得:SINS单独定位时,随着时间累积,误差逐渐增大,而使用神经网络预测的位置误差相对较稳定;GM(1,1)-LSTM 网络的空间位置平均绝对误差比GM(1,1)-BP 网络小38.32 %。

图9 空间位置误差对比

最后,单独分析使用神经网络预测每个特征参数的结果,使之能够更清晰地看出预测位置与实际位置之间的误差,由此将 2 种神经网络单一特征进行预测,结果如表 1 所示。由表 1 可看出:GM(1,1)-LSTM 网络预测结果误差在单个特征值上整体比GM(1,1)-BP 神经网络小,但是2 种网络预测时间间隔的最大值均比较大;在一般情况下,由 GM(1,1)-LSTM 网络处理的各个特征预测误差和精度均可满足列车定位要求。

表1 单个特征参数的预测结果

5 结束语

实时精准地确定列车位置是保证行车安全的重要前提。本文在GPS/SINS 组合列车定位系统基础上,针对GPS 信号失锁下,列车定位精度低的问题,将GM(1,1)与LSTM 网络相结合来满足列车定位的需求。该方案采用GM(1,1)对传感器数据进行粗预测以降低原始数据本身的误差,再使用LSTM 网络进行训练并预测 GPS 失锁下的列车位置,预测结果证明了该算法的有效性。本文通过设定不同的神经元个数、步长,分析了参数的设定对实验预测结果带来的影响;为了更好反映该网络性能,将其与GM(1,1)-BP 神经网络进行对比,可以发现 LSTM 在解决梯度消失问题的同时,利用其自身记忆特点更好地学习了传感器数据间的关系。在最终预测结果上,GM(1,1)-LSTM 网络的空间位置平均绝对误差比 GM(1,1)-BP 神经网络小38.32 %。

猜你喜欢
时刻神经网络误差
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
冬“傲”时刻
北斗导航种萝卜百米误差仅2厘米
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
捕猎时刻
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
精确与误差