高铁中基于改进GM(1,1)马尔可夫模型的频谱预测策略

2021-03-11 02:04:20白天晟陈永刚
关键词:持续时间残差校正

白天晟,陈永刚

(兰州交通大学 自动化与电气工程学院,兰州 730070)

0 引 言

高铁环境中支持专有通信的固定频谱分配政策使得该环境中频谱利用率低。铁路长期演进(long term evolution-railway, LTE-R)系统现已在京沈铁路和宁波城轨中进行试验,并在朔黄铁路中投入运营,其通信频段分别为450 MHz,900 MHz和1.8 GHz。报告表明,在3~6 GHz的授权频段平均使用率不到0.5%,而低于3 GHz的平均使用率最高也只有 35%[1],高铁通信频段资源存在明显浪费。因此,认知无线电的引入显得尤其重要。认知无线电有主用户与次用户之分,高铁中的主用户包括机车综合无线通信设备,如司机语音、视频传输设备、列控、监测系统、手持台等。本文针对LTE-R系统下行链路进行研究,主用户指列控终端,次用户指列车上乘客的各种通信终端。列控终端长期独占专有频段,此法虽可保障列车通信的安全可靠,但同时造成的频谱资源浪费不可避免,无法使更多的通信用户接入该网络。

并且日益丰富的各类高铁无线通信业务,如列车安全监控和视频传输业务,与固定的频谱资源政策共同导致现有频谱资源无法满足无线通信的快速发展。当高铁中紧缺的频谱资源无法适应快速增长的无线通信业务时,认知无线电的引入显得尤其重要。因此,这又成为将认知无线电引入高铁的又一原因。为保证列车安全通信,列控设备作为主用户,拥有使用信道的第一优先权,只要其需要通信,次用户必须马上撤离信道,供主用户通信。认知无线电技术充分利用高铁中的通信频谱,进一步简化高铁的网络环境[2]。

在高速铁路环境中,信号的传输受许多环境因素的影响,如距离、散射、衰减、噪声等。以电气化铁路为主的现代铁路,其无线电噪声严重影响着铁路的无线通信,而无线电噪声主要来自于弓网噪声。高速的列车移动、频繁的越区切换以及车体穿透损耗会导致信道切换和接入时延增加,使次用户无法得到良好的服务质量。比起公众环境中次用户的低速移动和穿透损耗,高铁环境有其特殊性,在该环境下,无线通信的稳定性尤其重要。综上所述,针对高铁中认知无线电的其中一项关键技术——频谱预测,使用拥有人工智能特性的认知无线电对高铁频谱的主用户状态进行预测,其目的是预先得到主用户状态信息,一方面为次用户择优分配信道提供先验知识;另一方面可以有目的性地进行频谱感知。在提高频谱利用率、通信稳定性的同时,减少能量损耗。

1 高铁中的认知无线电

1.1 认知无线电用于高铁的优势

1)高铁中较差的无线通信环境易产生多普勒频移和多径效应等,认知无线电可自适应地调整自身内部的通信机理来适应无线环境的变化[3],有良好的适应能力。

2)高铁环境一般是由多种网络组成的复杂异构网络,而认知无线电可“自由穿梭”于各种网络,捕捉空闲频谱。认知基站更可将捕捉到的空闲频谱择优分配给优先级高的次用户,充分利用频谱资源。欧洲的CORRIDOR(cognitive radio for railway through dynamic and opportunistic spectrum reuse)项目,目的是合并高铁中的异构网络(公网和专网等),有效减少网络的运营维护成本,高效使用频谱资源[4-5]。

图1介绍了将认知无线电用于高铁后形成的高铁无线通信模型。铁路沿线布有公网和专网,本文中的公网用于乘客(次用户)通信,专网用于列控终端(主用户)与列控中心之间的通信。当主用户使用专网通信时,次用户使用公网通信;当主用户不使用专网时,将认知无线电捕捉到的专网空闲频谱用于次用户通信。

1.2 高铁中的LTE-R认知基站

虽然高铁中的全球移动通信(global system for mobile communications-railway, GSM-R)系统作用巨大,改变了传统的通信方式,提高了运输效率和运输安全。但随着高铁的发展,通信业务层出不穷,在GSM-R体现的众多问题中,频谱及容量限制尤为关键[6-7]。而LTE-R可优化GSM-R系统性能,其高速率、低时延、全IP的通信模式备受通信行业的青睐,在高铁通信中引入LTE-R,是时代所需,是大势所趋。

本文将LTE-R基站作为认知主体,形成LTE-R认知基站(简称“认知基站”)[8]。基站之所以具备认知功能,是由于认知设备的存在,基站中的认知设备具有感知周围频谱状态和预测的能力,将预测算法导入认知基站的媒体访问控制层(media access control, MAC),可对频谱状态进行预测。认知基站的提出使得铁路更具人工智能的特性。认知基站作为频谱管理者,探测其覆盖范围内的主用户状态信息,为各次用户择优、合理分配可用信道,避免冲突的发生。由此看来,认知基站可控制信道的有序分配,提高频谱利用效率。

2 预测的算法选择及方法描述

2.1 算法选择

文献[9]中提到,原始序列越平顺,模型的预测精度越高,原始序列越接近指数函数的分布,模型的精确度越高,该算法在地铁开挖沉降中得到了证实。灰色模型(grey model, GM(1,1))也可预测满足正态分布的实数序列,文献[10]提出用GM(1,1)来预测正态分布区间灰数这类复杂问题,进而说明可将GM(1,1)用于满足正态分布的序列预测。对于校正GM(1,1)模型预测值,文献[11]提出通过产生状态转移期望改进马尔可夫算法,进而利用该算法对GM(1,1)模型进行校正。在文献[1]中提到认知无线电的主用户到来时间满足指数分布,主用户到来后的持续时间满足正态分布。因此,本文在原有理论的基础上提出一种改进新陈代谢GM(1,1)马尔可夫模型频谱预测方法。

2.2 方法描述

文献[12]中引入灰色关联度因子,利用各种影响主用户到来的因素,对频谱空洞信息进行预测,减少了次用户接入信道后的切换次数。文献[4]利用贝叶斯算法推算信道的可接入性,并对性能指标进行强化分析,该方案有效降低了次用户接入信道的切换次数。

主用户(列控设备)与列控中心进行通信,首先要向认知基站发出通信请求,为其分配合适的信道,当主用户释放信道后,认知基站将空闲信道分配给次用户使用,在此过程中,认知基站记录了主用户请求通信的到来时间以及持续时间,为实际应用提供数据。在仿真过程中,主用户的到来时间以及持续时间分别满足指数分布和正态分布,计算机随机产生相应的历史数据。本文进行仿真预测的对象为信道中的一个主用户到来时间及其持续时间,通过预测,可在频谱管理中更加快捷、合理地为次用户择优分配信道。将主用户到来时间t历史和持续时间T历史分别作为历史数据进行预测,得到未来主用户到来时间及其持续时间t预测,T预测,其他时间默认为空闲,得到信道的占用/空闲状态模型。

将主用户历史、预测得到的主用户占用和空闲状态组成信道状态示意图,如图2,可用于信道的择优分配,降低用户的切换次数和丢包率。其中,{t}表示主用户到来时间序列;{T}表示主用户到来后持续时间序列。

图2 信道状态示意图Fig.2 Schematic diagram of channel status

3 改进GM(1,1)马尔可夫模型

3.1 改进GM(1,1)马尔可夫概念介绍

GM模型的一般表达方式为GM(n,x),表示用n阶微分方程对x个变量建立模型。GM(1,1)通过把分散在时间轴上的离散数据看作一组连续变化的序列,并对该序列进行累加和累减。累加过程是将无序时间序列变为递增的有序时间序列,一般情况下,经过累加的序列具有指数分布特性;累减则为累加的逆过程。经过将灰色系统中的未知因素弱化,强化已知因素的影响程度,最后构建一个以时间为变量的连续微分方程,通过数学方法确定方程中的参数,从而实现预测目的。

普通的GM(1,1)不主动剔除多余的历史数据,当有新数据不断加进来时,其历史数据会降低频谱预测精度。因此,考虑在GM(1,1)的基础上进行改进,即在新数据输入后,旧的历史数据主动退出预测。相较普通的GM(1,1),新陈代谢GM(1,1)提高了预测的精度,该算法在文献[13-14]中得到了证明。

在对信息传输实时性要求高、用户到来时间随机的高铁环境中,频谱状态预测追求速度快且精准这一目标。新陈代谢GM(1,1)模型研究的是小样本、贫信息、不确定问题[15],而马尔可夫模型主要解决随机性、波动性较大问题[16],符合这一特定要求。

本文在新陈代谢GM(1,1)的基础上,使用二次加权马尔可夫模型对数据进行残差校正,进一步提高频谱预测精度,用于真实的高铁通信环境。

3.2 新陈代谢GM(1,1)模型

1)建立模型表达形式为

x(0)(k)+az(1)(k)=b

(1)

(1)式中:x(0)(k)为主用户到来时间和持续时间的历史序列各元素;z(1)(k)为生成背景值序列中的各元素,表示由x(1)(k)和x(1)(k-1)围成的近似梯形的面积;a为发展系数,其决定了该算法的拟合能力;b为灰色用量,其决定了该算法的预测能力。X(0),z(1)(k)表达形式分别为

X(0)=(x(0)(1),x(0)(2),…,x(0)(n))

(2)

(3)

(3)式中:k=2,3,…,n;x(1)(k)是对历史序列前k个元素的累加值,表示为

(4)

(4)式中,k=1,2,…,n。

累加使无序历史序列变得有序,更加体现了指数增长趋势,有助于发掘无序序列中的有序规律。一般只需通过一次累加便可体现出明显规律,一次累加序列与原始序列对比如图3。

2)对一次累加数据建立(5)式的白化微分方程并求解。

(5)

将(1)式表示为矩阵形式

(6)

用(7)式表示为

Y=BA

(7)

图3 原始数据序列与一次累加数据序列对比图Fig.3 Comparison chart of raw data sequence and one accumulated data sequence

按最小二乘法利用(8)式求得a,b的值,即

A=[a,b]T=[(BTB)-1BTY]

(8)

将a,b代入(5)式,求解微分方程。

3)进行累加的逆过程——累减,即可分别求出主用户到来时间及其持续时间的预测值。X(0)的时间响应式为

(9)

(9)式中,k=1,2,…,n。

4)对模型进行精度校验。常用精度检验方式有3种:关联度检验法、相对误差检验法、后验差检验法[17]。本文选择关联度检验法对模型进行检验。由于关联度检验法的思路清晰、对数据要求低、工作量少且检验结果准确,本文选择该方法对模型进行检验。一般来说,若关联度大于0.6,即视为可用模型。

(10)

由(10)式求得各关联系数,关联度即为各关联系数的平均数,表示为

(11)

若关联度相同,则分别由(12)式、(13)式比较被预测值的绝对误差和相对误差。

(12)

(13)

(12)—(13)式中,k=n+1,n+2,…,n+p。

计算得到相应的相对误差值,精度等级如表1。

表1 精度等级表

由文献[9]可知,预测精度与历史序列的分布和个数有关。因此,本文将主用户到来时间及其持续时间分别用新陈代谢GM(1,1)进行预测并对其进行最佳历史序列个数的讨论。

3.3 二次加权马尔可夫模型

接下来,利用二次加权马尔可夫模型对新陈代谢GM(1,1)产生的较大残差进行校正。

1)求得新陈代谢GM(1,1)预测结果与实际数据对比产生的残差值及其相对残差,形成残差序列S=[S1,S2,…,Sn],并对该序列进行状态区间划分,形成初始状态区间Zi,由[Si,Si+1]表示。其中,i=1,2,…,n-1。

2)根据历史数据预测值的状态转移情况,得到(14)式所示的各阶(步长)状态转移矩阵T,进行未来状态预测。

(14)

(14)式中:t(k)ij表示经过k步从状态i转移到状态j的概率;k表示步长,k=1,2,…,m。

3)为充分考虑到各步长对预测结果的影响,本文选择将各步长的转移概率进行加权处理,通过自相关系数ck为各步长分配相应权重wk[18],分别表示为

(15)

(16)

4)形成新的概率分布矩阵P={pi|i∈Z}。

(17)

5)在新的转移概率中,由于除了概率最大的转移状态外,其他转移状态的概率不全为零,若仅参照现有文献中概率最大转移状态计算预测值,会产生不精确模型,与实际数据产生较大偏差[10]。

因此,本文充分考虑到其他小概率转移状态对预测结果的可能影响,进一步将各转移状态概率作为权值对最终状态进行第2次加权平均计算,得到最终状态区间中值为

(18)

(18)式中,x=1,2,…,n。

6)根据最终状态Zx修改预测值。

经过二次加权的马尔可夫模型即为改进马尔可夫模型,该模型对新陈代谢GM(1,1)产生的预测误差进行校正,可获得较为精确的频谱预测模型——改进GM(1,1)马尔可夫模型。

预测流程如图4。

4 仿真分析

分别随机产生10个满足指数分布的主用户到来时间和满足正态分布的到来后的持续时间,其中①—⑨代表历史数据,⑩代表与1步预测数据对比的实际数据。由于每2个主用户到来时间间隔适中,故将单位定义为“min”;由于高铁场景中列控消息的传输时长较短,故将单位定义为“s”。随机数据产生图及数值如图5。

图5a中每一点对应的数值分别为①29.78, ②35.37,③45.09,④56.28,⑤72.39,⑥119.80,⑦145.96,⑧199.95,⑨203.46,⑩301.41;图5b中每一点对应的数值分别为①37.68, ②39.20,③40.51,④42.42,⑤37.93,⑥42.59,⑦45.54,⑧39.01,⑨40.94,⑩38.69。

以①—⑨,③—⑨,⑤—⑨历史数据为例,分别产生3个主用户到来时间及其持续时间的1步预测结果,如图6。

图4 改进新陈代谢GM(1,1)马尔可夫模型预测流程图Fig.4 Flow chart of improving metabolic GM(1,1)Markov model prediction

3种主用户到来时间和到来持续时间指标分析如表2,表3。

表2 3种主用户到来时间指标分析

表3 3种主用户到来持续时间指标分析

由表2和表3分析可知,以①—⑨,③—⑨,⑤—⑨为历史数据进行预测,计算得到主用户到来及其持续时间的实际历史数据与预测历史数据关联度均为0.6,进而对数据⑩的预测值进行相对误差比较。

图6 1步预测拟合曲线Fig.6 One-step prediction fitting curve

表2中以①—⑨为历史数据进行预测具有最高精度,等级为二级,并且通过指数分布随机产生的大量数据对该方法进行实验,均如上所述,当利用新陈代谢GM(1,1)对主用户到来时间进行预测时,9个历史序列使得预测结果较为精准。

表3中以⑤—⑨为历史数据进行预测具有最高精度,等级为二级,并且通过正态分布随机产生的大量数据对该方法进行实验,均如上所述,当利用新陈代谢GM(1,1)对主用户到来后的持续时间进行预测时,5个历史序列使得预测结果较为精准。

由上述仿真预测结果可知,新陈代谢GM(1,1)对于主用户状态预测为可用模型,但即使是使用最佳序列产生的主用户状态拟合曲线与实际曲线还有较大残差。由此引入二次加权马尔可夫模型对新陈代谢GM(1,1)产生的1步预测残差进行校正。

将主用户到来时间的预测序列残差率[-0.203,0.092]划分为3个状态,Z1=[-0.203,-0.105],Z2=[-0.105,-0.007],Z3=[-0.007,0.092],分别写出实际序列拟合值对应的状态为Z3,Z1,Z1,Z1,Z1,Z3,Z3,Z3,Z1,分别得到k≤3的k步转移矩阵,进而计算出自相关系数分别为c1=0.289,c2=0.579,c3=0.620,进而得到各步长的权重分别为w1=0.194,w2=0.389,w3=0.417,进而得到加权之后的转移矩阵为

将每个数据进行修正,直到第10个数据。由于第9个数据的拟合值残差状态为Z1,则看到第1行的概率值。将转移到各状态的概率值作为权重对残差率进行第2加权平均,得到校正残差率为-0.024,对应状态Z2,因此,修正后的1步预测值为304.25。

将主用户到来后的持续时间的预测序列残差率[-0.062,0.065]划分为3个状态,Z1=[-0.062,-0.020],Z2=[-0.020,0.022],Z3=[0.022,0.065],分别写出实际序列拟合值对应的状态为Z2,Z1,Z3,Z1,Z2,分别得到k≤3的k步转移矩阵,进而计算出自相关系数分别为c1=-0.558,c2=0.141,c3=0.033,进而得到各步长的权重分别为w1=0.762,w2=0.193,w3=0.045,进而得到加权之后的转移矩阵为

将每个数据进行修正,直到第6个(完整序列第10个)数据。由于第5个(完整序列第9个)数据的拟合值残差状态为Z2,则看到第2行的概率值。将转移到各状态的概率值作为权重对残差率进行第2次加权平均,得到校正残差率为0.007 4,因此,修正后的1步预测值为38.95,属于状态Z2。

将本文的改进模型与灰色关联度模型以9个历史序列进行主用户到来时间1步预测的精确度对比,以5个历史序列进行主用户到来后持续时间的1步预测精确度对比,如图7。

根据对比可知,本文的改进模型对主用户到来时间及其持续时间的1步预测精度为0.009和0.006 7,灰色关联度模型的1步预测精度为0.211和0.029。并且就时间序列预测而言,本文的改进模型对原始序列拟合程度较灰色关联度模型更高。

图7 第1步预测拟合曲线对比图Fig.7 First step predicts comparison chart of the fit curve

因此,依据上述结论,利用新陈代谢GM(1,1)对主用户到来及其持续时间进行第2步预测。将1步预测结果加入历史数据,进行第1次新陈代谢预测,得到第2步预测结果如图8。

依据对第1步预测的校正方法,对主用户到来时间及其持续时间的第2步预测进行校正。利用新陈代谢GM(1,1)得到主用户到来时间的第2步预测结果为385.49,校正残差率为-0.015,对应状态Z2,校正结果为391.27。利用新陈代谢GM(1,1)得到主用户到来后持续时间的第2步预测结果为37.01,校正残差率为-0.034,对应状态Z2,校正后的预测结果为38.29。

将第2步预测结果加入历史数据,同时去掉距离被预测数据最远的一个数据,对主用户到来时间进行第2次新陈代谢预测。利用新陈代谢GM(1,1)得到第3步预测结果如图9。

同理,对主用户到来时间及其持续时间的第3步预测进行校正。利用新陈代谢GM(1,1)得到主用户到来时间的第3步预测结果为492.30,校正残差率为0.017,校正之后的预测结果为484.16。利用新陈代谢GM(1,1)得到主用户到来后持续时间的第3步预测结果为37.20,校正残差率为-0.041,校正之后的预测结果为38.74。

图8 第2步预测拟合曲线Fig.8 Second step prediction fitting curve

将校正得到的主用户到来时间及其持续时间的3步预测结果加入信道状态模型,可为次用户择优分配空闲时间较长的信道。

5 结 论

本文主要针对高铁下行链路中认知无线电的其中一项关键技术——频谱预测做了相应研究。本文采用新陈代谢GM(1,1)分别对主用户到来时间及其持续时间进行1步预测,并且经过分别讨论得到最佳的历史序列个数。其中主用户到来时间的最佳个数为9;主用户到来后持续时间的最佳的个数为5。鉴于新陈代谢GM(1,1)的预测精度较低,本文通过改进马尔可夫模型对1步预测结果进行残差校正。仿真结果表明,校正之后的频谱预测精度有所提高。依据上述结论,得到频谱预测模型——改进GM(1,1)马尔可夫模型,并利用该模型对频谱进行后续第2步,第3步预测。将预测得到的主用户到来时间及其持续时间分别作为占用状态填入频谱,其他状态默认为空闲,形成频谱的主用户占用/空闲状态图。利用提出的改进GM(1,1)马尔可夫模型对频谱进行的3步预测,其目的是为保证实时与准确地进行频谱分配做出铺垫,据此指导频谱的择优分配。

图9 第3步预测拟合曲线Fig.9 Third step prediction fitting curve

猜你喜欢
持续时间残差校正
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
劉光第《南旋記》校正
国学(2020年1期)2020-06-29 15:15:30
基于递归残差网络的图像超分辨率重建
自动化学报(2019年6期)2019-07-23 01:18:32
一类具有校正隔离率随机SIQS模型的绝灭性与分布
机内校正
The 15—minute reading challenge
基于SVD的电压跌落持续时间检测新方法
平稳自相关过程的残差累积和控制图
河南科技(2015年8期)2015-03-11 16:23:52
一种基于eNode B的主动式频偏校正算法