一种新型的基于深度学习的时变信道预测方法

2021-02-01 11:56:10张捷杨丽花王增浩呼博聂倩

电信科学 2021年1期

张捷，杨丽花，王增浩，呼博，聂倩

（南京邮电大学江苏省无线通信重点实验室，江苏南京 210003）

1 引言

近年来无线通信技术发展迅速，与无线信道相关的成果层出不穷[1-2]。随着运行速度超过300 km/h 的高速铁路（high speed railway，HSR）的大规模部署，HSR 环境下的无线通信在全球引起了越来越多的关注[3-5]。在HSR 环境下，列车的高速运行会引起大的多普勒频移，而大的多普勒频移会使得信道发生快速时变，在此场景下高精度地获取信道状态信息（channel state information，CSI）是关键。通过信道估计虽可以获得CSI，但是信道的快速时变以及信道估计的处理时延，使得获取的CSI 已经过时，不能反映当前时刻的信道状况。然而，信道预测可以根据过时的信道状态信息，预测未来发送时刻的信道状况，能够显著提高系统性能。

目前时变信道预测问题已经引起了广泛的关注，传统的时变信道预测方法是使用线性预测模型，通过对当前时刻CSI 和过去时刻CSI 的线性组合，获取未来时刻的CSI。其中，参考文献[6]给出了一种基于二阶自回归（auto regressive，AR）模型的瑞利信道预测方法；参考文献[7]给出了一种基于线性最小均方误差（linear minimum mean square error，LMMSE）的信道预测方法。由于基于AR 模型的预测方法求解AR 系数需要基于已知的信道时域相关性信息，而在非平稳状态下，信道的时域相关特性随时间变化，导致AR 模型中依赖时域相关性的待定系数的计算非常复杂。为此，参考文献[8]与参考文献[9]提出了一种基于一阶泰勒展开的信道预测方法，由于待拟合的多项式的最高阶数为1，故该多项式的拟合问题可等价于线性回归问题，通过多元函数极值的必要条件，将问题转化为求解线性方程组，从而得到一阶泰勒展开模型的系数。与AR 模型相比，该方法以较低的复杂度实现信道预测，更适用于复杂的信道环境。然而这些线性预测方法虽具有较好的预测性能，但是不适用于非线性特性的快速时变信道。因此，实现时变信道预测的另一有效途径是建立非线性预测模型，通过非线性预测来提高信道预测的精度。

典型的非线性预测方法有支持向量机（support vector machine，SVM）方法和深度学习方法，其中参考文献[10]给出了一种HSR 场景下基于SVM 的信道预测方法，该方法通过使用遗传算法（genetic algorithm，GA）优化SVM 模型的惩罚系数和高斯核宽度，可以获得优于传统线性模型的预测性能，但是该方法需要从低维空间映射到高维空间，复杂度较高。深度学习的方法由于可以进一步地提高预测精度和降低复杂度，因此近年来受到了越来越多的重视。其中，参考文献[11]提出了一种基于复值神经网络的信道预测方法，该方法主要利用线性调频Z 变换获取的信道估计训练复值神经网络，从而实现时变信道的预测。与传统的信道预测方法相比，该方法具有更高的预测精度，但是基于复值神经网络的预测方法的计算量比基于实值神经网络要高得多，因此具有较高的计算复杂度。参考文献[12]给出了一种基于回声状态网络的信道预测方法，该方法使用具有自反馈环的双向环形内部结构降低计算复杂度，实现快速信道预测。但是由于该方法权重矩阵初始化过于随机，且不进行权重矩阵的更新，因此具有较低的信道预测精度。参考文献[13]给出了一种基于反向传播（back propagation，BP）神经网络的信道预测方法，该方法利用稀疏样本训练BP 神经网络，并采用了早期停止策略防止过拟合，因此该方法具有较高的预测性能。但是，该方法采用随机初始化方式训练网络，没有考虑初始参数对预测性能的影响，故其预测精度有待进一步提高。

为了解决以上问题，本文提出了一种适用于高速移动场景的基于深度学习的时变信道预测方法，该方法基于BP 神经网络进行线下训练与线上预测。在线下训练阶段，为了降低BP 神经网络随机初始化引起的性能损失，本文方法设计了一个预训练方法来获取期望的网络初始值，然后基于该初始值对BP 网络进行再次训练。在线上预测阶段，本文方法充分利用多输入多输出BP 神经网络，基于训练网络，实现未来单个以及多个时刻信道的预测。仿真结果表明，本文方法既具有较高的预测精度，又具有较低的计算复杂度。

2 系统模型

考虑一个单输入单输出（SISO）的高速移动正交频分复用（orthogonal frequency division multiplexing，OFDM）系统（即SISO-OFDM 系统），假设Sm为频域第m个发送的OFDM 符号，且Sm=[S(m,0),S(m,1), …,S(m,N−1)]T，其中，S(m,k)表示第m个OFDM 符号第k个子载波上的发送信号，N是OFDM 符号长度。对Sm进行N点IFFT 得到时域发送信号为：

在HSR 通信环境中，由于基站均沿铁轨附近建立，所以将存在一个很强的直射（line of sight，LOS）分量，因此在HSR 环境中通常采用莱斯信道作为信道模型[14-16]，即：

其中，α0(m,n)为信道的 LOS 径分量，αl(m,n),l=1, …,L−1为散射分量径，其服从瑞利分布，L为多径莱斯信道的径数，τl是第l径的归一化时延，莱斯因子定义为

假设循环前缀的长度大于无线传输信道的最大时延，且接收端考虑理想定时同步，则第m个OFDM 符号第n个采样点的接收信号为：

其中，z(m,n) 是均值为0、方差为的加性高斯白噪声（AWGN）。由于在此考虑的每个OFDM符号的信道预测方法是一样的，因此，下面的论述中将省略符号的序号标识m。

3 新型的基于深度学习的信道预测方法

本文方法主要分为预训练、训练与线上预测3 个部分。由于BP 神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络，具有非线性映射能力强、网络结构简单的特点[17]，因此本文方法采用了BP 神经网络来进行时变信道预测。下面将对BP 神经网络及本文方法进行详细的介绍。

3.1 BP 神经网络

一个多输入多输出的三层BP 网络如图1 所示，其包括一个输入层、一个隐藏层和一个输出层。假设该BP 神经网络的输入层有D个神经元，隐藏层有Q个神经元，输出层有P个神经元。在此，定义该网络的训练样本集合为：

其中，U表示训练样本的个数，是第u个输入样本向量，是第u个输入样本向量中的第d个元素，即第d个输入神经元上的值。表示第u个输出样本向量，是第u个输出样本向量中的第p个元素，即第p个输出神经元上的值。

由于神经网络中任何节点的输入值是前一层的神经元的输出乘以权重再加上阈值，然后由激活函数激活得到该节点的输出值[18]，因此，对于任意训练样本而言，第q个隐藏神经元的输出为：

其中，g1(⋅)为隐藏层激活函数，在此选择Sigmoid函数，即：

为第q个隐藏神经元的输入：

图1 三层BP 神经网络示意图

其中，dx表示第d个输入神经元，Wd,q表示第q个隐藏神经元与第d个输入神经元之间的权重，qξ为第q个隐藏神经元的阈值。

在BP 网络的输出层，第p个输出神经元的输出为：

其中，g2()⋅为输出层激活函数，在此选择ReLU 函数，即：

是第p个输出神经元的输入：

其中，Vq,p为第q个隐藏层神经元和第p个输出层神经元之间的权重，pθ为第p个输出神经元的阈值。

本文将BP 网络输出与理想信道值h(n) 的均方误差（MSE）作为损失函数，采用梯度下降法更新权值与阈值矩阵，通过样本训练网络，以使误差满足设定精度。

3.2 基于BP 神经网络的信道预测方法

由于复值神经网络的复杂度远高于实值神经网络，因此本文将采用实值神经网络，即将复数样本数据的实部与虚部进行分离，并进行样本重塑以提高网络预测的效率。本文方法主要分成预训练、训练和线上预测3 个阶段，通过线下的预训练与训练处理获取真实的信道预测模型，再利用线上预测实时获取信道预测值。

（1）预训练阶段

为了降低BP 神经网络随机初始化引起的性能损失，本文方法中引入了预训练处理以获取较优的网络权值与阈值。假设预训练阶段的训练样本集为Cp，即：

其中，U表示预训练样本数，表示预训练阶段第u个输入输出样本集，其中，为输入样本，其表示估计信道参数hˆ(n) 中第u个采样时刻和接下来的(D−1) 个采样时刻的信道状态信息；为输出样本，其表示理想信道参数h(n)中第(u+D)个采样时刻以及之后的(P− 1)个采样时刻的信道状态信息，即：

在预训练阶段，基于随机初始化的网络参数，本文方法利用训练样本集Cp对BP 网络进行训练，得到具有权值参数为Wpre、Vpre和阈值参数为ξpre、θpre的神经网络。参考文献[13]中也是基于BP 网络实现信道预测，然而参考文献[13]只有一次训练迭代过程，且在训练过程中随机初始化网络参数，而本文方法中的预训练方法使用了基于数据与导频均已知情况下获取的较理想的信道估计值进行网络训练，因此通过该方法获得的BP 网络参数可以作为训练阶段网络的初始参数，以避免网络参数随机初始化，使网络收敛的更快。

（2）训练阶段

本文方法中训练阶段是在预训练得到的BP网络的基础上继续训练网络。假设训练阶段的训练样本集为CT，即：

其中，U表示训练样本数，表示训练阶段第u个输入输出样本集，构造为：

在训练阶段，采用预训练阶段获得的权值参数Wpre、Vpre和阈值参数ξpre、θpre作为本阶段BP网络的初始参数，利用训练样本集CT训练该网络，获得最终的具有权值参数为Wtrain、Vtrain和阈值参数为ξtrain、θtrain的信道预测网络模型。与预训练阶段不同的是，训练阶段的样本是仅利用导频和线性内插得到的信道参数，因为这种情况更符合真实的系统；而预训练阶段是在数据和导频均已知的情况下获得的信道估计参数，用准确性更高的数据进行预训练，并作为训练网络的初始参数，避免了网络随机初始化带来的影响，同时也提高了预测的准确性。

（3）线上预测阶段

本文方法中预测阶段是利用训练阶段获得的信道预测网络模型，进行线上的信道预测的过程。在此，只需要给该网络输入前D个时刻的信道参数估计值xE，即可获得之后P个时刻的信道预测值yE。其中：

最终得到的信道预测值为：

其中，Γ−1()⋅为Γ()⋅ 的反操作，即将实数转化为复数的操作。

4 仿真与分析

4.1 仿真

为验证本文方法的性能，本节将对该方法进行仿真与分析。考虑一个OFDM 系统，其中FFT/IFFT 长度为128，循环前缀长度为16，采用梳状导频结构，导频数目为32，且均匀分布。假设列车移动速度为500 km/h，信道采用多径莱斯信道，莱斯因子为5。载波频率考虑3.5 GHz，子载波间隔为15 kHz。样本的采样间隔Ts=0.72 ×10−4s 。网络的输入神经元数目D= 20，隐藏层神经元数目Q= 5。网络的学习速率η=0.001，训练的目标误差εgoal= 1 ×10−4，最大迭代次数设置为1 000。仿真中，考虑的训练样本数U=5 000。为了比较本文方法的性能，仿真中还给出了参考文献[6]、参考文献[12]和参考文献[13]中方法的性能，其中参考文献[6]为基于AR模型的线性预测方法，参考文献[12]为基于回声状态网络的信道预测方法以及参考文献[13]为传统的基于BP神经网络的信道预测方法。

不同训练样本数下本文方法与参考文献[13]所需训练时间的对比见表1。从表1 中可以看出，随着样本数的增加，两种预测方法训练网络所需时间都会增加，且在同一样本数量下，本文方法训练网络所需时间始终比参考文献[13]要少，这是因为本文方法加入了预训练处理，并将预训练获得的网络参数作为BP 网络训练的初始参数，促使训练阶段快速收敛。

表1 本文方法与参考文献[13]训练不同数量样本所需时间（单位：s）

不同信噪比下各种信道预测方法的MSE 性能曲线如图2 所示。从图2 中可以看出，随着信噪比的增大，各种预测方法的预测性能将得到改善，且与传统的信道预测方法相比，参考文献[13]方法和本文方法可以取得更好的预测性能，更加接近理想值。然而，由于本文方法加入了预训练处理，其为训练阶段提供了较为理想的网络初始参数，避免了参数的随机初始化，因此本文方法较参考文献[13]方法具有更好的性能。

图2 各种信道预测方法的MSE 性能

在不同多普勒频移下各种预测方法的MSE性能曲线如图3 所示。从图3 中可以看出，随着多普勒频移的增大，各种方法的MSE 性能均会变差，但本文方法的MSE 性能始终要优于其他文献的方法，这是因为本文方法增加了预训练阶段，充分利用了信道状态信息，使用了基于数据与导频均已知情况下获取的较理想的信道估计值进行网络训练，对时变信道进行了二次训练，增强了预测网络的准确性和鲁棒性，与参考文献[13]相比，能更好地适应时变信道状态特征，因此，本文方法能更好地适应多普勒频移的变化，具有更强的适用性。

在不同信噪比下本文方法与参考文献[13]实现多时刻预测的MSE 性能曲线如图4 所示。从图4中可以看出，无论是单时刻预测还是多时刻预测，随着信噪比的增加，本文方法与参考文献[13]方法的MSE 性能均会变好，且当信噪比增加到一定程度，本文方法的预测性能趋于稳定，利用本文方法进行信道预测的MSE 性能曲线在误差可允许的范围内略微浮动，但总体保持在稳定水平。但是，随着预测时刻数的增加，两种方法的MSE 性能均会变差，这是因为随着时间间隔的增大，信道的相关性逐渐减弱[19]，因而多时刻预测的MSE 性能将随着预测时刻数的增加而变差。然而，本文方法的性能始终要优于参考文献[13]方法，这也说明与现有方法相比，本文方法可以更好地实现信道的多时刻预测功能。

在不同信噪比下本文方法与参考文献[13]方法基于不同隐藏层结构实现信道预测的MSE 性能曲线如图5 所示。从图5 中可以看出，无论基于何种隐藏层结构，随着信噪比的增加，本文方法与参考文献[13]方法的MSE 性能均会变好。但是，增加隐藏层的层数对信道预测性能的改善效果不及增加隐藏层神经元数，因此，可通过适当增加隐藏层神经元数改善预测性能。然而，在相同隐藏层结构下，本文方法的MSE 性能始终要优于参考文献[13]的方法，这说明本文方法对实现信道预测具有优越性。

图3 不同多普勒频移下各种信道预测方法的MSE 性能

图5 不同隐层结构下本文方法与参考文献[13]方法的MSE 性能

4.2 复杂度分析

本节将主要对第4.1 节中仿真的几种信道预测方法的计算复杂度进行分析。参考文献[6]中传统的基于AR 模型的预测方法的计算复杂度是O(NAR)，其中，NAR表示AR 的迭代次数。由于基于深度学习的信道预测方法线下训练完网络后，网络模型就确定了，网络参数不再改变，为此基于深度学习的信道预测方法只考虑线上实时预测的计算复杂度。因此，参考文献[12]的计算复杂度是O(max(M,Nnz,N))，其中，M表示输入变量数，Nnz表示中间层权重矩阵的非零元素的个数，N表示中间层的变量数；本文方法和参考文献[13]方法线上预测阶段的计算复杂度均是O(max(D×Q,Q×P))，其中，D、P、Q分别是神经网络的输入层、隐藏层和输出层的神经元数目。参考文献[13]的线下训练阶段的计算复杂度是其中，表示网络训练过程中的迭代次数。本文方法在线下预训练阶段和训练阶段的计算复杂度均为这是因为本文方法在预训练阶段与训练阶段共经历两次训练迭代过程，参考文献[13]方法线下只经历一次训练迭代过程，因此线下过程本文方法复杂度较参考文献[13]有所增加。但两种方法在线上实时预测阶段的复杂度是相当的，因此，在只考虑线上阶段复杂度的情况下，本文方法较参考文献[13]方法在性能方面提升了，而复杂度却没有增加。

根据上述分析，不同信道预测方法复杂度的比较见表2。从表2 中可以看出：参考文献[6]方法的计算复杂度最低，但是其预测性能最差；参考文献[12]方法计算复杂度次之，参考文献[13]方法与本文方法的计算复杂度最高，但本文方法与参考文献[13]的预测性能远远优于参考文献[6]与参考文献[12]。虽然本文方法的计算复杂度与参考文献[13]的相同，但是本文方法具有更优的预测性能。另外，由于本文方法考虑的神经元的数目非常少（例如，D=10，Q=5，P=1），因此本文方法的计算复杂度在实际运用中也是可以接受的。

表2 不同信道预测方法的复杂度比较

5 结束语

针对高速移动场景，本文提出了一种适用于OFDM 系统的基于深度学习的时变信道预测方法。本文方法在BP 神经网络的基础上，通过预训练、训练和线上预测处理，实现了时变信道的高精度预测。另外，本文方法通过改变输出神经元的个数重新训练网络，可以实现时变信道的多时刻预测，这不仅提高了信道预测的精度，降低了计算的复杂度，同时还提高了系统的预测效率，有效地节约了系统资源，是一种具有高有效性和可靠性的时变信道预测方法。