未来无线通信与大数据、人工智能

2020-12-01 09:19:34胡圣波朱满琴杨露露罗鸿秋莫金容
关键词:香农编码器信道

胡圣波,朱满琴,杨露露,罗鸿秋,莫金容,杨 凯

(1.贵州师范大学 智能信息处理研究所,贵州 贵阳 550001;2.贵州大学大数据与信息工程学院,贵州 贵阳 550025)

0 引言

如果说4G开启了基于无线宽带通信为主导的移动互联时代,让人们初步感受到了大数据带来的变化,那么5G则将引领社会步入万物互联、人工智能、无人驾驶为主要内容的新天地,大数据的发展也将进入黄金时代。从技术角度看,以4G为主要代表的无线宽带通信主要涉及的关键技术包括OFDM调制、软件无线电、MIMO、智能天线等;而尽管5G即将商用,但5G和基础技术的机遇/挑战仍在探索中,并主要集中在超密集网络、大规模MIMO(多输入多输出)、毫米波技术[1-2]等。

但事实上,随着5G的出现,无线设备的数量预计将达到数千亿[3],数据量、速度、准确性、多样性等动态特性大规模扩展,数据爆炸并不意外。为了高效管理这些海量数据源、提取有价值的东西,将采用现代数据分析技术,即大数据技术。因此,对于未来通信与网络,大数据分析和机器学习将发挥关键的使能作用,大数据分析正在成为无线通信以及高效管理网络的重要组成部分[4-8]。

从创新角度看,“装备一代、研制一代、探索一代”的技术演进路线已成为国防科技坚持的方针,未来无线通信也不例外。事实上,从5G一经提出,B5G及其未来演进就没有停止探索。早在2018年7月,国际电联(ITU)“网络2030”焦点组成立。在其提出的6G概念中,全息媒体与连接、服务、网络体系结构已列出[9];同期,芬兰提出6Gensis以致力于未来无线通信的发展,研究领域跨越可靠、近乎即时、无限制的无线连接,分布式计算和人工智能(6Genesis-Taking the first steps towards 6G);在我国,2018年3月,通过央视对原工信部部长苗圩的采访,我国已开始了6G研究[10]。而最近,由东南大学移动通信国家重点实验室主任、紫金山实验室首席科学家尤肖虎教授领衔,联合东南大学、紫金山实验室、上海科技大学、北京邮电大学、电子科技大学、中国移动研究院、华为技术有限公司等国内优势科研院校及企业,并邀请英国南安普敦大学、曼彻斯特大学、爱丁堡大学、贝尔法斯特女王大学、萨里大学、加拿大滑铁卢大学、澳大利亚悉尼科技大学、瑞典林雪平大学、美国佐治亚理工学院、普林斯顿大学、德国德累斯顿工业大学等国际知名大学的顶尖学者,共同撰写的6G长篇综述“Towards 6G wireless communication networks: Vision, enabling technologies, and new paradigm shifts[11],全面展望了6G无线通信网络的最新进展和未来趋势:与5G相比,6G无线通信网络期望引入新的性能指标与应用场景,6G无线通信网络将依赖于新的使能技术,并将出现“全覆盖、全频谱、全应用、强安全”新的四大范式转换。为了满足全球覆盖的需求,6G 无线通信网络将不仅仅局限于陆地无线通信网络,需要通过卫星、无人机等非陆地网络作为有效补充,构建空天地海一体化网络。全频谱资源将被充分挖掘进一步提升数据传输速率和连接数密度,包括sub-6 GHz、毫米波、太赫兹、光频段。由于超异构网络、多种通信场景、大量天线单元、大带宽、新的服务需求的出现将产生海量数据,6G 将借助人工智能与大数据技术实现一系列智能化应用。网络安全在建设6G 网络之初就要被考虑在内并加强,称为强安全或内生安全。

总结前述工作,可以清晰看到未来无线通信“全覆盖、全频谱、全应用、强安全”的蓝图,看到未来无线通信超异构网络、多种通信场景、大量天线单元、大带宽、新的服务需求将产生海量数据,未来无线通信系统更加复杂、面临的环境更加复杂。但是,本文并不关注未来无线通过如何推进人工智能与大数据技术的应用。相反,更关注人工智能和大数据技术如何推动未来无线通信技术的发展。

数据科学,也被称为数据驱动的研究,是强调从大数据集开始解决具体问题一种的方法。今天,数据科学和大数据技术应用之所以越来越得到重视,是因为它能够更好地理解复杂系统的行为,而这恰恰不是建模或仿真容易做到的。因此,根据Dhar给出的数据科学定义,大数据技术或数据驱动利用海量数据,通过构建统计模型,以更好地理解系统行为并最终提取新的知识,生成综合数据[12],并在很多领域得到应用[13-14]。

而大数据技术或数据驱动在无线通信领域的应用则是一个非常有趣的问题,因为无线通信既要受到自然现象的影响,又要受到人为的影响。一方面,无线通信依赖于电磁传播,这是一种自然现象;另一方面,无线通信取决于由软、硬件组成的网络技术,这是一种人类行为。因此,尽管根据经典香农理论的现代无线通信技术已取得很大发展,但面对无线通信环境不可预测性和无线通信系统的日趋复杂性,这些基于模型驱动的技术和方法却很难再提高整个通信系统的性能。因此,可以预期:采用大数据技术或数据驱动,应用在无线通信领域,则可以另辟蹊径,推进无线通信的发展,这或许是未来无线通信发展的重要思想。

因此,本文将综述性地分析香农理论对现代无线通信的影响,研究数据驱动与未来无线通信的关系,研究AI赋能无线通信技术,以期为未来无线通信的发展提供一些借鉴。

1 香农理论与现代无线通信系统

众所周知,在保证信息传输准确的前提下,尽可能提高传输速率是现代无线通信的基本问题,就是如何提高通信系统信息传输的有效性和可靠性。70多年过去,解决这一基本问题的理论基础集中体现在香农1948年发表的不朽论文“通信中的数学问题”中[15]。因此,有必要再重温这篇经典论文中的香农信源、信道编码定理。

香农第一定理又称为无失真信源编码定理或变长码信源编码定理,其意义在于将原始信源符号转化为新的符号,使符号尽量服从等概分布,从而每个码符号所携带的信息量达到最大,进而可以用尽量少的符号传输信源信息。现今各种压缩编码遵循的就是这个定理,体现的就是信息传输的有效性。

定理2(香农第二定理) 对于任意容量为C的信道,给定希望传输误差概率ε。当信道传输速率R

(1)

式中,B是信道带宽,S是信号功率,N是噪声功率。

香农第二定理亦称有噪信道编码定理,式(1)称为香农公式,体现的是信息传输的可靠性。香农第二定理和香农公式给出了信道信息传送速率的上限(每秒比特)和信道信噪比及带宽的关系。香农公式给出了信道容量的极限,也就是说,实际无线制式中单信道容量不可能超过该极限,只能尽量接近该极限。4G、5G中,在卷积编码条件下,实际信道容量离香农极限还差3dB;在Turbo编码的条件下,接近了香农极限。同时,LTE中多天线技术(MIMO)也没有突破香农公式,而是相当于多个单信道的组合。

现代无线通信技术很好地体现了香农的思想,这从图1所示的现代无线通信系统组成结构就可以清楚看到。

图1 现代无线通信系统架构Fig.1 Architecture of a modern wireless communication system

从图1可见,通信系统受到各种各样的损害。例如,硬件引入互调和放大器失真、正交不平衡、本振和时钟谐波泄漏以及量化损耗。信道会引入衰落、多径、干扰、传播损耗和反射。针对这些问题,采用算法和硬件优化设计曾有效改善了通信系统性能。但是,未来通信系统所需的自由度继续增加,如无线电和调制参数的数量,如天线、信道、频带、波束、码和带宽等。这些因素使得未来无线通信系统会越来越复杂,面临包括深空、深海等在内的信道环境更难预测,如再依赖简单、近似的闭式信道模型,采用每个模块独立再优化、再集成的方法,则将很难满足未来对无线通信系统的需要,也很难再改进无线通信系统性能。应该看到,现代无线通信系统优化设计根本上是借助模型驱动思想,要求通信系统工作原理准确、清楚,而香农定理指出的只是信源、信道编码存在性,并未给出具体的编码方法。因此,现在无线通信系统的优化设计只能是不断逼近极限,只能是不断优化、不断集成。然而,面对无线通信环境不可预测性和无线通信系统的日趋复杂性,而模型驱动的思想并不能 容纳系统无限的复杂性和环境的不可预测性。因此,另辟蹊径或许是未来无线通信发展需要考虑的。

2 数据驱动与端到端无线通信系统

2.1 数据驱动端到端无线通信系统模型

正如前述,借助模型驱动思想的现代无线通信系统优化设计方法已无法满足未来无线通信环境不可预测、系统日趋复杂的要求。相反,基于学习的数据驱动方法则可提供一种新的路径。近年来,深度学习被应用于改进传统的块结构通信系统,包括多输入和多输出(MIMO)检测[16-17]、信道解码[18-20]和信道估计[21-22]。此外,基于深度学习的方法在联合信道估计和检测[23]、联合信道编码和信源编码[24]等方面也显示出独特的优势和潜力。

数据驱动是一种新的思维方式,由机器学习实现,能够更好地理解复杂系统的行为并最终提取新的知识。近年来,作为机器学习的一种方式,深度学习为未来无线通信系统提供了一种新的范式。作为一种纯数据驱动的方法,通过优化端到端的损失函数,深度学习模型的特征和参数可以直接从数据中学习。受此启发,基于学习的端到端通信系统已受到关注[25-29]。这些工作中,发射机和接收机都由深度神经网络(DNN)表示,并可以分别解释为自动编码器和自动解码器,从而将“通信的基本问题”[15]转化为一个端到端的机器学习优化问题,如图2所示。

图2 基于深度学习的端到端通信模型Fig.2 End-to-end communication model based on deep learning

图3 物理层学习模型Fig.3 Physical layer learing model

2.2 数据驱动端到端无线通信系统的例子

数据驱动是一种新的思维方式,为端到端的无线通信系统的设计优化提供新的路径。下面给出2个例子,以进一步说明数据驱动对未来端到端无线通信系统的影响。

1)物理层调制解调

信道自动编码器提供的端到端优化可以支持全新的物理层设计类。前述图3给出训练学习物理层的简单实例,同样的思路也适用于更复杂的环境。高功率放大器如何最大化信噪比和功率效率,要求必须采用低阶或恒模处理由放大器引起的非线性失真。美国宇航局(NASA)的跟踪和数据中继卫星(TDRS)系统中,采用行波管放大器(TWTA)完成天基中继通信就是这样的例子。

为此,NASA在其TDRS天基通信系统中采用了信道自动编码器。根据图2所示的端到端通信模型高级模型,NASA采用如图4所示结构,设计了一个深神经网络(DNN)信道自动编码器[31]。图4中,“信道模型”包含通信系统建模中经典幅度和相位噪声,以及由行波管引起的非线性失真。“编码器”和“解码器”网络映射到图2中的相同网络,学习物理层调制解调器(即调制器-解调器对)。图4中,信道自动编码器为TDRS天基通信系统训练、提供了一个优化的新物理层,优化的新物理层兼顾了信道和硬件的不利影响。

图4 NASA天基中继星系统信道自动编码器结构Fig.4 Channel automatic encoder structure of NASA space-based relay satellite system

图5给出学习如何通过TDRS物理层进行通信。图5中,左边是学习的发射星座,中间是接收星座,右边是全局重建损失函数。值得注意的是,编码器网络通过学习新的发射波形,优化了放大器引起的非线性压缩,并在接收机端分离了32符号类QAM星座。而采用传统通信设计方法,即各模块分离独立优化设计的方法,却很难解决由于行波管非线性造成的TDRS天基通信系统性能下降的问题。相反,信道自动编码器能够学习适合信道又优于已知星座信号的表示。而使用NVIDIA Titan V级GPU时,如图4所示的信道自动编码器训练时间为分钟量级,可快速迭代。可见,这种快速学习新调制解调器的能力,可对极复杂信道进行优化,从而使全新的物理层类成为可能。

图5 NASA天基中继星系统信道自动编码器训练结果Fig.5 Training results of channel automatic encoder of NASA space-based relay satellite system

值得注意的是,编码器网络通过学习新的发射波形,优化了放大器引起的非线性压缩,并在接收机端分离了32符号类QAM星座。而采用传统通信设计方法,即各模块分离独立优化设计的方法,却很难解决由于行波管非线性造成的TDRS天基通信系统性能下降。相反,信道自动编码器能够学习既非常适合信道又优于已知星座信号的表示。而使用NVIDIA Titan V级GPU时,如图4所示的信道自动编码器训练时间为分钟量级,可快速迭代。可见,这种快速学习新调制解调器的能力,可对极复杂信道进行优化,从而使全新的物理层类成为可能。

2)未知信道无线通信

在前述基于DNN的端到端通信系统中,将面临几个严峻挑战:第一、DNN中的加权系数需要采用随机梯度下降法更新,误差梯度将从输出层后向传输到输入层。一旦信道传递函数h(x)不能提供,梯度后向传播将受到阻止,端到端的学习将不能进行。尽管可以假设信道传递函数,但加权系数会引起较大误差,影响学习效果。而对于实际通信系统的不确定性,很难得到信道传递函数。第二、当传输符号序列较长时训练的维数太难。通信中的代码块大小系统需要足够长的时间来保证足够的编码增益。但是,作为可能的码字随着代码块的大小呈指数级增长,训练时间也会相应显著增加。所以,未知信道基于学习的端到端无线通信十分必要。

作为一个生成框架,生成对抗网络(GAN)中生成器和鉴别器在训练阶段相互竞争。通过鉴别器的反馈,生成器提高了生成与真实样本之间相似能力[32]。而为了生成特定样本,可采用条件GAN方法。条件GAN中,背景信息被添加到生成器和鉴别器。添加的条件是标签信息,以便生成器生成特定类别的样本数据。目前,条件GAN得到了广泛的应用用于更改输入的样式和内容[33-34]。

GAN[32]是一类新的生成式分布学习方法,其目标是学习一种可生成接近目标分布pdata样本模型。系统中,使用一个GAN来模拟信道输出分布,然后在训练发射机时学习模型替代真实信道,从而使梯度可以传送到发射机,如图6所示[33]。

图6 信道GAN的架构Fig.6 Architecture of channel GAN

图6中,生成器G和鉴别器D之间的GAN中引入极小化极大博弈算法,G和D都用DNN实现。鉴别器D学习生成数据和实际数据之间差别。

训练时,生成器首先将具有先验分布pz(z)的输入噪声z映射成一个样本。然后采集实际数据样本和G生成样本,并区分这两类样本。如果鉴别器可以成功区分这两种样本,则可用来生成反馈给G,这样生成器就可以生成更接近真实的样本。

如果生成器G和鉴别器D参数集分别表示为G和D,则优化的目标函数可表示为:

(2)

式中,当输入属于真实数据集时,鉴别器D目标值高;反之,当输入为G产生的样本集时,鉴别器D目标值低。而在给定生成样本GG(Z)时,生成器G的目标是使鉴别器D输出最大化。

如果G和D都给定一些附加信息m,那么GAN可扩展为条件模型,如图6所示。仅需要提供附加的条件信息m,作为生成器和鉴别器输入即可。所以,G的输出变为G(X|m),D的输出则变为D(Z|m),而极小化极大目标变为:

EZ~pz(Z)[log(1-DD(GG(Z|m)))]

(3)

在端到端通信系统中,给定编码信号和接收导频数据的条件信息,可使用条件GAN用于信道输出分布的建模。

根据以上思想,当选择卷积神经网络(CNN)作为DNN时,[33]给出了在瑞利衰落信道、频率选择性衰落信道下误码率性能,提出的端到端的通信误码性能最好。

3 AI赋能无线通信技术

为面对未来无线通信系统和环境日趋复杂的挑战,要求具有无线电可配置的超灵活网络,而人工智能和机器学习将与无线电感知和定位配合使用,以学习静态和动态无线电环境。学习无线电环境可用于预测高频端的链路损耗,在密集城市网络中主动判决最佳基站切换,确定基站和用户的最佳无线资源分配。未来无线网络必须能够与地面、卫星和机载网络无缝连接。无疑,为适应给定的无线电环境,人工智能将是未来设计最佳的空中接口重要手段。下面给出两个人工智能赋能的无线通信技术的例子。

1)智能反射表面技术

近年来,智能反射面(IRS)因其能够通过控制无线传播环境获得高的频谱/能量效率,而被认为是一种很有前途的技术[34-35]。具体来说,IRS是由大量复合材料单元组成的均匀平面阵列,每一个单元都可以调节入射电磁波的反射系数(即相位或振幅),并无源反射。因此,采用预编程控制器智能调节反射系数,IRS可以改变入射电磁波衰减和散射,以便电磁波可选择希望路径到达目标接收机,这就是可编程和可控的无线环境。由此,可联合通过考虑无线收发机信号处理和电磁波传播优化设计无线通信系统。

与现有的相关技术相比,即传统反射面[36]、放大转发(AF)中继[37]、有源智能表面[38]、后向散射通信[39-40],智能反射表面技术具有以下优点[41-42]:第一、IRS可以重新配置反射系数,这得益于MEMS和复合材料方面取得的突破[43],而传统的反射面反射系数固定。第二,IRS是一种绿色节能技术,因为其采用无源反射技术,而在放大转发(AF)中和有源智能表面需要有源射频器件。第三、尽管IRS和后向散射通信都是无源通信,但IRS配备大量的反射单元,而由于复杂和成本高,后向散射通信通常仅配备几个天线。此外,IRS只是辅助传输信号,没有传输自己信息传输的意图,而后向散射通信则支持后向散射器件信息传输。

由于IRS的显著优点,IRS在许多无线通信领域受到关注。其中,最值得期待的就是下行链路单用户多输入单输出(MISO)系统[44-46],如图7所示。

图7 基于IRS的MISO系统Fig.7 MISO system based on IRS

图7中,接入点AP配备M天线,为单个天线用户服务,而为增强链路性能,N个无源单元组成的IRS安装在周围的墙上。IRS装配智能控制器,通过周期感知,学习传播环境,动态调整每个反射单元相移。IRS智能控制器可协调切换两种工作模式,即接收模式,用于环境感应(如CSI估计)和反射模式,用于散射AP入射信号[47]。由于路径损耗显著,可忽略IRS 2次或2次以上反射的信号功率。另外,可假设一个准静态平坦衰落信道模型。由于IRS是被动反射装置,可采用TDD协议用于上行链路和下行链路传输,并利用信道互易性在IRS的2个链路方向进行CSI采集。

(4)

式中,s表示0均值、单位方差的独立同分布随机变量,z表示接收端0均值、方差为σ2的高斯白噪声。对应地,接收到的信号功率为:

(5)

0≤θn≤2π,∀n=1,…,N

(6)

2)AI赋能软解调

解调是无线通信系统中实现高速传输、低误码的基本模块之一。理论上,设计传统无线通信系统的最佳解调器考虑的是高斯白噪声信道[49]。此外,常常需要信道状态信息(CSI)和信道噪声分布。以前的研究[50-55],大多数都假设接收机能正确估计衰落信道。然而,实际无线通信信道会受多径衰落的影响,脉冲噪声、杂散或连续干扰,以及其他复杂的损伤,导致解调性能显著下降,究其原因是CSI估计准确性有限[56]。因此,未知或其它复杂信道下,接收端解调器的最佳设计始终是一个挑战。

软解调,即将接收到的符号去映射,恢复成比特对数似然比是现代无线接收机的核心。自然,机器学习与软解调结合是研究的热点,如文献[57]提出一种基于神经网络、可训练通用解调器结构, 称为LLRnet,该解调器结构即提高误码性能,也可显著降低计算复杂。这里给出例子的背景是:当航天器再入大气层时,周围空气就会因与航天器高速摩擦而被电离,造成通信黑障,给航天器带来危险。文献[58]发现,这种时变等离子体会引起的IQ信号幅度衰落和相移,且接收到的信号沿着星座上的曲线旋转。为此,文献[59]通过提取接收信号的主成分,构造一种半监督学习的对称流形网络,利用新衰减曲线迭代更新软判决信息,实现解调和衰落估计的耦合。提出的方法可以获得比传统最大似然法更低的符号差错率,信道估计方法对噪声具有较强的鲁棒性。文献[59]提出的方法描述如下:

如果即将发射的信号序列为X=[x1,…,xm],接收到的信号序列为Y=[y1,…,ym],则Y的似然函数可分解为:

L(X,Y)+DKL[q(X)|p(X|Y)]

(7)

式中,q(X)是X的任意随机分布,DKL表示KL距离。DKL≥0的事实表明L(X,Y)是logp(Y)的下界。当且仅当q(X)=p(X|Y)时,logp(Y)取得最大值。所以,用L(X,Y)代替logp(Y)最大化是有效的。

文献[58]中,由于信道h的时变性,p(Y|X)可表示为:

(8)

对于前述应用背景,接收到的基带信号可表示为[59]:

yi=s(ne)xi+ni

(9)

式中,ni是独立同分布的复高斯白噪声,s(ne)是接收信号星座上的衰落曲线,ne(t)引起接收信号yi时变,包括幅度衰落和相移。yi可理解成沿接收信号星座上衰落曲线集S(ne)={s1,s2,…,sK}呈高斯分布。该衰落曲线是一种高维空间曲线,而主曲线是非线性条件下第一线性分量的推广,即高维曲线可被认为是嵌入在欧几里德空间的一维曲线,可用单变量λ和坐标函数表示为f(λ)=(f1(λ),…,fd(λ))。因此,结合式(8)和(9),p(yi|xi)可看成给定sk下yi的概率,即:

(10)

式中,λfk(yi)是yi在sk上的投影,θ是λfk(yi)λfk的参数。由于λfk(yi)在实际中不可行,故需要采用深度神经网络学习。

通信中,由于p(X)常常是等概率,故L(X,Y)可采用期望最大化(EM)算法优化。其中,θ局部最优可通过反向传播算法可以得到,E步骤用于计算具有先知衰落的软决策信息,而M步骤则估计具有软决策信息的信道。

正如前述,由于接收到的基带信号位于多条曲线上,所以,通过提取衰落曲线主成分,文献[59]设计了一种称为半监督学习的对称流形网络(SMN),如图8所示。图8中,复信号可分解为实部和虚部,即I信号和Q信号。实现时,网络首先学习h的极坐标,然后将其转换为笛卡尔坐标,每条曲线都有一个独立的编码器和变换矩阵Txi,而解码器是相同的。Txi由下式给出:

图8 SMN结构Fig.8 SMN structure

(11)

式中,ρxi和φxi分别时xi的幅度和相位。

4 结论

从香农定理出发,综述性地分析了现代无线通信的体系架构和发展;从未来无线通信超异构网络、多种通信场景、大量天线单元、大带宽、新的服务需求出发,通过给出物理层调制和解调、未知信道端到端无线通信系统例子,分析了数据驱动对未来无线通信的影响,提出了应用大数据技术和人工智能,采用端到端优化设计无线通信系统的新的路径;面对未来无线通信系统和环境日趋复杂的挑战,通过分析智能反射表面技术和AI赋能软解调的两个例子,提出了AI赋能未来无线通信的思路,以满足无线电可配置的超灵活网络的需要。综上所述,未来无线通信会大量采用大数据技术和AI技术,未来无线通信不但要“全覆盖、全频谱、全应用、强安全”,还要“全智能”。

猜你喜欢
香农编码器信道
大卫,不可以
基于FPGA的同步机轴角编码器
校园恩仇录:小混混和易拉罐女王的故事
基于PRBS检测的8B/IOB编码器设计
艾米丽的呼噜
基于导频的OFDM信道估计技术
JESD204B接口协议中的8B10B编码器设计
电子器件(2015年5期)2015-12-29 08:42:24
一种改进的基于DFT-MMSE的信道估计方法
基于香农熵的超细粉体填料混合均匀度的评价研究
中国塑料(2015年9期)2015-10-14 01:12:18
基于MED信道选择和虚拟嵌入块的YASS改进算法