基于深度学习的传感云sink节点最优能效SWIPT波束成形设计

2021-08-16 10:46王哲李陶深葛丽娜张桂芬吴敏

通信学报 2021年7期

王哲，李陶深，葛丽娜，张桂芬，吴敏,5

（1.广西民族大学人工智能学院，广西南宁 530006；2.广西混杂计算与集成电路设计分析重点实验室，广西南宁 530006；3.广西民族大学网络通信工程重点实验室，广西南宁 530006；4.广西大学计算机与电子信息学院，广西南宁 530004；5.广西电网有限责任公司科技信息部，广西南宁 530023）

1 引言

无线传感网络（WSN,wireless sensor network）在万物互联中扮演着重要的角色。然而，传统的WSN 通常受制于能量、计算、通信和规模等资源有限的约束，无法为大型应用提供及时高效的服务。传感云（sensor cloud）系统突破了这一限制，利用云端在线或离线的高性能计算与实时数据处理能力，拓展了WSN 的应用规模和服务范围，推动万物互联的进步[1-3]。

对底层WSN 进行高效的资源规划是实现传感云系统应用的首要任务[3]。为了提升WSN 中能量规划的自由度以延长网络生命周期，无线功率传输（WPT,wireless power transfer）技术被引入以实现能量冗余节点与能量匮乏节点间的能量均衡。截至目前，WPT 在WSN 中的应用形式主要有无线供电通信（WPC,wireless powered communication）和无线携能通信（SWIPT,simultaneous wireless information and power transfer），前者将WPT 与无线信息传输（WIT,wireless information transmit）规划在不同的时段中运行，后者则实现了同步传输。WPT 所伴随的非线性能量收集过程增加了WSN 资源规划的难度，传统的网络资源管理方法无法适用。文献[4]基于列转换方法，将目标函数的比例和形式转化为等价的减法形式，能够设计出有效的迭代最优资源分配算法。在每次迭代中，通过半定松弛方法求解其中具有秩约束的最优解。文献[5]给出了下行链路多用户SWIPT 系统的速率−能量区域。将其中参数代入文献[4]中，同时将基于线性模型的系统能量收集最大化为目标的资源分配算法作为对比基准，代入SWIPT 系统中与饱和非线性模型进行对比。结果表明，基准算法由于使一部分能量收集器饱和，另一部分则没有充分利用，因此不能够最大化系统资源利用率，同时为发射节点增加多天线配置能够提供额外的空间自由度，显著增加资源分配方案的系统增益。进一步地，文献[5]采用WPC 的时序规划，设计了非线性能量收集模型下多输入多输出（MIMO,multiple-input and multiple-output）多用户无线认知网络的最优波束成形，以分别实现overlay和underlay 场景下的系统吞吐量最大化。利用半定松弛与S-过程将其联合凹模型转化为等效凸问题，然后利用KKT（Karush-Kuhn-Tucker）条件与拉格朗日方程得到最优解。不同于文献[5]方法，文献[3]则利用最优停止理论，求解基于SWIPT 的WSN 系统中，汇聚（sink）节点何时开始SWIPT 传输以实现系统能效最大化的问题，该问题的求解依赖于对未来较好信道状态信息（CSI,channel state information）的期望和当前能效之间的折中。综上所述，传统的无线网络资源规划通常基于最优化方法，将其构建的问题模型通过适当的数学变换实现问题的解耦合凸形式转换，当涉及能量收集的非线性、模型非凸、整型参数时将导致问题难以求解，或其算法具有较高的复杂度难以实现实时的资源规划，因此，基于优化方法的规划算法难以满足传感云中大规模WSN 和系统实时性的需求。

为了克服这一困难，文献[6]提出使用多层网络以拟合迭代软阈值算法（ISTA,iterative soft-thresholding algorithm），并将其应用于大规模稀疏优化中，其中多层网络模型中的参数通过离线训练的方式进行“学习”得到。文献[7-8]利用这种“学习”的思想，分别用于非负矩阵分解和反向乘法器设计。这些研究验证了“学习”方法能够实现对优化算法的逼近，推动机器学习方法在网络资源规划中的应用。然而，网络资源规划中建立机器学习模型的首要问题是何种优化算法能够被有效学习，以及如何设计可迭代的计算机优化算法生成足量的数据集用于模型的训练和测试。文献[9]从理论的角度论证了全连接深度神经网络（DNN,deep neural network）通过训练以精确拟合最优化算法的可行性，给出了迭代优化算法的广义逼近定理，即当输入输出满足确定的紧密集且存在连续多层映射关系时，包含有限隐藏层单元的DNN 能够实现从参数和初始化输入到最终输出之间的有效逼近。得益于机器学习方法更好的实时特性，文献[9]基于深度强化学习设计了无线网络动态功率分配方法，能够在一定程度上缓解基于模型方法的不精确和CSI 的时延。文献[10]利用DNNk-step 预测，解决了高动态环境下5G MIMO 空时分组编码系统中的决策定向信道估计问题，结果表明基于DNN 的机器学习方法能够很好地学习衰落信道的统计特性，在不需要精确估计多普勒速率的前提下较传统决策定向信道估计算法实现更低的传播误差。文献[11]针对平面布局的设备到设备（D2D,device to device）网络，将CSI 估计替换为网络密度图形式，利用卷积深度神经网络学习实现网络干扰链路的规划。由此可见，机器学习方法在有限替代传统最优化方法的同时，能够实现无线网络资源的动态规划。文献[12]使用深度强化学习实现非正交多址（NOMA,non-orthogonal multiple-access）功率与信道的联合优化分配，设计深度强化学习的最优NOMA 协议，通过在发送端叠加编码和在接收端连续消除干扰实现不同用户在同一信道上的复用。文献[13]提出一种在线学习方法，利用组合的多臂Bandit 算法来跟踪5G 网络中D2D 的模式选择与资源分配策略的组合特性。文献[14]提出了一种基于深度强化学习的分布式动态功率分配方法，每个发射机只收集本地信道状态和服务质量信息，降低计算复杂度的同时实现了近似最优的功率分配。然而，上述研究未能考虑当前融合WPC 的无线网络资源管理问题，如何将机器学习方法应用于WIT 与WPT 的联合优化中仍是有待解决的关键问题。

基于上述分析，本文考虑机器学习方法的特性，构建传感云网络将节点的学习过程卸载至云端进行，进一步降低节点的计算能耗和决策时延。同时基于SWIPT 应用实现多天线sink 节点更高的资源复用率。

本文主要的研究工作如下。

1) 建立下行SWIPT、上行WIT 的底层传感网模型，给出sink 节点能效定义并提出sink 节点的最优能效问题，该问题为NP 难问题；通过数学方法将sink节点能效最优化问题的数学模型转换为高维可求解形式，设计迭代式的 SWIPT-WMMSE（weighted minimum mean squared error）算法以实现最优波束成形向量的求解；理论证明了SWIPTWMMSE 算法的收敛性。

2) 提出DNN 对SWIPT-WMMSE 算法的可逼近性，并依据神经网络实现逼近的误差传递过程，提出迭代式算法在最终输出满足给定误差时的网络规模设计依据，并据此设计DNN 算法以实现对SWIPT-WMMSE 算法的学习，制定基于DNN 算法的sink 节点最优能效策略。

3) 通过仿真实验，首先验证了 SWIPTWMMSE 算法的有效性与性能，并通过DNN 算法与其的对比，验证了DNN 算法的逼近效果及其在降低复杂度和提升实时性方面的优势。仿真结果表明，基于深度学习的网络资源分配方法实现了较好的逼近效果并缩短了系统决策时长，有利于提升系统性能。

2 系统模型

本文采用的传感云系统结构如图1 所示。

图1 传感云系统结构

首先，对底层传感器网络中传感器节点的分布特性进行描述。由于底层节点的分布具有较强的随机性，当前大多研究工作使用泊松分布描述该随机性[15-17]，如文献[15]中考虑底层节点以泊松点过程（PPP,Possion point process）进行聚类，而文献[16-17]则分别使用等边六边形的PPP 和泊松洞过程（PHP,Possion hole process）对底层节点分布特征进行描述。另一方面，由于WPT 过程中节点能量收集的“双近−远”[18]效应，基于SWIPT 的底层网络通常采用规则化且可拓展的单元式结构[19-20]，该单元的范围相对于传统小区范围较小，因此单元内的能量收集节点通常依据中心节点的能力进行主动部署。本文考虑到底层传感器网络中所制定的sink 节点运行策略的可复制性和网络的可扩展性，将底层传感器网络中的传感器分布区域划分为连续的等边六边形蜂窝状结构，并假设每个蜂窝区域内的传感器节点数量相差不大。在每个蜂窝区域的中心位置部署一个sink 节点，用于向其所在小区中的传感器节点提供SWIPT 服务并回收节点的感知数据用于云端应用。此处的sink 节点为具有较强数据收集能力的传感器区域中心节点，且由稳定电源供电，区域内的传感器节点均具有能量收集能力，其全部能量均收集自sink 节点的下行SWIPT 过程。

其次，针对底层网络相对云端而言处于“边缘”位置的情形，虽然当前研究表明边缘计算（EC,edge computing）能够为边缘网络提供更快速的响应能力和更低的时延[21-23]，但这并不能够代替本文系统中的云端，原因主要有2 个方面。其一，本文考虑使用DNN 制定sink 节点的运行决策，即求解最优波束成形矩阵，此时涉及2 个过程：训练出一个误差在可接受范围内并可以代替SWIPT-WMMSE 算法的DNN 模型；使用训练好的DNN 将当前的系统状态（信道状态、能量状态等）作为输入得到最优波束成形输出。第一个过程需要消耗较多的算力，且可以离线进行，无实时性需求，因此这个过程考虑利用云端实现以进一步节省底层网络能耗。第二个过程中，云端训练好的DNN 模型下放至sink 节点，由sink 节点使用该模型进行计算得到波束成形决策，这过程不涉及迭代式的机器计算，因此不占用过多资源，实现了DNN 代替传统最优化算法在sink 节点决策制定中提供更低的资源消耗和更高的计算实时性。其二，对于EC 系统，通常需要设计专用的机器学习方法以适应边缘网络的分布式特性[24]，或需重新设计边缘网络的计算卸载方法以适应机器学习的梯度下降过程等[25]，这将增加底层传感器网络的决策制定复杂度和运算能耗，且无法实现云端应用对底层网络的整体监测和控制。因此，考虑以上2 个方面的因素，本文使用传感云系统，构建基于深度学习的sink 节点最优能效SWIPT 波束成形矩阵设计方法。

传感网的系统周期分为2 个阶段：下行SWIPT与上行WIT。在下行阶段中，sink 节点向本小区内的传感器节点提供SWIPT 服务，传感器节点则以功率分割（PS,power split）[26]的工作方式实现能量与任务信息的同步接收并假设下行阶段的时长对于任务信息的接收是充分的[3]，上行阶段中传感器节点利用下行阶段收集到的能量，将采集到的数据上传至sink 节点。图2 给出了系统的运行时序，其中，第i(i=1,2,…,I)个小区的系统周期表示为Ti，下行阶段的时长因子为ηi。为了进一步提升系统性能，sink 节点配备了多天线以增强SWIPT 效率，同时传感器节点配备单一天线。然后，构建系统能效优化问题并分别设计SWIPT-WMMSE 算法与深度学习算法求解最优波束成形矢量，验证深度学习方法在传感云系统资源规划应用中的有效性与性能。同时，sink节点配备单一天线的场景，可通过将数学模型中信道向量替换为信道系数以实现本文方法的应用。

图2 系统运行时序

2.1 下行阶段

在下行阶段中，由sink 节点向传感器节点提供SWIPT 服务。假设底层传感网中的小区数量为I个，第i（i=1,2,…,I）个小区内sink 节点所配备的天线数量为Mi，发送功率为Pi，传感器节点总数量为Ki，且均基于PS的工作模式实现同步的能量收集与任务信息解码。于是，第k（k=1,2,…,Ki）个传感器节点收集到的能量可表示为

2.2 上行阶段

在上行阶段中，小区内全部传感器节点将感知数据同时发送给sink 节点，sink 节点基于最大比合并（MRC,maximal ratio combining）的线性检测算法[27]实现信号检测。其中，传感器节点发送数据所消耗的能量全部来自下行阶段的能量收集，且在上行阶段中全部用于信息传输。与此同时，假设第k个传感器节点发送的符号是一个均值为零且方差为pik的高斯随机变量sik，且 E[|sik|2]=1，pik为传感器节点的发送功率。于是，上行阶段第i个小区中sink节点的信号与干扰加噪声比（SINR,signal to interference-plus-noise ratio）可表示为

其中，约束条件表示与第i个小区中第k个传感器节点在下行阶段所收集到总能量Eik相关的上行阶段最大能耗约束。

2.3 sink 节点的最优能效问题

在底层的传感网络中，每个sink 节点消耗自身能量为传感器节点提供SWIPT 服务，并在上行阶段收集传感器节点回传的数据作为服务回报。同时，由于传感器节点运行的全部能量来自下行阶段的能量收集，因此依据能量守恒定律，sink 节点用于SWIPT 的能耗等于路径损耗与传感器节点收集能量之和，其中传感器收集能量又全部用于环境感知与数据传输。于是，底层传感网中全体sink节点的能效可定义为其服务回报与所付出的能量之比，即上行吞吐量与下行SWIPT 能耗之比，可表示为

其中，Piηi Ti表示 sink 节点i在下行阶段用于SWIPT 的能耗，Ψi表示sink 节点i下行阶段的固有能耗。

于是，sink 节点的能效优化问题，可视为其下行阶段所消耗能量与上行阶段所实现吞吐量之间的均衡，其目标为求解sink 节点最优的波束成形矩阵Wopt=，以实现传感网中sink节点的能效最大化，其数学表达式为

由于问题式(5)中含有式(3)中所述功率分配问题，因此问题式(5)为非凸的且是NP 难问题[28]。由于在上行阶段不涉及WPT，因此可将上行过程视为存在干扰的多址接入信道（IMAC,interfering multiple-access channel）的功率分配问题，且sink 节点不具有连续干扰消除能力[29]。于是，基于求解干扰多址接入信道（IMAC,interfering multiple-access channel）功率分配问题的WMMSE 算法[29]，设计SWIPT-WMMSE 算法以求解sink 节点的最优能效问题。

3 算法设计

为了实现深度学习在sink节点能效优化问题中的应用，需首先设计基准的最优化算法以建立“学习”对象。由于“学习”过程中必然存在误差，因此基准算法的设计应具有迭代形式，能够迭代评估每次逼近过程中的误差传递及误差上限。本节通过将问题式(5)转化为高维可求解形式，设计迭代的SWIPT-WMMSE 算法，以建立深度学习方法应用过程中的“学习”对象。

3.1 SWIPT-WMMSE 算法

sink 节点的能效优化问题可视为能量收集约束下的上行吞吐量最大化问题，其最优波束成形矩阵Wopt的求解可分为以下2 个步骤：首先求解加权吞吐量最大化问题，得到小区内传感器节点的最优发送功率；然后依据最优发送功率，求解满足约束的sink 节点波束成形向量，得到最优波束成形矩阵Wopt。其中，加权吞吐量最大化问题可基于求解IMAC功率分配问题的WMMSE算法求解[29]。另一方面，文献[5,30]已证明其最优波束成形向量所对应的协方差矩阵满足秩一约束，因此在步骤2的求解中，可令Wi=w iwiH并将约束替换为rank(Wi)=1，通过对Wi的特征向量的分解得到最优波束成形向量wiopt，并由此构建传感云系统的最优能效矩阵Wopt。

根据上述分析，首先基于MMSE-SINR等式[31]，将上述最大化问题转换为高维空间的可求解问题，引入等式MMSEi= 1/(1+SINRi)，其中MMSEi表示sink 节点i的最小均方误差（MMSE,minimum mean squared error）。转换后的形式为

引入变量xik,yik,zik分别表示第i个小区中第k个传感器节点的权重系数、上行阶段波束成形器的发送增益和接收增益。算法 1 给出了SWIPT-WMMSE 算法求解sink 节点最优能效的波束成形矩阵的详细过程。在算法的复杂度方面，由于算法1 的计算复杂度与WMMSE 算法复杂度相关，因此，基于文献[29]中给出的WMMSE 算法复杂度，可以得到算法 1 的计算复杂度为O(K2M+K2M2+K2M3+K3+3K)，其中，K为蜂窝区域内传感器节点数量，M为sink节点天线数量，算法复杂度的表示方法为大O表示法。

算法1SWIPT-WMMSE 算法

3.2 算法收敛性

由于转换后的高维空间可求解问题式(6)含有一个可微的目标函数和一个可分离为变量xik,yik,zik的约束集，因此，问题满足广义最优化理论[32]，即SWIPT-WMMSE 算法可视为对式(6)的块坐标下降法的应用，算法收敛于式(6)的一个稳定点z*。下面证明当且仅当与z*对应的(x*,y*,z*)是式(6)的稳定点时，z*是式(5)的稳定点。定义

其中，第一个等式和最后一个等式来自链式法则，第二个等式来自式(14)。因此，由式(12)可知

即为问题式(5)中z*的稳定条件。

综上所述，SWIPT-WMMSE 算法迭代过程中产生的任意极点 (x*,y*,z*)是式(6)的稳定点，且对应的z*是式(5)的稳定点。反之，如果z*是式(5)的稳定点，则点 (x*,y*,z*)是式(6)的稳定点。

4 基于DNN 的最优能效算法设计

以SWIPT-WMMSE 算法为基准，本节基于DNN 实现对基准算法的逼近，代替SWIPT-WMMSE 算法使系统实现更好的实时性与更低的计算复杂度，从而降低系统能耗。本节首先讨论了基准算法的可逼近性与DNN 规模的设计依据，然后通过训练与测试2 个环节构建DNN 模型。其中，训练环节与测试环节如图3 所示。

图3 DNN 模型的训练与测试环节

4.1 可逼近性与网络规模

基于前文设计的SWIPT-WMMSE 算法，本节研究DNN 实现对其逼近，从而获得相近的系统性能和更快速的决策过程。然而，使用DNN 逼近SWIPT-WMMSE 算法的首要问题是能否逼近及网络规模设计。基于文献[9]中迭代算法的神经网络广义逼近定理，建立引理1，然后给出DNN 逼近SWIPT-WMMSE 算法的网络规模设计依据。

引理1给定如式(17)所示的信道可行集用于生成SWIPT-WMMSE 算法计算过程的信道参数，则由信道参数h和初始量λ0到算法输出λ T之间的映射能够使用一个具有N个隐藏单元且带有激活函数的DNN 进行逼近，如式(18)所示，且对于任意给定的误差ε≥ 0，存在足够大的正数N，使式(19)成立。

式(17)中，Hmin和Hmax分别为信道参数可能取得的最小值和最大值；Zmin>0为人为设置的误差传递界值，以确保全体z的集合为紧集。在引理1中，信道可行集确保其信道参数满足紧集，参数λ0和z均满足确定紧集，即最优化问题式(6)中的最优化参数集合为紧集。由于连续映射的叠加依旧是连续的，因此式(18)成立。参考文献[35]中定理2.1，对于任意的紧集和任意δi>0，存在Ni使式(20)成立。

假设xt的维度为L，将上述L个NET 叠加起来建立一个更大的 DNN，即 DNN=NETN(λ0,z),，即可得到式(19)。

引理 1 表明对于具有迭代形式的SWIPT-WMMSE 算法，DNN 能够基于有限数量的隐藏单元对其进行逼近。依据文献[9]中多层神经网络对于乘法和除法运算的逼近及其误差传递过程，本文利用网络的重复叠加，实现对用于SWIPTWMMSE 算法逼近的DNN 规模设计。

定义DNN 算法第t次逼近的输出及其误差上界分别为，推导DNN 算法近似误差上界与网络规模的关系。针对SWIPTWMMSE 算法中的3 个更新规则，给出其逼近形式与误差上界。

为了方便计算，将算法1 中的更新规则重写为

依据文献[9]中DNN 对于乘法和除法运算的误差传递，参数的逼近误差上界分别为

将全部变量使用二进制展开并假设ε≥ 2−n，即当一次迭代逼近过程中的逼近误差被放大g(D)倍时，从初始值到最后一次迭代的逼近误差上界将大于2−n。本文通过均衡逼近误差上界与所使用的二进制单元位数之间的关系，计算用于逼近的神经元数量与层数。用于逼近所需的二进制单元位数分别为

其中，T为算法的总迭代次数。于是，每一位的实现需要一个二进制单元和一个激活函数ReLU，而由于并行运算机制的存在，所需要的层数为式(30)的1/K2倍，取其大O表示法，得到定理1。

定理1假设SWIPT-WMMSE 算法中，初始化后执行t次迭代过程，存在一个以H为可行集的输入h和初始化参数z0作为输入的神经网络，其输出为DNN(h,z0)，网络层数为

ReLU 单元的数量为

使式(33)成立。

引理1 给出了DNN 逼近SWIPT-WMMSE 算法的可行性，而定理 1 则给出了 DNN 逼近SWIPT-WMMSE 算法的网络规模设计依据。基于上述分析，DNN 的网络结构使用全连接形式，包含一个输入层、多个隐藏层和一个输出层，如图4 所示。该神经网络的输入为一规模为(I,K,Mi)的三维数组，输出为I个 sink 节点的最优波束成形向量wi(i=1,2,…,I)。隐藏层的激活函数使用了ReLU函数，输出层的激活函数设计为

图4 DNN 结构

其中，input 为隐藏层的输出，output 为激活函数的输出。

4.2 数据生成

用于DNN 训练与测试的数据生成过程如下。首先，基于特定均值与方差的Rayleigh 衰落分布生成信道数据，表示由第i个小区内的sink节点与当前小区中第k个传感器节点所形成的信道状态信息；然后，初始化，并启动SWIPT-SWMME 算法，算法的终止条件为达到500 次迭代（T=500）或步骤10)的误差参数ε< 10−3；通过算法输出得到相应的最优波束成形矩阵Wi，取其特征向量wi作为输出，即第i个sink节点的最优波束成形向量。此时，将构建元组(hik,wi)为第一次运算中得到的数据样本。将多个数据样本组成样本集并将其切片为训练集{(hik,wi)}train与测试集{(hik,wi)}test两部分，分别用于DNN 的训练与测试过程。

4.3 训练与测试

使用全部的训练集{(hik,wi)}train实现神经网络权重的优化，其中损失函数为神经网络的输出与基准数据wi之差的模，优化算法使用了标准的梯度下降算法。为了提升训练过程的性能，权重和边长的初始化服从截断正态分布，设置衰减率为0.9，并通过交叉验证设置合适的学习率和批大小[36]。

得到训练完成的DNN 模型后，使用全部的测试集{(hik,wi)}test进行DNN 模型测试，基于训练阶段优化得到的权重与边长，计算得到相应的输出数据，与数据生成阶段的标准输出数据wi进行对比以验证所训练生成的DNN 的准确性，具体结果将在仿真实验环节进一步阐述。

5 仿真实验

5.1 仿真设置

本文所设计的SWIPT-WMMSE 算法与DNN算法均在Python3.7 环境下编程实现，其中，DNN的训练与测试过程基于Tensorflow2.2.0。硬件环境为一台联想Thinkpad X1 carbon yoga 笔记本电脑，含有8 核CPU i7-10510U@1.8 GHz 和16 GB的DDR3 内存，DNN 的训练与测试过程均使用CPU 进行运算，无GPU 参与。基于上述仿真环境，首先验证SWIPT-WMMSE 算法的有效性和性能，并将其作为基准算法与DNN 算法进行对比，验证机器学习在网络资源规划中的可行性与效果。

5.2 参数设置

在蜂窝结构的底层传感器网络中，假设其总的小区数量为I，每个小区中随机均匀散布总量为K的传感器节点。蜂窝小区的边长R设置为100 m，sink 节点位于小区的中央位置。在SWIPT-WMMSE算法中，sink 节点i与其所在小区中传感器节点k之间的信道hik服从Rayleigh 衰落分布，其均值为0，方差为200L/d，其中参数d为传感器节点至sink 节点之间的欧氏距离，L满足其10lg(L)服从均值为0且方差为64 的正态分布[37]。SWIPT-WMMSE 算法输出为sink 节点i的最优波束成形向量wi。

将上述过程分别重复实现25 000 次和5 000 次，继而形成DNN 模型训练集{(hik,wi)}train与测试集{(hik,wi)}test，分别用于DNN 模型的训练与测试。其他参数的设置如表1 所示。

表1 系统参数

5.3 SWIPT-SWMME 算法有效性与性能

设置SWIPT-SWMME 算法的最大迭代次数为500。根据Rayleigh 衰落分布特性生成25 000 个信道数据，将其代入SWIPT-WMMSE算法计算25 000次，每隔500 次采样得到的算法收敛过程如图5 所示。图 5(a)为参数ε= 10−3时的收敛过程，可以看出SWIPT-WMMSE 算法在第150 次至第200 次迭代中达到稳定收敛；图5(b)为参数ε= 10−5时的收敛过程，可以看出算法在第400 次至第500 次迭代后达到稳定收敛。由此可见，SWIPT-SWMME 算法在求解sink 节点最优能效波束成形向量时是有效的，且能够在有限次的迭代后得到最优解。

图5 算法收敛过程

通过以下 4 种策略的对比，验证SWIPT-SWMMSE 算法在提升系统能效方面的优势：1) 基于SWIPT-WMMSE 算法的策略；2) 随机功率分配策略，即sink 节点的波束成形向量wi随机给定；3) 最大功率分配策略，即sink 节点以最大功率传输，其波束成形向量中各个分量均相等；4) 基于DNN 策略。系统能效的累积分布函数（CDF,cumulative distribution function）曲线如图6 所示。

从图6 可以看出，基于SWIPT-WMMSE 算法的策略相较其他3 种策略实现了更高的系统能效。同时，相较随机功率分配策略与最大功率分配策略所实现的系统能效值的累积分布，基于SWIPTWMMSE 算法的策略所实现的能效值具有更加广泛的分布区间，这是由于后者能够依据当前的信道状态数据，及时改变波束成形策略，在较好信道状态时增大功率传输，在较差信道状态时降低功率传输，从而节省能量传输的路径损耗；随机功率分配策略难以保障其波束成形方案随信道状态进行调整，最大功率分配策略虽然适用于信道状态较好的情形，但其在信道状态较差时具有较大的路径损耗。

图6 系统能效CDF

5.4 DNN 的算法有效性与性能

在DNN 训练阶段，其损失函数定义为网络输出与标准波束成形向量之差的模，经过15 次的梯度下降过程优化DNN 的权重与边长数据。训练中损失函数梯度下降的过程如图7 所示。从图7 可以看出，DNN 的训练过程均能够在有限次的迭代中趋于稳定，得到DNN 最优的权重与边长值，此时训练过程的批大小bs 设置为10。结合图6 中DNN 和SWIPT-WMMSE 这2 种算法实现的系统能效CDF曲线可知，DNN 在训练阶段较好地逼近了SWIPTWMMSE 算法。

图7 DNN 训练过程中损失函数梯度下降过程

在DNN 测试阶段，参与测试的5 000 个数据样本分别通过DNN 和SWIPT-WMMSE 算法计算得到相应的波束成形向量，以对应的向量之差的模作为DNN 准确度测试标准，其环境参数设置和数据计算结果分别如表2 所示，其中最大系统能效为算法所得最优解对应实现的系统能效值，拟合度的含义是使用DNN 算法得到的输出结果与SWIPT-WMMSE算法输出结果的拟合程度，总CPU 用时为在当前实验环境下，2 种算法求解最优解所消耗的CPU 运算时间。可以看出，基于DNN 的波束成形算法能够实现较好的预测准确度和计算效率。其中，随着每个小区内传感器节点数量增加（K=10,20,50），SWIPT-WMMSE 算法的CPU 用时显著增多，这是由于更多的传感器节点数量增加了最优解的维度，增加了算法的计算量；同时，DNN 算法的计算精度随着K值的增大有所下降，这是由于其网络规模的增加需要更庞大的数据样本集用于模型训练，原有的固定样本量无法满足网络规模增大时的DNN 训练需求；sink 节点天线的增加在一定程度上提升了DNN 的精确度，这是由于更多的天线配备提升了DNN 训练过程的自由度；训练过程中学习率变化与DNN 精确度并无明显线性关系，这是由于过大的学习率可能导致下降过程震荡无法收敛，而过小的学习率则会导致收敛过程过于缓慢；批大小的增大会导致DNN 准确度的下降，这是由于较大的批大小与较小的批大小相比，达到相同精度所需要的Epoch 数量越多，合理的批大小能够在梯度下降过程的计算时间与收敛精度之间实现均衡。在算法的CPU 耗时方面，DNN 算法较SWIPT-WMMSE 算法具有明显的优势，其5 000 次测试过程的计算时长远低于SWIPT-WMMSE 算法的计算时长。其中，网络规模（传感器节点数量、sink 节点天线数量）的增加均导致计算时长的增加。综上所述，基于DNN 的波束成形算法能够实现较高的准确度，且在计算复杂度与实时性方面较SWIPT-WMMSE 算法具有更好的优势。

表2 DNN 测试结果

使用不同隐藏层数量和神经元数量的DNN 模型经过训练后在测试阶段实现的准确度如表3 所示。表3 结果表明，依据前文所设计的3 层隐藏层且各层神经元数量分别为1 000、100 和10 时，所实现的准确度最高。而随着隐藏层数量或神经元数量的增大或减小，其DNN 模型的准确度均有所降低，这是由于过于简单的DNN 结构不能完全逼近SWIPT-WMMSE 的计算过程；而过于复杂的结构则会导致模型陷入细节特征的描述，导致DNN 无法在逼近误差与特征描述之间实现均衡。该结果也验证了定理1 的有效性。

值得注意的是，基于DNN 的策略相较于基于SWIPT-WMMSE 算法的策略能够提供更高实时性，其原因在于，sink 节点使用云端训练好的DNN 模型，将当前的系统状态作为输入得到决策输出，这一过程不包含迭代，仅为线性的数据输入输出过程，而SWIPT-WMMSE 所代表的最优化求解算法，其算法求解过程由于包含有迭代过程，即需要通过循环式的参数更新过程实现最优解的获取。因此相较于最优化算法，基于机器学习的方法能够为系统带来更好的实时性。在计算复杂度方面，由于DNN在训练完成后，利用其进行波束成形矩阵求解是从输入到输出的单向过程，其基本单元的执行频度均为常量，因此其计算复杂度为O(1)。

综上所述，基于DNN 的sink 节点最优能效策略能够很好地逼近SWIPT-WMMSE 算法，实现相似的系统性能，同时为系统决策提供更低的计算复杂度和更高的实时性。

6 结束语

本文研究深度学习方法在基于SWIPT 的传感云系统sink 节点最优能效问题中的应用。依据下行SWIPT、上行WIT 的传感云系统运行机制，建立了sink 节点的能效优化问题，继而通过数学变换将该问题转换为高维空间可求解形式；为了实现深度学习方法的应用，首先设计了求解该问题的具有迭代形式的SWIPT-WMMSE 算法，并论证了算法的收敛性；然后通过 DNN 训练过程实现对SWIPT-WMMSE 算法的逼近，并提出了DNN 对于SWIPT-WMMSE 算法的可逼近性与网络规模设计依据；最后通过仿真试验分别验证了基于SWIPT-WMMSE 算法的策略和基于DNN 的策略在求解sink节点最优能效的波束成形策略的有效性与所实现的系统增益，同时也验证了DNN 在降低计算复杂度和提升系统实时性方面的优势，为机器学习方法在网络资源分配中的应用提供了理论依据。