特邀策划人
李艳斌
博士,中国电子科技集团公司第五十四研究所研究员。
畅鑫
博士,中国电子科技集团公司第五十四研究所高级工程师。
刘东辉
博士,石家庄铁道大学管理学院讲师,长期从事复杂系统管理、策略优化等领域的研究。获评中国地质大学(北京)优秀博士学位论文,在国内外期刊和会议发表论文15 篇,其中,以第一作者发表SCI / SSCI 论文5 篇。主研河北省教育厅青年基金项目1 项,担任Nonlinear Dynamics,International Journal of Financial Research,Complexity 等国际期刊审稿人。
马宏斌
博士,航天工程大学电子与光学工程系、智能化航天测运控教育部重点实验室讲师。长期从事人工智能、电磁频谱感知等领域的研究,在国内外期刊和会议发表论文10 篇,其中,SCI 论文8 篇,会议优秀论文1 篇,授权发明专利21 项,担任IEEE Signal Letters,SignalImage and Video Processing 等期刊审稿人。
内容导读
随着Alpha Go 在围棋领域击败李在石夺冠、Alpha Star 在复杂的“星际争霸2”游戏中完胜职业选手、深度强化学习支撑在托卡马克装置内保持核聚变等离子体稳定惊艳全球,这些里程碑事件展示了基于人工智能的决策技术在各种实时、动态和复杂环境下的惊人表现,从而证明了其在决策制定方面的巨大潜力。在各个领域中,基于人工智能的决策技术都具有革命性的潜力。在无人驾驶领域,智能系统可以根据路况和环境实时做出决策,提高交通安全性和效率。在频谱管控方面,人工智能可以优化无线电频谱的利用,提高通信网络的性能。在智慧医疗领域,人工智能可以帮助医生做出更准确的诊断和治疗建议,提高医疗服务的质量和效率。在指挥控制领域,人工智能可以辅助军事人员及时做出决策,应对各种复杂情况。因此,推动智能决策技术的发展是将我国建成人工智能领域的领先国家和全球创新中心的重要方向之一。
在当今所处的大数据时代,智能决策技术能够充分地利用海量数据分析、挖掘和探索内在机理,解决动态复杂场景下的多目标优化和多智能体的协同管控等问题。为集中展现基于人工智能的决策技术的最新研究成果,《无线电工程》第6 期推出“基于人工智能的决策技术”专题。专题采用公开征稿的方式组织稿件,在所有通过专家评审的稿件中,最终确定录用稿件7 篇。专题主要展示了通信辐射源识别、协作频谱感知、解决奖赏稀疏性问题、多智能体协同能力提升、基于LEO 卫星网络的切换判决、电力物联网动态切片策略和车联网资源分配等研究成果。
在通信辐射源识别方面收录1 篇论文。作为电磁频谱决策和管控的重要环节,王育欣等介绍了开源辐射源识别数据集,综述了基于知识驱动和基于数据驱动的辐射源个体识别技术研究现状,剖析了当前深度学习在辐射源个体识别领域面临的问题,指引了未来辐射源个体识别的发展方向。
在协作频谱感知方面收录1 篇论文。为解决多节点协作频谱感知引起的全局决策延迟问题,刘春玲等提出节点评估与选择和网格搜索的强化学习算法。先通过节点评估与选择算法阻止恶意用户参与协作频谱感知,再基于网格搜索的强化学习机制搜索出所有可能的参数组合。仿真结果表明,该方法与其他算法相比,在提高检测概率的同时,解决了全局决策延迟的问题。
在解决多智能体策略生成奖赏稀疏性问题的理论研究方面收录1 篇论文。针对特定策略如何快速产生对抗策略这一问题,刘东辉等基于静态博弈理念,对马尔科夫决策过程演化,以对抗结果作为目标函数,基于动作集合优化目标函数,对策略优化问题进行数学建模。相比于经典多智能体强化学习方法,本方法能够针对特定策略高效产生多智能体对抗策略。
在提升多智能体协同能力的理论研究方面收录1 篇论文。针对典型多智能体博弈对抗策略生成框架缺乏从整体角度对子策略的协同控制的问题,畅鑫等基于分层强化学习提出改进方法。构造融合观测信息的顶层策略控制模型,完成控制信息的映射。基于开源对抗场景的实验结果表明,该策略生成方法对于多智能体协同对抗效果提升明显。
在基于LEO 卫星网络的切换判决方面收录1 篇论文。张英健等结合LEO 卫星网络切换判决方法研究进展,综述了切换判决方法。归纳了常用的图论模型切换判决方法。总结了机器学习在LEO 卫星网络切换判决中的应用。结合常用评价性能指标对不同切换判决方法进行了对比分析。对未来LEO 卫星网络切换研究值得关注的问题进行了展望,为后续相关研究提供解决思路。
在电力物联网动态切片策略研究方面收录1 篇论文。辛锐等研究了动态网络场景下的切片策略,基于深度强化学习算法求解虚拟网络功能部署和业务传输路由确定这一复杂联合优化问题,实验证明所提策略能根据目前的网络状态灵活地改变部署方案,控制业务路由平均能量损耗、平均可靠性和平均剩余带宽占有率,提高了网络整体传输性能。
在车联网资源分配方面收录1 篇论文。孟水仙等为解决车辆高速移动性和全局状态信息获取困难等问题,提出了一种基于完全分布式多智能体深度强化学习的资源分配算法。引入共享经验池机制、长短期记忆网络、卷积神经网络和残差网络结合增强算法的准确性和预测能力。实验结果表明,所提出的算法能够满足车对基础设施链路的高吞吐量以及车对车链路的低延迟要求,并且对环境变化表现出良好的适应性。
综上所述,专题收录的7 篇论文,分别针对特定的研究问题,从理论研究和工程应用维度,多个视角展示了当前基于人工智能的决策技术的进展,得到了有意义的研究结论,能够提供较好的参考作用。当然,这些论文也不能穷尽智能通信技术各方面的进展,希望通过这些论文的刊出,让更多的专家学者和研究人员关注该领域的发展,从而促进产生更多的研究成果。
最后,感谢参与稿件评审的各位专家学者的辛勤工作,衷心希望专题的出版能够对基于人工智能的决策技术研究起到有益的作用。