专题策划人
虞红芳
电子科技大学教授、博士生导师、英才学院副院长,担任《IEEE Internet of Things Journal》《IEEE Network Magazine》等刊物的编委;主要从事下一代网络与分布式系统的研究工作;作为项目负责人和核心成员,承担多项国家“973”项目、“863”项目、国防预研项目、国家自然科学基金项目等;获教育部自然科学二等奖1项;发表学术论文 200 余篇,谷歌学术引用 2 600 余次;撰写专著 3 本,获授权专利 40 余项。
近年来,网络在可编程、软件化方面取得了很多进展,为网络智能化提供了很好的基础。同时,新的人工智能模型、算法和技术层出不穷,分布式人工智能成为主流。网络和人工智能越来越需要对方的支撑,两者的结合将带来新的机遇和挑战。网络和人工智能结合分为两个场景,一个是考虑网络如何支撑AI,即Networking for AI;另一个是如何把AI用在网络设计上,即AI for Networking。本期专题及专家论坛的栏目的文章从这两个方面展开讨论。
在Networking for AI方面,随着人工智能技术的飞速发展,以分布式机器学习为主的分布式人工智能应用实现了爆炸式增长,正在成为互联网支撑的又一类重要应用。同时,计算能力的快速突破,使得网络成为分布式机器学习的主要系统瓶颈。因此,对规模分布式人工智能应用的网络架构及技术进行创新,优化分布式机器学习训练性能,对中国的人工智能发展有重大的意义。《分布式深度学习系统网络通信优化技术》一文概述了业界在大规模分布式深度学习的通信网络优化方面的基本技术途径,并展望其未来发展的机遇和挑战。《新型拓扑感知的参数交换方案》和《地理分布式机器学习:超越局域的框架与技术》这两篇文章分别探讨了数据中心和跨广域网的分布式AI场景所面临的性能瓶颈和对应的性能加速技术。《面向分布式AI的智能网卡低延迟Fabric技术》一文结合中兴通讯智能网卡的研究工作,介绍了基于远程直接内存访问(RDMA)的低延迟通信网络以及对应的抽象化的通信原语库设计思路和面临的挑战。算力网络作为新型的分布式人工智能基础设施,是由运营商主导并提出的概念,目的是把分散的计算资源整合,将网络与算力融合后作为基础资源向用户提供服务。《电信运营商泛在智联网络的构建》一文介绍了如何用算力网络以及AI能力分发平台等核心要素,构建新一代泛在智联网络,应对“应用本地化”“内容分布化”和“计算边缘化”的态势。《算力网络中面向业务体验的算力建模》一文研究了算力网络中算力建模和算力资源调度问题。
在AI for Networking方面,网络连接数的爆炸性增长以及多种网络接入方式并存,使得网络高度复杂。同时,现有网络运维自动化程度不高,很大程度上依赖于人的经验和技能,运营成本(OPEX)逐年递增。因此,迫切需要将人工智能技术应用到网络中,实现网络智能化。《基于AI的运营级IDC节能研究》一文探索了将AI算法应用于互联网数据中心(IDC)节能中的研究工作。通过采集IDC机房数据,利用AI对运营商IDC机房进行画像。同时,借助深度学习和控制算法,把人工调节经验和数据分析结果通过预设规则下发到机房的控制系统中。《超密集蜂窝网络智能干扰协调算法》一文将超密集蜂窝网络中动态干扰环境下,小基站发送功率的动态调整问题建模为马尔科夫决策过程,并设计了一种基于Actor-Critic方法的小基站功率智能控制算法。这两篇文章为人工智能应用于网络运维提供了很好的参考。
本期专题论文来自高校、电信运营商、科研院所、设备制造商等中国网络人工智能研究优势单位的专家学者,凝聚了他们多年的研究成果和工作经验,希望能给读者提供有益的启示和参考。在此,对各位作者的大力支持表示衷心感谢。
虞红芳
2020年9月20日