黄韬,刘江,汪硕,张晨,刘韵洁
(1.北京邮电大学网络与交换国家重点实验室,北京 100876;2.网络通信与安全紫金山实验室,江苏 南京 211111)
互联网是人类历史上最重要的基础设施之一。互联网已经从最初的科研型网络发展成消费型网络,目前正在向生产型网络转变,未来网络发展迎来新的机遇。在互联网过去几十年的发展过程中,涌现出一系列优秀的技术和标准,如 TCP(transmission control protocol)/IP(Internet protocol)、OSPF(open shortest path first)、BGP(border gateway protocol)、MPLS(multi-protocol label switching)、IPv6(Internet protocol version 6)、BBR(bottleneck bandwidth and RTT)、QUIC(quick UDP Internet connection)、SDN(software defined network)、NFV(network function virtualization)、VxLAN(visual extensible local area network)等,以及移动通信网络领域的3G/4G/5G 网络相关技术等,这些技术为互联网的发展演进提供了重要支撑,做出了历史性贡献。然而,随着互联网功能从“信息传输”向“产业服务”转变,传统互联网技术正迎来新的挑战。
从需求驱动角度看,新的业务将对未来网络提出更高的要求。业界预测,未来网络将需要满足超低时延(毫秒级)、超高通量带宽(>1 Tbit/s)、超大规模连接(>1 000 亿连接)等需求。例如,在消费型业务领域,AR(augmented reality)/VR(virtual reality)/3D 通话、全息传送、交互式游戏等沉浸式业务将对网络低时延、大带宽性能提出更高要求;在工业互联网领域,精仪制造、远程工控、数字孪生等生产性业务则要求网络具备更好的低时延、低抖动能力;在车联网领域,自动驾驶、车路协同、无人车、无人机、无人船等新兴业务则会对网络提出低时延、高可靠的双重需求。此外,参考Gartner近期发布的2020 年十大技术性趋势,超级自动化、透明度和可追溯性、授权边缘、分布式云、自主设备、实用区块链、AI(artificial intelligence)安全等技术和应用将对互联网提出更高要求,推动未来网络向智能化、柔性化和可定制化方向发展。
从技术挑战角度看,未来10 年互联网在可扩展性、移动性、安全性、服务质量保障、高效服务分发、绿色节能等方面,仍将面临巨大挑战。虽然从21 世纪初开始,一些问题已被学术界意识到,并开展了诸多创新性研究,然而很多技术难题仍未能从根本上解决,并且随着网络规模日益增大而变得愈加严峻。例如,在可扩展性方面,网络流量增长速度远高于芯片处理性能增长速度,如何构建新一代网络芯片甚至变革网络架构体系,以满足未来10 年网络流量爆炸性增长需求成为新的难题;在服务质量保障方面,传统TCP/IP 网络遵循“尽力而为”的设计理念,网络设备主要负责数据分组的转发,网络侧重公平性原则,不强调对全网的可管可控,然而随着新业务对服务质量保障需求的增加,未来网络亟须增加差异性服务能力,实现网络端到端确定性可控。
为解决传统互联网暴露出的种种问题,世界各国都在积极探索未来网络相关技术方案,并抢先展开战略布局。通过设立重大项目,从“网络体系架构设计”和“网络试验平台构建”这2 个角度入手,探索新的网络体系并进行测试验证,本文首先系统地追踪了国内外未来网络学术界和产业界的最新发展情况,在此基础上再从网络体系架构和创新试验平台2 个角度展开分析。“网络体系架构”是目前网络研究领域公认的一项科学难题,也是当前世界各国信息网络领域争相研究的焦点。本文系统梳理了近10 年未来网络体系架构方面的研究进展和思路,并在此基础上提出了思考和设想。“网络创新试验平台”作为未来网络技术创新研究的基本手段,在国际上得到广泛重视,全球已经建立了超过10 个大规模网络试验设施。本文系统梳理了全球网络创新试验平台的主要思路和最新进展,并在此基础上介绍了中国主导建设的未来网络试验设施的核心思路及发展趋势。
面向2030 年的需求,本文期望构建可提供“万亿级、人机物、全时空、安全、智能”的未来网络。然而,网络的创新发展必须要兼容现有的基础,即使提出革命性的创新技术也需要找到演进式的部署路线,本文在对未来网络体系架构研究的基础上,梳理了网络控制编排、网络深度可编程、网络确定性服务、网络计算存储一体化、网络空天地海一体化、网络+人工智能、网络+区块链、智能安全网络八大核心技术,并给出了业界最新进展及其发展趋势的思考。最后,本文给出了面向2030 的未来网络发展展望。
自未来网络的概念提出以来,各国高度重视未来网络体系架构的创新研究,并纷纷加大投入力度支持学术界对未来网络架构进行探索。美国未来网络研究项目主要由国家科学基金会(NSF)管理,包括未来互联网设计(FIND,future Internet design)和未来互联网架构(FIA,future Internet architecture)计划。FIND 从2005 年开始资助了关于新型网络体系结构、网络虚拟化、网络感知测量等方面的近50 个研究项目,FIA 于2010 年启动,对命名数据网络、MobilityFirst、XIA(expressive Internet architecture)、Nebula 等项目提供支持,从内容中心网络架构、移动网络架构、网络安全可信机制、分布式数据中心互联等方面探索未来网络关键机制。
欧盟第七框架计划(FP7,7th framework programme)以探索克服现有网络问题的全新整体性解决方案、设计运营商未来网络架构为目标,从2007 年开始启动了FIRE(future Internet research and experiment initiative)、4WARD、SAIL(scalable and adaptive Internet solution)等一系列未来网络体系结构相关的项目。目前,主要由欧盟创新框架计划Horizon 2020 对信息和通信技术(ICT,information and communications technology)系统的研究和开发进行支持,包括5G 相关技术研究、下一代计算系统和技术,以及未来网络软硬件、基础设施、技术与服务、内容技术和信息管理等方面。
日本国家信息通信技术研究院(NICT)于2006 年启动AKARI 研究计划,该计划提出新一代网络的概念,其核心思想是在考虑与现有网络过渡问题的基础上研究创新网络架构,并提出了未来网络架构设计的三大原则:简单、真实连接和可持续演进。随后,NICT 对 AKARI、JGN-X(Japan gigabit network extreme)等多个项目进行整合,形成新一代网络研究与发展计划,该计划涉及网络架构、光、无线和安全等领域,致力于解决当前网络存在的问题并促进未来网络的可持续发展。
我国科研人员从2007 年开始跟踪未来网络领域的发展,国家科技部、自然科学基金委等也启动了“新一代互联网体系结构与协议基础研究”“未来互联网寻址机制与节点模型”“面向服务的软件定义网络体系架构与关键技术研究”等一系列项目,中国科学院与中国工程院在相关报告中也明确提出加强未来网络领域研究的必要性与紧迫性。从2018 年开始,科技部又进一步启动了宽带通信与新型网络专项、天地一体化信息网络重大工程、人工智能重大专项等研究,期望能在网络体系架构方面取得进展和突破。
国内外未来网络体系架构的研究主要从简化网络结构、增强可扩展性和兼容性等方面进行,形成的主要研究成果总结如下。
Plutarch 架构[1]支持网络的异构性。XIA 架构[2]支持以内容、服务、用户等多类主体为中心的网络。文献[3]认为互联网架构的基础是各种网络的组合而非简单的层级集合,互联网持续发展的关键在于理解和建模网络组合体系结构。文献[4]为实现全新替代方案和兼容性的折中,提出一个支持全新部署的后向兼容互联网体系架构,该架构通过简化部署、允许应用同时使用多个共存框架,引导互联网架构的永久性变革。目前,未来网络架构方面的主要研究成果包括软件定义网络、信息中心网络、移动网络(5G)、无线网络、雾计算/移动云计算、物联网等。
软件定义网络将网络的控制功能抽象为逻辑集中的控制平面,对底层设备资源进行管理并支持可编程,数据平面负责转发操作,具备良好的灵活性、可控性,其中涉及的关键技术包括网络交互协议、网络控制器和控制平面可扩展性研究。
信息中心网络指出,用户访问网络的目的是获取信息,网络的基本行为模式应当是请求和获取信息,以信息为中心可以提高资源利用率和服务质量。CDN(content delivery network)/NDN(named data networking)是可适应当前内容获取模式的新型互联网架构,该架构保留了IP 协议栈的沙漏模型,细腰层使用类似统一资源定位符(URL,uniform resource locator)的层次化内容命名方式,涉及的关键技术包括命名机制、缓存策略、路由与转发机制以及移动性。
移动和无线网络(MobilityFirst)是面向资源有限的移动及无线场景,以移动终端作为主流设备、稳健、可信、安全的网络体系架构,该类架构需具备的技术特征包括:支持异构设备的共存性、与硬件解耦并具备灵活的控制接口、支持快速的全局域名解析、核心网络采用扁平地址结构、支持可编程的移动计算模式。
云网络(Nebula)是基于云计算的网络架构,结合网络虚拟化、SDN、云计算等技术,促进网络计算、存储和传输资源的管理控制。云网络架构一般分为基础设施层、平台层和软件服务层,云中构建的主要网络包括公共网络、管理网络、存储网络和服务网络。公共网络向外部用户提供访问;管理网络用于管理云中各物理节点间的通信;存储网络可用于建立存储池;服务网络是纯虚拟网络,在物理主机间使用隧道技术构建。
4K/8K、AR/VR、全息全感通信、工业互联网、车联网等新应用场景的出现使未来网络需要具备哪些能力与功能成为未来网络发展亟须考虑的问题。2018 年7 月,ITU 成立了网络 2030 焦点组(FG-NET-2030,Focus Group on Network 2030)专门研究传输这些新应用所需的网络技术,研究范围包括2030 年及以后的未来网络架构、需求、使用场景和网络功能[5]。该焦点组指出未来网络的研究可以从新的垂直行业、新通信服务和空天地网络基础设施3 个角度出发。新的垂直行业需要对工业自动化和个人近实时全息通信体验提供支持;对于新通信服务,网络2030 将开发一种具备新型网内服务的模型,支持应用更智能、高精度地与网络交互,满足应用对确定性时延的需求,并将服务形式化;空天地网络基础设施需要把握使用对象及所需服务类型。该焦点组关注的重点领域包括时间保证通信服务(准时服务、及时服务、协调服务)、具有复杂约束的通信服务(如全息通信、全感官沉浸式体验)、异构网络基础架构共存(如光网络、分布式数据中心、公有云、卫星网络)、新垂直行业(如自动工厂、沉浸式教育)以及与下一代移动技术的关系。中国于2018 年6 月成立了网络5.0 产业和技术创新联盟,主要针对下一代数据通信网络愿景、架构、技术验证、部署与运营等展开研究,推动数据网络技术演进,目前已与FG-NET-2030在未来网络应用场景研究与技术创新等方面建立合作关系。
国内高校、科研院所也同步展开了地址驱动网络[6]、智慧标识网络[7]、多模态智慧网络[8]、双结构网络[9]等一系列新型网络体系架构的探索,为未来互联网的发展提供了新的思路。
未来网络在面向2030 的系统架构与能力上面临巨大的挑战。挑战之一,来源于目前 IT(information technology)与 CT(communication technology)的加速融合,网络与计算/存储的边界正在逐步模糊,各类IT 与CT 资源正在广域网范围实现一体化,并统一按需提供服务,这将推动互联网架构从传统的“以网络资源为中心”转变为未来的“以应用服务为中心”。挑战之二,来源于产业互联网的潜在爆发,相关的自动化要素通过互联网进行流通与协同,对于网络传输的带宽、时延、抖动等指标提出了更精细量化的需求,这将导致互联网的能力从传统的“随机不可控”进化为未来的“确定可预期”。
上述的变革与挑战,是未来网络体系架构需要重点关注与解决的问题,同时也是面向2030 年未来网络所面临的重大机遇,因此,需要通过设计“以应用服务为中心”的“服务定制网络”[10]来解决上述挑战。服务定制网络以简单开放、可扩展、安全、融合为设计原则,以为不同应用服务提供差异化组网能力为主要目标,支持计算及存储资源的在网高效灵活调度。
服务定制网络愿景与路线的实现,需要综合使用、探索各类新型网络技术,并组合形成完整的服务定制网络技术栈。软件定义网络、软件定义广域网、网络功能虚拟化等技术,可为服务定制网络提供灵活的管控能力,支撑实现协议全栈开放可定义。白盒转发设备、协议无关编程语言、SRv6(segment routing IPv6)转发编程框架等技术,可为服务定制网络提供灵活的转发行为,支撑实现设备转发开放可编程。时间敏感以太网、灵活以太网、确定性网络等技术,则可为服务定制网络提供精细化的服务保障能力,支撑实现传输质量确定可预期。
值得注意的是,实现网络底层融合计算存储也是服务定制网络的一个重要理念,通过在网络中分发调度计算与存储资源,可有效降低业务时延并减少信息冗余。随着云计算与边缘计算的加速应用,展望2030 年的未来网络,服务定制网络将原生结合云计算/边缘计算,在广域范围实现网络、计算、存储的超融合一体化,使各种应用服务资源(如算力、数据、内容等)在运营商“云、边、端”多个层次,甚至跨多运营商的广域网络范围内进行智能动态分布和按需连接协同。届时,服务定制网络将在传统互联网基础承载平面(网络第一平面)之上,引入一个广域大尺度的叠加服务平面(网络第二平面),作为未来网络应用服务的技术底座,实现“革命式”新型网络技术的演进式部署,支撑人工智能、区块链等向大规模分布、泛边界协同的形态进行演进。
自2014 年服务定制网络的发展愿景提出以来,其思想与概念已经在诸多应用领域形成了雏形。例如,在企业广域网领域,中国电信、中国联通积极探索的软件定义广域网技术支持中小企业用户自定义其WAN(wide area network)的结构与能力,可为不同的企业应用服务提供差异化的选路、安全,以及QoS(quality of service)保障;在移动核心网领域,中国移动提出的云原生核心网技术支持以容器化的形式按需提供核心网服务网元,不同的移动用户或应用服务可按需定制差异化的增值业务能力;在5G 移动通信领域,华为、中兴等公司所推动的网络切片技术支持对于 RAN(radio access network)无线接入和承载回传网络资源的硬切片,以便为不同的5G 应用服务与行业用户提供差异化的5G 组网能力;在工业互联网服务领域,工业互联网标杆外网技术可为不同的工业互联网应用服务定制提供确定性的传输时延与抖动,实现工业生产信息化要素在外网的安全可控传输。
试验平台对比如表1 所示。
试验验证作为未来网络技术研究、设备开发和应用创新的基本方法,在国际上得到广泛重视,许多国家已经建立了大规模的网络试验设施,如美国的GENI(global environment for networking innovation)、CloudLab,欧洲的Onelab、Fed4FIRE+,日本的RISE、NICT 集成试验平台,我国也积极布局了网络试验平台的研究与建设。为了支持网络新技术的研究,许多试验床结合SDN 技术、虚拟化技术进行构建,利用网络切片技术可在统一的物理基础设施上为不同试验提供相互隔离的网络资源,并结合OpenStack 等云管理平台支持用户按需动态申请网络切片资源。为了更好地推动未来网络技术的研究和发展,各类试验平台仍在不断完善和创新。
GENI[11]于2005 年由美国国家科学基金会提出,以创建分布式试验平台支持计算机科学试验并促进试验设计、执行和记录的良好规范为长期目标[12]。现阶段GENI 已经实现对OpenFlow 技术的支持,并允许用户按需申请网络资源。GENI 体系结构包括控制平面和数据平面,控制平面用于管理资源,数据平面根据用户提供的说明进行设置,资源由不同实体运营的异构资源以集合的形式提供。GENI的管理核心是控制框架 GCF(GENI control framework),网络试验以切片的形式运行于数据平面,使用的切片工具包括VLAN(virtual local area network)、FlowVisor 和OpenVirteX[13]等。GENI 支持用户访问CloudLab、Chameleon、Emulab 等联合测试平台的资源以进行跨平台试验。
CloudLab[14]旨在提供支持各种云计算研究的大规模、多样化、分布式试验平台,是美国国家科学基金委员会NSFCloud 计划的组成部分,从2014 年开始运行。该试验平台为用户提供云计算资源,在允许用户构建上层云应用的同时,提供直至裸机的控制和可视性。CloudLab 为地理分布式结构,主要包括Utah、Clemson、Wisconsin这3 个集群。每个集群侧重于不同研究领域,Utah集群主要用于横向扩展研究,Wisconsin 集群主要用于存储和网络技术研究,Clemson 集群主要用于高性能研究[15]。现阶段,CloudLab 与GENI、Emulab 等平台联合,已为上千个项目及用户提供了试验服务。
Chameleon[16]是由NSF 资助的大型、可深度重配置的计算机科学试验平台,支持的项目涉及操作系统开发、虚拟化方案、性能可变性研究和能耗管理等计算机系统研究。该平台基于OpenStack 开源架构,可为用户提供软件堆栈的完全控制,支持系统裸机重配置,用户可通过云端裸机访问Infiniband、NVMe、GPU(graphics processing unit)、低功耗Xeon 和ARM(advanced risc machine)处理器等多种类型的硬件。该试验平台从2015 年7 月开始开放使用,目前已经为3 000 多个用户的500多个项目提供支持。
表1 试验平台对比
OneLab 包括OneLab 和OneLab2。OneLab项目由欧盟FP6 项目组提供支持,主要工作是对当时广泛使用的PlanetLab 基础架构进行无线环境下的扩展并建立统一的网络测试环境。OneLab2 项目由欧盟FP7 项目组提供支持,将前期OneLab 项目中的试验平台扩展至整个欧洲,并与全球其他PlanetLab 基础设施联合,构建开放、可持续的大规模共享试验设施。基于前期研究基础,OneLab 联盟于2014 年正式成立,解决了单一入口访问异构资源和分布式资源并联合多个权限控制下资源的联合模型问题[17],形成了包括FIT IOT-LAB、NITOS、FIT WIRELESS、FIT Cloud 等联合的试验平台,可支持用户搭建相应的异构网络试验环境。
Fed4FIRE+属于欧盟Horizon 2020 计划项目,建设周期为2017 年至2021 年,旨在构建全球最大的下一代互联网联合试验平台,通过通用框架和工具对无线、有线、云服务等各类技术设施进行访问,提供对云计算、大数据分析、媒体分发网络、智能城市、5G 和物联网(IoT,Internet of things)领域相关研究的支持。Fed4FIRE+主要关注中小企业,企业利用测试平台可降低产品开发、测试和优化的门槛,而测试平台提供商能够获取有关运行和操作测试平台的反馈。根据 2019 年第一阶段报告,Fed4FIRE+项目已发布一站式服务初始框架,并加入13 种不同类型的21 个试验平台,技术创新包括SLA(service-level agreement)和声誉支持、试验即服务、监测和互联、服务编排和代理、测试平台联合的个体等方面。
RISE[18]是 2009 年由 NICT 开始部署的OpenFlow 试验平台。该平台基于JGN-X[19]构建,主要目标是提供大规模、真实的SDN 验证环境。目前,RISE 拥有14 个站点。NICT 集成试验平台由NICT ICT 测试平台研发促进中心于2016 年开始建立,将NICT 的4 个测试平台即JGN、RISE、StarBED[20]和JOSE[21]进行合并,为大规模网络及物联网相关技术试验提供支持,已被用于日本的工业、学术研究和NICT 研究项目中。
全球未来互联网试验大会(GEFI,Global Experimentation for Future Internet)致力于未来网络试验平台相关研究的合作与交流,目前已召开三届会议。GEFI 2017 主要关注试验的可重复性、测试平台的可扩展性、低时延边缘云应用、SDX(software-defined network exchange ) &SDI(software-defined infrastructure)。GEFI 2018[22]对测试平台建设存在的问题进行探讨,提出推进光传输“白盒”开发,以支持弹性光网络的联合测试平台创建,研究端到端网络系统在无线网、边缘网和云数据中心的虚拟化技术融合;GEFI 2019[23]主要涉及分布式网络基础架构、5G/B5G无线基础设施、边缘计算、试验可重复性及数据开放等方面。
为适应未来全球网络变革的新趋势,突破传统网络当前所面临的核心技术问题,保障我国网络通信领域的中长期发展,2013 年,我国将未来网络试验设施(CENI,china environment for network innovation)列入“国家重大科技基础设施中长期规划(2012-2030)”,该项目于2016 年12 月正式启动实施。
CENI 作为我国在通信与信息工程领域的国家重大科技基础设施,其建设覆盖了包括国内40 个主要城市,包含88 个主干网络节点、133 个边缘网络试验节点,以及4 大云数据中心,目标为建设一个先进的、开放的、灵活的、可持续发展的大规模通用试验设施,满足“十三五”和“十四五”期间国家关于下一代互联网、网络空间安全、天地一体化网络等重大科技项目的试验验证需求,获得超前于产业5~10 年的创新成果。
CENI 的建设对于我国未来网络领域具有重大意义,从学术界角度,可提供一个大规模虚拟化网络环境,作为高校、研究院所科研人员的网络技术创新验证平台,显著增强创新成果的国际认可度;从产业界角度,可为运营商的新型网络服务部署、设备商新设备的大规模测试、互联网公司的新型网络业务提供测试平台和应用基础环境。
图1 CENI 的整体架构
CENI 的整体架构如图1 所示,SDN 跨域协同控制器可分为主干网控制器、边缘网控制器和云数据中心控制器。CENI 主干网连接了全国40 个主要城市,主干网又可分为可编程路由器和SDN 白盒交换机2 个网络平面,提供差异化的网络连接与服务能力,企业、学校等边缘网络通过因特网入网点(POP,point of presence)接入CENI。CENI 中的各个域的网络,都将通过中国网络操作系统(CNOS,China network operating system)进行集中式的管理,以及跨域的协同编排与调度。在此基础上,CENI 试验服务平台与管理系统将作为CNOS 的关键应用,向试验用户提供自助式的一站式试验服务,可为全层次、多场景的网络与网络安全的创新技术与应用,提供先进、开放、灵活、高速、可靠的试验环境。
可编程路由器网络平面具备高度的开放性与灵活性。其中,单台可编程设备可生成多个虚拟化设备实例,各虚拟化设备实例之间逻辑隔离,可以共用或者复用物理端口,整个可编程路由器网络平面通过VLAN 标签技术支持相互隔离的虚拟网络平面。可编程路由器网络平面的主干网建成后,将可以在广域网层面提供L0~L3 层网络服务,以满足各类网络技术创新试验需求,如L0 层可提供裸光纤的试验服务,L1 层可提供10 Gbit/s、N×10 Gbit/s、100 Gbit/s 光波道的试验服务,L2 层可提供各类链路层技术与架构的试验服务,L3 层可提供各类IP/Non-IP 的网络层技术与架构的试验服务。可编程路由器网络平面通过可编程AP(access point)利用有线、无线、4G/5G、ZigBee、NB-IoT(narrow band Internet of things)和LORA(long range radio)等多种先进技术,在其边缘网络实现包括手机终端、计算机、巡检机器人、物联传感终端等多类型试验终端接入;并通过开放可编程接口,灵活实现应用创新和新协议部署,可为NDN、SCN(service-centric networking)、SOFIA(service -oriented future Internet architecture)等新型网络体系架构提供仿真与验证的试验环境,为自组织网络、隐私安全、多路径传输优化等新型网络技术试验提供组网与测试的试验载体。可编程边缘网还支持通过与监测、感知、溯源(包含流量、性能)、资产发现和网络安全态势感知配合,提供更面向试验终端、更贴近试验用户侧的感知数据,提供支持试验终端大数据分析的试验条件。
SDN 白盒交换机网络平面具备运营级大网的可靠性。其中,用户接入侧可通过以太网、光纤、专线、SD-WAN 等方式连接至SDN 白盒交换机网络平面的业务接入点,网络承载侧可实现对于不同用户间流量的安全隔离与控制,理论上整个SDN 白盒交换机网络平面能够支持高达1 600 万个用户并行运行。利用SDN 集中管控与自动化的能力,可实现用户网络的分钟级开通,同时结合先进的流量工程与调度技术,可满足不同用户对网络带宽、时延、分组丢失率等指标的不同需求,实现大网级别的网络切片并提供相应的差异化服务能力。SDN 白盒交换机网络平面的边缘网络与云数据中心,将利用云计算、网络虚拟化等技术构建SDN 试验服务平台,可支持单用户试验、多用户试验、跨域协同试验等多种试验方式,并能够为用户提供L3 层软件定义组网,以及L4~L7 层的网络创新试验服务能力,如网络安全、内容分发、协议无关网络、协议无关内容网络、意图网络、智能DNS(domain name server)试验、网络大数据分析、网络人工智能、区块链组网等。利用NFV 与服务链技术,SDN 试验服务平台能够支持多种虚拟化网元与中间件能力的任意编排,实现网络功能的虚拟化和池化。同时,SDN 试验服务平台可提供网络终端所需的计算和存储资源,为产生试验所需的流量和业务提供基础资源。
从技术路线角度而言,CENI 将同时为基于IP与非IP 的网络新技术提供验证与示范环境。IP 架构已经很好地满足了过去几十年的互联网发展需要,4K/8K、全息通信、车联网、工业互联网等新业务对于网络的带宽、时延、抖动性提出了新的需求,基于IP 的新技术也不断涌现以解决上述问题。但运营商现网由于已经存在大量存量业务,无法提供主干网端到端的试验环境,因此新技术难以在现网得到有效部署验证。针对这一问题,作为未来网络试验基础设施,CENI 将支持基于IP 的新技术部署测试,包括服务定制网络、端到端网络切片、低时延与确定性转发、大带宽多播分发、分段路由与可编程等,为相关高校与科研机构提供基于IP 的新技术和新业务的示范验证试验服务平台。
此外,由于IP 技术基因在可扩展性、安全性、移动性、可管控性等方面存在根源性问题,非IP的网络体系架构也是全球范围研究的热点,例如信息中心网络、可选网络、可信网络、移动优先网络等。国内提出了NewIP、地址驱动网络、全维可定义网络、标识一体化网络等体系架构,这些非IP的体系架构急需主干级别的大规模网络试验环境。针对这些问题,CENI 将提供自定义标识的试验服务平台,并支持主干网级别的规模试验,支撑国内外相关领域的创新与突破。
随着网络需求日益复杂,网络中出现了众多创新技术,本节选取了一些比较热门与关键的技术领域进行总结,如表2 所示。首先,对当前直接与网络相关的关键技术进行了粗粒度的划分,从网络控制编排层面、数据层面对一些创新技术进行了总结。其次,对创新技术的领域范围做了进一步延展,亟须探索网络与人工智能、区块链、安全进行交叉融合的创新。最后,对未来网络关键应用方面的技术进行总结,重点关注热点技术在空天地海一体化方面的应用。
传统分布式网络的控制能力分布于各类路由设备及网络协议中,存在操作复杂、管控困难等问题,软件定义网络技术的出现为网络控制模式变革创造了新的契机。面向业务应用发展需求,未来网络将可能进一步强化网络的端到端控制与编排能力。
网络控制与编排整体架构如图2 所示。网络操作系统作为网络控制与编排的核心,成为未来网络竞争的制高点,对产业生态和国家安全具有重大意义。事实上,网络操作系统在网络基础设施和网络应用之间起到了承上启下的纽带作用。一方面,网络操作系统通过相应的接口协议对底层网络设备进行集中化的管理、状态监测、转发决策以处理和调度下层数据平面的流量;另一方面,网络操作系统通过相应的接口向上层应用放开多个层次的可编程能力,允许网络用户根据特定的应用场景灵活地制定各种网络策略。在多个用户争用底层资源时,网络操作系统可以进行资源调配和管理,从而更好地服务和满足用户的差异化需求。网络操作系统涉及网络控制和网络编排两大方面,业界对相关技术展开了诸多研究。
表2 热点技术领域总结
图2 网络控制与编排整体架构
网络控制方面主要涉及控制器架构、控制平面性能、控制平面接口,以及可扩展性、安全性等。在SDN 技术的发展初期,网络控制一般以单实例的控制器出现,主要用于学术研究与探索,如NOX/POX、Ryu、Floodlight 等。这些控制器采用不同的机制实现了网络的灵活可控,为大规模复杂网络的网络操作系统设计奠定了基础。随着运营商级网络场景的出现,多控制器架构成为研究热点。多控制器架构具有逻辑集中物理分布式和完全分布式2 种实现方案。逻辑集中物理分布式方案中所有控制器具有全局一致的网络视图,需要重点解决大规模网络控制器间的状态同步问题;完全分布式方案则需要重点解决控制器放置优化等议题。随着SDN 技术的发展,控制器的设计和功能也越来越完善。目前,国内外设备商、运营商、开源组织等设计了多种控制器,并形成了不同的控制器生态链。其中,思科公司和开放网络基金会分别主导了OpenDaylight 和ONOS 两大开源控制器阵营,并大力构建相关的产业生态,期望能打造具有高性能、分布式的SDN 大网控制器。
在网络编排方面,主要包含SDN 高层业务编排和NFV 底层虚拟网元编排两大部分,其中SDN高层业务编排负责将业务部署的工作流程进行规范,再转化为标准化策略下发给底层资源控制器;NFV 底层虚拟网元编排则将物理硬件资源与软件功能解耦,抽象交换机、路由器、防火墙、负载均衡等网络功能为虚拟网元,通过北向的标准化接口针对业务需要最终实现业务的部署,同时将当前的网络状态反馈给业务编排,进行策略的改进。业务编排和网络资源编排相互依赖,形成一套闭环的网络编排系统,实现自动化、定制化业务部署。文献[22]总结了网络功能虚拟化技术的最新进展,当前网络功能虚拟化主要用于性能加速,包括软件加速、硬件加速和中间件卸载;文献[23]总结了基于机器学习的软件定义智能网络应用,随着人工智能技术的不断突破,网络编排正由“自动化”向“智能化”转变。在产业生态方面,AT&T 和中国移动共同推出了开放式网络自动化平台(ONAP,open network automation platform),试图克服新软件和虚拟化技术带来的互操作性挑战,实现面向运营商场景的端到端编排。
面向2030 年的未来网络,网络控制和网络编排将呈现出更灵活、更开放、更智能、更深度可编程的特征。端到端控制与编排将变成业务用户最关心的能力,各种网络协议将不再像今天这么重要。构建具备开放灵活、面向业务、具有微服务化架构的网络操作系统将成为未来网络的核心,整个网络生态将迎来巨大的变革。随着云计算、边缘计算、智能终端、物联网的飞速发展,实现异构云网边端资源的控制、编排、调度将是整个系统的关键。在网络操作系统领域,目前业界已开展诸多研究。2019 年5 月,国内科研团队联合推出了CNOS 大网级网络操作系统,具备全场景、全兼容、高性能三大特征,在全球首次实现了SDN 交换机代替传统路由器构建广域主干网的尝试。
总结来讲,软件定义网络经过十余年的发展取得了巨大的进展,从最初的数据中心应用,到现在渗透到各个网络场景中,以控制和编排为核心的网络操作系统已成为未来生态构建的关键。在各类新型应用的推动下,网络操作系统也面临许多新挑战。例如,随着网络规模的扩大,网络操作系统的可扩展性、可靠性、安全性变得尤为重要,网络操作系统如何支持主干网、城域网、边缘网、数据中心网络等多场景跨域横向协同,以及光传输平面、数通平面、业务平面的跨层纵向协同,同时更灵活地兼容路由器、交换机、光传输设备、智能网络接口卡等多种设备形态,以及兼容异构厂商设备、白盒设备等多种南北向接口;随着远程工控、全息通信等新型业务的发展,网络操作系统如何支持网络端到端毫秒级时延、微秒级时延抖动保障,如何支持无状态网络层多播成为必须要解决的问题,如何实现具备更智能的全网实时感知、按需调度、路径保障、全局优化功能,实现流量管理、故障处理的智能化,并具备支持微服务化架构、分布式集群、TB 级别网络状态容量的高性能等。此外,网络功能虚拟化在实现软硬件加速、中间件卸载、部署的灵活性和扩展性等方面也存在巨大的挑战。这些都是值得继续思考和研究的内容。
传统网络转发设备种类多样但彼此标准不同,网络受到功能固定的分组转发处理硬件和芯片硬件厂商不兼容协议的限制,存在网络设备更新缓慢、运行成本增加等问题。面对快速升级的网络需求和不断更新的网络业务,网络可编程的能力成为未来网络服务和应用的关键。
网络可编程性是指网元将数据分组处理逻辑与网络控制逻辑暴露于用户,以进行系统快速和可理解的重新配置的能力。网络可编程性的概念始于主动网络研究,随着控制平面和数据平面分离等相关研究经历了几个不同的发展阶段。在SDN 刚刚兴起时,由于转发设备功能和性能的局限性,网络可编程主要体现在软件定义网络的控制平面,面对超大规模网络及大流量,基于SDN 控制器对网络节点提供的开放接口进行管理,实现对网络功能和行为的按需管控和新业务的快速部署。斯坦福大学团队设计的OpenFlow 模型成为控制平面可编程性的主要标准接口协议。然而,OpenFlow 协议仅仅定义了控制器与转发设备间的行为机制,通过控制器向网络设备下发转发流表,实现流量转发。网络的可编程性局限于控制平面,数据平面的可编程性仍旧受限,成为制约网络性能的瓶颈。随着新一代高性能可编程数据分组处理芯片及数据平面高级编程语言的出现,以软件编程方式设定数据分组的处理流程并在芯片中编译执行成为现实。通过使用可编程芯片以及对应的可编程语言,可以实现对转发行为的定义,完成访问控制列表(ACL,access control list)过滤、路由策略、修改分组内容、队列调度等功能,实现数据平面的可编程。当前,随着数据中心、云计算等场景的兴起,服务器端CPU(central processing unit)的负担逐渐加重,网络接口卡(NIC,network interface card)可编程成为一个新的趋势,智能网络接口卡(即Smart NIC)可以将网络虚拟化、负载均衡等功能从服务器CPU 中卸载,从而为应用提供更多的处理能力。因此,当前网络可编程主要集中在编程语言、可编程芯片、智能网络接口卡的研究上。
数据平面高级编程语言的出现为用户自定义网络数据分组处理流程提供了基础。P4 是目前主要的数据平面编程语言,其核心设计目标体现在3 个方面:1) 可重配置性,交换机的分组处理方式可以修改;2) 协议无关性,交换机对数据分组的处理方式不受协议限制;3) 平台无关性,管理员对数据处理方式的描述不受底层平台限制,编程实现与平台无关。P4 的抽象转发模型建立在OpenFlow 的“匹配−动作”模式基础之上,主要包含解析器、多级流水线和缓冲区3 个部分。P4 程序的工作流程包括配置和运行2 个阶段。P4 的语言规范定义了管理员处理数据分组的范式,目前主要有P4 14 和P4 16。PISCES[24]基于P4 高级编程语言在数据平面的深度可编程性提出了协议无关的、可编程的软件交换机,其解析、匹配、操作执行等代码通过P4 编译器生成代码。除P4 之外的数据平面领域特定语言还有POF(protocol oblivious forwarding)、Click、packetC、PX、NPL(natural language processing)等。
可编程芯片是在网络中提供发送和接受逻辑的微处理器,它打破了转发设备功能固定的限制,配合可编程语言可以快速地开发和部署新的网络功能。可编程芯片的转发逻辑不是在硬件中固定的,而是由网络运营商或交换机制造商编译到芯片上的可编程语言程序决定的。可编程芯片软件开发环境提供了更多的新增功能,如编译器、调试工具等,允许数据层面的自定义功能。当前,根据使用的芯片技术可大致分为以下几类:专用集成电路(ASIC,application specific integrated circuit)、现场可编程门阵列(FPGA,field programmable gate array)、网络处理器(NP,network processor)等。Barefoot 公司生产的Tofino 芯片是业内第一个支持协议独立交换架构(PISA,protocol independent switch architecture)的可编程ASIC 芯片,并且是P4 可编程的。目前还有众多设备厂商基于PISA 架构设计交换芯片,如 Cisco、Mellanox 等。P4 FPGA[25-26]提出了将P4 程序编译到FPGA 固件的框架结构。在P4 FPGA 中利用P4 程序生成适于仿真应用的BSV 代码,其主要包含对P4 管道和其他基础结构的描述。
智能网络接口卡通过编程转移CPU 的大量功能,比如OpenvSwitch、VxLAN 等,从而节省了CPU 资源,提高应用的性能。Smart NIC 采用可编程的数据平面,可以根据需要在硬件上更新分组交换规则和数据处理协议。Smart NIC 的可编程性可通过3 种方式实现,分别是基于特定应用集成电路实现、基于现场可编程门阵列实现和基于将CPU与标准NIC 功能组合在一起的系统芯片实现。大多数Smart NIC 增加了对可编程语言P4 的支持,可以使用标准的开发工具进行编程,因此运营商可以使用Smart NIC 厂商提供的软件工具,自行开发定制化软件或提供接入服务。Xilinx 公司开发了SDNet开发环境,其在数据平面中可重构网络元素的部署方面被广泛应用。该公司基于SDNet 开发环境提出了称为“Softly Defined Line Card”的下一代Smart NIC 架构,该架构通过数据分组处理器和可编程流量控制器共同组成定制的数据层面。
网络的深度可编程有助于实现充分调度网络资源,提高应用性能。在网络状态信息的收集、负载均衡和网络安全等方面的灵活性都有突出表现。可编程还减少了技术更新的成本,促进了网络运营商、设备生产商、服务提供商的协同合作。目前越来越多的项目开始关注网络的深度可编程,如开放网络基金会在谷歌的支持下推出的Stratum 开源项目、微软正式发布的SONiC 开源项目,均旨在构建一个开放的软件网络系统。未来,在高可编程业务场景的需求导向下,网络设备还需要具备更大程度的开放性,可编程数据平面需要攻克数据分组处理流程与转发设备绑定等问题,建立开放的协议无关可编程网络环境,支持核心功能可编程,实现协议与网络功能的快速定制与重构。
未来10 年内,可编程网络不仅需要能够向下精确控制数据分组的处理过程,还需要向上形成一个可验证的闭环控制管理网络。使未来网络能够自上而下地进行“零接触”的网络控制操作,同时结合强大的硬件生态系统,利用深度可编程的方式来加速未来网络的创新发展。
传统以太网、IP 网络主要基于“尽力而为”的分组转发机制设计,从机理上欠缺面向业务的服务质量保障能力。运营商网络为了给用户提供基础的差异性、按需服务能力,往往采用接入限速、网络轻载的方式实现,这在一定程度上满足了大客户专线业务的差异化需求。然而,随着网络业务需求大规模从消费型向生产型转变,未来业务应用对网络的端到端服务质量保障能力提出了更高的要求。在此背景下,确定性网络的概念被业界提出,并逐步成为学术界和产业界研究和关注的热点。
确定性网络的核心是为应用提供确定性的服务保障能力,这些确定性能力根据需求可包括带宽、时延、时延抖动、分组丢失率等多个指标。总体来看,确定性网络应用主要包含三大类场景:一是面向未来沉浸式交互体验的新型业务,如交互式AR/VR、全息通信等,需要保障网络的带宽和实时性;二是面向工业互联网场景的应用,如工业自动化、远程工控、工业遥操作等,主要对网络的时延和时延抖动提出了更严苛的要求;三是具备快速移动的实时交互场景,如车联网、自动驾驶、车路协同等,主要对网络的时延、抖动、分组丢失等方面提出了多维指标要求。网络确定性整体架构如图3所示。
图3 网络确定性整体架构
L1 层的确定性网络技术主要是FlexE/FlexO 技术,FlexE 也称为灵活以太网,是由OIF(Optical Internetworking Forum)发布的通信协议,其基本思想是通过增加时分复用的 Shim 层实现 MAC(medium access control)层与PHY(physical)层的解耦,得到更加灵活的物理通道速率,从而实现链路捆绑、子速率和通道化3 种应用模式,承载各类速率需求业务。2016 年3 月,灵活以太网研究小组发布FlexE1.0 标准,实现100GE PHY 的支持,单个时隙对应带宽,即时隙粒度为5 Gbit/s,确定了管理信息传递通道,但没有确定同步时钟信息如何传送。2018 年6 月,OIF 又推出了FlexE 2.0 版本标准,确定了200GE、400GE PHY 的承载方案,并通过合并5 个5 Gbit/s 的时隙,实现了25 Gbit/s 的时隙粒度。2018 年11 月FlexE 2.1 标准制定项目启动,旨在对FlexE 2.0 进行扩展,增加50GE PHY和50 Gbit/s 时隙粒度的支持。此外,BBF(broad band fourm)在2017 年5 月启动“network services in IP/MPLS network using flex ethernet”标准项目,以实现通过FlexE 接口在IP/MPLS 网络中实现增强QoS 功能框架,并基于现有网络兼容支持FlexE 接口隧道技术。IETF(Internet engineering task force)启动了FlexE 控制平面标准制定工作,以实现接口隔离、网络分片等技术。基于灵活以太网的网络切片方案能够实现带宽按需灵活分配,并且专用硬管道能够实现安全、低时延的服务质量。L1 确定性网络技术能够通过PHY、MAC 层协同调度,实现时隙交换以保证时延、提高带宽利用率,也能够与SDN 技术结合实现对L1 层的传输控制,实现网路动态调整。目前灵活以太网技术主要用于5G 承载网场景,作为未来网络体系的基础性技术,还将进一步扩展至其他网络场景。
L2 层的确定性网络技术主要是TSN(time sensitive networking)技术。TSN 技术是IEEE 802.1工作小组中的TSN 工作小组发展的系列标准,于2012 年由已有的AVB(Audio Video Bridging)工作小组更名而来,并在2015 年合并互联网工作小组。在TSN 参考网络架构中,每个节点都有对应的同步时钟和数据队列,时钟用于同步计算,队列用于处理数据优先级,包括针对高动态数据的快速通道方式、抢占式机制。通过各个机制的协同,TSN为数据传输提供确定的传输路径与确定的传输时隙从而实现有界低时延传输。目前,TSN 相关机制标准仍在逐步完善中,2011 年工作组发布了IEEE802.1AS-Rev(时钟同步),实现了相差500 ns以内的时钟同步,现在仍在起草阶段的IEEE802.1AS-Rev 进一步引入了时间敏感应用所需的新特征,支持故障切换并改进了测量精度。在2015 年,IEEE802.1Qbv(时间感知队列)发布,为流量传输提供确定的时隙,与IEEE 802.1Qbu &IEEE 802.3br(转发与队列机制)结合可以进一步降低时延。之后工作组又在IEEE802.1Qcc(系统配置)制定了TSN 的端到端资源管理和配置标准,发布IEEE802.1CB(冗余数据传输)提供系统故障转移的容错能力。作为当前实现L2 确定性网络最成熟的技术,TSN 技术主要应用方向有专业音视频、汽车控制、商用电子、工业控制和需实时反馈的工业领域。工业领域各企业在2016 年成立整形器小组加入TSN 技术研究,并构建了多个测试床。2019年,IEC 与IEEE 合作成立IEC 60802 工作组,以便工业领域的TSN 开发可以实现底层的互操作。同时,OPC UA 基金会成立工作组,将TSN 技术与OPC UA 规范融合,以提供适用于智能制造、工业互联网领域的高带宽、低延时、语义互操作的工业通信架构。
L3 层的确定性网络技术主要包括确定性网络(DetNet,deterministic networking)等技术。2015 年,IETF 成立了确定性网络工作组,侧重于为L3 层数据提供确定性的时延、分组丢失、抖动以及高可靠性,将确定性网络通过IP/MPLS 等技术扩展到广域网上。DetNet 技术核心思想是,主要面向全局性大网场景,借鉴TSN 的机制和架构,在统计复用的基础上提供确定性时延和抖动。其核心旨在定义一种通用架构,对数据平面和L3 超低时延操作、管理和维护进行标准化,涉及多跳路由的时间同步、控制和安全性,动态网络配置及多路径转发。目前,实现DetNet 只提供了基本架构及用例、数据平面MPLS/IP/SRv6 方案、配置模型等草案,还没有形成标准化文档,另外OAM(operation administration and maintenance)、QoS 等机制也在不断研究探索中。此外,华为公司目前在确定性网络提出了DIP(deterministic IP)方案,通过“时隙+门控”的方案,保证三层网络每一跳的严格时延上限,进而保证任意端到端的超低时延及抖动。
总结起来,面向未来业务需求,网络确定性服务成为重要驱动力,然而确定性网络技术目前还处于研究初期,还存在诸多挑战。在系统架构方面,需要进一步解决精确时间同步、整形与反压、复杂拓扑、多路协同、端到端、平滑演进等关键问题;在转发平面技术方面,需要进一步解决转发不确定性、多打一、微突发、抢占、排队算法等核心技术;在控制平面技术方面,需要攻克全网时隙规划、即插即用、拥塞控制、带内控制、非实时控制以及虚拟隔离等技术难题;在管理平面技术方面,如何构建低开销OAM 监控、故障容错和安全防御机制,以及跨广域编排成为下一步需要解决的重点;在部署模式方面,如何实现分布式部署与集中式部署的折中与权衡,并确保各层技术之间的有效融合都是值得进一步研究的关键问题。
如今互联网技术正面临巨大变革和机遇,未来网络在业务形态和业务需求上都将发生巨大的变化,确定性与差异性服务的需求日益增多。各层确定性技术融合的确定性主干网的构建是生产型网络发展的必然趋势。确定性网络互联性的增强、融合网络的控制、资源管理以及安全性策略也将是确定性网络日后的研究热点。
虚拟现实、工业互联网、车联网、自动驾驶等新业务需求快速发展,不仅需要网络具备高数据传输速率,还需要具备高速缓存和计算能力,传统网络中计算和存储的分离模式难以满足这些新业务的要求。随着存储技术的发展,存储设备成本不断降低,并行计算、高性能计算、效用计算等技术不断成熟,云计算、雾计算等技术逐步应用,网络/计算/存储一体化并在一体化平台中融入内容分发能力成为未来网络技术发展的重要趋势。针对这一趋势,学术界和产业界也进行了大量的探索和创新,网络与存储融合相关技术包括内容分发网络、对等网络、信息中心网络等,网络与计算融合相关技术包括云计算、雾计算、边缘计算等,网络、计算和存储的统筹协调包括多云管理、云网协同、SDN 技术与ICN(information-centric networking)技术结合等解决思路,以便为未来网络和应用提供更好的服务。
CDN(content delivery network)和P2P(peer to peer)技术是在应用层利用网络基础设施的存储和处理能力来提升网络的内容分发和检索能力,但在内容共享、可扩展性、移动性等方面具有局限性[27]。为有效解决这些缺陷,ICN 更多地关注内容本身,将传统的端到端通信模式转变为基于内容的检索方式,在网络层支持节点对内容的存储和处理能力。根据缓存位置可将ICN 缓存方式分为路径上缓存和非路径缓存[28]。典型的ICN 方案之一是命名数据网络,NDN 保持ICP/IP 协议架构的细腰模型,在网络层放置数据名称,文献[29]介绍了NDN 路由器的详细数据传输过程。目前,大规模扩展NDN仍面临替代式部署等方面的严峻挑战,但其命名机制、缓存机制等技术对未来推动网络、计算、存储一体化起到了很好的参考作用。
云计算可利用集中的大量计算资源协助用户执行计算任务,有效解决了用户算力有限的问题。为了解决用户远离云导致的实时性业务无法保障、计算任务长距离大规模迁移成本高等问题,思科提出雾计算作为云计算的补充,采用分布式计算范式提供更靠近用户的计算资源,可为实时应用提供低时延服务。为解决移动云计算的长时延问题,业界提出了移动边缘计算[30],允许在网络边缘对应用提供计算支持,具有低时延、节能、实时感知、隐私及安全性等方面的优势。边缘计算等的基础设施靠近用户侧,如园区、工厂,在未来可能推动新的开放、协作生态系统的构建,为电信运营商的运营模式带来新的变革机遇。
网络/计算/存储一体化核心技术研究涉及构设计、在网计算、转算存融合协议、智能分发机制等方面。文献[31]提出一种统一架构,结合SDN 思想、ICN 缓存及计算技术,实现网络、计算和存储资源的动态调度以满足无线网络的需求。文献[32]认为,网络、存储和计算的互操作融合是构建可扩展部署的分布式系统的必要条件,融合基础架构的跨层结构必须简单、通用。
总体来看,未来网络将是智能化的网络,网络应该具备利用节点的通信和计算能力优化性能的自学习能力[33],如何表征这些参数,使用什么样的学习策略均有待研究。此外,面向网络/计算/存储一体化背景,如何设计更有效的缓存更新规则,如在线学习、实时更新,是值得思考的问题[34]。同时,移动边缘网络中涉及网络、计算和存储等各种资源,如何协调这些资源以实现良好的用户体验及应用的最佳性能,如何更好地对这些资源进行分配,提高一体化平台的可扩展性、开放性和安全性也是值得考虑的重要问题。
随着信息通信技术和人工智能技术的发展,人类社会正快速向着信息化、智能化的方向迈进。人工智能技术为人类社会的持续创新提供了强大的驱动力,开辟了广阔的应用空间。在计算机网络领域,人们普遍认为人工智能技术与网络的结合是富有前景的。总体而言,网络人工智能可以分为人工智能优化网络和网络优化人工智能2 个方面。一方面,机器学习和深度学习的快速发展为计算机网络研究注入了新的活力,种类繁多且不断增加的网络协议、拓扑和接入方式使网络的复杂性不断增加,通过传统方式对网络进行监控、建模、整体控制变得愈加困难,可以将人工智能技术应用到网络中来实现故障定位、网络故障自修复、网络模式预测、网络覆盖与容量优化、智能网络管理等一系列传统网络中很难实现的功能;另一方面,网络性能的提高也为机器学习计算提供了更好的支持,随着训练数据量的迅速增加和机器学习模型变得越来越复杂,计算需求超出了单机的能力,因此产业界已经出现了数十个分布式机器学习平台,但是昂贵的通信成本导致这些平台出现多个瓶颈,网络优化(例如网络拓扑结构、网络通信和传输协议的优化)极大地提高了这些分布式机器学习平台的整体性能。
人工智能技术用于优化网络首先需要考虑数据收集问题。数据收集一般可分为离线和在线2 个阶段,离线阶段主要收集大量用于模型训练和测试的历史数据;在线阶段用于收集实时网络数据作为模型的反馈或者新的输入[35]。文献[36]考虑到边缘计算网络中汇总数据的困难性,使用梯度下降方法训练了一组支持分布式参数学习的通用模型,并提出控制算法实现局部更新和全局参数聚合之间的折中。文献[37]针对多媒体物联网(IoMT,Internet of multimedia things)应用结合机器学习提出一种基于隐私保护的数据收集和分析框架。文献[38]使用无监督学习对设备的通信流量进行建模,通过分析设备的网络通信流量来识别IoT 设备的类型。
流量预测对网络的管控和维护具有重要作用,传统的方法是使用时间序列预测进行处理,文献[35]调研了基于时间序列和非时间序列流量预测问题的机器学习方法。文献[39]结合网络流量估计和异常检测两项任务设计了一种估计源和目的地之间网络流量的新方法。针对移动网络场景,文献[40]针对未来智能蜂窝网络的精准流量建模和预测,提出基于深度学习的预测模型;文献[41]根据用户需求和网络的移动特性提出一种基于深度学习的空闲时间窗口预测模型,并使用时间图卷积网络表示学习网络。文献[42]介绍了SDN 中机器学习技术在流量分类、路由优化、QoS 服务质量/QoE 体验质量预测、资源管理方面的应用。
使用人工智能技术对网络进行优化的研究涉及网络的各个方面。文献[43]研究了与网络流量控制系统优化相关的深度学习技术、系统工具和平台以及典型应用。文献[44]通过离线学习和在线学习2个阶段分析网络状态,优化了自适应比特率视频在网络中的传输。文献[45]提出基于深度对抗神经网络的新型网络切片方法,允许网络提供商实时将计算、存储等资源进行联合分配。文献[46]基于强化学习和神经网络方法解决分布式计算集群中数据处理任务的调度问题。文献[47]基于在线学习思想,利用梯度进行速率控制,从而实现在稳定性和灵敏度上的平衡,优化了网络拥塞问题。文献[48]探索了数据驱动方式作为核心算法代替传统网络路由协议的问题,通过将路由问题转化为机器学习问题,证实了方案的可行性和优越性。
另一方面,随着深度学习和强化学习的普及,两者都对计算能力提出了越来越高的要求,耗时的训练过程和繁重的工作量甚至使在一台机器上无法完成这些任务,因此分布式机器学习被认为是必然的发展趋势,成为业界的研究热点。一般而言,在构建高效的分布式学习平台时,需要考虑网络拓扑、传输协议等重要问题。
网络拓扑的设计会对参数同步时间以及系统整体性能产生重大影响。到目前为止,已有2 种类型的网络拓扑架构被提出,即基于参数服务器的结构和基于环的结构。参数服务器架构下,各节点分为参数服务器和工作机器。工作机器只负责计算模型梯度,彼此不会互相通信;参数服务器则负责汇总来自不同工作机器的模型梯度,并对原有参数进行更新,然后下发到工作机器上以便开始下一次迭代。基于环的架构则是一种去中心化的架构设计,在此架构下,所有节点以环状排列,各节点仅与其前后2 个相邻节点通信,通过相应的同步算法(例如Ring-allreduce),可以实现快速参数同步,避免产生中心化的通信瓶颈。
除网络拓扑外,传输协议对参数同步性能也具有重要的影响。尽管TCP 在广域网中取得了巨大成功,但由于其在拥塞控制以及系统实现方面表现不足,不太适用于专用的分布式机器学习系统。为改善其网络性能,远程直接存储器访问(RDMA,remote direct memory access)技术被应用于分布式机器学习系统。RDMA 规避了TCP 的上述限制,RDMA 内核旁路机制允许应用与网络接口卡之间的直接数据读写,将服务器内的数据传输时延降低到接近1 μs。同时,RDMA 内存零拷贝机制允许接收端直接从发送端的内存读取数据,极大地减少了CPU 负担,提升了CPU 效率。根据某知名互联网厂商的测试数据,采用RDMA 可以将计算效率同比提升6~8 倍,而服务器内1 μs 的传输时延也使SSD(solid state drive)分布式存储的时延从ms 级降低到μs 级成为可能,在最新的NVMe 接口协议中,RDMA 正逐步成为主流默认网络通信协议栈。为了提高数据传输速度、满足用户需求,阿里巴巴、亚马逊、微软、华为等主要云厂商都在投入该技术的研发和部署。
智能化网络已成为未来网络发展趋势,网络运营和运维模式将发生根本性变革,网络将由当前以人驱动为主的管理模式,逐步向网络自我驱动为主的自治模式转变。当然,面对大规模网络的管理需求,网络人工智能方面的核心算法和理论还有待突破,大规模的复杂网络如何进行训练、不同层级的人工智能技术如何协作等关键技术还需要研究。另一方面,深度学习服务集群可以从高性能的网络中受益,然而现有的网络拓扑和通信协议仍存在很多问题,例如对于参数服务器架构,参数服务器节点上的带宽将成为整个计算机集中式拓扑的瓶颈,而基于环的拓扑缺乏容错能力,RDMA 网络也存在与现网难以兼容、对分组丢失敏感等缺陷。
区块链可以定义为一种融合多种现有技术的分布式计算和存储系统,它利用分布式共识算法生成和更新数据,利用对等网络进行节点间的数据传输,利用密码学方式保证数据传输和存储的安全性。通过大多数节点认可的数据可以被记录在区块链上,这些数据不可篡改,因此人们可以基于这些数据实现价值转移以及其他可信活动。从历史发展的角度来看,蒸汽机释放了人类的生产力,电力解决了人类的基本生活需求,互联网彻底改变了信息传递的方式,而区块链作为构造信任的机器,具备去中心化、公开、透明以及安全等特性,能够解决当前中心化应用权力过大的问题,以低成本的方式充当信任中介并证明价值。因此,区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术,可能会改变人类社会价值传递的方式。
目前,世界范围内各研究机构都在积极研究并推动区块链技术的发展与应用,我国也对区块链高度重视,相关政策文件中明确要求加快推动区块链技术和创新应用,探索“区块链+”模式,促进区块链和实体经济深度融合。但目前区块链在技术层面仍然存在诸多问题,主要体现在性能吞吐、跨链互通、安全隐私等方面,导致区块链目前仍然无法进行大规模产业落地与应用,上述问题需要从网络层面得到有效解决。而对于互联网基础设施而言,区块链的发展反过来也能够有效解决身份认证、标识解析、路由等层面的安全可信问题。
区块链作为分布式账本解决了数据的可信问题,但由于共识机制的引入,导致了区块链的记账速度相比于传统应用严重不足,如VISA 的日常吞吐量大约是2 000 Tbit/s,峰值可以超过5×104Tbit/s,支付宝处理交易的峰值则超过30×104Tbit/s,而比特币只有7 Tbit/s,以太坊约为20 Tbit/s,性能严重不足已成为目前技术层面影响区块链规模应用的最大问题,其主要原因包括:公链需要在保证强一致性的同时,防止节点作恶、网络因素导致在吞吐量过高的情况下出现丢块现象、合约引擎确认机制速度过慢等。针对此,公链交易的高吞吐网络机制有待重点研究突破,如共识算法与机制优化、共识的P2P 网络传输优化、区块数据的DAG(database availability group)结构改造、区块数据的分片与侧链等,以提高区块链整体吞吐量性能。
目前区块链的种类繁多,但各链的网络与数据无法做到可信的互联互通,导致了区块链的孤岛问题,需要通过跨链技术来实现链间的可信互通。跨链泛指2 个或者多个不同链上的资产与状态通过一个可信的网络机制互相转移传递与交换,链与链之间的关系不仅是主侧的关系,也可以是对等的,链上资产不仅可以双向锚定,也可以相互可信兑换。跨链是区块链3.0 时代的重要技术特征,跨链交易验证、跨链的事务管理、锁定资产管理、多链协议适配等核心技术问题有待研究,例如,结合区块链虚拟化等新型区块链网络架构实现一套完整的跨链可信互联互通方案。
传统互联网的身份认证、标识解析、路由同步主要通过PKI(public key infrastructure)、DNS 和BGP 等技术来解决。PKI 和DNS 的技术体系均采用了集中式权威根节点加分级缓存解析的架构,这存在巨大的单点风险,一旦发生对于权威根节点的蓄意攻击或者破坏,将对整个互联网的稳定性造成巨大影响,通过区块链技术,可实现对身份认证与标识解析的可信存储,从根本上实现相关数据源的不可篡改,这对于工业互联网、产业互联网尤为关键。BGP 是实现互联网全球互通的基础,但BGP经常发生路由劫持与路由泄露问题,一旦发生类似问题将导致大范围的网络故障,该问题难以得到有效解决的原因是传统网络中缺乏对于路由数据的可信验证手段,可结合区块链技术对运营商的路由数据进行可信记录,对于恶意或者错误的路由发布进行过滤,从而解决劫持与泄露问题。另外,针对互联网流量交换架构和模式存在的问题,新型交换互联中心正成为新的研究热点,区块链技术依据去中心特征,也可能在新型交换互联中心这一天然的多方互信环境中得到应用,以降低网间互联成本。
随着云计算、边缘计算、5G 的发展,在传统IaaS(infrastructure as a service)、PaaS(platform as a service)、SaaS(software as a service)的基础上,又出现了FaaS(function as a service)、LaaS(link as a service)、NaaS(network as a service)等概念。各类ICT 能力以XaaS 的形态出现,在技术上极大地弱化了运营商的概念,跨运营商的多网、多云、多边间的ICT 能力协同将可能成为未来网络的重要趋势。借助于区块链/智能合约在技术层面所提供的绝对可信性,有利于形成多中心化、甚至于去中心化的云网基础设施,从而实现真正的分布式网格。
随着网络的使用范围和涉及领域不断扩大,网络的安全问题受到越来越多的关注。我国网络用户数量居世界首位,网络技术广泛应用于政治、经济、文化等各个方面,保障网络安全对国家发展具有重要意义。但网络系统存在的诸多特征导致传统的信息系统安全模型无法很好地适应系统安全保护要求,统计分析、机器学习和可视化等技术逐渐应用于安全分析,以应对高级威胁检测和攻击溯源的海量数据,提升分析效率和准确度。
传统网络和安全相关孤立,缺乏一体化设计,未来网络的安全框架需要与网络架构统一设计,即融合为一体化的智能安全网络。同时,智能安全网络可将人工智能技术应用于网络安全领域,具备高效的风险预测、感知和识别能力,支持网络故障和威胁的快速定位,并能够根据网络状态选择最佳策略对问题进行处理。业界针对网络安全问题进行了大量研究,网络安全保障体系的构建可从信息保护、入侵检测和故障恢复三方面进行。
信息保护常用的技术包括数据加密、数字签名、访问控制、接入认证等,防火墙即为一种典型的访问控制方式。智能安全网络通过全分布式防火墙,实现全分布式安全功能框架及基于实时遥感技术的主动防御,解决网络组网、安全的性能和效率问题。该防火墙可部署于数据中心边缘、应用近端、边缘交换机及协议栈底层,有效防护网络威胁。不同网络环境及应用场景下的安全防护方式具有不同的特点。文献[49]对物联网环境下的设备和资源保护问题,对访问控制方法主要趋势及现有授权架构进行了总结。文献[50]介绍了云计算环境中使用的访问控制机制。文献[51]提出基于完全同态加密技术的解决方案解决医疗数据存储到云上的隐私保护问题。
对于DDoS(distributed denial of service)攻击、病毒等威胁网络安全的行为,网络需要及时识别并处理,随着网络环境的变化,攻击的形式呈现多样化的特点,研究能够识别未知攻击的入侵检测系统成为新的趋势,文献[52]介绍了基于机器学习的入侵检测相关研究。为进一步提高网络入侵检测的准确性及灵活性,文献[53]提出了一种用于入侵检测的新型深度学习技术。智能安全网络通过人工智能技术实现主动的DDoS 压制能力,关键技术包括动态加载的多点采样、基于机器学习的流量模型监控及主动探测、多级动态DDoS 缓解。
网络需要具备快速恢复能力以应对攻击行为,相关技术包括分布式动态备份、故障定位、快速恢复与修复算法等。文献[54]提出了一种数据中心网络中的共享备份方案,支持按需故障修复且应用无感知。文献[55]设计了主动探测技术对路由器中断进行探测。文献[56]研究了在大规模故障条件下故障位置不确定的网络恢复方案,将问题建模为混合整数线性规划问题并提出迭代随机恢复算法渐进式地恢复网络。智能安全网络利用人工智能技术对网络中的异常告警关键信息进行分析处理,通过过滤、筛选、匹配、分类等流程实现网络故障的快速定位和诊断。对于故障预测,智能安全网络可基于实施运行状态的监控数据,利用长短期记忆神经网络学习系统状态,完成对短期内系统错误的预测。故障预测与故障定位技术相结合,将能够有效保证网络故障的快速响应和恢复。
总体来说,现有网络安全问题基本只能通过被动打补丁的方式解决,形式被动,成本高且存在中心化问题,智能安全网络中的基础设施应具有内生安全防御能力,即通过在网络层内置安全属性,结合区块链等新技术设计网络信任体系,实现端到端安全传输、认证及管理。人工智能技术的蓬勃发展为网络安全提供了新的思路,如何在网络中深度融合深度学习等技术增强信息保护能力、提高入侵检测的有效性和可靠性、实现网络故障精准定位和快速恢复,是智能安全网络建设过程中值得思考的问题。此外,智能安全网络在工业互联网、智能交通、边缘计算等应用场景下的数据隐私、接入控制、授权、信任等问题也有待进一步攻关研究。
地面无线通信近几年呈现爆炸性增长的趋势,但由于网络容量和覆盖范围的限制,地面通信难以实现全球覆盖,也无法为海洋等恶劣环境提供高速、可靠的无线接入服务,利用新的网络体系结构满足物联网、云计算等各类新兴应用的需求成为一大热点。
网络空天地海一体化以地面网络为基础、以空间网络为延伸,承载天、空、陆、海各类网络业务,为各类用户的活动提供信息保障。当前国外在天地一体化网络领域侧重于对卫星-地面网络的研究,美国致力于商用天地一体化网络的大规模建设,如Starlink 计划大规模制造并发射低成本低轨卫星、Google Loon 项目已推进到商业化阶段。欧盟侧重于卫星−地面网络与5G 网络融合的架构研究,特别是与SDN/NFV 的结合,H2020 计划下的多个相关项目已经给出系统原型。我国目前已设立天地一体化信息网络重大工程以及低轨卫星网络建设计划。
空天地海一体化网络具有规模庞大、拓扑结构立体多层次化、高度异构性、业务种类繁多等特点,设计一套结构清晰、功能简捷、易于高效实现的网络体系结构,使网络既能适应通信技术的快速发展与变化,又能支持层出不穷的新型应用,是空天地海一体化网络需要解决的首要问题。目前空天地海一体化组网技术研究主要包括一体化组网架构设计、适用于大规模高异构性的空间网络协议族、高动态轻量级移动性切换机制、多维网络资源协同管理控制技术研究四个方面。
空天地海一体化网络的基础设施主要包括高中低地球轨道卫星、高空飞行器、海上移动设备、地面设备等。不同设施在覆盖范围、传输时延、带宽成本、容量、频率等方面具备不同的特征,空天地海一体化网络组网架构设计的关键在于充分利用各类设备的特点组成复合协同网络,并结合SDN等网络领域新技术,提升系统可控性,实现对各类业务的高效承载。文献[35]提出一种具有分层结构的软件定义空天地一体化网络体系结构,利用空天地网络的优势为各种车载服务提供高效支持。文献[57]提出了一种结合地面网络的天基信息系统,提供精准、实时的地理空间信息服务。
网络空天地海一体化需要满足空、天、地、海四大场景需求,具备大规模、高异构性的基本特点。在天地一体化领域,相关学者已提出了CCSDS(consultative committee for space data system)、DTN(delay/disruption tolerant network)、快照、IP 等多种网络协议。面向航天器可以采用CCSDS 协议,间歇性连接情况下可以采用DTN 协议,规律性运动情况下可以采用快照协议,地面表用户可以采用IP协议实现宽带组网应用,最近还有研究人员提出将内容中心网络协议用于该领域,但具体的场景适配还需要进一步研究。
空间网络节点,如低地球轨道卫星的高动态运动会导致连接的频繁切换,网间移动切换过程往往面临较高的切换时延及数据丢失。在空间网络资源有限的情况下,高动态轻量级的移动性切换机制尤为重要。低地球轨道卫星网络中的切换方案大致可分为链路层方案和网络层方案两大类。其中,链路层方案包括点波束切换、卫星切换和星间链路切换,网络层切换可根据连接传输策略划分[58]。针对卫星网关间的切换,目前已开发出多种智能网关分集方案来保证网络性能,并提出使用机器学习、网络编码等技术提高网关间协调策略的有效性和预测算法的精确度。对于空、天、地、海网络系统间的无缝过渡,星地间网络切换需要保持透明,文献[59]提出使用S1 和X2 这2 种切换过程。
面向天基网络与地面网络的融合需求,SDN、NFV 等技术逐步应用于天地一体化网络,实现空间网络与地面网络的高效管控和互联互通。其中,涉及多维网络资源虚拟化切片和服务质量保障、应用驱动的网络控制、按需网络资源调度、安全可靠的网络管理等关键技术。文献[60]针对5G 卫星集成网络提出一种基于SDN 的流量分配策略,利用卫星链路容量的动态可控最大化网络利用率。文献[61]提出基于哈希链的身份认证和隐私保护方案,利用区块链技术增强SAGIN(space-air-ground integrated network)安全性。
总体而言,空天地海一体化是超大规模、高复杂度的立体通信网络,如何在保证卫星网络、海洋网络等内部网络正常运转的情况下,充分发挥各类网络的优势,为未来的新应用提供高效、经济、实时的服务是网络空天地海一体化面临的严峻挑战。这方面的研究尚处于起步阶段,网络架构异构设计、资源约束下的流量工程、服务质量保证、设备频繁变动下的路由算法、移动性管理等诸多方面还需要深入研究。我国关于空天地海一体化网络的研究起步不久,受到全球建站和频率轨位资源的限制,在很多方面面临较大挑战,亟须利用我国在航空航天工业和互联网产业的技术基础,积极布局这一重要领域。
未来网络的核心在于大规模可扩展、支持异构技术融合、高效的网络基础体系结构,包括各种新型网络架构和解决当前网络问题的新技术、新方案。随着网络与实体经济的不断融合,未来网络逐渐成为战略新兴产业的重要发展方向,预计到2030年将支撑起万亿级、人机物、全时空、安全、智能的连接与服务,未来网络的发展方向总结如表3 所示,具体说明如下。
1) 提出新型网络体系架构。探索面向2030 年及以后的新型网络应用及需求已经成为全球未来网络技术研究的焦点,如前文所述,国外ITU-T 组建了网络2030 焦点组、国内成立了网络5.0 产业技术联盟,以华为代表的传统网络设备制造也提出了可变长地址(Flexible IP)、确定性转发、去中心化互联网基础设施、内生安全等一系列前瞻性技术,因此,开展新型网络体系架构的设计已成为了未来网络发展的主流趋势。在此基础上,如何开展原创性、颠覆性网络架构验证,如何有效测试新技术的可行性也是新型架构设计中被讨论的热点问题。江苏省未来网络创新研究院、网络通信与安全紫金山实验室、鹏城实验室分别展开了未来网络试验设施、长三角一体化综合试验环境、粤港澳湾区网等为代表的新一批网络试验环境的建设,以期能够促进我国的原创网络技术创新。因此,合理地预判未来应用的发展、评估网络重大需要、设计未来新型网络架构成为网络2030 所要解决的首要问题。
2) 支持确定性网络控制与服务。随着网络应用对网络服务质量需求的不断提高,现有“尽力而为”的网络越来越难以满足远程医疗、无人驾驶、VR游戏等新需求,并存在大量的拥塞崩溃和数据分组时延等问题,在这样的背景下,如何从“尽力而为”到“准时、准确”,控制网络的端到端时延不仅成为当前全球关注的热点领域,也成为新一代路由器、交换机等转发设备所要具备的功能。在工业领域,国外思科、博通等公司正在面向局域网场景,研制支持时延敏感功能的可编程网络芯片,国内盛科、华为等厂商正在加紧相关技术的攻关,研制国产化芯片;在运营商领域,华为、中兴、信通院、移动、电信、联通等参与了主干网络确定性技术的国际标准的研究与制定;网络通信与安全紫金山实验室、华为等已经开始确定性网络技术的大规模测试。因此,设计局域网时延敏感芯片、设计主干网确定性网络架构、实现端到端网络确定性已成为了下一步网络控制与设备研制的关键问题。
3) 构建去中心化网络应用。随着区块链技术的发展与逐步成熟,金融支付、数据存储等业务的去中心化已被普遍接受,网络相关业务的去中心化也成为下一步发展的重要趋势。传统网络业务、应用与协议虽然物理位置上是分布式的,但是逻辑上是集中式的,例如,DNS、BGP、CDN、云计算等业务都存在一个集中式的节点和运营组织,由此这些应用容易被大型机构所垄断,不利于互联网“平等、自由”发展。在此背景下,以DNS 为代表的根域名解析成为去中心化网络应用研究的首要问题,信通院等单位进行了一系列新型标识解析体系的研究与技术攻关。因此,设计去中心化的新型标识解析体系、去中心化的BGP、去中心化的网络存储等问题都成为未来网络应用的重点。
表3 未来网络的发展方向总结
4) 实现空天地海一体化泛在互联。一方面,随着无线通信频率向太赫兹发展,通信基站信号覆盖的范围也越来越小,需要部署的基站数量和成本呈指数式增长。另一方面,随着物联网、车联网等的飞速发展,人们越来越依赖网络,需要网络提供泛在互联服务。因此,如何实现万物互联、满足人们随时随地的网络连接需求,进行空、天、地、海的全面网络覆盖已经成为新的产业发展方向。国外以SpaceX 为代表的企业、国内以航天、电科为代表的科研院所纷纷展开空天互联网的系统设计与研制,希望实现卫星组网、天地协同,以解决网络全球无缝覆盖问题。此外,国外以谷歌为代表的公司、国内以鹏城实验室为代表的研究机构也正在开展浮空飞艇的研究,以实现低成本区域性网络覆盖。因此,满足未来的泛在互联接入需求,利用卫星、飞艇、6G 等多种方式实现网络的低成本全球覆盖成为技术与产业发展的重要趋势。
5) 实现智能化网络与通信。如今世界正处于人工智能的第三波浪潮,社交网络、物联网和云计算所产生的海量数据为人工智能的繁荣提供了燃料。而同样地,互联网发展至今,单纯的数据运算、问题求解和功能搜索等已经很难适应网络飞速发展的需求,将人工智能与网络技术进行一定程度上的融合,能够促使二者共同发展,爆发新机。目前,将人工智能技术应用到网络中仍处于早期或试点阶段,虽然许多企业认识到了其中的价值,并且可能已经在实验室或试验环境中涉足网络人工智能技术,但迄今为止几乎没有大规模的部署。从长期来看,人工智能与网络相结合的发展空间和作用巨大,网络引“智”,化“繁”为“简”,人工智能将成为实现网络智能化的目标和愿景的重要手段。
传统网络难以满足超高清实时视频、车联网、智慧城市等新业务新场景的需求,未来网络技术研究得到了全球各国的高度重视,学术界和产业界涌现出大量的技术方案,其核心目标是突破未来网络领域核心技术,构建满足当前及未来应用需求的可扩展、安全、智能、可定制的开放网络环境。本文介绍了未来网络领域现阶段的热点技术,由于篇幅所限,只对部分代表性技术进行了阐述,期望通过综述该领域各项技术的已有研究成果,探讨技术发展趋势,为国内相关领域的研究人员提供参考和帮助。