东数西算中多云管理技术应用浅析

2022-12-06 03:28归律王悦张钟琴
信息通信技术与政策 2022年11期
关键词:东数云网多云

归律 王悦 张钟琴

(上海邮电设计咨询研究院有限公司,上海 200092)

0 引言

2015年以来,以通信运营商、互联网厂家为实施主体的云网融合相关技术持续演进,积累了大量的技术和经验。2021年,国家提出了东数西算的战略,同时相关核心枢纽节点布局也在逐步推进落地。之前由于行业特性的约束,云网融合的各类落地大都局限于某个企业内部,而东数西算的提出,使得云网融合真正找到了跨地域、跨企业、跨行业、跨要素的应用落地场景,而跨云服务商(简称“云商”)、跨地域的多云管理技术是东数西算落地的技术前提,同时东数西算战略也为多云管理技术提供了真正广阔的应用场景。本文首先介绍云网融合的发展历程,然后描述东数西算对云网融合尤其是多云管理技术的需求,最后分析多云管理的技术和功能架构及在东数西算中的应用方式。

1 云网融合的背景

随着云计算和网络的互相渗透,信息通信行业需求不断整合变化,使得以网为代表的通信技术(Communications Technology,CT)和以云为代表的信息技术(Information Technology,IT)不断实现深度融合,这是云网融合的基本内涵[1]。

(1)2015—2016年,以中国电信为代表的通信运营商提出了云网融合的总体战略,截至2022年云网融合基本已经发展到了第三个阶段,即云网融合3.0。

云网融合1.0主要实现云网协同和能力整合,云网融合2.0主要实现网随云动和融合赋能,云网融合3.0的特征是实现数字要素升级以及要素集成创新。其中,数字要素包含DC+网+算力+云+大数据/AI+安全+绿色等多种云网要素的一体化统筹、一体化规划、一体化建设、一体化调度和一体化运营,以要素化的联动升级,实现基于场景化的端到端集成[1-2]。

(2)中国联通提出的CUBE-NET 2.0和3.0可以认为分别对应了云网融合1.0+2.0与云网融合3.0[2]。

(3)中国移动提出算网融合战略可以认为是云网融合3.0中的重要要素组成部分和关键落地方式。

云网融合持续向一体化布局、一体化编排、一体化调度深入演进。其中,多云管理成为了云网融合中的核心焦点之一,多云管理主要含义为对不同云商的云网资源实现统一连通和统一调度[3-4]。

2 东数西算的技术需求

2.1 东数西算的提出

为推动数字经济发展,我国陆续出台了多项政策,正加快构建以算力和网络为核心的新型基础设施体系。

2020年12月,国家发展和改革委员会、中共中央网络安全和信息化委员会办公室、工业和信息化部、国家能源局联合发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》,提出“布局大数据中心国家枢纽节点,形成全国算力枢纽体系”的具体要求。要优化数据中心基础设施建设布局,加快实现数据中心集约化、规模化、绿色化发展,加强跨部门、跨区域、跨层级的数据流通与治理。到2025年,全国范围内数据中心将形成布局合理、绿色集约的基础设施一体化格局,东、西部数据中心实现结构性平衡,数据中心集约化、规模化、绿色化水平显著提高,使用率明显提升。

2021年5月,国家发展和改革委员会、中共中央网络安全和信息化委员会办公室、工业和信息化部、国家能源局联合发布《全国一体化大数据中心协同创新体系算力枢纽实施方案》,明确提出布局建设全国算力网络国家枢纽节点,加快实施“东数西算”工程,提升跨区域算力调度水平,构建国家算力网络体系。统筹围绕国家重大区域发展战略,根据能源结构、产业布局、市场发展、气候环境等,在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点,发展数据中心集群,引导数据中心集约化、规模化、绿色化发展[8]。

2.2 东数西算对云网融合的技术需求

总体来看,实现东数西算所需的云网融合技术较为庞杂,涵盖算力基础设施、网络基础设施、编排管理和运营服务、算力封装与感知、云网安全、绿色低碳等,其中算力网络为其核心基础技术,而跨云管理的调度是其核心应用场景(见图1)[9]。

图1 ONAP云网融合技术底座

东数西算可以视作云网融合最新阶段各基础技术要素集成创新的典型场景,目标是实现端到端的算力统一标准化封装编排及自适应调度,将数据流通和算力适配结合起来,将算网的按需使用变为现实。另一方面,东数西算不能单纯地被看成算力和数据的调配,伴随在一起调度的还有安全能力、存储能力、网络能力、绿色低碳能力等,东数西算是一种端到端的云网多要素融合的应用方式。东数西算的现实内涵就是实现跨云的统一调度和编排,其中不同云服务商间的打通成为了难点[6,10,11]。

2.3 东数西算中多云管理的需求

东数西算的现实情况是国内各云商已采用不同的云系统架构和技术体系推出自己的云业务品牌和服务,一般情况下,不同云商的云资源系统是不互通的。在国家实施东数西算工程的大背景下,跨地域、跨网络、跨云商、跨架构的算力、存力资源调度能力成为工程实现的关键要素。

多云管理技术是解决上述难点的重要基础,可提供对不同技术架构、不同模式云的统一集成管理,屏蔽底层不同云商架构和技术体系的差异,提供统一资源管理和调度能力[12]。

3 多云管理技术实现方案

在未来东数西算的场景下,多云调度管理技术实现的互联互通场景包括以下内容。

(1) 异构多云管理:多云调度管理平台通过对接云商API,实现第三方云产品在多云平台的统一纳管,屏蔽底层云平台架构的差异,灵活调度异构算力资源,实现各类应用在异构云间的灵活部署。客户可以通过多云调度管理平台一键订购、开通、纳管及出账,并可实现和相关云商的结算[13]。

(2)云间互联服务:通过多云网络承载和多云调度管理平台能力,满足应用系统在多个异构云资源间的互访与数据传递需求,实现云间数据调度。

(3)多云接入:通过采用通信运营商各类专线产品,连接专线传输网络平面边缘路由和多云调度管理网络平面路由,打通客户专线端到达公有云内部网络接口的虚拟电路通道,形成专线接入各云商资源池客户内部网络的能力[7]。

(4)企业分支互联:用户通过云专网或采用SD-WAN组网上云服务,实现驻地或分支机构接入企业云侧内部系统,全过程由多云调度管理平台网络管理平面自动分发配置并跟踪交付[8]。

多云管理技术可借助多云管理平台实现对各类云资源的管理和调度[24]。

3.1 多云管理平台功能

多云管理平台核心目标为实现跨云商、跨网络的多云接入和资源管理需求,实现专线入云、云间互联、公有云资源分配、整合一点计费和一站式云网管理能力(见图2)。多云调度管理平台将协助企业客户向云转型,依托多租户账户体系实现自助服务交付、按使用量计费、智能运营等支撑能力,提供多云之间的“网随云动”能力,构建低成本、高可靠、扩容灵活且安全合规的云架构IT系统[5,20,21]。

多云管理平台主要应对多云应用场景下的融合问题,以交付最终用户一体化服务为目标,整体协调各方利益满足广义上的云网“使用者”需求,核心价值包括以下内容。

(1)资源整合:构建基于数据中心(Data Center Interconnection,DCI)网络及云商网络接入基础上的云网融合组织及调度能力,提供较完整的互联互通基础服务体系。

(2)流程融合:对接异构资源核心能力标准化接口,实现与第三方异构业务平台信息和流程同步,从而实现异构云网产品的开通流程融合。

(3)能力开放:利用资源互联和接口开放机制,实践增值产品和安全服务体系加载,实现围绕客户为中心的平台赋能架构[24]。

3.2 多云管理平台的技术架构

多云管理平台是在基于多云之间交互的DCI网络平面上构建的云网一体运营管理系统,其技术架构中包括微服务架构、云网接入、运营管理等关键要素。

多云管理平台可采用微服务、模块化、组件化架构设计,通过弹性部署提高自身稳定性和工作效率。采用插件化集成适配技术,提升平台的扩展性和集成能力。通过可视化编排技术提供所见即所得的服务目录,纵向提供端到端的全面服务。具备部门、组织机构管理体系,支持对云租户的映射,实现多云多租户的统一管理和资源分配[24]。多云管理总体技术架构如图3所示。

图2 多云管理平台定位示意图

图3 多云管理总体技术架构示意图

(1)微服务灵活架构

多云管理平台软件实现可基于微服务架构,基础结构如下:平台架构所有的服务具备动态负载均衡、高并发以及高可用能力。可采用容器承载实现分模块按需实现部署容量控制,按需局部平滑升级,不中断业务。可采用内存数据库集群提供系统数据缓存,提升系统可靠性及运行效率。建立分布式同步及集群管理集群为服务发现和注册提供支撑,并与各注册/发现服务维持心跳信号[15,6]。

(2)云网通用接入

多云管理的网络平面自上而下可分为业务运营层、业务编排/协同层、网络采控层和网络承载层。其网络承载层可采用SRv6(Segment Routing v6)+ EVPN(Ethernet Virtual Private Network)等灵活的网络技术实现云网业务极简承载,用户可以方便地接入多云。

多云管理网络将基本网元分为云网关(CECloud Gate Way,CGW)和网网关(PDN Gate Way,PGW)。CGW与云资源池进行预置网络连接,节省云网连接的资源规划及部署时间,构筑泛云生态,为企业提供任意云之间的高速安全互联和混合云服务;PGW负责与用户侧租赁的各运营商专用网络(例如STN、PON以及新兴SD-WAN、5G切片等接入专网)连为一体,覆盖客户各种入云接入的办公场所和托管区域。

CGW与PGW间可通过SRv6技术提供SLA保证路径预部署能力,能够根据业务的带宽、时延等要求,预先部署符合质量要求的业务路径,并通过SRv6封装为网络服务,进而通过标准接口被网络控制器灵活调用,为应用提供所需的连接。

(3)云网运营管理

多云管理面对的是多种复杂的多云网络纳管环境,需具备灵活、弹性的云网运营管理能力,实现组网、入云、互联网访问等全方位的业务综合承载。依赖多云调度管理平台提供的运营管理功能,提供业务和带宽随选、按需调用云网能力,可在客户侧不做任何变动的情况下根据实际业务需求快速增删各类业务。平台需加强业务自动化部署功能,实现云网端到端拉通及协同,提高部署和运维效率。下发的网络配置应适配业务的动态配置,促进网随云动,网络随迁,最终为企业带来云网的灵活承载。

(4)网络切片隔离

多云管理可结合切片管理提供专网级隔离保障能力,对高价值用户提供独享资源,对高等级保障需求的业务进行隔离保障(见图4)。通过将不同用户类型或不同接入类型的专线划分到各自的业务切片中,切片间实现隔离、业务不相互影响,不同的切片内基于业务等级要求配置不同的QoS保障等级。

图4 多云调度管理网络切片管理示意图

此外,面向多云服务商的复杂账号环境,多云调度管理平台需要构建一套独立且外延的账号管理体系,通过核心账号授权映射多个异构云平台账号,在不影响云商账号独立使用的前提下,由多云调度管理平台协同多个异构资源域账号完成端到端关联服务的开通。由于云网融合体系穿越了多个异构服务域(如公有云商、数据中心服务商以及独立网络运营商等),各异构服务域的认证方式迥异,为给用户提供一致性体验,多云调度管理平台需建立多云网络运营平台与多运营域的账号映射关系,屏蔽异构账号体系差异[20, 26]。

3.3 多云管理平台功能架构

多云调度管理平台将侧重实现跨云服务商、跨异构平台的资源开通和管理能力。平台可基于算力网络对接各大主流云服务商资源,贯通数据业务接入和传输线路,实现云网一体化受理、开通、管理、出账能力,支撑最终客户和云服务提供商实现云网一体融合交付。为更好地支撑国家东数西算工程,多云调度管理平台需具备以下能力。

(1)多云调度管理平台通过开放的API接口架构以及灵活的资源适配能力,需要支持对接多种异构云服务平台(例如天翼云、阿里云、腾讯云、华为云、AWS云等),并能够调度x86算力、ARM算力、AI算力等多种异构算力资源。

(2)多云调度管理平台需要支持对各种计算、存储、网络、容器资源和服务等进行统一管理和调度,可实现应用部署在异构云环境下的云间互联,同时支持传统应用、云原生应用等在异构云之间的灵活部署,可通过策略匹配合适的算力资源进行应用的部署。

(3)多云调度管理平台需要具备统一运营能力,支持多租户管理、异构虚拟资源池管理、分级分域管理,并通过账号账户体系和资源配置能力,支持二次运营场景下的配额、计量、流程等灵活适配。

(4)多云调度管理平台具备完备的资源和业务统计功能,通过算力感知模块获得各云服务域的设备容量、额定功耗、实际功耗等资源池信息和算力资源利用率、性能、告警数据,支持统计各云服务域的云服务总容量、已分配总容量、实际利用率等信息。

平台功能架构总体可分多云服务门户、云网接入层、业务开通层、支撑管理层、接口管理层五个大的层次和模块(见图5)。多云服务门户提供给客户和MSP服务商通过门户进行自助式业务申请、信息查询和运维服务等功能;云网接入层主要实现云商对接、云网资源汇聚、产品拓展及多种专线/网络对接能力;业务开通层实现多云业务的业务订购、激活、编排及开通;支撑管理层实现流程管理、账单管理、租户管理、多云运营管理等IT管理功能;接口管理层实现与外部系统的接口,提供服务API的统一入口,包括对接各云商的云管API,实现对主流云商云业务的配置和开通,对接云网运营系统,实现云网资源一体化编排开通和配置下发[26]。

图5 多云调度管理平台功能架构图

4 多云管理的应用

基于多云管理技术的算力调度在国际和国内已有类似的应用案例,可以参考业界的情况,制定符合我国需求的算力布局和调度使用模式。从国际云商的算网布局和调度来看,主要的方式为聚焦核心枢纽节点建设,按需扩展;就我国东数西算的定位来看,除了强化核心枢纽节点能力和规模之外,还应按需布局边缘节点。

对东数西算的资源调度而言,通过基于多云管理技术的云调度平台可实现跨地域、跨云商实时算力、存力调度,并通过切片技术确保不同的服务等级,灵活匹配客户需求(见图6)。

图6 东数西算场景布局探讨

从业务对云资源需求角度分析,公有云用户可考虑搬迁到西部,典型适配应用为小企业上云、开发测试等,主要是为了实现绿色低碳。时延<100 ms,业务迁移到西部后,可做到不影响用户感知。

对计算机较为密集的需求,可通过层分类部署来布局,对应用分层、智能动态负载、跨区域多活等所需的前端静态缓存部署东部,后端则部署西部。

对存储型的应用,数据存储实现云灾备、冷温数据存储。灾备存储 VPC 部署在西部数据中心,通过 IP 网传输存储灾备数据,两地三中心实现数据异地灾备。

对于智能算力需求,可考虑通过混合云AI算力实现西算东用,适合的典型解决方案为非实时分析系统AI训练、大数据分析等,通过智能云骨干网实现数据传输,完成训练数据收集和训练结果反馈,以满足带宽敏感的需求。

5 结束语

东数西算工程是云网融合的最佳工程实践之一,而多云管理技术是实现东数西算的核心基础。多云管理、算力网络、AI、内生安全等云网融合要素是组成东数西算体系的关键技术底座。随着云网融合在各行各业的深度推进及云网融合关键技术的持续发展,东数西算工程也将同步渐次落地,从而实现跨地域、跨行业的数据流通和基础技术要素交易。东数西算也必将与南水北调、西气东输、西电东送一样成为新时代新型基础设施和新型信息资源统筹大布局的新范例,在世界范围内创造领先的技术新业态。

猜你喜欢
东数云网多云
下期要目
东数西算
“东数西算”能为我们算出怎样的未来
“东数西算”,亿万蓝海
“东数西算”全面启动
向日葵·成长·礼物
航天云网科技发展有限责任公司
何氏“十全大补粥”