刘晶 宋婧 齐旭
日前,“东数西算”工程正式全面启动,这对提升国家整体算力水平,实现全国算力规模化集约化发展、绿色发展,带动有效投资,推动区域协调发展意义重大。与“南水北调”“西气东输”“西电东送”工程一样,“东数西算”工程是一个不断面对挑战、不断以技术创新攻坚克難的过程。在算力平台、网络传输、基础软件、数据治理等关键环节,“东数西算”工程可能还会面临诸多挑战。
“东数西算”的本质是改变了数据在本地的存储、备份、加工、处理、分析等行为,这也对算力平台在链接、服务、安全等方面提出了新的挑战。
如何应对挑战,赛迪数字经济研究中心总经理边大成认为,算力平台的发展需从以下三方面入手:一是根据数据传输规模,建设地域之间的高速网络通道。二是整合政府、企事业单位等多方算力资源,根据客户使用需求,制定相应的技术、软件、运维等综合服务解决方案,全面提升平台的综合服务能力。三是完善海量数据的识别、防护、脱敏等技术,进一步根据区域、权属等细化数据的访问和使用权限,同时,做好网络安全监测。
站在全国“一盘棋”的角度统筹规划,推动优化算力资源配置。中科曙光高级副总裁任京暘表示,算力网络作为统筹调度算力资源、存储资源、网络资源、数据资源及增值服务的载体,类似于新时代的“电网”,是优化数据中心建设布局,促进东西部协同联动的重要抓手。
伴随“东数西算”工程的启动,算力网络建设进入新一轮建设周期,目前主要面临算网融合、数据开放、技术标准支撑等挑战;建成后,还需解决可靠性、易用性、迁移性等关卡。这些难点的攻克,需要产业链上下游共同推进,才能最大程度促进算力资源协同利用。
如何把国家算力枢纽平台与各省市算力调度平台建设有效结合是又一个挑战。提升政府治理能力大数据应用技术国家工程研究中心常务副主任、太极股份副总裁韩国权认为,国家规划建设了8个国家算力枢纽节点,在数字经济发展热潮的带动下,全国各省市争相推进算力基础设施建设,掀起了建设热潮。如何把国家算力枢纽平台与各省市算力调度平台建设有效结合,通过大数据产业带动新基建及周边产业快速发展,是一个重要的问题。
韩国权同时表示,国家“东数西算”整体布局是打造了一个存算用分离的算力平台和算力数据应用,而算力平台的建设,存储数据并不是目标,而是集约化后如何更高效地利用数据,这才是它的核心目标。因此,算力平台的建设一定要匹配算力服务体系的建设。二者有效结合起来可能会更有效地借助大数据提升基本公共服务水平,保障公共服务效率。
随着“东数西算”工程的展开和推进,对包括云计算在内的各种各样多元算力都提出了更高的要求,华云数据高级副总裁郭晓认为,要快速迭代云平台产品线,满足更丰富的用户业务场景需求,如图形图像渲染、业务日志收集分类管理、丰富的数据库服务、大数据治理等。
另外,并不是所有行业的数据都适合做“西算”。因此,私有化云平台对数据安全保护、数据治理的能力需要持续提升。数据在“西算”过程中,对云平台上数据存取实时性、准确性也提出了更高的要求,这主要是由于用户对业务数据处理紧急性和数据传输过程中的诸多不确定性造成的。
“东数西算”工程将数据、算力和网络紧密地联系起来。自运营商推动云网融合之后,“东数西算”进一步要求实现算网融合,将算力传输作为网络传输的重要目标。
支撑“东数西算”战略顺利实施,需要有更高品质的网络基础设施,这对传统网络提出了挑战,促使其升级。
伴随“东数西算”工程的启动,算力网络建设进入新一轮建设周期,目前主要面临算网融合、数据开放、技术标准支撑等挑战;建成后,还需解决可靠性、易用性、迁移性等关卡。这些难点的攻克,需要产业链上下游共同推进,才能最大程度促进算力资源协同利用。
中国联通研究院副院长、首席科学家唐雄燕表示,支撑“东数西算”网络首先要满足算力对传送带宽、容量和低时延的需求。
目前全国算力已经达到13000亿亿次浮点运算,而且市场对算力的需求每年都在增长。因此要支撑如此庞大的数据量,只有通过全光网络才能够支撑。首先,要优化骨干光缆网的布局,可以采用新型G.654E光纤,构建横贯东西、纵贯南北的高效直达光缆架构。其次,为满足“东数西算”带来的海量数据传输需求,骨干传输系统需要由当前单波速率100Gbps向200Gbps乃至400Gbps演进,同时,需要在IP层部分骨干节点升级路由交换容量,核心路由器引入400G端口。最后,引入ROADM+OTN光电双平面立体架构,增强光层的业务调度能力。
中国移动研究院网络与IT技术研究所所长张昊对记者表示,“东数西算”对网络的时延(小于20ms)、可靠性(99.9%)等指标的要求较高,网络面临低时延、高可靠、大带宽以及算力跨区域、跨层级连接敏捷开通的挑战。传输网络需进一步提升光网络的带宽和传输性能,需设计面向算力的扁平化、低时延全光传输网络架构,降低传输时延,并提供实时响应和端到端的服务保障。
“要实现算网连接能力与调度能力的持续提升,包括持续优化电信承载网的多云连接能力和网络调度能力,需要更多地实现与各大云服务商算力资源的直连,并构建最短时延算力互访平面。”唐雄燕说。
“承载网络需提供低时延路径调度能力,简化跨域连接拉通复杂度,同时需要通过切片技术将物理网络虚拟化为多个互相隔离的切片网络,实现高价值业务专网保障,并提供业务质量实时感知能力,加速故障闭环处理效率。”张昊说。
为了实现这一目标,需要引入SR-TE/SRv6等新兴技术,增强网络的路由调整能力,增强承载网控制平面的SDN管控功能,使网络能够根据算力变化,及时更新路由策略,优化用户体验。进一步发展IPv6+技术,构建算力与应用感知的可编程网络。
唐雄燕认为,要不断增强算网融合服务能力,包括算力度量与交易、网络感知与路由、算网联合调度与编排等技术标准均有待完善。需要提升全网算力资源的统一运营能力,实现网络服务和算力服务的同开、同停、同监控,通过算网一体的智能调度,满足算力高效、绿色、安全的承载需求。而且要进一步研制算网大脑,实现计算与网络服务的融合化和智能化。
“东数西算”工程正式启动之后,三大电信运营商都有资源支撑这一工程。中国电信拥有794个数据中心,50万个机架。按照2+4+31+X的结构进行全国布局,该布局与全国一体化大数据中心的国家枢纽节点的选址、业务定位以及核心集群与城市数据中心的分类高度吻合。
中国移动在全国范围内布局N+31+X资源池、数据中心,依托中国移动5G网络优势,目前已部署虚拟处理器(vCPU)近500万核,中心节点覆盖13省份15节点,边缘节点超500个,存储资源达1500PB,出口带宽达4140GB。
中国联通现有数据中心880余个,数据中心主要分布在京津冀、长三角、珠三角、鲁豫、川陕渝、蒙贵等区域。下一步,三大运营商都计划围绕国家“东数西算”八大算力枢纽节点,优化资源布局。
“东数西算”工程凸显了数据作为一种生产要素的价值,并将其分类治理——对于服务后台加工、存储灾备、离线分析、存储备份等对网络时延要求不高的“冷数据”,优先向贵州、内蒙古、甘肃、宁夏节点转移;与此同时,对网络时延要求高的“热数据”,选择在东部城市进行布置。
早在数年前,ICT企业早已启动建设,自然地将数据业务“分流”计算、存储。目前,除在线游戏、电商交易、在线支付等对网络时延要求极高的应用之外,大量从事数据存储、离线数据分析等业务的数字经济企业均可通过购买西部地区数据中心云服务来有效降低运营成本。“东数西算”是国家级迁移工程,转移和承载的数据量可能在数ZB(十万亿亿字节)。中国信通院云大所数据中心部副主任郭亮在接受记者采访时表示,“东数西算”之后,数据传输和计算异地远程化,并由此带来效率、安全等方面的挑战。
数据传输和计算异地远程化,又称为“数据跨地域交互”。“东数西算”将构建起一个数据要素大市场,但前提是要以一个安全可靠的数据要素流通网络为基础。赛迪研究院信息化与软件产业研究所数据治理研究室主任王伟玲指出,“东数西算”战略之下,数据跨地域交互会对数据基础设施和通信基础设施带来更高要求,特别是跨网访问时,西部地区不同网络部署性能不一,可能无法满足高频实时的要求。
有业内专家指出,目前各大互联网企业纷纷在电力资源丰富、电价便宜的西部地区建设大型数据中心,但受限于网络带宽、产业配套、人才等问题,数据分流实际效果不理想,导致“东数西算”推进得远没有想象中顺畅。
国家大数据灾备中心总经理、人民网舆情数据中心副主任郑光魁告诉记者,受限于网络长距离传输造成的时延,以及相关配套设施等因素影响,可以考虑分级分类建设、转移数据存储产业。针对一些对网速要求较高的业务,比如工业互联网、灾害预警、远程医疗、AI推理等,可在京津冀、长三角、粤港澳大湾区等东部枢纽布局,枢纽内部要重点推动数据中心从一线城市向周边转移;对于后台加工、离线分析、存储备份等对网速要求不高的业务,可率先向西转移,由西部数据中心承接。
“东西部在数据治理方面,存在治理体系、技术能力、数据流通和应用场景等方面的差异,东部地区整体能力高于西部地区。”郭亮说。中国数据治理产业整体来讲还处于初步发展阶段,数据治理产业界面临的共性瓶颈,是数据尚不具备作为一种生产要素所必需商品化、资产化机制,无法界定权属,无法评估质量,无法有效定价,无法可信流通,企业获取政府数据、政府获取企业数据或企业之间交换数据,均存在巨大障碍。
对此,王伟玲指出,针对西部地区数据治理能力薄弱的现实问题,建议采取“引凤入巢”的策略,与擅长数据治理的“国家队”积极沟通合作,围绕数据分类分级、数据管理能力成熟度评估、数据安全等数据治理不同领域,以项目合作、队伍共建等不同方式,强化自身数据治理能力建设,在外脑的协助下,进一步壮大提升自身数据治理产业发展。
国家信息中心大数据发展部王建冬告诉记者,在推进“东数西算”发展过程中,还需要处理好政策、市场与企业的关系,鼓励引导社会主体充分利用公共数字资源,运用新监管机制、新服务手段为数据充分共享流通和产业跨区域平衡发展提供制度基础。一是在国家级重大专项、试点示范项目和政策引导方面,探索建立政务数据跨域存储和主权管理新机制。二是鼓励产业界探索完善跨区域数据中心运行增值服务和产业培育机制,推动大型互联網企业探索在将大型数据中心业务放在西部地区的同时,切实帮助中西部地区依托数据中心就地发展偏劳动密集型的数据加工、数据清洗、数据内容生产等产业。三是通过数据沙箱、特征库等技术,建立国家信息交换体系生态体系,形成“数据不见面、算法模型见面”的数据价值共享流通机制,为企业使用政府数据、政府采集企业数据、企业之间共享交易数据提供共性服务。
在这个软件定义的时代,“东数西算”工程的建设本质上是在用软件思维来进行算力的调度与整合,包括操作系统、数据库、中间件等在内的软件将贯穿在“东数西算”工程全生命周期各个环节之中。
“目前‘东数西算’工程大量关注点都集中在数据中心、通信设备和5G等运营商服务等领域。实际上,这些都属于新基建中的‘硬’基建,具体到大规模应用中,无论是数据的存储、传输还是处理,均与基础软件密切关联。”北京计算机学会数字经济专委会秘书长王娟在接受记者采访时坦言。
“无论算力中心在哪个区域,基础软件都是其必需的核心组件。”麒麟软件有限公司副总裁李震宁说。在他看来,“东数西算”会提供更多算力平台市场,市场需求会带动部署更多的自主创新的基础软硬件,同时,“东数西算”也能为自主产品提供更多算力应用的舞台,形成示范场景和应用,进一步拓展算力应用和市场边界。
在這个软件定义的时代,“东数西算”工程的建设本质上是在用软件思维来进行算力的调度与整合,包括操作系统、数据库、中间件等在内的软件将贯穿在“东数西算”工程全生命周期各个环节之中。
赛迪顾问软件与信息服务产业研究中心高级分析师郭旭辉称:“与传统意义上基础软件厂商销售单一环节产品不同,‘东数西算’将带来大量的链条式市场需求,进一步深化本土基础软件厂商上下游合作,加速产品适配,加快整体解决方案的形成。”
“东数西算”工程的开启,在为基础软件产业发展提供丰沃土壤的同时,也对其提出了更高的要求。新兴技术融合度、西部地区产品交付及服务能力、场景需求等正在成为基础软件产业面临的新难题。例如,“东数西算”工程鼓励数据中心在节能降碳、可再生能源供电、异构算力融合、云网融合、多云调度、数据安全流通等方面创新突破,基础软件需要同步升级。同时,西部地区基础软件产品的交付及服务能力也需要尽快跟上。
李震宁分析称,未来,操作系统等基础软件要服务超大型数据中心的建设发展,需要支持大规模数据并行分析处理,特别是对海量规模数据的集中处理,还要能支撑工业互联网、金融交通等行业的业务需求,在数据中心安全保障层面也提出了更高要求。
据专家估算,“东数西算”工程每年投资体量将达数千亿元。中软国际方案咨询专家战腾分析称:“此次出台的政策将给产业带来大量市场空间,有了具体项目,自然会推动资本、人才的发展,同时本土基础软件厂商也得到了检验产品水平的大好机遇,这将推动技术升级。”
中科院软件中心有限公司董事陈鹏建议:“首先,要以区域资源调配为弹性底座,提升基础软件的灵活部署能力;其次,要增强软件技术适配能力,提高软件自身的可移植性和易用性;最后,应加强资本监管力度,合理筹划、分步实施,实现均衡发展。”
郭旭辉指出,基础软件企业应当树立发展信心,进一步深耕基础软件研发。首先要加强云计算、大数据等新兴技术相关产品研发;其次要借助“东数西算”工程优势,进一步拓展西部市场,形成全国性的市场布局;最后要重视产业生态构建,加快与产业链上下游产品适配融合,与各厂商协同发展,共同构建产业生态。同时基础软件对于技术人才要求较高,厂商应建立完善的人才培养体系,保障企业技术实力的不断提升。
◎ 来源|中国电子报