○温竹蹈
21 世纪,大数据已经成为影响社会发展的重要因素之一。在全社会数据总量爆发式增长的情况下,大数据中心作为数字经济的“底座”,不仅为各行业“上云用数赋智”提供了基础性支撑,也为大数据这一新生产要素的自由流动创造了可能。因此,近年来,各种大数据中心如雨后春笋般涌现。但是,在这一快速发展的过程中也逐渐暴露出一些问题,比如一哄而上、各自为战、产能过剩,以及与绿色发展相悖等。
为实现国家利益最大化、技术及经济最优化,2022 年2 月,国家发展改革委等部门联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,并规划了10 个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。
为了让大家了解国家实施“东数西算”工程的必要性和重大意义,我们先来具体了解一下什么是“东数西算”。
“东数西算”中的“东”指的是我国的东部地区,包括北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、广东、广西、海南12 个省、自治区、直辖市。“西”指的是我国的西部地区,包括四川、云南、贵州、西藏、重庆、陕西、甘肃、青海、新疆、宁夏、内蒙古、广西12 个省、自治区、直辖市。“数”,指的是数据。“算”指的是算力,即对数据的处理能力。
由上可知,“东数西算”就是在我国的东部地区建立数据库,在西部地区建立算力库,通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部进行计算和处理,让西部的算力资源更充分地支撑东部数据的运算,更好地为数字化发展赋能,促进东西部协同联动。
2016 年,在十八届中央政治局第三十六次集体学习中提出了“东数西算”的宏伟蓝图,即建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。2020 年12 月,明确了全国一体化大数据中心要形成“数网”“数纽”等体系。即网络中要建设枢纽,节点之间要建数据传输的“高速路”,而且要在全国范围内开展算力的资源调度。后来,“加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群”被写进了全国“十四五”规划纲要。又经过一系列的考察、论证,枢纽节点的具体布局点位尘埃落定。
为什么要实施“东数西算”工程呢?大家都知道“南水北调”“西电东送”“西气东输”吧?“东数西算”工程实施的部分原因和上述几大工程类似,也是因为我国幅员辽阔,不同地域的自然资源及发展水平有着很大的差异。有的人还是不太明白,数据处理怎么还和自然资源搭上边了?为此我们先来了解一下什么是数据中心。
维基百科的定义是“数据中心是一整套复杂的设施。它不仅仅包括计算机系统和其他与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置”。谷歌则将数据中心解释为“多功能的建筑物,能容纳多个服务器以及通信设备。这些设备被放置在一起是因为它们具有相同的对环境的要求以及物理安全上的需求,并且这样放置便于维护”,而“并不仅仅是一些服务器的集合”。
因此,任何数据中心都不是我们想象的几台计算机而已,而且它的正常运行需要某些关键要素来保证。我们知道,即使是一台小小的笔记本电脑也需要电才能运行,而且运行过程要保持适宜的温湿度等。一个数据处理中心动辄就是几十台甚至更多的大型计算机或超大型计算机,其耗能可想而知。随着5G、人工智能、物联网等新技术的普及应用,全社会数据总量爆发式增长,数据中心快速发展,对能源、土地、气候等条件提出了更高要求,矛盾日益凸显。据统计,当前我国各类数据中心年用电量已占全社会用电量的2%左右,耗电量增速连续多年保持在10%以上。我国数据中心目前大多分布在东部地区,在土地、能源等资源紧张的形势下,东部一些地区明确将数据中心定位为高耗能产业而加以限制发展。而我国西部地区资源充裕,特别是可再生能源丰富,具备发展数据中心、承接东部算力需求的潜力。
实施“东数西算”工程的现实背景是“数字产业化、产业数字化”。当各行各业数字化进程加快,全社会数据总量呈爆发式增长时,不管是数据的存储、计算,还是传输、应用,整个与数据相关的算力需求都在大幅提升。今年年初西安因突发疫情而出现“一码通”崩溃事件,也说明大数据在当今社会应用的重要地位和广泛影响。
总之,我国东西部之间无论是资源、经济、生产、技术等各方面存在的差异以及社会对大数据及算力需求的激增、绿色持续发展等现状都迫切需要搭建一张“全国一体化算力网络”。通过在全国布局、建设大数据中心,让数据要素跨域流通,引领带动资金流、人才流、技术流等,进而实现产业聚集、区域均衡发展,并为打通我国东西部数字经济的大动脉而做出重要贡献。实施“东数西算”工程意义重大,可推动数据中心合理布局、优化供需、绿色集约和互联互通,有利于提升国家整体算力水平,实现算力的规模化和集约化;有利于促进绿色发展,就近消纳西部绿色能源,持续优化数据中心能源使用效率;有利于促进东西部数据流通、价值传递,延展东部发展空间,助力形成西部大开发新格局;可推动东西部地区数据和网络的安全和协同发展。
通过实施“东数西算”工程,我国将根据算力需求,促进数据中心由东向西梯次布局、统筹发展;推动实现“东数西算”循序渐进、快速迭代。国家发展改革委强调,要坚决避免数据中心盲目发展,在当前起步阶段,8 个算力枢纽内规划设立10 个国家数据中心集群,划定物理边界,明确绿色节能、上架率等发展目标。比如,集群内数据中心的平均上架率至少要达到65%以上,可再生能源使用率要有显著提升。未来将结合发展情况,不断优化完善布局,适时扩大集群边界或增加集群,论证新设算力枢纽,实现统筹有序、健康发展。需要强调的是,大数据中心不应简单地被定义为数据的仓储空间,它还应具备数据加工和智能化分析的功能。换言之,大数据中心的建设,不仅要增加数据的存储能力,还要强化在算法、算力上的能力,推动大数据中心从“瓦特”向“比特”的转化。
这8 个国家算力枢纽,分为两大类,定位不同,作用也不尽相同。贵州、内蒙古、甘肃、宁夏属于第一类。特点:可再生能源丰富,气候适宜,数据中心绿色发展潜力较大。定位:不断提升算力服务品质和利用效率,充分发挥资源优势,夯实网络等基础保障,积极承接全国范围的后台加工、离线分析、存储备份等非实时算力需求,成为面向全国的非实时性算力保障基地。
粤港澳大湾区、成渝地区、长三角地区、京津冀地区属于第二类。它们与我国重要城市群重合,其特点是用户规模较大,应用需求强烈,要服务于重大区域发展战略实施需要。定位:进一步统筹好城市内部和周边区域的数据中心布局,实现大规模算力部署与土地、水、电等资源的协调可持续,优化数据中心供给结构,扩展算力增长空间。
同时,每个算力枢纽内都规划设立了1个~2 个数据中心集群,共10 个国家数据中心集群。算力枢纽和集群的关系,类似于交通枢纽和客运车站。
下一步,将聚焦提升8 个算力枢纽的影响力和集聚力,牵引带动全国算力一体化协同发展。包括打造一批“东数西算”示范线路,提高网络传输质量;强化能源布局联动;支持数据中心进行节能减碳、可再生能源供电、云网融合、数据安全流通等创新融合;加快完善数据中心产业生态体系等。