中信改革发展研究基金会“安全可信多边数据治理机制”课题组
全球数字化的角逐已然是一场殊死革命
数字驱动已成为科技创新的范式,而国家超大综合算力则是现代综合国力的重要组成部分和实现人工智能发展的重要基石。当前,以ChatGPT为代表的美国人工智能技术(涉及通用人工智能和AI大模型)取得了突破性进展,通过数据、算力和AI模型,改变认知、探索前沿已呈现出重大的示范意义和启示作用。这种“预训练,能够自监督学习,具有强生成能力,并且可以自我进化”的能力,标志着数字平台时代进入数字智能时代,表现出对社会经济发展各领域具有超越认知的渗透性、扩散性和颠覆性,展示出驱动历史发展的内生动力十分强劲。美国在这一领域处于领先地位,它通过封锁技术和严格输出相关产品,不断挤压我发展空间,迟滞我国发展,并对我国安全与发展形势构成了全方位、多维度的压力、挑战与威胁。对此,中国必须做出反应和付诸行动,这关乎10年、20年甚至未来较长时期我国在全球创新、社会发展、国家博弈和企业竞争中的地位与作用。在全球新一轮数字技术竞争的赛道上,不能一抬头,世界已经走远,中国必须制定国家战略,咬住强者,应对挑战,选择“以网强算、算网融合”的发展路径,破解发展难题,重塑发展格局。
以全球的视角看待与迎接数字革命的挑战
在获取、表达、存储、传输、处理、交付信息中,中国新一轮人工智能技术的发展障碍在算力。历史形成的算力分散现状与算力分治的体制相关,造成可用性算力能力和AI大模型所需算力能力不强,这是制约我国的真正瓶颈。仅以ChatGPT-3为例,其早期版本算力消耗约为3640PF天(即假如每秒计算一千万亿次(PF),需要计算 3640天),以国内一个投资超30亿元、算力500P的数据中心为例,支撑ChatGPT-3正常运行的算力消耗超出了单个数据中心8倍的计算能力。
我国算力总量仅次于美国,居全球第二,但差距却反映在美国拥有全球最领先的芯片能力、硬件水平和金融资本偏好上;反映在少数科技头部企业打造出的是全球集中度最高的算力总量。我们的问题是囿于算力资产确权在各个机构手中,运行体制和运行方式呈现分治与分散的状况,使算力能力很难集合成满足人工智能大模型需要的算力。
算力的提升离不开高性能芯片和相关先进服务器技术。美国对我国严格禁售计算芯片、网络芯片,严格限制服务器等相关技术输出,这种供应链、科技链断链的状况短期内不会得到缓解和改善。因此,我国靠自己在短期内解决芯片代际差距,集中投资高密度算力设施都是不现实的,更不可能将我国数据与信息全面暴露和置于美国领先的人工智能系统控制之下,选择直接连接美国的算力系统去训练它的模型,这都将构成对我们发展的进一步制约和国家安全的严重威胁。
不致在全球竞争中掉队,算力能力已经不是单纯的技术问题,而是国家竞争战略和行动重要的组成部分。我们必须以自己的方式和选择的路径,破解新一代人工智能产业发展的瓶颈问题。
“以网强算、算网融合”的中国方案
我国不能按照美国的方式和路径构建集中度很高的算力能力,只能寻找适合我国发展阶段实现工程化的“以网强算、算网融合”中国解决方案。在总算力规模和全球领先的通信网络基础上,利用自主可控的创新技术和技术实施条件,建设超大规模高速广域计算集群(“大集群”),提升国家综合算力能力(“大算力”)是现实选择的中国落地方案。
构成一张统一可灵活调用算力的集群算力网络,有效支撑通用人工智能和AI大模型对算力的需求,我国在技术层面具备三個有利条件:第一,已建成全球规模最大、技术领先的网络基础设施,具备全球优势,总算力规模也具有良好基础,且发展势头强劲;第二,在分散的计算中心间,利用经过国家实验室实测验证的自主可控的超远距离、高通量、高速度、低时延技术和产品,实现计算中心的网络联结,就是拓宽了的数据传输网络的“高速公路”;第三,分布式训练是国际常用并规模部署的大规模人工智能训练技术,我国在该领域既有多方安全计算的国际原创,也有多方联合训练的前沿研究,并取得了优异的成果。
建设“大集群”,实现“大算力”的工程怎么干
“大算力”是由国家主导、国家与社会共建、市场化运营的国家大科学工程基础设施。为此设计一整套体制机制方案和分步实施方案,实现资源上优化配置、技术上联合攻关,标准上互认互信,机制上协同协作,利益上公平体现。按照这个定位和思路,利用新型创新体制优势,解决四个问题:
一是将“以网强算、算网融合”上升到国家大科学工程基础设施的国家战略层面进行规划与建设,制定目标、统筹规划,编制实现工程化落地运行的时间表和路线图。
二是在强对抗的竞争态势下,要实现大算力零到一的突破。与美国“技术+金融资本”模式不同,我国算力集中度不高,零到一的阶段缺乏资本投入,因此,我国应当选择国家主导先期投入,国家与社会共建模式,如同开发出“操作系统”,从而带动社会资本进入生成式人工智能时代的应用领域,为企业提供创新的大机遇和实施条件。同时思考,突破了零到一,在一到十阶段,不致出现资本蜂拥而至,避免形成算力新的过剩,造成大面积内卷和极大浪费的预案。
三是创新体制是实现数字中国伟大构想的关键。数字化生态进化的方式离不开场景的开发和应用,离不开创新型企业群体的兴起。积极营造创建创新型国家的生态环境是艰巨的任务,国家层面要抓好三件大事。首先,营造好“善治”与“宜商”的市场环境,在政策环境、法治环境和舆论环境上保持逻辑的一致性、稳定性和可预期性。落实实现市场主体地位平等,使用资源条件平等和公开、公正、公平竞争的条件;第二,整合数字化能力;第三,抓好技术开源的国家引领。唯此才能占领未来产业竞争的制高点,推动产业创新经济体的兴起。随着创新型企业群体的兴起,国家数字化产业和产业数字化发展的局面将大为改观,创造出更多的财富回馈国家和社会,实现社会、经济、科技发展的良性循环。
四是让市场运行机理、机制、标准和规则在调动算力、使用算力资源中起决定作用,使其能够更广泛地汇聚算力资源,可持续健康发展。
形成统一的算力网,须同步推进四方面工作:
一是大规模算力的底座是数字中国的公用基础设施,策略上要为我们争取发展时间,减缓各界焦虑,对冲美国强化技术封锁的进攻态势,收窄中美技术发展差距创造条件。在2023年年底以前,选择有意愿、有条件的10多个数据中心链接起来,工程化地建立大约6EF算力的集群(对标微软的Azure集群算力,基本支撑一个ChatGPT-3的算力需求)。然后,明年年底形成大约200多个数据中心大集群。在时延10毫秒(覆盖范围约2000公里)内的计算能力达到100EF(大约支撑20个ChatGPT-3)的算力集群网络。经过两年的努力,基本形成对我国AI大模型提供优质快速、便捷绿色的高质量算力支撑,为推动各类AI计算模型的广泛发展提供实施条件。
二是在示范算力集群网络的基础上,进一步在算力集群网络架构、调度、测量、交易、安全等关键技术路径上,联合攻关,研究设立国家标准(广域RDMA通信、分布式异构计算、算力链接标准),增强互认互信,强化协同共建,建立算力运营、调度、计量、交易等管理机制,逐步优化形成算力集群网络建设部署、运维管理、效能提升、长远发展等多层面、多维度、更加科学的顶层规划。
三是把握数字化永远是平台驱动的特性,构建三个功能性平台。
1.在技术上破除算力分治的体制性障碍,通过统一标准打通各计算中心的广泛链接,形成大容量、长距离、高速度、高容损一体化的算力集群网络,实现可计量、可调度、可使用的算力。以算力集群网络发展技术方向,带动芯片、通信领域技术发展,持续建设更快更强的中国版算力强网。
2.建立调度、分配、动用算力的生产系统和监管机制,在可实施和可实现的基础上健康发展。
3.以市场化的方式运行,有偿使用算力。将算力作为重要的生产力要素,为分散在各个计算中心的算力提供交易平台和配套的制度安排,建立一套与算力使用相关的市场运作机制与规范。
四是GPT开启了定义性时代,没有强大的算力支持不了大模型,但算力也并非越大越好,应立足满足当下需求。当下,通过通用人工智能的支持,解决垂直领域应用的需求极为迫切,例如:解决工业数据的关联与融合,工业软件的开发与工程化的模拟验证实验,为首台套、首批次、首版次的应用提供可靠依据,缩短成果转化周期,从而提升科研成果的转移转化率和产业化率,促进更多的中小企业转型升级为隐形冠军;将线下线上融合的数字化新型社会信用体系建设提上议程,强力推进社会有序、公民有信的数字化新型社会信用体系建设,将会大大减少社会治理成本的支出。国家事权机构对应身份证信息,给每一个公民颁发一个唯一数字身份标识,将需要信用评价的行为确权后在技术上实现归集,并将伴随一生的信用记录纳入信用评价体系进行管理;其他如态势感知决策支持系统;智慧城市的智能建造与运营管理;现代金融体系的构建、运行,金融资源的合理配置、与实体经济往来中的风险识别与管控;智慧医疗与全民全生命周期的大健康管理,疑难病症的诊断与新药开发,促进医学进步;灵活就业人口社会保障账户的设立与管理,奠定为未来社会稳定的条件基础、网络安全与防御、国防与安全等領域应用,都离不开通用人工智能技术的支持。
(编辑 季节)