郭 涛 徐 晶
GhatGPT 自发布以来,AI 大模型崭露头角,正加速催生大量“新物种”。为抢占AI 大模型发展机遇,赢得AI 科技的战略制高点,2023 年4月,中共中央政治局会议明确强调要重视通用人工智能发展,国家网信办等七部门也于今年正式印发《生成式人工智能服务管理暂行办法》,将推动人工智能安全发展提上日程。为贯彻落实国家有关人工智能的决策部署,省委十二届三次全会将人工智能列为战略性新兴产业,作为新领域新赛道助力推动四川创新发展。然而,从实践来看,传统低水平、分割式、少生态的数据中心和算力中心根本无法满足“大数据、大计算、大模型”人工智能应用需求,布局建设AI 公共算力平台成为发展通用人工智能的关键,它将实现对通用计算、超算、智算等多元异构算力的融合管理,大幅提升AI 模型训练与推理服务效率,为发展新一代人工智能产业提供强大驱动力。
当前,AI 大模型的出现是人工智能发展进程中的一个重要里程碑事件,人工智能正快速迈入新的“未知”的阶段,推动人类社会走向全面数字化、网络化和智能化。
ChatGPT 是由谷歌研发团队提出的Transformer 模型演化而来。根据其原理,只需将训练好的大模型利用少量数据进行微调,甚至不进行微调就可以完成多场景任务,由此逐渐形成了“大模型+微调”的训练新范式。相较于传统人工智能模型优化方式,ChatGPT 的诞生促成了模型训练由传统“手工作坊”到规模化智能生产的转变,成为了AI 大模型加速催生人工智能技术和产业落地的新引擎。目前,业界普遍认为,大模型将为产业数字化转型和智能化升级带来新范式,带动数字经济迈入新发展阶段。
从应用实践来看,AI 能够帮助知识生产者更好地去理解、运用并形成新知识,而新知识又将反向助力训练出更好的AI 模型,更好的AI 模型又能产生更多新知识。因此,一旦形成算力、算法、数据应用的逻辑闭环,三者便可互相推动、良性循环,进而不断迭代升级产品和技术。目前,作为美国AI 领域的领先企业,OpenAI 公司拥有微软提供的巨量公共云算力,并在ChatGPT 算法以及海量用户数据闭环的不断迭代下,已经坐上高速运转的飞轮。而我国的公共算力平台及其生态却与之存在明显差距,特别在AI 公共算力设施及部分AI 芯片上落后世界先进水平,多数市场份额为国外厂商占据。
ChatGPT 的兴起掀起了国内智算中心的建设热潮,AI 算力及其服务市场“碎片化”的现象或将日益突出。类似于GPT-4 各类大模型的研发竞争是基于AI+云计算的全方位竞争,不仅需要网络、存储和数据支撑,而且还高度依赖超大规模智算平台。目前,各地建设或即将建设的低水平、小规模智算中心,根本无法支撑大模型的训练任务,数据中心之间的带宽也无法达到大模型训练每秒TB 级别的传输速率。因此,各地若再投资建设不具备大模型训练能力的算力中心,未来或将出现“数字烂尾楼”的问题。
在大模型应用已成趋势的情况下,单纯硬件驱动模式下的低水平算力中心对发展通用AI 是不利的,不仅会造成区域算力及其服务市场的分割,同时也难以形成良好数字生态支撑通用AI 发展,从长远战略考虑,这也为我国在国际AI 市场中形成竞争优势增加了更大的难度。由此推断,伴随通用人工智能向纵深发展,高质量算力平台将逐渐成为人工智能时代最具代表性的新型公共算力基础设施。
通用人工智能产业化、商业化将对高性能算力、多类型任务和多方法调度的服务产生巨大需求。根据国内外实践经验,目前只有AI 公共算力平台才能提供高性能、低能耗、强拓展、灵活稳定的服务。当然,AI公共算力平台建设不是简单的硬件堆砌,而是基于以CPU+GPU 为主要内核的云数据中心,通过提供包括普惠算力、超算智算、算法模型和数据训练等服务,实现“通用计算+超算+智算”的一体管理,在提高算力资源利用率的同时,满足不同场景下的算力需求,让算力更易得、管理更轻松、应用更聚焦。
传统超算中心的计算能力依赖于专有硬件平台,强调高精度的计算能力,追求数值计算的精确,适合必须严格把控精度的科学研究。因此,超算服务对象较为单一,多局限于如新材料、新能源、高端装备制造、航空航天等领域的国家重大科研类工程项目。而AI 公共算力平台可有效聚合“智算+超算+通用计算”的功能,跨区域、多领域融合调度算力资源,满足不同群体、不同领域的多元需求,实现算力资源利用率和AI 训练效率数倍提升的目标。
根据数据处理的延迟划分,计算分为“实时计算”和“离线计算”。对于实时计算,比如智能驾驶、工业机器人、辅助医疗等行业,延迟需求是毫秒级甚至微秒级的,可以通过AI 公共算力平台实现近距离边缘算力调度;对于离线计算,也就是对于延迟和时效要求不敏感的业务,可以通过AI 公共算力平台实现远程传输和模型深度训练。按照“东数西算”工程的总体布局,国家对实时性要求不高的场景应用和模型训练任务进行“西算”,使用AI 公共算力平台显然是具有可行性的,这将大量节约算力和能源资源。
AI 是数字经济与实体经济融合发展的产物,涉及大量实体制造,产业链长、波及面广,成为具有数万亿市场潜力的新赛道。为抢占AI 产业发展先机,以北京、上海、深圳为代表的城市正加速布局AI 公共算力服务平台。当前,全省上下正在着力构建现代化产业体系,超前认识AI 公共算力服务平台的重要性,提前布局新一代人工智能算力服务平台,这在推动通用人工智能产业争先竞速发展中尤为重要。
一是研究制定《四川省加快发展新一代通用人工智能的实施意见》等系列政策文件,大力支持发展AI 公共算力平台,有效整合多层级算力资源,逐步构建起全省统一的算力调度服务机制。二是人才引育制度方面要支持更多数学、物理等科学领域科学家、研究人员投身于AI 算力技术、算法模型等领域的研究,大力培养与引进跨学科顶尖AI 研发团队,为四川人工智能发展持续输送高端人才。三是标准规范方面,针对政府、企业、居民不同服务对象,要构建AI 公共算力标准化体系,特别是在科学、政务、教育、医疗、金融、交通、文旅等重点行业要加快探索突破。
一是与国内知名云商合作,有序建立服务政府侧和非政府侧的AI 公共算力平台,提供多元优质普惠算力,在逻辑上形成全省一体两翼的高质量AI 算力平台体系,实现异构算力统一管理、统一运营、统一调度的目标。二是科学统筹AI 公共算力空间布局,打造四川省级和重点区域边缘AI 公共算力联动的智能调度体系,推动天府数据中心集群与重庆算力集群在AI 公共算力的协同联动,充分发挥好算力集群优势与集约化的成本优势,增强高性能算力资源的区域一体化调度能力。三是支持成都超算中心升级试点探索建设新一代人工智能公共算力开放创新平台,支持“通用计算+超算+智算”异构融合发展,构建多元协同的算力供给体系,助力新一代人工智能技术在现代化产业体系中的规模化应用。
一是依托成都国家新一代人工智能创新发展试验区,积极融入国家算力AI 芯片产业布局,突破关键核心技术,特别是提升GPU 等芯片国产化率,助推人工智能安全发展。二是突出基础研究与应用研究协同,要大力引进龙头数字科技企业研发基地落地四川,引导其牵头推进以“公共云+AI”为驱动的算力技术体系发展,逐步主导全球新一代AI 公共算力软硬件生态,突破现有技术路径的封锁。三是以构建AI 算力、算法和数据的逻辑闭环为导向培育上下游产业生态,大力发展“模型即服务”新业态,培育和推广AI模型社区,推动各行业训练数据集资源开放流通,形成统一开放的AI 算力产业生态。
一是要在产业基础好、创新能力强的地区,优选若干细分特色优势行业,特别是突出在制造业的智能应用,打造AI 大模型应用标杆,提升AI 公共算力平台资源的利用效率。二是要以发展战略性新兴产业为牵引,对需利用高性能算力的产业场景可优先导入使用AI 公共算力服务平台专区,直接在云端调用算力开展AI 模型训练和高性能计算等任务,服务现代化产业体系构建。三是要降低中小企业算力使用门槛,深化以“算力券”的市场化举措活跃算力消费,支持专精特新、小巨人、瞪羚等企业使用公共算力平台资源,推动中小企业参与模型训练和算法迭代,全面提升AI 公共算力设施的普惠服务能力,加速赋能千行百业。