AIGC机遇下的算力挑战

2024-01-20 15:59孙杰贤
中国信息化 2023年12期
关键词:算力人工智能评估

文 | 本刊记者 孙杰贤

以“智算力就是创新力”为主题的2023人工智能计算大会(AICC 2023)日前在北京召开,大会重点围绕智算基础设施、大模型创新、AI Infra 技术创新、自动驾驶创新与应用、AI for Science、智算开放标准等热点话题开设一场主题论坛,六场专题分论坛,近百位政产学研专家现场分享智算产业前沿趋势和创新成果。

浪潮信息高级副总裁刘军在演讲时表示,面向生成式人工智能(AIGC)带来的机遇与挑战,通过智算力系统来更好地支撑AI创新与应用,已经成为智算产业的关键,应该从算力系统、AI Infra(AI软件基础设施)、算法模型和产业生态4个方面来进行综合考量,从而加速智能产业的落地。他特别指出,AIGC大模型开发是一项极其复杂的系统工程,即便解决了底层算力供给的问题,仍面临建不了和用不好的问题。“建不好”是指构建算力平台不仅需要服务器、存储、网络等硬件集成,还需要考虑不同硬件和软件之间的兼容性和版本选择,确保驱动和工具的适配性和稳定性;“用不好”则体现在算力平台效率低、稳定性不足、模型开发环节冗长等现实困扰。因此,在算力系统外,AI Infra也亟需创新。

据悉,针对AI Infra层面的优化,浪潮信息开发了大模型智算软件栈OGAI。在算力集群部署方面,开源了业界首个AI算力集群系统环境部署方案PODsys;在大规模训练的长时保障方面,从算力调度平台层实现了自动化断点续训;在多元算力接入方面以标准化、模块化接入方式稳定接入超过40+芯片;在数据治理方面构建了流程化、可自定义的数据清洗流水线,有效缩短数据清洗时间、提升文本审核过滤准确率;在计算效率优化方面,通过对分布式并行算法的极致优化,将千亿参数模型训练的计算效率提升到54%;在多模型管理方面已经支持了超过10个业界主流的开源大模型和元脑生态大模型,用实践证明AI Infra全栈基础软件和工作流的创新是多元算力高效释放、提升大模型算力效率的关键。

除了刘军,在上午的主题论坛上,还有众多重量级嘉宾就AIGC、大模型以及智算基础设施等相关话题从技术、理念、产业、生态等方面展开了深入、全面、客观地交流与分享。

中国工程院院士王恩东——大模型带动AIGC产业迅速发展,在科学探索、技术研发、艺术创作、企业经营等诸多领域都带来了巨大的创新机会,提升大模型智能水平需要提升模型训练的参数量和数据量,这必须要通过更大更好的智算力才能够支撑,从这个意义上可以说智算力就是创新力,当前人工智能产业发展的基础是智算能力。

北京智源人工智能研究院副院长兼总工程师林咏华——大模型时代,面对异构算力不能合池训练、生态割裂和芯片各异评测难的三大算力束缚,我们需要攻关兼容异构芯片的混合训练技术,提升训练效率,并推动面向异构芯片的开源算子软件栈,以及建立评测体系。

腾讯云产业智能首席专家王巍——大模型深刻触动了产业变化和底层逻辑,引发动力变革、交互变革和效率变革。企业大模型落地需要从底座、功能和应用等方面来进行能力加持,在跨模态大模型落地过程中克服数据、连接、安全、统一等四个方面的挑战。

此外,大会还发布了两份重要的研究成果——《北京市人工智能行业大模型创新应用白皮书(2023年)》(以下简称《白皮书》)和《2023-2024年中国人工智能计算力发展评估报告》(以下简称《评估报告》)。

《白皮书》从大模型全球发展态势、国内外行业应用概述、北京应用情况和发展建议等方面进行了系统分析和阐述,旨在展示北京市大模型应用成果,促进大模型价值传播和供需对接。《白皮书》指出,目前北京是当前国内人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区,现已拥有大模型创新团队122家,数量居全国首位,约占全国的一半。在大模型技术落地方面,北京市场空间广阔,已率先开展了多样化的应用实践,从模型演进看,呈现出从技术到产品、再到商业化的发展路线;从应用领域看,呈现出百花齐放发展格局,其中传统产业赋能和金融领域发展较快;从应用类型看,多类应用全面开花,其中内容生成和智能问答最为成熟;从商业模式看,大模型已形成“基础+行业+应用”的三层架构。

而《评估报告》则从算力规模、区域分布和行业渗透度等多维度,对我国人工智能计算力发展进行综合评估,给出大模型和AIGC的发展将引发AI算力产业之变的核心洞察,并提出针对性的行动建议。《评估报告》指出,当前在AIGC的带动下,人工智能计算力技术及应用趋势发生了较大的变化。

一是计算范式之变。大模型和AIGC的发展加速了更高计算性能、更快互联性能的算力基础设施建设,推进人工智能在云-边-端的覆盖。此外,伴随应用场景多样性,底层基础设施呈现多元化发展。

二是产业动量之变。AIGC可重构现有的工作方式,在内容创作、自动驾驶、零售、医疗等诸多领域改变着人们的生活和生产方式,同时也带来更大的市场机会。算力、算法、应用、服务等诸多产业变量将成为创新的加速器,在算力生态链上的各个环节催生出新的玩家。

三是算力服务格局之变。由于基础大模型的本地训练成本不菲,企业将更多地使用已有的人工智能数据中心设施和AIGC服务器集群,这将为算力服务市场带来新机会。算力服务供应商要能够提供定制化的基础设施服务能力,满足单个用户对训练和推理资源的独占式、大规模、长时间使用的诉求,同时帮助用户实现成本控制。

《评估报告》认为,中国市场有其独特性和一些新的变化。面对单芯片性能受限等局面,中国市场对于算力供给能力的评估指标将从硬件性能向应用效果转变,企业在获得算力服务的过程中,会更加以应用为导向进行综合考量,增加对于诸如单位时间可处理Token数量、可靠性、时延、训练时间和资金成本、数据集质量等指标的关注。

针对这一转变,《评估报告》指出,算力供应商需要“以应用为导向、系统为核心”,构建算力基础设施平台,提高算力利用率,提升诸如卡间互联、多节点间互联等水平,支持灵活稳定扩展和弹性容错,积极打造通用的人工智能软件和硬件平台,以先进的系统性能力满足市场的应用需求。

猜你喜欢
算力人工智能评估
苏州:到2025 年算力产业创新集群规模达4 000 亿元
卫星通信在算力网络中的应用研究
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
基于SiteAI算力终端的交通态势感知系统
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!
评估依据
立法后评估:且行且尽善