我们正在迎来一个属于AI的新时代。
“没有大数据,数字经济便是‘无米之炊;没有智能算法,数字经济就不能‘创造价值。”
在日前的2023世界人工智能大会(以下简称WAIC)“大模型生产与产业落地合作论坛”上,国务院参事、中国科学院虚拟经济与数据科学研究中心主任、中国科学院大数据挖掘与知识管理重点实验室主任石勇说。
近一年来,随着通用人工智能(AGI)与生成式人工智能(AIGC)的兴起,人工智能产业掀开了新的篇章——AI对部分产业的颠覆开始加速,我们正在迎来一个属于AI的新时代。
纵观整个计算机科学历史,进入AI时代后,中国AI产业与国际先进水平之间的差距正在不断缩小。但业界也清醒地认识到,中国AI产业的基础设施仍然有很大的提升空间。
正如石勇所言,在AGI时代,数据、算力以及算法、算法开发平台,都是中国AI产业发展壮大不可或缺的基础设施。
在今年的WAIC大会上,越来越多的专家、学者以及AI、芯片等领域的从业者们都开始关注到这一问题,并希望能从底层入手,夯实中国AI产业的“地基”。
AI产业需要什么样的基础设施?
随着AI技术进入大模型时代,AI产业对于数据、算力的需求急剧膨胀。
以ChatGPT为例,根据媒体报道及投资、咨询机构的分析,GPT-3时期的ChatGPT数据量达到了45TB,对于纯文本数据而言,这一数字堪称惊人。
与此同时,ChatGPT的算力消耗巨大,参与训练的算力在万张英伟达A100级别,单次训练成本就高达140万美元。此外,ChatGPT在运营过程中,用户的每次互动都会产生一定的算力成本。
而在数据、算力之外,AI从业者,特别是最核心的算法工程师,还需要大量的开发工具。
“算法工程师很多时候并没有真正研究算法,而是把时间浪费在了环境搭建的工作上。”在WAIC大会上,闪马智能创始人、董事长兼CEO彭垚说:“我们希望人能更好地利用工具,而不是被工具利用。”
有AI从业者将AI训练调侃为“炼丹”,可靠的算法训练平台,可以有效减轻算法工程师的“炼丹”筹备时间。在这一背景下,越来越多的AI企业开始关注到AI开发平台,闪马智能便是其中之一。在WAIC上,闪马智能发布了新一代的ATOM AI生产力平台,希望通过更友好的开发平台,帮助算法工程师提升效率。
据悉,闪马智能的ATOM AI生产力平台构建了从标注、训练、测试到落地的全链路自动生产体系,可以实现模型快速生产、迭代与验证的一站式管理,保障技术成果积累和数据资产沉淀。
具体而言,ATOM AI平台支持跨云、跨集群灵活调度,基于DataExpress数据多级缓存与数据pipeline,可支撑千卡级大模型训练及各类场景微调模型的稳定运行。
ATOM AI生产力平台的前身,是闪马智能团队推出的ATOM深度学习平台。官方资料显示,该平台经多年迭代后,已成为1000余位算法科学家和数十所高校师生使用的AI模型开发工具。
视频大模型方兴未艾
与目前AI产业时下火热的ChatGPT、Midjourney不同,ATOM AI平台关注的是另一赛道。前两者通过大模型实现了文本、图片的AIGC,而后者则关注视频领域,希望打造出更多视频专属的AI模型。
在AI视觉领域,业界现有的模型大多基于静态图片。目前,针对人脸、车牌、敏感内容审查领域的AI模型已高度成熟。但在视频领域,特别是较长视频中的物体跟踪与行为检测,现有AI模型的表现仍然不够理想。
这背后的原因是,大部分视觉模型针对静态图片表现良好,但针对动态视频,模型需要根据时序模型,对单帧静态图片进行空间-时间建模,再提取视觉特征。这一过程的效率极低,且需要大量的算力支持。
此外,相较于图片数据,视频数据更稀缺、体积更大、标注也更加困难。因此,在整个AI产业,视频大模型仍处于方兴未艾阶段,增长潜力巨大。
针对视频模型开发的特殊需求,闪马智能的ATOM AI生产力平台提供了集成数据管理、标注、训练、优化和推理功能的一體化服务,并通过打通算力、数据资源的形式,帮助算法工程师专注于模型训练本身。
事实上,闪马智能自身也在持续投入模型开发。目前,闪马智能解决方案已经在智慧交管、智慧高速、智慧轨交、智慧建造、智慧电站和扬尘治理等业务场景中落地应用。
“大模型存在的意义一定是需要应用到实际场景中,为人们解决问题,赋能社会发展。”彭垚称,“对于大模型本身,我们是理智的——不盲目投入极大参数LLM(大型语言模型),而是结合自身优势,基于视觉拓展做了感知大模型。”
例如,闪马智能日前发布的SupreMeta感知大模型,就融合了视觉、激光、雷达等多模态,对于目标及场景拥有更强的泛化能力,针对同一物体的不同视角、光照、遮挡,都能实现准确识别。
联合算力、算法,打造AI生产生态
作为一家AI企业,闪马智能以智慧交通解决方案为主营业务。对于ATOM AI开发平台,闪马智能更希望借此打造一个AI生态。
在WAIC大会上,闪马智能宣布与北京国科智算科技有限公司、北京国科未来科技有限公司联合成立“中科闪马”,意在借助更多资源,共同推广ATOM新一代异构人工智能计算平台和DataOcean新一代存储系统,打造主可控、软硬一体的人工智能计算与存贮设备,并为大模型的训练与实战提供可靠的计算平台。
中国科学院虚拟经济与数据科学研究中心特聘研究员张影飞表示:“中科闪马智能有限公司具有三大优势:第一,强强联合、资源整合;第二,技术融合、拓展应用;第三,聚力发力、突破难点。期待与闪马智能共同推动自主可控的国产技术发展与创新。”
毫无疑问的是,在大模型时代,算力的意义变得无比重大。在日前的WAIC大会上,闪马智能便邀请了国产GPU及解决方案厂商沐曦加入ATOM产业生态。
在沐曦创始人陈维良看来,以GPU为代表的芯片产业已经成为了AI产业的发展瓶颈。AI产业旺盛的需求催生出了GPU的广阔市场,GPU未来的发展架构也将针对AI产业需求进行定义。
闪马智能的生态圈也在尝试将更多伙伴拉入自身的生态圈。例如,在WAIC上,闪马智能宣布将与3D互动内容创作和运营平台Unity中国合作,基于3D孪生技术和“AI+交通”的算法能力,打造实时全息的智慧交通系统与灵活弹性的渲染云平台。
以往,Unity大多被用于游戏开发,客户以游戏厂商为主。但近年来,随着科技业对于3D引擎需求的增长,越来越多的开发者开始将Unity用于非游戏领域的开发,如汽车智能座舱、数字孪生、元宇宙等等。特别是在汽车领域,包括闪马智能在内的众多厂商,都在使用Unity作为3D渲染工具。
而Unity也在积极拥抱AIGC。日前,Unity中国公布了其在AIGC相关领域的规划——打造U3D Copilot——开发者只需要使用自然语言下达需求,AI就可以通过大语言模型和用户更自然的交互界面,串起3D的AIGC模型,以及引擎内部能提供的包括资产库和程序化生成等这种工具。
U3D Copilot同时面向游戏和非游戏行业的开发者。在2023世界人工智能大会上,Unity中国CEO张俊波在接受36氪采访时表示,以U3D Copilot为代表的3D渲染AIGC工具,对于非游戏行业意义更大。与游戏开发者相比,这些开发者在3D渲染方面的经验有限,而AI则可以为他们提供更多助力。
不难看出从上游的算力、数据资源,到下游的行业应用,闪马智能结合自身业务,搭建起了一整套面向大模型开发的生态系统。从某种程度而言,闪马智能自身也成为了AI大模型产业基础设施的一部分。
如今,中国AI大模型正在蓬勃发展。根据科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》,据不完全统计,国内参数在10亿规模以上的大模型全国已发布了79个。
对于大模型的未来前景,彭垚给出的答案是,这条赛道如今從业者甚多,但并不拥挤,因为大模型赛道极其广阔:“今天,仍有很多领域的大模型甚至还没有完成定义。”
“所以,我们一定要拥有自己的GPU、自己的算力,有更多做模型、做算法、做平台的公司,这样,中国的大模型产业才能发展起来。”他进一步解释到。