田丰
2023年10月31日,观众在杭州2023云栖大会“人工智能+”展馆参观人工智能产品及应用(黄宗治/ 摄)
当前,国产大模型科研创新加速,成为国家综合科技实力的体现;发展新一代人工智能,引领前沿发展,也成为每一家中国原创AI团队的责任使命。
“这场未来通信革命带来的好处与难题,将比上次个人计算机革命造成的好处与难题大得多。” 比尔·盖茨在《未来之路》一书中提到。他认为,大语言模型是“自图形用户界面以来最重要的技术进步”,应被视为新一代人机通信革命。
关于人机通信,早期,专业技术人员使用命令行界面,是让人说“机器的语言”;之后,Windows和iPhone让大众使用图形界面,是人类操作图形来控制机器;再到如今,众多模型、软件采用对话式交互界面,让机器、程序使用“人类母语”(自然语言、方言)交流,AI突破“图灵测试”,成为人类社会的“新成员”。
例如,美国互联网公司Meta推出的MetaAI在不同平台上与人类用户社交的有28位AI虚拟角色,包括舞蹈爱好者、高尔夫职业球手、手工艺专家和破案侦探搭档等。
众多模型、软件采用对话式交互界面, 让机器、程序使用“人类母语”(自然语言、方言)交流,AI突破“图灵测试”,成为人类社会的“新成员”。
国内微博也上线了热门电视剧《长月烬明》《狂飙》中的AI虚拟人物,与粉丝进行微博、私信互动。终有一日,虚拟角色将从线上走入线下。
AI写作、AI绘画、AI编程等AIGC(生成式人工智能)应用,或将成为未来5年数字经济的新动能。可以预见的是,伴随爆款AIGC应用的出现,庞大的用户访问量持续推高推理计算成本,将带来算力分工与转移。
每一次模型应用都是一次推理计算,虽然单次推理算力成本很低,但数亿用户进行数亿次推理时,推理算力的总成本,将超过训练算力总成本。
现在,英伟达、英特尔和安谋等芯片厂商,都在积极投入终端AI芯片产品研发,预计2024年消费电子市场将会出现众多嵌入AI芯片的智能增强型个人电脑、手机、AR眼镜、家电等。“无所不在的AI”驱动的AI新终端,将会分担一部分推理算力任务,减轻AI云负载。
当新一代“应用软件”(AI模型)与新一代“硬件终端”(机器人、AR眼镜等)加速融合,新一轮工业革命将拉开大幕。
在供给侧,基于大模型的智能体将变成人类的“生产力遥控器”。伴随AI芯片嵌入智能车、智能机器人、智能AR眼镜、智能家电等所有终端,人类个体在“人机协同”模式下能够同时指挥的生产资料规模将大幅上升。
现在,特斯拉正在研发2万美元的擎天柱机器人,搭载大模型Grok,有望成为受工厂主、家庭主妇欢迎的“超级智能体”。美国斯坦福大学李飞飞教授团队的论文、中国智元机器人公司的机器人产品亦展示出,没有经过特定训练的工业机器手,能够通过视觉语言大模型,第一次就能实现复杂任务处理,体现出令人惊叹的“柔性操作”能力。
大模型提升生产力的同时,将与各国人口数量脱钩,与能源、AI研发实力挂钩,这可能将彻底改变发达国家与发展中国家的供需模式和生产分工。同时,人工智能产业也会从高端人力密集型转向重资产密集型。
事实上, 大模型、大计算、大数据都具有重资产投入的特征。
1993年,美国宣布实施“信息高速公路计划”,总投资额4000亿美元,占年度GDP的5.8%,开启了全球互联网“数字经济2.0”浪潮。近年来,美国数字经济年均增速超过6%,占GDP比重已超过10%,年度产值高达2万亿美元,并带来了5%的就业岗位。
在我国,据国家发展改革委数据显示,2022年正式全面启动的中国“东数西算”工程项目总投资额超过4000亿元。
国际数据公司IDC预计,2022年至2027年,中国智能算力规模复合增长率将高达33.9%,是通用算力的2倍增速;用于行业应用的推理算力将从2024年出现拐点,首次超越训练算力规模;2025年,中国数字经济规模将首次超过实体经济。
2023年7月7日,上海世博展覽馆,2023世界人工智能大会上AIGC大模型应用火爆,商汤展区的AI 绘画生成艺术与观众互动火热
2023年11月24日, 杭州,第二届全球数字贸易博览会前沿趋势馆内,首次汇聚的50个人工智能大模型同场竞技,热闹非凡
AI芯片已成为AI从业者的沉重“税负”,让AI算力成本回归社会公共服务的平民价格,是数字经济3.0可持续发展的关键。
市场上AI算力的稀缺为少数芯片制造商带来巨大的市场控制权和高额利润。据美国金融机构瑞杰金融集团透露,头部AI芯片公司的利润率可能高达1000%。在如此高额利润的刺激下,必将有更多低价格的竞争对手(含国产AI芯片)涌现,让AI芯片回归公共基础设施的本质,更多价值将从芯片释放出来,向算力服务、模型服务、AI2.0应用转移。
反之, AI芯片价格若长期运行在高位,会让面向大众市场的所有AIGC创新应用因昂贵的“芯片税”而衰败,无法形成“数字经济3.0”的创新浪潮。
一般而言,算力消耗的能源是AIGC创新应用必须分摊的成本,持续降低成本,对AI应用生态健康良性发展至关重要。
以Meta研发的语言大模型LLaMA为例,训练LLaMA-65B (650亿参数量,属于中等规模)一次的电力成本,以美国电价换算成人民币为0.87元/度估算,约需40万元。而OpenAI的GPT-3训练一次的电力成本超过100万元人民币。
大模型产业数据分析显示,大语言模型的训练成本中,电力费用占比高达65%。当“万亿参数量”的GPT-4,以及更大规模参数量的GPT-5到来时,能源与算力成本或让众多应用创业者望而却步。
目前,微软基于GPT-4推出的AI编程工具Copilot,用户每人每月需付费10美元,但微软需为此功能向每个用户每月倒贴20美元,因此微软全年亏损超过一亿美元——这是小型AI应用创业团队无法承受的。
目前,微软与OpenAI都投资了核聚变创新公司,如美国联邦聚变系统(CFS),同时与美国橡树岭国家实验室、欧洲实验室等多方共同研发核聚变技术,以求不断降低能源成本。
博古通今的大模型,将引发“知识大革命”。
11世纪毕昇发明的活字印刷术、15世纪古登堡发明的铅活字印刷术,让人类在千年历史中积累的庞大知识通过印刷书籍的形式推广传承,知识传播速度由此提升。
比尔盖茨在《未来之路》一书中提到,在谷登堡印刷革命之前,整个欧洲大陆大约只有3万册书,几乎都是圣经或圣经评注性著作,而到了公元1500年,各类题材的图书猛增到900多万册。宗教精英圈子以外的人士第一次有机会接触到书面信息。
鉴于大型语言模型远超人类的超高速学习能力,不少专家预计其将在2026 年学习完所有人类历史上的高质量文本数据。
据多方研究数据表明,大型语言模型能显著提高知识学习速度、知识检索速度、知识传播速度和知识推荐准确性,具有跨语言、跨学科领域、跨信源的独特优势。
在人机协同模式下,大型语言模型可将人类科学论文的阅读时间缩短40%,知识搜索时间缩短20%。而这仅仅是ChatGPT出现一周年的“起点”,鉴于大型语言模型远超人类的超高速学习能力,不少专家预计其将在2026年学习完所有人类历史上的高质量文本数据。
20世纪90年代,未来学家雷·库兹韦尔发现指数级发展的规律:“一旦技术变得数字化,即被编辑为0和1表示的计算机代码,它就能够脱离摩尔定律的束缚,开始呈指数级加速发展。”因此,数字经济中每一代超级平台企业都是软件创新型企业。
每一次软件大革新,都会诞生新的超级平台企业,颠覆原有的数字经济霸主。从Windows、AppStore到GPTs(一种预训练语言模型),都不例外。
当前,智能编程助手改变代码生产流程,大型语言模型成为新一代AGI(通用人工智能)服务入口和软件调度枢纽。新一代青少年将在新兴AI软件与MaaS(模型即服务)模型化创新思维逻辑上成长起来,并将新型生产力软件带入办公室和家庭。
AI算力基础设施即将迎来大量技术工程创新。随着持续的降本增效,AI将真正成为赋能千行百业的通用型基礎设施;同时,“百模大战”将走向AI产业专业化分工。
纽约大学AI Now研究所发布的《计算能力和人工智能》报告称,早期AI模型算力需求是每21.3个月翻一番,2010年深度学习后(小模型时代),模型对AI算力需求缩短至5.7个月翻一番,而2023年,大模型需要的AI算力需求每1至2个月就翻了一番。
摩尔定律的增速显著落后于社会对AI算力需求的指数级增长速度。换言之,“AI超级需求曲线”遥遥领先传统架构的AI算力供给,带来了AI芯片产能瓶颈、涨价等短期市场现象。
为此,许多国家均加大大规模智能基建资源投入,并力图在AI芯片、智能算力集群、大模型架构、专用模型加速等环节创新突破。
纵观国际格局,2023年7月中国国际数字和软件服务交易会中,科技情报大数据挖掘与服务系统平台AMiner联合智谱研究发布《全球人工智能最具创新力城市500强分析报告》显示,在全球AI创新力城市TOP100中,美国33个城市入选,中国有19个;在TOP500里,美国有143个城市入选,中国有42个。
要抓住AI大模型发展机遇,需从K12中小学生和社会职业培训两个方面入手——让大模型走进每一个课堂和家庭,让每一位中国人都能接触到学习调优、使用国产大模型的课程,以培养当前和未来的AI工程师。
商汤教育联合业界知名教育家,在中国出版了《人工智能基础》四册教材,以提升青少年AI技术应用开发能力,同时加强人文伦理教育。截至2023年12月,商汤教育已经为中国超过24个省区市、40个城市、3200多所学校带去了人工智能教育产品(课程、教材、教具、实验平台),覆盖22万名学生,培训出1万多名AI教师。
在不远的未来,我们将看到人人用得起AI算力,人人训得起AI数据,人人做得好AI模型。
(作者系商汤科技智能产业研究院院长)
2023年7月6日,人们在上海2023 世界人工智能大会上观看华为云盘古气象大模型(王翔/ 摄)