ChatGPT上线两年了,大模型依然在你追我赶。
继上次挑起价格战之后,字节跳动旗下的火山引擎再次延续策略,发布了豆包视觉理解模型,主打在教育、旅游和电商三个主要场景的落地,价格上把每千tokens输入的价格打到了0.003元,比行业平均水平降低了85%,号称视觉AI进入了“厘时代”。
大洋彼岸,几天前OpenAI正式开放视频大模型Sora,但很快过高的需求就导致ChatGPT遭遇全球范围内的宕机,而苹果新版本落地,Siri也开始真正调用ChatGPT。作为有力的竞争对手,谷歌也发布了最新AI模型Gemini2.0,多模态能力进一步升级,智能助手Astra可调用谷歌搜索和识图等应用来完成任务。
2024年年末,ChatGPT的周活跃用户突破了3亿人次,10亿是未来的目标,但成本的压力已经显现,因此它们推出了不同版本的付费模式。
而对中国市场的竞争来说,2024年的竞争分化已经非常明显。首先是大模型人才上的争夺,这一点从字节与阿里等大厂身上已经可以非常明显地感受到;其次是追赶速度加快,不论是通用模型和多模态大模型,技术路线有区别,但落地场景一个都不能少;最后则是大模型创业公司,它们要跟大厂同台竞技,就必须走上差异化的道路,而且已不断在做减法。
2025年,大模型市场依然背负着巨大的期望,不论快与慢,它们都要回答来自外界的关切:如何让用户发现我物有所值?
2023年,阿里与字节在大模型竞争策略上最明显的不同,就是投资覆盖的面积。阿里选择的是海投,投资了5家最有代表性的大模型创业公司,包括月之暗面、智谱AI、MiniMax、零一万物和百川智能;虽然字节一个都没有投,但亲自下场,布局从模型到应用的市场。
到了2024年,在人才争夺上,字节和阿里打起了对垒。2024年年中,阿里通义千问大模型技术负责人周畅离职创业,到年末才爆出,周畅实际早已经加入字节跳动,负责AI大模型相关工作,而阿里方面也以违反竞业协议为由起诉周畅,进行索赔。
抢人才,只是字节跳动在大模型竞争最明显的动作之一。根据2024年9月发布的《2024大模型人才报告》,AI大模型领域人才竞争激烈,字节跳动成为新发大模型岗位量最多的企业;其次是小红书,超过了阿里、美团等互联网大厂。
除了加入字节大模型团队的周畅,原零一万物核心成员黄文灏、面壁智能核心成员秦禹嘉、谷歌原videopoet项目负责人蒋路等人都被字节跳动大模型团队招入麾下,向负责人朱文佳汇报工作。
阿里并非不注意人才密度的问题。2024年10月,阿里云创始人王坚在媒体采访中也提到了人才的问题,他举出的一个最明显的例子,就是对比谷歌和OpenAI。OpenAI有600多人,谷歌有几千人,而最后决定创新成败的还是人才的密度。因为OpenAI人才密度高,但谷歌人虽多却各自为战。
“人才密度加上科研的强度,创新加速度就出来了”,王坚当时认为,这个加速度才是科技创新最重要的东西,有加速度即使落后也能赶上,没有加速度即使原来领先,时间一长也会变得落后。
纵观2024年,加速度恰好可以成为字节和阿里在大模型领域竞争的关键词。
阿里通义大模型2024年的发展不能算慢,9月正式上线了AI通义万相视频生成大模型。在模型端,通义千问开源模型Qwen2.5,性能上完胜Meta405B参数的Lama3.1;而在基础层,AIInfra系列产品构建起阿里云稳定高效的AI基础设施产品,模型算力利用率整整提升了20%。
但更本质上的对标,字节大模型+火山引擎,瞄准的就是通义千问+阿里云这套打法,也就是都瞄准了B端市场的未来。
阿里云CEO吴泳铭曾在财报会上披露,预计2025财年下半年(2024年10月—2025年3月),阿里云将恢复两位数的收入增长,而从2024年前三季度的业绩来看,阿里云营收增长的一个推动力就是AI相关产品,连续五个季度保持三位数增长,在公共云中的占比中进一步提升。
而字节跳动争抢云端市场的策略非常明确,2024年12月18日,火山引擎的FORCE原动力大会公布一系列豆包大模型的最新进展。久未露面的张楠也发布了“即梦AI”(原Dreamina)——作为前抖音CEO,如今她把抖音定义为一个真实世界的相机,而即梦则是想象力的相机。
即梦AI是剪映旗下一款一站式AI视频创作平台,对标的就是OpenAI的Sora,2024年5月正式更名,下半年发力;11月开始密集更新,上线S2.0版本。进入12月,豆包电脑版上也开启内测了视频生成模型PixelDance。
火山引擎已成为阿里云毫无疑问的竞争对手,二者都掌握着实力相似的AI算力基础设施,对二者来说,持续不断降低的算力成本和模型价格已经成为过去式,未来如何长出更繁荣的AI应用生态,已成为各自更迫切的赛点。
从一开始,腾讯在大模型上就选择了开源路线,而百度则是闭源模型领域的大厂代表。起跑争先的百度,和不争先的腾讯,成为大模型行业的另外一组对标。
2023年,百度是国内大厂中最先发布大语言模型的一家,而腾讯则是大厂中起跑最晚的一个,二者发布时间间隔了6个月。
到了2024年,二者在技术升级和场景拓展上都有进步,也与各自原有业务上结合出了新亮点。比如百度文库经过大模型重构成了一站式AI内容获取和创作平台,而微信搜一搜等场景中,混元大模型都成为更高效的存在。
2024年上半年,混元大模型最大的变化就是发布了腾讯元宝APP,但从这一年的变化来看,元宝的用户数据还很难说成功。因为Kimi智能助手、文小言和豆包牢牢占据前三的位置,网页端用户访问体量都达到1500万以上的规模,腾讯元宝上线最晚,数据也是最后一名。
当然,网页端访问数据只是各家大模型活跃程度的一个侧面。
在移动端AI原生应用方面,同样是截至2024年10月,行业月活规模总数达到8976万,同比增长373%,其中,豆包、Kimi智能助手、文小言月活跃用户分别为4839万、1650万、1179万——也就是说,网页端Kimi占优,而豆包在移动端占优,文小言居中。
可第三方数据和大模型公司在官方数据上差异明显,2024年11月,百度官方公布的数据是,文心大模型日均调用量已超过15亿,文心一言用户规模达到4.3亿。而量子位智库数据显示,截至2024年11月底,豆包2024年的累计用户规模已超过1.6亿。
数据口径可能有差异,但财报不会说谎。
2024年三季度,百度营收为335.57亿元,同比下滑3%,非公认会计准则下,归属百度的净利润58.86亿元,同比减少19%。百度在财报会上提到,AI搜索商业化仍处于早期阶段,短期内百度并不急于商业化,主要收入来源的在线广告业务将承压。
无独有偶,腾讯在2024年三季度财报会上,同样对混元大模型嵌入商业化搜索结果的做法持否定态度,因为目前阶段的主要任务依旧是吸引用户,而不是过早的货币化。而另外一面是,大模型确实提升了微信搜一搜的搜索效率,商业查询增加,点击率提高,腾讯的搜索收入同比翻了一番多。
相比起来,2024年下半年腾讯在大模型领域的发布动作不断,先是发布了新一代万亿参数大模型混元Turbo,然后又推出首款开源的大语言模型混元Large、3D图像生成模型混元3D和视频生成大模型,加上2024年5月腾讯推出的开源文生图模型,腾讯混元大模型已经发布了四款开源大模型。
尤其是2024年12月初,混元视频生成大模型的发布和开源,相当于补足了腾讯大模型的短板。2024年OpenAI发布了首个视频生成模型Sora,在这一风潮之下,视频生成大模型成为互联网大厂们的必争之地,如今腾讯起跑虽慢,但年末也终于对齐了同行。
“可能要再过几个季度,我们才能看到一些真正的大模型的大规模应用案例”,腾讯财报会上这样回答混元大模型的商业化策略,目前混元大模型最直接的好处就是给内容推荐和广告带来了效率的提升。
与美国成熟的toB市场相比,中国的AI大模型们很难通过平台销售软件的模式打开市场。百度在大模型上商业化的重点方向还是做大智能体生态,李彦宏2024年的判断是,作为AI应用的最主流形态,智能体将迎来爆发点,而百度将于2025年初发布新一代大模型。
2024年的大模型创业公司,各有各的烦恼。
大模型创业危机四伏,减法成了标配之一。2024年9月,月之暗面停更了两款出海toC产品:Ohai和Noisee;百川智能联合创始人兼商业化负责人洪涛离职,他与王小川同出清华,曾任搜狗首席营销官;2024年8月,零一万物算法副总裁、模型预训练负责人黄文灏加入了字节跳动,核心成员李先刚离职重返贝壳;MiniMax的角色陪伴类AI应用在海外市场高速增长,但TikTok未来面临的问题也同样在困扰它。
另一方面,对大模型创业公司们来说,即便估值都达到了两百亿美元的水平,但过去一年行业进入了理性周期,它们都不得不走上差异化的道路。
“不要重复造轮子”,已经成为AI行业越来越显见的观点,比如2024年10月传出消息,6家大模型独角兽公司中至少有两家,逐步放弃预训练大模型,其中之一可能就是零一万物,但创始人李开复随后否认。
相比零一万物,其他四家大模型独角兽在过去一年,都已经展示出了各自独特的发展路径:外媒曾披露,Minimax的7000万美元2024年预计收入,主要依靠的是海外角色陪伴产品Talkie;月之暗面一直在卷技术,2024年下半年发布了Kimi探索版,2024年年末又推出推理模型上的两个进化版本K0-math和视觉思考模型K1;智谱AI则强在做B端的定制化项目,中国大模型中标公告中,智谱AI是五大独角兽中唯一一个与大厂竞争的,它刚完成新一轮30亿元融资;百川智能则一直在医疗领域深耕。
表面上,大模型独角兽们还是在积攒大招做模型创新,但实际上,经过这一两年的进化,这场大模型独角兽与互联网大厂们的同场竞技已经不再单纯,它要考验的不只是模型能力,更是公司组织能力和业务场景的竞争,这是对大模型独角兽各自战略综合实力的挑战,也注定是一场残酷的淘汰战。
2025年,谁会掉队?