AI大模型的“反共识”和“冷思考”

2023-10-24 10:40:16李笛

商界评论 2023年9期

关键词：小冰商业模式人工智能

1. AI大模型还处于萌芽阶段，既有新方向，也有大忽悠。好多年前，计算机刚刚开始普及，那时候连算命的都叫“电脑算命”，价格还挺贵。不久之后呢？

2. 中国的AI公司或者大模型公司，面对的最主要问题不是技术问题，而是商业问题。我们判断，未来主流应该是混合模型。有很多同行，都已经在布局更小参数规模的模型。

3. 越大的模型越容易同质化。想象一下，一个班上的同学，训练数据是相同的，训练方法是相似的，老师也是同一个，越大规模参数的大模型，不就越可能同质化吗？

4. 大模型公司能不能养活自己？API（应用程序接口）的商业模式会不会被开源颠覆？随着行业的“内卷”，大模型本身将不再是一个昂贵的东西，大模型将越来越不值钱。

5. 我们有两个坚持：第一，我们不愿意收不是AI的钱；第二，我们不只靠卖技术赚钱。小冰（北京红棉小冰科技有限公司）在积极推进新的商业模式，是一种共享终端利益的商业模式，而非一种提供铲子的商业模式。

6. 人工智能公司的护城河到底是什么？以前搞人工智能、自然语言处理的团队，全国算起来可能也没多少，大模型出现以后大家发现谁都可以做。技术本身越来越不成为护城河。什么是护城河？Deep Relationship（深度关联），有用户数据，有深厚关系。

7. AI是助手，而不是对手。小冰是打造用户与AI的“孤岛”，而不是建立用户与用户的“广场”。与同行业者普遍使用的“广场”“话题”“排行榜”等产品设计不同，小冰的每个用户仅能与AI接触，从产品底层设计逻辑上，避免了用户之间的任何聚集。

8. 产品中不冒然使用大模型，而是使用技术成熟的小模型和检索模型。小冰目前在产品中，仅使用技术成熟的小模型，模型参数规模最大仅为3.5B，最小为0.5B。同时综合运用了技术更为成熟的检索模型作为安全模式。

小冰公司前身微软小冰团队，是微软全球最大的人工智能独立产品研发团队。小冰框架目前是全球承载交互量最大的人工智能框架之一，技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。

2020年7月，小冰开始独立运营，微软互联网工程院副院长李笛担任CEO；2021年7月，小冰公司完成A轮融资，估值超10亿美元；2022年11月，小冰公司宣布完成10亿元融资，估值超20亿美元。少女小冰、Rinna、夏语冰、小堂妹、冬奥裁判观君等AI虚拟人，都是小冰框架孵化出的AI Being（人工智能数字员工）。

以下内容来自小冰公司CEO李笛的分享，希望能给大家带来一些启发。

我必须先谈一件事，这件事直接影响我们各行各业如何看待大模型。

坦率来说，我个人观点，人工智能发展到今天为止，仍处于孟德尔刚刚发现遗传学规律的那会儿。

也就是说，当下的AI大模型，还处于萌芽阶段。

在萌芽阶段，可以想象，也可以看到各种各样跟大模型有关的东西冒出来。有一些是真正的新方向，有一些是大忽悠。

我记得多年前，计算机刚刚开始普及，那时候就出现了“电脑算命”，价格还挺贵。

很多人认为，大模型新的能力会不断涌现，谁在大模型时代领先一步，谁就能够在接下来的时间里步步领先。

可惜，事物的发展并不是如此。这更像是一个波形，大模型在接下来也會遇到瓶颈。整个科技界会期待新的方法，下一波浪潮也会来解决我们当下遇到的这些瓶颈问题。

第二点，我想跟大家分享的是，截至目前，对于大模型时代的技术，科学家们还只是停留在一个观察结果上面，并没有特别多的关于背后原理的了解。

我们今天还处在人工智能的蛮荒时代，更准确地说，是蛮荒时代的一次剧烈波动期。

我个人判断，从现在开始，到明年二季度，大模型等技术还会产生剧烈的波动。

我在微软时，除了是小冰的负责人，还是微软搜索引擎必应的亚洲负责人。

从我的视角来看，为什么最先推出大模型的公司不是谷歌？是因为它没有吗？那是因为，谷歌在搜索引擎领域处于老大的位置。

微软必应在全球范围内最大的竞争对手是谷歌。谷歌的规模大约是必应的10倍左右。当微软使用大模型来冲击这个市场的时候，谷歌要印证，就必须付出10倍的成本。

此外，由于谷歌在搜索引擎上面的收入非常大，当它使用新的技术范式的时候，就会直接导致毛利迅速下降，已经构建成功的商业模式也会迅速被破坏。

谷歌没有任何的主动意愿，在自己占据优势的领域尝试新的技术模式。

但对于微软而言，大模型就是一个非常棒的挑战者的新武器。

百度在几个月前宣布推出文心一言的时候，很多人都认为它会将文心用到搜索引擎上。我们当时的判断是不太可能的，更可能的方式是将大模型利用到百度占据老二、老三的位置上去。果然，最后它是和百度云深度捆绑。

对于大公司来讲，如果你已经在某一个市场具备了领先地位，就应该把大模型当作战略性储备武器。对于挑战者来讲，它是一个比较好的武器，使你有机会在短时间内获得更多的市场份额。

不同人看待大模型的视角不同，不可避免地会附带各自的主观期望。我也会带有主观色彩，但尽量客观。

我认为，中国的AI公司或者大模型公司，面对的最主要的问题不是技术问题，而是商业模式问题。

几个月前，行业里面普遍认为大模型将通吃。换句话说，就是未来将有一个唯一的大模型，这个大模型能够取代其他已有的技术范式。这也是很多人贸然布局大模型的原因。

我们当时判断，不是这样的。大模型不是越大越好，大模型不会通吃，未来将是混合模型居多。

给大家举一个简单的例子：

如果你的模型参数规模控制在130亿以内，就可以用单卡的A100驱动这个模型；如果控制在70亿参数左右，可以用单卡的V100去驱动；如果控制在40亿参数规模，甚至可以用非常廉价的T4去驱动。

而这中间产生的成本差，大概有上百倍的差异。

所以像我们小冰公司，还有很多同行，其实都在布局更小参数规模的模型。

很多的技术创新都会有一种从众心态，从众就意味着整个领域会“卷”得非常快。

现在有很多大模型，比如有650亿参数以上的，甚至有超过千亿参数的。

第一，它们都需要海量的数据。大部分的同行业者所拿到，或者所准备的训练数据，都是类似的，彼此之间差异不大。

第二，它们的训练方法也是类似的。大家都想先追上GPT（生成式预训练Transformer模型，一种基于互联网的、可用数据来训练的、文本生成的深度学习模型），所以大家的训练方法也是相似的。

想象一下，一个班上的同学，训练数据是相同的，训练方法是相同的，老师也是同一个，那么越大规模参数的大模型，不就越可能会同质化吗？

反而是中模型和小模型，因为训练数据少，所以能精细地筛选训练数据，训练方法也可以不同，就有可能产生足够高的差异性，进而形成壁垒。

还有，到目前为止，大模型的涌现是不是已经到了尾声？

有一种观点认为，再要涌现新的能力，可能需要参数规模3个数量级的增长。还有其他的观点认为，需要新的一种技术范式的变化，比如杨立昆（Yann LeCun，Meta首席人工智能科学家）提到的世界模型。

毫无疑问的是，涌现并没有像我们所想象的那样继续激动人心，这意味着什么？

这意味着对于大模型而言，基于当前的技术进行场景应用的深挖，变成了最至关重要的事情。

大模型公司能不能养活自己，我们甚至都不讨论它能不能赚钱。

先跟大家分享一个例子—“这个女孩叫小美”。

可能很多年轻的朋友，在B站（哔哩哔哩）、抖音上看过这种电影解说。实际上，這个声音是微软云服务里面所包含的一个声音。

很多视频创作者都使用了这个声音。其中，有短视频做得非常棒，赚了很多钱的人；也有因为种种原因短视频完全不挣钱的人。微软作为提供声音技术服务的公司，能不能从中获得不同的回报？

答案是否定的。

类比到人工智能。AIGC（生成式人工智能）创造了巨大的价值，但是人工智能企业能不能从巨大价值中获得应有的价值？

答案可能也是否定的。

人工智能服务提供者，无论使用它做出来的内容是多么赚钱或者不赚钱，都只能按照次数或者时长来收取相同的钱。还有可能面对很多同行，以免费的方式来跟我们竞争，最后大家谁都赚不到钱。

再给大家举一个例子：

一个媒体朋友跟我咨询人工智能撰稿，让AI写出符合媒体调性又高质量的稿件。

我好奇地问：“你愿意为此付多少钱？”

对方回答：“这不是有定价吗？1 000个Token（在自然语言处理中，指文本中的一个最小单位，通常是一个单词、一个标点符号、一个数字、一个符号等）是0.2美分，一个月200篇稿件。”

我说：“刨去成本，我一个月能从你身上挣到多少钱？100元都不到。”

换作人类撰稿，一篇稿件或要1 500元起，200篇稿件则要35万元。人们是不会给人工智能企业按照创造的价值来付费的。

回顾过去，一些人工智能公司，比如做人脸识别的，帮我们解决了很大的问题，但它的服务很难收到钱，最后不得不去做软硬结合。

所以说，制约大模型和AI发展的，其实是经济学规律。

这一波人工智能新技术有一个巨大的特点，那就是：降低了人工智能领域从业者的进入门槛。

以前搞人工智能、自然语言处理的团队，全国算起来可能也没多少。大模型出现以后，大家发现谁都可以做大模型，甚至很多传统领域的企业，也开始亲自训练自己的大模型。

各行各业都可以参与其中，所以技术本身越来越不成为护城河。

那么什么才是人工智能公司的护城河？

我先给大家讲一个例子：Inflection Pi（人工智能初创公司Inflection AI推出的首款聊天机器人Pi）。

Inflection AI公司近期宣布，在微软、里德·霍夫曼、比尔·盖茨、埃里克·施密特和新投资者英伟达（NVIDIA）牵头的一轮融资中，共筹集到了13亿美元，总计融资达到15.25亿美元。据路透社报道，该公司最新一轮估值约为40亿美元。

Inflection AI的首席执行官Suleyman（苏莱曼）介绍说：

“我们不知道所有的答案，但我们正在着手开发一种真正对你有用的个人智能，它就在你身边。我们的使命是将你的人工智能与你和你的兴趣，坚定地联系在一起。这意味着设计一种人工智能，可以帮助你表达你的意图，组织你的生活，并在你需要的时候为你服务。”

ChatGPT（美国人工智能研究公司OpenAI研发的一款聊天机器人程序）不管用户是谁，更关心后端，更像搜索引擎。

Inflection AI则寻找另外一个方向，认为护城河是其对用户的理解。

如果大家使用Inflection AI，会发现一个很明显的特点，袭天卷地的各种各样的提问，他会抓住一切机会去理解你，甚至一天之内会问你200个问题。

说实话，只要是具有相关从业经验，并且资金储备、算力儲备差不多，在技术产品上，谁也不会比谁领先一两个月的时间，但是用户数据的护城河能够领先很久。

我们以前认为，人工智能是可以取代人的。但真的是这样吗？

比方说，已经有一个莫言了，人工智能是要写出比莫言更好的小说吗？不是的。

人工智能真正的特点和价值，是在同样质量的情况下，人工智能可以不眠不休，可以7×24小时，可以同时和千万人进行交互。

人工智能会不会取代人？如果他是我的助手，他就不会取代我。大家想想，如果今天每一个人类的创作者都有了一个助手，它可以帮助人类去更好地创作，不是更好吗？

按照助手的逻辑，AI一定和人是一对一交互的。

小冰公司致力于打造用户与AI的“孤岛”，而不是建立用户与用户的“广场”。

与同行业者普遍使用的“广场”“话题”“排行榜”等产品设计不同，小冰的每个用户仅能与AI接触，从产品底层设计逻辑上，避免了用户之间的任何聚集。

如果一定要把人工智能掺到人和人之间，无异于破坏式地改变原有的良性结构。

以前，一家公司可以通过技术研发，掌握一种别人很难追上的知识图谱的能力。现在，这件事情不存在了。

所以，如果做了一个抄袭型的大模型，达到了跟别人一样的质量，那最后商业模式才是关键。如果率先推出了一个原创型的大模型，你就等着被别人追赶吧。为什么？因为大模型短期内看不到新的能力的涌现，所以你自己不能加速甩掉后面的跟从者，你只能在原地等着，直到被后来者追上。

我们可以看到，大模型多是API的商业模式，这个商业模式会不会被开源颠覆？随着行业的竞争加剧，大模型本身将不再是一个昂贵的东西，大模型将越来越不值钱。

小冰公司在探索商业化时，有两个坚持：

第一，我们不愿意收不是AI的钱。比方说，有一个智能防盗门，可以人脸识别，它可能卖3 000元。之所以卖3 000元，是因为防盗门的成本有2 800元。所以，这2 800元就不是AI的钱。我们今天有很多智能音箱，更多的是音箱值那么多钱，而不是智能值那么多钱。

第二，我们不只靠卖技术赚钱。OpenAI把研究室的研究成果API直接卖给客户来使用。我们追求的是，一定要取得实际产生价值的那部分。小冰在积极推进新的商业模式，是一种共享终端利益的商业模式，而不是一种提供铲子的商业模式。像我们跟奈飞、网易云音乐的合作，就是挣共创的钱。

我们也仍然只是在探索，小冰也有可能是“前浪死在沙滩上”。

到目前为止，人工智能无论是To C还是To B，尚未产生一个成熟或者成功的端到端的商业模式。所以各位，咱们大家都还有机会。