“擂响战鼓”的中国AI大模型

2023-06-20 17:57孙冰

中国经济周刊 2023年11期

孙冰

谁是当下中国乃至全球的“科技顶流”？AI大模型几乎毫无争议。

5月28日，科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示，中国研发的大模型数量排名全球第二，仅次于美国，目前中国10亿参数规模以上的大模型已发布79个。而从大模型区域分布来看，中国已有14个地区在开展大模型研发，其中，北京、广东、浙江、上海处于第一梯队，数量最多的北京有38个大模型，第二位的广东有20个。

在全球大模型竞赛中，中国科学院院士、中国计算机学会开源发展委员会主任王怀民表示，过去5年世界上参数量超过百亿的大模型大约有45个，其中有32个出现在美国，9个出現在中国，4个出现在欧洲。

但是，发展迅猛、一路“狂飙”的中国AI大模型们，仍然需要一些冷静的思考。

大模型“智能涌现”令人兴奋，AI能力开始不可预测

人工智能技术已经发展了很多年，为什么大模型出现后，学界、产业界乃至社会大众会如此兴奋甚至害怕呢？北京智源人工智能研究院院长黄铁军教授告诉《中国经济周刊》记者，AI之前更像是人类的助手，根据人类的指令做着人类能够确定结果的工作，比如你设计AI打开电灯，AI就只会打开电灯。

“但是，大模型之所以现在如此受关注，是因为当人工智能的参数量达到了百亿级别之后，出现了拐点或者说突变，人工智能的能力开始不可预测了，就是所谓的‘智能涌现现象，人工智能一些没有被预期到的能力开始出现，这种不可预知让大家都很兴奋。”黄铁军说。

黄铁军介绍，这一波人工智能浪潮的核心任务就是训练模型，所谓模型，在人工智能领域的意思很明确，就是一个神经网络，而神经网络并没有什么特别的地方，我们人脑就是个神经网络。

“但人脑是一个很庞大的神经网络，大约有800多亿个神经元通过100万亿个神经突触进行连接，所以人脑的能力非常强。对比一下，最接近人类的猩猩，其脑部神经元的数量和连接的数量差不多是人脑的1/3，猴子是人类的1/10，而一条虫子大概有300多个神经元，但其实也可以有很多生命活动了。”黄铁军解释说。

当然，目前人工智能模型的神经网络比人脑要简单很多。但是，随着数据规模的增长和算力的增加，模型的参数量也在不断增加，能力也就不断随之提高，于是就有了“大模型”，即参数量巨大的神经网络，当然其智能程度就更高。

大模型是有史以来最大平台革命，将10倍于移动互联网

“AI大模型是绝对不能错过的历史机遇。因为这将是有史以来最大的平台革命，它将比Windows、安卓要大10倍甚至更多，它会让每个应用改写，会重构人类的工作，会让有创意的那些人的聪明才智被放大10倍或者更多。”创新工场董事长兼CEO李开复说。

李开复还表示，他非常认同美国著名VC机构投资人安德里森·霍罗维兹（Andreessen Horowitz）的观点：大模型的市场未来到底多大很难把握，它最小将是所有软件，最大可能将代表着人类所有的努力。

“人类历史上可能也就只有三四次这样的机会。大模型赛道是未来的兵家必争之地，因此，自主创新将是中国企业的必经之路和重大责任。”李开复告诉《中国经济周刊》记者。

李开复已经投身人工智能超过40年，他戏称自己是“投资人中最懂AI的，AI科学家中最懂投资的”。他从投资和产业发展的角度认为，随着大模型的崛起，人工智能的发展已经从AI 1.0时代进入AI 2.0时代。

李开复认为，在AI 1.0时代，单领域的数据集、数据集和模型各成孤岛，且数据标记工作量和成本非常可观；但AI 2.0时代大模型的出现可以解决这些瓶颈障碍，人们用超级巨量数据训练具有跨领域知识的单一大模型，微调后就可以执行五花八门的任务。这是一个全新且巨大的平台机会，所有的应用和界面都要重写，AI 2.0应用会进入爆发期。

“虽然目前大模型还是非完美的，但它已经拥有相当大的商业价值，甚至几十万亿规模的商业价值。”李开复预测。他表示，大模型目前还有“一本正经地胡说八道”的问题，因为AI的推理能力也来自同一个技术引擎，如果你把它的胡说八道降到接近零，它的推理能力也几乎没有了。也就是说，那些让它聪明的理由，也是让它胡说八道的理由。

“我们相信未来这是可以解决的问题。比如可以让AI与人类协作，我们不是把AI拿来作为一个终极的应用，而是把它当作一个人类‘助理。比如可以先让AI起草法律文件或者新闻稿件的初稿，最后由人类的律师和记者进行把关和调整，这样就能够在享受AI强大能力的同时，又避免了AI会犯的错误。”李开复表示。

大模型竞争没有绝对壁垒，但平台席位不会太多，成败关键在生态

黄铁军表示，大模型最终会成为未来社会的一种新型基础设施，其提供“智力”能力，输送给千行百业和千家万户。因此，人工智能进入大模型时代之后，会形成一个体系化的产业生态。

简单来说，就像电力时代的电网一样，千行百业、千家万户都在用电，但并不是自己发电，而是有专门的发电厂，发电方式也是多种多样，如煤电、火电、风电、核电……也有企业去生产各种各样的电器。

“有了大模型就像人类学会发电了，目前可能是一种技术路径走通了，但后续一定还会有各种各样‘发电手段不断演进迭代、降本增效。这意味着，就像不会有国家或企业垄断发电一样，大模型也没有绝对壁垒和门槛，大家比拼的是成本和效率，竞争的是应用和生态。”黄铁军说。

李开复也表示，未来的AI 2.0时代会有三大生态层：基础模型层、中间层和应用层。“以大模型为代表的AI 2.0市场规模巨大，足以容纳巨头、中小企业和初创公司在里面‘赛马。”他说。

至于創业者和投资人如何选择自己在这个庞大生态中的地位和角色，李开复认为，需要基于不同的判断。

比如，基础模型层的大模型平台公司当然机会巨大，天花板会非常高，就像PC互联网时代的微软和移动互联网时代的谷歌，但风险也是最大的，因为平台公司一定是少数；如果是做应用层，风险就没有那么大，而且每一个生产力领域都可能成长出垂直领域的领先公司，但规模可能无法与平台公司相比。对于投资人来说，则永远是在风险和回报之间寻求平衡。

中国大模型在“狂飙”，但“平台席位”不会太多，安全威胁也要警惕

聚焦到中国，李开复认为，大模型和AI 2.0也是中国不容错过的历史机遇，而且中国也有自身的优势。

“中国拥有丰富的中文语料和庞大的市场，通过发展AI大模型，中国可以推动创新产业的发展，实现科技与经济的双重红利。而且中国拥有庞大基数的年轻工程师和最坚韧的企业家，为发展AI大模型提供了强大的人才支持，技术领先、策略灵活、市场反应快、能打硬仗、落地执行力强，将是中国大模型公司的成功关键。”李开复表示。

黄铁军也对中国在大模型领域的发展充满信心。但也有一些现象需要格外关注。比如，大模型火了之后，还是出现了一哄而上、同质化竞争加剧的现象。

“数据就是这些数据，算力也就这么多，如果大家都去训练模型，一定很多工作是重复的，这其实也消耗了大量社会资源，不利于大模型生态的发展。”黄铁军说。

“如果类比PC互联网时代和移动互联网时代，全球范围内的大模型底层平台很有可能不会超过三个。就像移动互联网初期也曾有很多操作系统，但最后只剩下iOS和安卓。很多企业想要成为第三个，投入巨大但最终都铩羽而归。”黄铁军说。

黄铁军认为，中国甚至全世界大模型的运营体系都会是屈指可数的，虽然还不能预判是几个，但肯定不可能是十几个或几十个，根本没有市场可能性。“更多企业参与进来，不是运营平台，而是做应用。类似于苹果生态和安卓生态，会生发出很多应用。”他说。

因此，黄铁军建议，一方面要依靠“市场的手”，让市场的“大浪淘沙”发挥主要作用；但同时也需要“政策的手”予以引导和调节，推动、鼓励和统筹产学研进行合作，共建大模型的产业生态。

纵观全球，打造人工智能生态，有开源和闭源两种路线。王怀民表示，大模型因其不确定性形成开源模式和预研模式同时推进的基本格局。在美国32个大模型中，有15个开源。中国的9个大模型中，有5个开源。

但一位人工智能领域的资深投资人告诉《中国经济周刊》，现在国内确实有一些大模型就是把国外的开源代码进行“套壳”和微调，“GPT3.5人家可能还会开源给你，但GPT4.0短期内人家是不可能会给你用的”。所以，中国要发展大模型，还是要自主创新。而且因为大模型的发展涉及数据问题，从监管的角度，这几乎意味着中美一定是“平行宇宙”。

大模型越来越强大，担心安全风险和被AI替代不如学习与AI合作

随着人工智能技术，尤其是大模型的快速发展，安全问题也被提高到新的维度。“AI一定会给数字世界带来新的安全威胁。”奇安信集团董事长齐向东告诉《中国经济周刊》记者。

“这个安全威胁主要来自两个方面：一是AI可以模仿，甚至以假乱真地实施诈骗；二是AI能够帮助黑客提高攻击水平，帮助一些黑客写程序、写代码、制定攻击方案和提供攻击策略。这些都给数字世界带来新的威胁。”齐向东说。

齐向东表示，网络安全技术是一个伴生型技术，一定是先有数字化技术的创新，再有安全技术的创新，这是矛和盾的关系，就像没有一种特殊材料的矛出现，就不会出现特殊材料的盾。现在大模型等AI新技术还处在萌芽状态，应用还只是试探性的，发展还是第一要务。

但齐向东表示，他相信网络安全的技术和产品的创新，一定能够解决新时代AI带来的这些网络安全问题和风险。“奇安信正在抓紧跟进AI的各种场景，探索解决AI给我们带来的新的网络风险所需要的新技术和新的安全解决方案，我相信，未来安全不会拖AI发展的后腿。”他说。

至于大模型何时会影响到普通人的生活，黄铁军表示，其实已经在发生了。比如现在人工智能已经在替代人类的某些工作，尤其是不具备原创性的部分。

以绘画为例，黄铁军认为，像毕加索、齐白石这种开创性的创作，人工智能还无法替代，但如果只是模仿和组合之前的创作，那人工智能肯定是效率更高的。再比如像爱因斯坦、牛顿这种原创性的理论创新，人工智能也无法做到，但如果是常规编程和做数学题，那人工智能确实可以做得更好。

但黄铁军强调，AI和人类之间并不是简单替代，而是需要合作。“比如，一个企业原来需要1000名程序员，但接入了AI大模型能力之后，可能只需要几十个就够了，通过人和AI的合作来获得更高的效率和产生更好的效果。”

而且黄铁军认为，这种影响力会很快传递到教育领域。

“现在很多学生有疑问，不是先问老师，而是先问AI，因为AI掌握的知识和信息可能更全面、更丰富，然后自己根据AI给出的资料就可以学习了。这个会是非常大的冲击，未来教师在学生的成长过程中到底发挥什么作用？扮演什么角色？AI在不停学习，人自然也是要不停学习，教育肯定是会长期存在下去的，只不过我们教育的目的是什么？教育的方式是什么？都需要重新思考。”黄铁军说。

更为“可怕”的是，我们常说：读书破万卷，下笔如有神。“一个人一生能读完一万本书已经非常厉害了，但AI一天就能读100万本书，而全人类共有书籍约1亿部，AI再读3年左右就全读完了，那AI的能力提升速度可想而知，和人类完全不在一个尺度上。”黄铁军说。

科大讯飞副总裁章继东告诉《中国经济周刊》记者，AI技术尤其是大模型的发展，会对中国的教育带来巨大挑战。

“中国教育的核心在于知识的传递和知识的获取，尤其是考试的考核目标主要是以知识为主，那些记忆好、训练多的孩子就能得高分，而这些是最容易被AI替代的能力。未来，我们将更需要具有创造力、有批判思维和创新思维的人才。但我相信，随着大模型成为各行各业的好助手，其也会成为教育的好助手。”章继东说。