中关村：风起云涌“大模型”

2024-02-18 14:25勒川

中关村 2024年1期

勒川

中关村曾在互联网时代独领风骚，这里有着“大学群”和科研院所的智力支持，这里被寄予厚望——在大模型时代再次创造奇迹。

在2023中关村论坛上，百度创始人、董事长兼CEO李彦宏说：“大模型成功地压缩了人类对于整个世界的认知，让我们看到了实现通用人工智能（AGI）的路径。”他表示，“当下，我们正处在全新起点，这是一个以大模型为核心的人工智能新时代，大模型改变了人工智能，大模型即将改变世界。”

一段时间以来，人工智能成为人类创新的焦点，越来越多的人开始认同以人工智能为标志的第四次产业革命正在到来。在这一广泛共识的基础之上，李彦宏又再次将助推人工智能不断变革的“大模型”推到了聚光灯下。

大模型是大规模语言模型（Large Language Model）的简称。语言模型是一种人工智能模型，它被训练成理解和生成人类语言。简单来讲，大模型就是用大数据模型和算法进行训练的模型，能够捕捉到大规模数据中的复杂模式和规律，从而预测出更加准确的结果。

随着ChatGPT的爆火，国内人工智能领域也风起云涌，互联网科技公司展开了大模型的军备竞赛，个人创业者也纷纷入局。无论是披挂上阵创业的创新工场董事长李开复、前搜狗公司CEO王小川、京东前任技术掌门人周伯文等领军人物，还是百度、阿里、华为、小米等互联网科技巨头，或是智谱AI、面壁智能、月之暗面等初创“黑马”，创投圈频频引发外界关注甚至收获巨额融资的高光时刻，不少都与人工智能大模型紧密相关。

为抢抓技术与产业变革机遇，各地政府也纷纷发力，为大模型创新提供加速度。据不完全统计，北京、上海、广东、安徽等地均已发布相关政策，从算力支持、场景开放、技术突破、产品生态等多方面鼓励大模型应用落地。

2023年12月22日，在“中关村大数据日”上，北京市经济和信息化局局长姜广智表示，“2024年将是大模型落地之年，北京将大力推进大模型在各行各业的应用落地，赋能各行各业发展。”

据《北京市人工智能行业大模型创新应用白皮书（2023年）》显示，北京是当前国内人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区，现已拥有大模型创新团队122家，推出文心一言、悟道、百川大模型等百余个AI大模型，约占全国的一半，大模型数量居全国首位。

中关村曾在互联网时代独领风骚，这里有着“大学群”和科研院所的智力支持，这里被寄予厚望——在大模型时代再次创造奇迹。

率先形成AI大模型集聚区

在全球范围内，世界各国均在积极推动大模型研发和应用。目前美国和中国发布的通用大模型总数已占全球发布量的80%，成为大模型技术领域的引领者。从全国来看，北京对大模型布局最早。得益于在人工智能领域的良好产业基础和先发优势，北京海淀的科研机构和企业在大模型领域走在全国前列，其中智源研究院在语言、视觉、多模态等基础大模型上取得了突破性进展，发布“悟道3.0”系列大模型，百度、第四范式等头部企业发布“文心一言”“式说”等自主创新成果。海淀区内已集聚约80家大模型企业、高校院所和科研机构，共发布主模型35个，在全国率先形成AI大模型集聚区。

为进一步集聚产业资源、促进创新协同、推动产业发展支撑大模型产业发展，构建活跃的创新生态，2023年9月15日，中关村人工智能大模型产业集聚区宣布启动建设。集聚区以东至学院路、南至知春路、西至万泉河路、北至清华西路—清华东路，约9.5平方公里的区域作为核心区。在核心区内，首批重点建设五道口人工智能产业园、北大西门人工智能产业园、中关村西区人工智能产业园、清华科技园等4个人工智能特色产业园，总建筑面积约67万平方米，进一步集中创新资源和产业共性服务，提升产业创新效能。

海淀区在率先建设核心区的同时，还将继续拓展引领区和发展区。核心区外围东至京藏高速，南至北三环、西至圆明园西路—萬泉河路，北至北五环（含沿线地区），约29.5平方公里的区域作为引领区。以中关村软件园、东升科技园、金隅科技园及中关村壹号等北清路沿线人工智能优势区域作为发展区。

为充分发挥中关村科学城人工智能产业优势，海淀区政府印发实施了《关于加快中关村科学城人工智能大模型创新发展的若干措施》。该措施强化布局大模型软硬件技术体系，通过揭榜挂帅等形式给予最高1000万元资金支持，促进企业或组建创新联合体开展协同攻关。

聚焦大模型研发所面临的算力资源短缺、成本高昂等问题，海淀区建设公共算力，降低大模型研发成本，对技术创新性强、应用生态丰富的大模型，给予最高1000万元算力补贴。

海淀区还推动大模型赋能实体经济，引导鼓励各类主体为大模型提供应用场景，推动包括但不限于金融、医疗、城市管理、消费等各垂直领域示范应用，打造标杆应用场景，最高给予500万元资金奖励，加快产业重塑。

此外，海淀区还将从加强大模型人才引育和国际合作、探索数据利益共享机制、强化耐心资本、建立评测体系、优化孵育体系、探索监管创新、强化伦理规范和社会治理实践等多维度营造开放安全、包容审慎的产业发展环境，加速人工智能产业健康有序发展。

园区构建完善产业生态

中关村西区人工智能产业园位于中关村西区核心区，项目整合了位于中关村西区的中国技术交易大厦、中关村创业大街等资源。截至目前，园区已入驻包括商汤科技、潞晨科技、太极图形、中科弘云等人工智能创新企业。

中关村西区人工智能产业园不断加强自身专业能力和创新服务体系建设，依托生态合作伙伴和企业资源，为人工智能及大模型企业提供创业孵化、金融投资、技术服务、人才服务等多项专业服务内容，为中关村人工智能企业提供灵活高效的服务产品，助力园区企业加速成长。在集聚区内，企业可以更有效地共享资源，提高研发效率，加快新技术的应用和商业化过程。同时，中关村西区人工智能产业园聚焦大模型、垂直行业AI应用、集成电路、具身智能等人工智能前沿领域，为企业提供生态化的特色服务。

园区为生态企业和平台机构提供技术交流合作的匹配服务，加快人工智能相關硬件、算法工具、数据、模型训练、行业应用等企业和机构的自主创新和国产化替代。同时，园区与奇绩创坛、创新工场、无限基金seefund、中关村智友研究院、北京智源人工智能研究院等头部平台机构深度合作，将头部平台在前沿创新、商业加速的优势与园区孵化服务及本地生态优势结合，通过超前孵化、概念验证、产品打磨、生态资源链接、场景落地等多种方式，共同推动具身智能、开放指令集等领域的前沿项目在海淀加速发展。

园区通过“线上+线下”相结合的方式及标准化服务产品、INNO-X高成长服务体系、产业分析师+企业成长服务官等一系列创新服务模式，为科技企业提供企业创办、办公空间、金融投资、资源对接、人才服务、政策咨询等全方位服务支持，联合各生态服务机构伙伴共同为人工智能企业提供最优质的专业服务。

大模型作为一种“从知识中来，到知识中去”的创新模式，具有重塑人类知识应用和转化方式的潜力，对经济社会发展具有重大推动作用。中关村软件园业已成为集聚AI创新动能、促进大模型产业发展的重要平台。在人工智能领域，中关村软件园已经形成了龙头引领示范、大中小微企业融合发展的创新生态，在深度学习平台、计算能力平台/计算框架、知识图谱、行业应用等人工智能核心攻坚领域已经走在了前列。

为了推动AI大模型产业的发展，中关村软件园采取了一系列策略和举措，提供全方位的支持和服务。从AI到+AI赋能百业，中关村软件园人工智能产业已成功涵盖人工智能基础层、技术层、应用层。基础层有提供算法平台、深度学习平台的厂商百度、浪潮、腾讯等。技术层有提供自然语音识别/处理、计算机视觉、知识图谱的厂商科大讯飞、百度、汉王科技、紫平方等。在应用层面，园区企业面向医疗、汽车、金融、制造、家居、教育等各行业领域打造应用，既有机器人、无人机、智能家居等硬件产品，也有智能制造软件、智能网联、金融大脑、人工智能医疗平台等软件产品。中关村软件园正在搭建人工智能底层技术协同创新平台，在关键技术领域为企业提供高效、稳定、安全的算力算法及应用服务。同时进一步挖掘、培育和落地更多前沿项目和优质企业，服务区域产业生态优化，夯实在新一代人工智能大模型领域的核心竞争力。

生态是一切产业发展的基础。完善的生态可以加速知识、技术、应用场景的积累，使创新成果更快地转化为产品，连接产业链上下游。在数字经济时代，为人工智能的进一步发展提供了关键的基础，只有加快建立一个开放性的产业生态，才能驱动行业百花齐放，真正促进大模型产业的健康发展。

将迎大模型应用“爆发年”

在AI火热的当下，人工智能毫无例外也是小米无法缺席的领域。“全面拥抱大模型”正是小米接下来的战略，小米集团创始人、董事长兼CEO雷军亲自推动了自研大模型团队的建立，并全程高度参与了小米大模型的自研，他会亲自查看团队的周报、月报甚至日报，关注大模型进展。至于投入，雷军也表示：“全力支持，投入不设上限。”

小米目前已训练出13亿和60亿参数规模的语言大模型，并在集团内开源赋能各业务。雷军表示，内部测试显示，小米的手机端侧大模型在部分场景的效果已经能够媲美云端。它们在小米澎湃OS系统和人工智能助手小爱同学的部分场景已经得到应用，更大参数规模的大模型也在紧锣密鼓地开发中。

1月3日，教育科技公司网易有道举办“子曰”教育大模型创新成果发布会。在发布会上，公司宣布推出国内首个教育大模型“子曰”2.0版本，同时还发布了基于大模型研发的三大创新应用及一款智能硬件新品：AI家庭教师“小P老师”、有道速读，虚拟人口语私教Hi Echo 2.0，以及有道AI学习机X20。

“正如2007年iPhone的问世预示着移动互联网时代的来临，Chat GPT的诞生则象征着人工智能领域的转折点。”网易有道CEO周枫在发布会上表示，“2023年是AIGC的起始元年，大模型将不断催生新的商业模式，这将成为未来几年人工智能发展的主要趋势。”

“当大技术浪潮到来，应该最快速度去参与，先干起来，速度非常重要。”2023年7月，有道推出了国内首个教育大模型“子曰”，并同时落地六大应用。半年来，基于子曰的多项应用亮出成绩单：全球首个虚拟人口语私教Hi Echo，上线后用户数量激增，目前已接近百万；首个搭载大模型功能的有道词典笔X6 pro，产品首发当日销量即突破40000台，开学季销售额突破1亿；2023年11月，“子曰”教育大模型顺利通过双新评估，成为首批通过完整国家备案的教育大模型。

1月5日，在“2023风马牛年终秀”上，周鸿祎分享了自己关于2024大模型的趋势判断。他表示，首先，大模型无处不在，成为数字系统标配。大模型不是操作系统，全世界只有鸿蒙、iOS、安卓三种。它更像当年的PC，未来会无处不在，成为企业数字化、政府数字化的标配；其次，开源大模型即将爆发。开源让大模型从“原子弹”变成“茶叶蛋”，每个人都用得起。未来的难点不再是大模型本身，而是看谁能结合业务和场景，训练出满足自身需求的模型。再次，“小模型”涌现，运行在更多终端。一个发展趋势是把模型做“小”，让百亿模型也能接近千亿的效果。做“小”的前提是把模型做“专”。小模型的好处是可以运行在更多终端，他预言2024年会有一些大模型“上车”。

周鸿祎认为，大模型推动基础科学取得突破。“大模型不能只做语言和聊天工具，应该成为科技家的工具。希望2024年大模型能推动数学、物理、生物等基础科学取得突破，成为科技发展的利器。”

大模型技术是人工智能领域的重要发展方向之一，具有广阔的应用前景和巨大的潜力。然而，也有专家认为，大模型的发展也带来了一些挑战。首先是数据隐私和安全性问题。大模型需要大量的训练数据来实现高精度的预测和决策，但这也增加了数据泄露和滥用的风险。如何在保护个人隐私的前提下，合理利用数据成为一个关键问题。同时，大模型也面临着计算资源和能源消耗的挑战。训练一个大模型需要大量的计算资源和能源，这对于普通用户和资源有限的地区来说可能是一个制约因素。

此外，大模型的黑盒特性也是一个挑战。由于大模型的复杂性和不透明性，人们很难理解模型是如何做出决策和预测的。这对于申请贷款、招聘、法律裁决等领域可能会引发公平性和透明度的问题。如何设计和改进大模型的透明度和可解释性是一个重要的研究方向。大模型在未来10年对社会的影响将是深远的。它将促进各个领域的创新和发展，但同时也需要解决数据隐私、计算资源、黑盒特性等挑战。

李彦宏给出答案：“人工智能技术飞速发展过程中，确实有可能出现对人类不利的方向。防止失控，需要拥有先进AI技术的国家通力协作，从人类命运共同体的高度来制定规则。要参与规则的制定，就要先上牌桌，才能拥有话语权，才有全球竞赛的入场券！”