北京如何加速大模型产业发展

2024-06-06 19:28韩菲子尚洪坤

投资北京 2024年5期

韩菲子尚洪坤

当前，人工智能日益融入经济发展各个领域，成为推动科技跨越发展、产业优化升级、生产力整体跃升的重要驱动力量。大模型技术的发展则推动了人工智能由量变引发质变。近一年来，大模型热潮席卷全球并持续升温。全球越来越多的科技巨头、知名高校、科研院所和创新型企业加大研究力度，大模型技术不断迭代升级，模型能力不断加强，逐渐形成从底层算力、模型开发到行业应用的全新智能化产业。北京正在建设国际科技创新中心，在推动大模型产业加速发展方面优势明显，但同时面临着一些挑战，大模型产业发展仍需综合施策。

国内加力推动大模型技术研发与应用

大模型，是指依托海量、优质数据，通过强大算力进行训练后，完成大量不同任务的模型。大模型具有超强计算能力，能够处理海量数据，完成各种云端的复杂任务。近年来，大模型技术迅速迭代，打破了原有人工智能技术发展的上限，认知和应用能力颠覆式提升。

大模型的崛起是算法、算力、数据三要素全面支撑的结果。首先是算力，算力是人工智能（AI）训练的基础设施，强大的计算能力对于训练大型人工智能模型至关重要，包括高性能处理器、大量存储空间和高速网络连接、软硬件适配完备的GPU算力生态体系；其次是算法，先进算法是大模型训练的关键，包括深度学习、迁移学习等，这些算法有助于模型在大量数据中找到有效的特征和规律；再者是数据，数据是大模型的“食物”，大型且优质的数据集可以源源不断为大模型提供丰富的训练数据，涵盖文本、图像、音频和视频等多种类型的信息。

中国大模型研发和应用快速发展。目前，美国和中国发布的通用大模型总数占全球发布量的80%，成为大模型技术领域的引领者。谷歌、微软、Meta、亚马逊等全球科技巨头将大模型视为重要发展机遇，积极投入并且大动作频发。我国众多企业也投身大模型领域，不断打通大模型研发与产业应用场景的壁垒，推动人工智能在传统行业落地。工信部赛迪研究院数据显示，2023年，我国生成式人工智能企业采用率已达15%，市场规模约为14.4万亿元。我国大模型企业主要包括：百度、阿里、腾讯等互联网大厂，科大讯飞、商汤科技、旷视科技等垂直于AI领域的厂商，以及智谱华章、百川智能、MiniMax等大模型初创企业。

一线城市竞相布局大模型。从全国范围看，北京、上海、广州、深圳等城市陆续出台大模型产业发展措施，加速大模型應用落地。根据2023年中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》统计表明，人工智能和大模型学者指数排名国内前四的分别是：北京、江苏、广东、上海。学校和机构作为开源主力，清华大学的ChatGLM-6B、复旦大学的MOSS、百度的文心系列大模型在开源影响力上位居三甲。北京不论在人工智能学者数量方面还是大模型学者数量方面都遥遥领先于其他地区，体现出明显的人才储备优势。

北京布局大模型优势和挑战并存

北京对人工智能、大模型布局较早，人工智能一直是北京的“强项”：北京已摘得人工智能核心企业数量、产业集聚能力、专利授权量、工信部“揭榜挂帅”优胜项目数量、国家级重点实验室数量、投融资活跃程度等多项“冠军”。

北京正在不断推进国际科技创新中心建设，加快建设全球数字经济标杆城市，人工智能产业作为建设工作的重要抓手，持续受到高度关注与重点支持。2023年，北京人工智能相关产值规模初步统计突破2500亿元，核心企业数量超过1800家，形成基本完整的产业链，涵盖基础层、技术层和应用层等环节。

截至2023年10月，我国10亿参数规模以上的大模型厂商及高校院所共计254家，分布于20余省市或地区，其中北京有122家，数量居全国首位，约占全国的一半。按模型类型分析，北京拥有通用大模型厂商及高校院所37家，占比30%，以百度、智谱华章、百川智能等为代表；行业大模型85家，以第四范式、云知声、衔远科技等为代表。北京大模型厂商及高校院所主要集聚在海淀区，其次为朝阳区。海淀区共87家（通用大模型33家，行业大型54家），占北京全市的71%。

2023年5月，北京市人民政府发布《北京市加快建设具有全球影响力的人工智能创新策源地实施方案（2023—2025年）》《北京市促进通用人工智能创新发展的若干措施》，强调开展大模型创新算法及关键技术研究，加强大模型训练数据采集及治理工具研发，推动大模型在政务、医疗、科学、金融等领域的示范应用。同时，北京市经济和信息化局联合市科委、中关村管委会、市发展改革委共同启动“北京市通用人工智能产业创新伙伴计划”，推进人工智能大模型研发和应用，赋能千行百业数智化转型，加速大模型的行业应用落地。

2023年10月，北京市经济和信息化局印发《人工智能算力券实施方案（2023—2025年）》支持在京注册的软件信息服务业企业和制造业企业，租用非关联方的智能算力资源，在工业、政务、医疗、金融、教育、法务、交通、文旅、科学研究、城市管理、便民服务等领域进行行业人工智能大模型训练和应用。企业申领算力券，可享受智能算力合同额一定比例的算力券补贴。

然而，北京发展人工智能大模型产业依旧面临一些挑战：算力资源供不应求，已成为大模型企业创新研发的重大挑战。大模型热潮兴起之后，市场上算力需求剧增，英伟达芯片供不应求，加之美国对中国实施芯片制裁，国内云厂商提供的商业化算力供应紧张，价格不断上涨。据统计，北京很多人工智能企业近两年内有租用英伟达A100/A800/H800算力需求，预计算力缺口约5000P。目前仅少部分龙头企业和头部初创企业能够租到算力资源，但成本过高，大量中小型企业仅持有少量英伟达高性能算力，仍需要外部算力支撑。

大量高质量数据缺乏。大模型的养成需要不断“投喂”大量、高质量的数据。目前市面上缺乏高质量公开的数据集，大模型厂商和拥有数据集的用户不互通，即大模型厂商无法迭代准确面向行业落地场景训练大模型；而多数行业数据丰富的企业用户又缺乏自研大模型的能力，严重掣肘行业模型研发和应用落地。例如，政务、医疗、智慧城市等领域数据获取难度大，隐私性要求高，阻碍了大模型应用落地的进程。

大模型应用落地性有待提升。现阶段大模型应用存在一定同质化情况，多集中在面向内部员工的知识检索、文字生成等方面，其落地效果及实际业务收益有待进一步提升。大模型厂商需与企业用户深度对接需求，找到高价值、差异化的大模型应用刚需。

北京大模型产业发展须打“组合拳”

当前，结合产业发展阶段和企业需求，北京可以围绕人才、基金、产业生态等方面保障，加快建设智能算力基础设施、提升高质量数据供给能力、创新大模型应用落地机制等举措，培育大模型产业生态。

全力夯实人工智能底层基础。开发自主品牌的国产人工智能芯片，积极引导大模型研发企业应用国产人工智能芯片，加快提升人工智能算力供给的国产化率。提升算力资源统筹供给能力，落实算力伙伴计划，建立算力资源调度平台，通过算力券、资金补贴等方式，支撑自主可控的大模型技术体系建设。

加强行业数据流通交易。鼓励各类企业建设高水平行业数据集，加强行业数据流通交易，增加高质量行业数据供给，繁荣行业大模型商业生态。鼓励大模型团队与行业用户多互通，交流大模型开发需求，共享数据，并建立共赢机制。

加快创新应用场景建设。依托北京创新潜能和资源优势，打造标杆型示范场景，牵引大模型创新成果落地应用。在政务、金融、医疗、文化旅游等领域，引导行业用户向大模型厂商开放有价值的核心业务场景，探索大模型商业化模式和产业化发展路径。

鼓励大模型企业在多层次资本市场开展股权融资。引导和撬动社会资本重点投向大模型产业。发挥人工智能产业基金支持作用，引导和撬动社会资本重点投向大模型产业。通过北京市人工智能产业投资基金参与投资，重点投向人工智能芯片、训练数据及相关软件等底层技术领域，大模型算法创新、可信AI等关键领域，以及大模型等人工智能技术产品开发和垂直行业创新应用等相关领域。

做好大模型应用监管。推动产业健康安全发展，坚持“包容审慎”的总基调，依法依理坚守安全底线，构建高标准评测及治理体系，持续推动模型备案上线。加快建立技术新标准，构建围绕大模型底层设施、关键技术、上层应用的标准体系。督促大模型企业使用安全可控的技术手段开展自评估，为重点企业提供服务和指导，争取更多优质的大模型产品更快更好地上线服务。

（作者单位：中咨海外咨询有限公司）