未来大模型：更多能更轻量更亲民

2024-05-25 12:11:15崔爽

科学导报 2024年28期

关键词：云端轻量化模态

崔爽

去年起，全球掀起以大模型为代表的生成式人工智能行业浪潮，人工智能迈向全面应用新阶段。国外以OpenAI、微软为代表，谷歌、Meta等巨头一个不落，国内头部科技企业则悉数入场。

近日，国家数据局局长刘烈宏表示，中国10亿参数规模以上的大模型数量已超100个，行业大模型深度赋能电子信息、医疗、交通等领域，形成上百种应用模式，赋能千行百业。

大模型技术日新月异，产业化脚步追星赶月。在这个热闹夹杂争议的行业，不同的技术路线和选择正在延展开来。

多模态正成标配

360集团董事长周鸿祎在关于2024大模型发展的十大趋势判断中明确表示，多模态将成为大模型标配。未来，大模型不仅能听会说，还能看懂图片和视频，更能识别理解。

中国科学院自动化研究所研究员刘静在《GPT-4对多模态大模型在多模态理解、生成、交互上的启发》一文中谈到，模态是指表达或感知事物的方式，例如人类的听觉、视觉、触觉等。在人工智能领域，多模态是指利用多种模态的信息来进行感知和理解。多模态技术可以让机器同时接收并处理不同模态信息，如文本、图像、音频等，从而提高机器感知和理解能力。

刘静进一步解释，相比传统的单模态大模型，多模态大模型更加符合人类的多渠道认知方式。它能将不同模态信息相互补充，提高信息的完整性和准确性，从而更好地应对复杂环境、场景和任务。如在语音识别中，多模态大模型可以结合语音和文本信息，让机器更准确地识别和理解语音内容。在图像识别中，图像和文本信息的结合可以让机器更深入地理解图像内容。

刘静介绍，落实到应用层面，多模态能使机器更好地理解人类的意图和需求，提供精准、个性化服务。例如，在目前智能技术已经深入落地的客服领域，多模态大模型可以根据用户的文本和语音信息，综合理解用户问题并提供解决方案。在智能家居领域，多模态大模型通过与智能家居设备的交互，可以根据用户需求智能调整家居环境。在医疗领域，多模态大模型则可以融合医学图像、病历文本等信息，辅助医生进行疾病诊断、制定治疗方案。

结合国内大模型产业布局，多模态大模型是近年主流厂商普遍选择的发力方向。如“紫东太初”2.0全模态大模型可实现文本、图片、语音、视频、3D点云、传感信号等不同模态的统一表征和学习。

落地应用越来越“轻”

为提升大模型性能、增进用户体验，大模型正以肉眼可见的速度越来越“大”。开源模型的参数从几百亿增加到几千亿，闭源模型也在沿着尺度定律路径不断升级，在千亿参数的基础上向着万亿参数攀登。但与此同时，人工智能产业算力吃紧，难以满足大模型参数规模的指数级增长。

为加速大模型落地应用，人工智能领域正尝试对大模型进行轻量化，通过打造更小型、更高效、成本更低的模型吸引行业客户，让模型在更广泛的场景有更高应用价值。

大模型轻量化通过降低模型的计算复杂度和内存占用，实现模型性能与资源消耗的平衡。这不仅有助于提高计算效率，降低运行时资源消耗，还可以减轻计算系统的硬件和软件压力，提高系统的可靠性和稳定性。此外，轻量化还有助于提高模型部署的灵活性和可扩展性，为模型在各种场景下的应用提供更多可能性。

轻量化主要通过模型压缩来实现。模型压缩是指在不降低模型性能的前提下，减小模型的计算复杂度和内存占用。模型压缩的方法有很多，剪枝、低秩分解等是业界常用的方法。具体来看，剪枝是指删除一些不必要或冗余的参数，低秩分解是指将高维数据或高维模型分解为低维数据或低维模型。这些方法都是通过降低模型的复杂度，减少参数和计算量，来达到让模型“更轻”的目的。

轻量化不仅有助于提高计算效率，降低运行时资源消耗，还可以减轻计算系统的硬件和软件压力，提高系统的可靠性和稳定性。

对于通用大模型服务垂直领域、行业大模型落地应用来说，轻量化更是关键步骤——通过合理的数据准备、模型选择、超参数设置和训练验证过程，可以使模型更好地适应特定领域，提高模型性能。

联想集团副总裁、联想研究院技术战略与创新平台总经理王茜莺曾表示，用好大模型主要有三个要素，第一是场景化，第二是隐私化，第三是轻量化。轻量化不仅是将个人大模型进行压缩并部署到用户设备上，还包括企业内部的轻量化，甚至云端的轻量化。轻量化意味着使用成本的降低。

端侧成厂商新“角力场”

去年以来，大模型正逐步走向“智能终端侧”，国内外一些厂商纷纷宣布加速推进大模型在移动终端的部署。端侧大模型，正成为行业热词。

所谓端侧，是指模型服务不部署在云端，而直接存储在终端内部的芯片中，利用芯片算力生成结果。这样的大模型服务不需要联网，数据也不需要被上传到云端。

相比于云端大模型，端侧大模型的优势主要在于：无需云端处理信息，安全隐私性更好；不消耗云成本，高频使用下的成本更可控；弱网和无网环境下也可以使用，用户无需担心云端服务器宕机，交互体验更稳定。

中国工程院院士邬贺铨表示，通过模型压缩和定制人工智能芯片提升算力，将具有百亿参数大模型的推理能力嵌入手机，可以提供低成本、低时延、高安全的智能助手服务。

相比ChatGPT、Midjourney等人工智能应用依赖云端服务器提供服务，端侧大模型主打在本地实现智能化。甚至有厂商提出，让每个人在手机上都拥有“个人大模型”。

目前，在中国手机市场份额排名前五的企业中，除了苹果公司，其余均已发布自有端侧大模型产品。手机厂商提出的包括通话记录自动生成、人工智能图像处理等应用场景，日渐成为消费者的日常。

端侧大模型同样是个人电脑产品发布时的高频词。在相关宣传中，端侧大模型不仅能够提升日常使用及办公效率，还是保护隐私和数据安全的最优解。

艾媒咨询CEO兼首席分析师张毅表示，人工智能可能成为今年度的手机新卖点，尤其是手机的社交价值功能呈现方面，将有更多故事可讲。对于手机厂商而言，大模型是公认的未来发展赛道和方向。尽管现在人工智能在智能手機终端的应用仍较为初级，但未来的普及和推广仍值得期待。

不过，现有技术条件下，要做好端侧大模型并不容易。目前条件下，手机性能远远不足以支撑大模型运行。对于大模型来说，参数量是模型能力的直观体现，如今云端大模型的参数量均在千亿级别，而手机端最高参数规模则不过百亿。

联想集团董事长兼CEO杨元庆认为，未来十年是人工智能的十年，人工智能将改造所有业务。将来人人都会有自己的智能体，后者通过交互学习越来越懂用户，最终成为每个人的“人工智能双胞胎”。

但他也不讳言市场的不确定性。在他看来，内置个人智能体需要更高配置，如果这些对用户不是刚需，可能就不需要这么高配置。

国际数据公司认为，未来人工智能终端将在创作与创意、游戏和虚拟世界、语音合成与转换、视觉和图像处理、聊天机器人等十大领域广泛落地发展。

未来大模型：更多能 更轻量 更亲民

多模态正成标配

落地应用越来越“轻”

端侧成厂商新“角力场”

未来大模型：更多能更轻量更亲民