ChatGPT来了，AI企业如何应对

2023-04-12 14:54王林贾骥业

风流一代·经典文摘 2023年4期

关键词：热潮算力基础

王林贾骥业

前不久，AI圈一股以“ChatGPT”为核心的热潮从美国“硅谷”涌入中国。

2022年11月底，初创公司OpenAI发布了名为ChatGPT的对话式聊天机器人模型，一经推出，便在网络上迅速走红。美国科技公司微软的联合创始人比尔·盖茨高度评价这项技术，认为它的出现不亚于互联网和个人电脑的诞生。

進入2023年，微软推新，谷歌入局，“ChatGPT”热潮迅速升温，国内的科技巨头也陆续涌入潮中。ChatGPT发布后，包括百度、科大讯飞、京东等在内的多家企业纷纷公布自己在AI领域的布局。

360创始人周鸿祎表示，如果企业搭不上ChatGPT这班车，很可能会被淘汰。确实，作为一个现象级的应用，ChatGPT的出现为AI领域的技术发展和产业布局带来新的变化。

在ChatGPT浪潮汹涌而至时，盲目跟风、“Copy To China”早已落伍，甚至只是在应用层面“搭车”也显得不合时宜。学习或挑战ChatGPT的“正确姿势”，或许还是在更基础、更底层的原始创新中寻找力量。一些中国企业在芯片、操作系统、AI大模型等方面持续投入，并且有所产出，ChatGPT的出现，也是中国AI企业加速奔跑，迎来新一轮发展的契机。

ChatGPT潮涌

“今天我们推出了ChatGPT，尝试在这里与它交谈。”

2022年11月30日，热潮来袭。OpenAI首席执行官山姆·阿尔特曼当天发布了一则推特，推特中除了上述文字，还包括一个链接，任何人都可以点击链接、注册账户，免费与ChatGPT交谈。

与Siri、小爱同学等语音助手类似，ChatGPT也是人机交互应用的一种。但在与ChatGPT“对话”的过程中，人们发现它的“智慧程度”远超其他的人工智能机器人。除了聊天，ChatGPT被网友们用来写文案、翻译文本、为代码纠错，甚至用来编写代码。

据OpenAI官网介绍，ChatGPT能够连续回答问题、承认错误、质疑不正确的前提和拒绝不适当的请求。“第一次，它答错了，我告诉它正确信息后，再问同样的问题，它的答案就改了过来。”一位曾尝试与ChatGPT对话的程序员说，“它甚至为此对我说‘抱歉”。

凭借出色的表现，ChatGPT仅用两个月便吸引了超过1亿用户的关注，一跃成为20年来互联网领域增长最快的消费类应用。

北京时间2月7日凌晨，美国科技巨头谷歌紧急入局，宣布基于LaMDA大模型的人工智能对话式机器人“Bard”正在进行内测。次日，微软宣布推出由ChatGPT支持的最新版本Bing搜索引擎和Edge浏览器，热潮升温并迅速触及中国。

从科技巨头，到行业龙头，中国企业竞逐AI赛道，AIGC（利用人工智能技术来生成内容）等人工智能概念在股市一路狂飙，虽然在监管出手后很快平息躁动，但涨势依然存在。中信证券研究报告认为，ChatGPT在全球的流行正在推动AIGC产业化全面提速，将引领创成式AI新变革。

“ChatGPT”热潮涌动，正处于冷静期的人工智能投资和产业布局迎来小阳春。

用大数据、大算力、强算法“喂养”

商企入局，资本关注。“ChatGPT”热潮涌动的背后，是AI大模型的一次场景化落地。ChatGPT的成功，意味着AI大模型之路的发展成熟。

AI大模型是人工智能迈向通用智能的里程碑技术，模型可以自动从数据中学习知识，提升性能。GPT是OpenAI推出的AI大模型系列。从2018年到2022年，OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT，此次发布的ChatGPT就是在GPT-3的基础上通过指令微调后得到的。

2022年年底ChatGPT实现了现象级的传播，这出乎制作团队所料。出圈是偶然的，但ChatGPT的成功却并非偶然，OpenAI在GPT系列模型的基础上，对算法、算力、数据等人工智能关键要素都进行了一定的升级和优化。

在算法层面，ChatGPT的基础是世界上最强大的LLM（大语言模型）之一——GPT-3，同时引入了基于人类反馈的强化学习方法，提高了对话的质量。从ChatGPT的表现上来看，它的精确性和整个性能效果确实提高了。

同时，AI的训练和使用也需要强大的算力支持。ChatGPT的训练是在微软云上进行的，在全球云计算市场，微软云的市场份额排名第二。高水平、高市场份额，再加上芯片技术的高速发展，这都为ChatGPT的横空出世奠定了坚实的算力基础。

除了算法和算力，AI大模型的进步迭代，需要大量的数据进行训练。2020年发布的GPT-3，其训练参数量已经达到了惊人的1750亿个，大量的数据被反复“喂”给ChatGPT。

而且，ChatGPT的训练成本支出巨大。拥有1750亿个参数的GPT-3单次训练成本达到460万美元。网友在讨论ChatGPT时，也都认为它很“烧钱”。因此，可以说ChatGPT是一个靠大算力、高成本，用大规模的数据“喂”出来的AI模型。

虽然国内外企业在算法研发上基本保持同等水平，但国内更注重大模型技术与行业场景的融合，对于数据标注和模型训练等高成本的人力投入更为谨慎。

“我们真正缺乏的是技术积累，包括数据怎么清洗、标注以及模型的结构设计，怎么训练、推理，这个地方很多都需要经验和积累。”网上一篇爆火的《ChatGPT专家深度解读》这样解释。

ChatGPT的产生是量变到质变的过程，积累了很多年，涉及算力要有多少服务器，知识库、标注等很多问题，若没有这些能力的公司跟风入局，会消耗掉许多资源。

把握优势，竞逐“生成式AI”浪潮

热潮已经袭来，有技术基础的企业在强势突围，没有技术基础的企业准备发力，尚待进场。而等热潮退去，能否留在场上，还需看清自己的优势和短板。

ChatGPT是AIGC的一种实现。在AIGC的大模型建设和应用层面，国内企业在技术基础和创新环境上都存在着相对优势。

首先，國内持续投入大模型研发、技术基础扎实。目前，阿里达摩院的多模态大模型M6参数量已达10万亿，是全球最大的AI预训练模型；华为盘古、百度文心等大模型的参数量都超过了千亿，其中百度文心模型参数量已经达到2600亿，不逊于GPT-3。国内有关企业、研究机构近几年在大模型方面已经有了技术积淀。

其次，国内加快“产业数字化转型”、实现人工智能与实体经济融合等政策为人工智能提供了创新发展环境。国务院国资委印发《关于做好2023年中央企业投资管理进一步扩大有效投资有关事项的通知》，指出要加大对5G、人工智能、数据中心等新基建投入。近年来，我国发布了一系列政策文件，为人工智能核心技术攻关、产品落地应用以及探索发展新模式新路径提供支持。

把握优势的同时，也要看到目前面临的一些挑战。如AI领军人才相对短缺，AI与实体经济的融合程度仍需进一步加深等等。要特别关注一些底层技术的发展，如大模型框架、算法等，还要进一步拓展AI的应用场景。要进一步提升大众对AI的认知，这对于AI的发展是有好处的。

但基于大模型的聊天机器人成本投入巨大，企业前期投入需保持一定的谨慎，且需要看清方向。

中国新一代人工智能发展战略研究院发布的《中国新一代人工智能科技产业发展报告（2022）》数据显示，中国人工智能企业布局侧重在应用层和技术层。其中，应用层人工智能企业数占比最高，达85.18%；技术层和基础层企业数分别占比12.41%和2.41%。由此可以看出，我国人工智能发展在应用层面有较大优势。

ChatGPT的成功出圈模式为企业提供了大模型、生成式AI、智能对话等技术的商业化应用路径，尤其将助力“生成式AI”通过更多形式实现在更多行业的探索和应用。

目前来看，国内大模型开发厂商一是布局以大模型为基础的通用对话、生成等能力；二是将其能力整合到搜索引擎、智能客服、智能音箱等产品线中；三是通过能力调用为中小企业满足具体场景落地需求。

随着ChatGPT的爆火，随之而来的安全、隐私保护、知识产权等问题也值得关注。目前国外出现有学生使用ChatGPT写论文作弊的情况，模型使用大量的数据进行训练，也存在使用过程中可能提供他人创作的侵权行为风险。如何防止ChatGPT类产品的滥用对社会产生潜在负面影响亟须得到重视，更希望我们目前的一些主流企业、科研机构，在生成式AI上发力，能引领新时代的AI发展。

（摘自2023年2月14日《中国青年报》）