张岚舒
2023年3月16日,OpenAI首席执行官山姆·阿尔特曼在其个人社交平台上发布GPT4多模态模型片段。
2022年11月30日,一款名为ChatGPT的应用程序横空出世,上市五天后用户即破百万,仅用了两个月时间便在全球收获1亿月度活跃用户,取代TikTok(抖音国际版)成为史上增长最快的消费者应用程序,每天有超3000 万人使用。与之对话的新奇体验及其带来的行业变革潜力更是持续引发热议。ChatGPT何以成为现象级应用,又正在全世界刮起怎样的风暴呢?
ChatGPT是由总部位于旧金山的初创公司 OpenAI 开发的一款聊天机器人,原理是基于“自回归语言模型”(Auto-Regressive Language Model),即一种基于深度学习的自然语言处理(NLP)工具,用于生成自然语言文本。从语义上看,chat在英语里是“聊天”之意,GPT则是“Generative Pre-trained Transformer”(生成型预训练变换模型)的缩写,属于一种基于互联网可用数据训练的文本生成深度学习模型。
ChatGPT是OpenAI开发的GPT系列模型中的GPT-3.5版本。这是一种参数上亿的大模型,采用了RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)技术用于模型训练,加入了更多人工监督对模型生成的结果进行大量微调。简单来说,ChatGPT的诞生过程就像不断在教一个基于深度神经网络的机器大脑理解人类世界的知识和语言,并根据模型中已有的海量知识储备生成合理内容,实现内容输出与人互动的功能,又通过不断对这些内容进行人工反馈校准,不断提高内容呈现的质量和水准。4.0版本的ChatGPT支持图像和文本输入,能生成文本结果。ChatGPT就像一个能协助人类完成各种文本任务的“助手”,可以实现自动文本生成、自动问答、自动摘要,甚至具备编写和调试计算机程序的能力。
ChatGPT表现出优越的技术能力。在ChatGPT开放注册前,市面上已有许多具备聊天回复功能的机器人工具,这类工具往往作为智能手机、电脑等智能设备的智能模块,可以实现使用者与智能设备功能相匹配的指令需求。在设备本身的功能框架下,这类程序在需求识别方面具有比较大的局限性,比如车载设备往往只能实现驾驶情境下的各种应答需求,且应答较为程式化。而ChatGPT没有设备框架限制,仅作为一个“几乎装载了整个世界的知识量”的大模型存在。
市面上的大模型动辄具有数百亿、千亿甚至万亿级的参数体量,ChatGPT的模型参数也超过了1750亿。OpenAI使用了45TB的数据、近1万亿个单词、10万轮以上的人类反馈来训练该模型。进入市面后,ChatGPT还通过抢先公测,收集了大量用户的使用数据来不断改进模型效果。最終,ChatGPT在惊人知识量、大量时间堆砌训练、大量人力反馈修正以及优越算法共同加持下,能准确识别用户的广域问题,为用户提供十分人性化的答案,看上去比以往出现的各种问答程序都更加“聪明博学”,极大提升了用户与人工智能互动的体验感。ChatGPT甚至可以通过谷歌L3软件工程师的入职面试,并在美国执业医师资格考试取得“合格”或“接近合格”的成绩。因此,《纽约时报》称其为“有史以来向公众发布的最好的人工智能聊天机器人”。
ChatGPT拥有可观的商业化前景。ChatGPT自推出以来就受到资本市场追捧。截至2023年2月8日,A股市场ChatGPT概念板块在一周时间内上涨超过20%。这得益于其三类重要的商业化特质。一是轻量级。ChatGPT打破了以往“嵌入式”人工智能的框架感,直接回答、执行文本任务的运行模式相对“单纯”,从“付费享有回答”到“定制应答服务”,均没有脱离轻量型的人工智能生成内容商业模式基础。二是快传播。ChatGPT一经推出即商业化,其新奇而丰富的使用感直接掀起以用户为主体的体验型宣传分享热潮,加之媒体持续关注和挖掘亮点,使其快速积累大规模用户,变现前景越发可观。三是易融合。ChatGPT对既有产品体现出很强的融合性和增益性。例如,可与联网汽车、智能电视等智能设备结合,发挥更“聪明”和“人性化”的能力,满足用户更为多元的内容需求。ChatGPT既自成一派,又具备广阔的融合赋能场景。以上三类属性很好地迎合了“快商业化”的资本与市场需求。
科技行业已经历了20多年的高速增长期,尤其是疫情以来,以Meta等为代表的大型科技公司纷纷扩展线上业务,布局具有新业态构想性特点的赛道。如今,随着新冠疫情对线上业务限制的消退,以及通胀和经济衰退预期的多重影响,科技行业正处于“回归基础型服务、剪裁概念型服务”和重视降本增效提升盈利的调整期。ChatGPT的技术链短,获取直接收益快,其走红凸显人工智能领域基础服务型产品的巨大价值和发展潜力,促使科技行业争相布局类ChatGPT“实用”赛道。
本刊与百度“ 文心一言”的对话截屏。
在行业调整需求和现实成功案例的刺激下,科技巨头纷纷加大对人工智能领域的投资,并呈现出三种倾向:第一类公司以微软为代表,将类ChatGPT型产品应用作为原有产品赋能和“弯道超车”的抓手。ChatGPT已获得微软100亿美元的投资,微软已着手在其“必应”(BING)搜索引擎中加入聊天机器人的组件,内部版本正在测试。第二类公司以谷歌为代表,与微软的“攻城”思路相反,其传统搜索引擎优势业务面临ChatGPT这种“代为搜索整合答案”的业务模式挑战。为此,谷歌斥巨资应对,宣布将发布20种新的人工智能产品,同时正在测试一个名为“巴德”(Bard)的聊天机器人,以同ChatGPT一争高下。第三类公司以Meta为代表,其在元宇宙业务受挫而ChatGPT应用走红后,宣布2023年额外投入40亿~50亿美元,全部用于人工智能。此类企业试图在现有业务增长与盈利双重“钝化”情况下,布局短平快技术赛道以为自身业务注入活力。
除美科技巨头外,中国的百度、阿里、网易有道、360和韩国的互联网巨头“领航员”等也纷纷启动类ChatGPT的产品开发,加入“实用”赛道布局竞争。2023年3月16日,百度正式发布包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等五大功能的“文心一言”(ERNIE Bot)。
从社会层面看,ChatGPT应用趋势存在多种问题与风险。就技术本身的局限性而言,ChatGPT目前以一定时间点之前的知识集合作为训练物料,仍存在知识滞后的时间差,还面临训练数据来源合规性、知识盲区等诸多问题,这些问题必然会使ChatGPT生成的内容存在偏差,提供的答案看似正确,实则经不起考证,使用者的现实工作可能会因此引入错误,甚至助力虚假信息传播。
ChatGPT已经引发对于知识产权、学术剽窃的担忧。ChatGPT生成的内容如被用于学术创作,可能会侵犯他人的著作权。同时,即便所引内容并非剽窃,人工智能生成内容被个人使用也存在知识产权争议。为此,全球多家知名学术期刊发布规定,任何大型语言模型工具都不会被接受为署名作者。
从社会伦理的角度看,人们正在探讨类ChatGPT应用的不断进化是否會跳脱其生产工具属性,占据人类的劳动价值空间。教师、记者、作家、法务、市场分析师、程序员、美工设计等数十种职业岗位被视为人工智能技术取代风险最高的工作类型。
从国家安全角度看,类ChatGPT应用可“以指定倾向为标准选择训练物料”等方式塑造输出内容,因此有可能被用作意识形态和舆论宣传工具。此类应用也被质疑存在收集用户信息和隐私泄露的风险,给数据监管带来挑战。
ChatGPT的爆火将加剧各国在革命性科技领域的竞争。一方面,ChatGPT的底层技术并不新,但组合效果惊人,反映了其背后算法或技术组合方式的优越性。这实际是一种“技术+”的数字竞争路线,此类技术对更广泛数字领域的赋能作用,将引领更多创新,成为驱动数字经济新业态发展的动力。各国在看到ChatGPT迅速创造的技术效应和经济前景后,必然加大在该领域的投入和布局。
另一方面,ChatGPT背后反映了一整套数据资源获取、创造和应用的高效模式,在“数据即战略资源”的今天,ChatGPT等现象级技术应用的发展差异也必将从数据实力起始,向着行业变革驱动力、价值观传播力、规则标准引领力、治理模式推广力等诸多层面传导,对中美等国战略博弈的走向产生影响。