ChatGPT,颠覆刚刚开始?

2023-03-31 07:59于靖园
小康 2023年9期
关键词:开源聊天人工智能

于靖园

大洋彼岸的振翅,掀起了全球的AI巨浪。ChatGPT的付费使用人数剧增,验证了其巨大商业价值和科研价值。它的出圈,可能意味着一个人工智能大规模商业化时代的到来。

“这篇文章的中心思想是什么?”“我们需要招聘公关人才,有没有推荐?”“今年房价预判怎样,能买房吗?”……“问ChatGPT吧!”如今,人们发现,无论什么人问什么样的问题,几乎都可以从ChatGPT找到答案。这一串英文字母,仿佛在一瞬间就火爆了全世界。

横空出“圈”的聊天机器人

去年底,OpenAI推出的人工智能聊天原型ChatGPT,瞬间吸引了全世界的目光。

ChatGPT 由 GPT-3.5 模型提供支持,GPT(Generative Pre-trained Transformer ,生成式预训练变换器)  是一种基于互联网可用数据训练的文本生成的深度学习模型。该模型使用了“利用人类反馈强化学习(RLHF)”的训练方式,包括人类提问机器答、机器提问人类回答,并且不断迭代,让模型逐渐有了对生成答案的评判能力。

2022 年 11 月 30 日,OpenAI 的CEO Altman 在推特上写道“今天我们推出了 ChatGPT,尝试在这里与它交谈”,然后是一个链接,任何人都可以注册一个账户,开始免费与 OpenAI 的新聊天机器人ChatGPT 交谈。

ChatGPT 能夠回答连续的问题、生成文本摘要、翻译文档、对信息分类、写代码等,它也会承认错误、质疑不正确的前提,并拒绝不恰当的请求。

通过学习大量现成文本和对话集合(例如Wiki),ChatGPT能够像人类那样即时对话,流畅地回答各种问题(当然回答速度比人还是慢一些)。无论是英文还是其他语言(例如中文、韩语等),从回答历史问题,到写故事,甚至是撰写商业计划书和行业分析,“几乎”无所不能,甚至有程序员贴出了ChatGPT进行程序修改的对话。

在一天之内,一大群人涌入网站,给 ChatGPT提了各种要求。软件 CEO 兼工程师 Amjad Masad 要求它调试他的代码;美食博主兼网红Gina Homolka用它写了一份健康巧克力曲奇的食谱;许多学生用它来做作业……

与之前出现的聊天应用不太一样,ChatGPT 可以进行长时间、流畅的对话,回答问题,并撰写人们要求的几乎任何类型的书面材料,包括商业计划、广告活动、诗歌、计算机代码和电影剧本。ChatGPT 会在一秒内生成这些内容,用户无需等待,而且它生成的很多内容都还不错。

在ChatGPT发布后的五天内,就有超过100万的玩家。这个数字令业内的人士感到惊叹。2022年12月4日,特斯拉的创始人埃隆·马斯克发了一条推文,他说:“ChatGPT厉害的让人毛骨悚然,我们离危险的强大人工智能已经不远了。”

吸引客户的魔笛

ChatGPT的厉害,大家都有目共睹。而它的相关产业和发展前景,也被各大业内巨头看好。

2019年7月,当时重组后的 OpenAI 新公司获得了微软的10亿美元投资。而2023年1月23日,微软表示,它正在扩大与 OpenAI 的合作伙伴关系,以290亿美元的估值继续投资约100亿美元,获得 OpenAI 49%的股权。

OpenAI 预计,随着 ChatGPT 成为吸引客户的魔笛,其收入将迅速增加。文件显示,该公司预计2023年的收入将达到 2 亿美元,并预计到 2024 年收入将超过 10 亿美元。

微软目前正在准备将OpenAI的语言AI技术引入Word、PowerPoint和Outlook等应用程序。未来还将增加对专业超级计算系统部署的投资,以加速OpenAI的AI研究,并将OpenAI的AI系统与其产品集成,同时“引入新的数字体验类别”。微软的Azure云平台将继续成为OpenAI的独家云提供商,为这家初创公司在研究、产品和API服务方面的工作负载提供动力。

据国外的媒体猜测,对微软来说,更大的收获可能在于搜索业务。科技出版物 The Information 最近报道,微软计划将 ChatGPT 集成到 Bing 中,可能允许它返回简单、简洁的查询答案,并让人们通过与该聊天机器人的对话而不是链接列表来更深入地研究。

据《纽约时报》报道,谷歌的高管们担心失去在搜索领域的主导地位,因此发布了“红色警报”。报道指出,谷歌 CEO 桑达尔·皮查伊 (Sundar Pichai) 已召开会议重新定义公司的 AI 战略,并计划在年内发布 20 款支持 AI 的新产品,并展示用于搜索的聊天界面。

不过,谈论ChatGPT,不能不提的是AIGC。

AIGC即利用人工智能技术来生成内容。与此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能构思内容的AIGC,是新一轮内容生产方式变革,而且AIGC内容在Web3.0时代也将出现指数级增长。业内专家表示,ChatGPT 模型的出现对于文字/语音模态的 AIGC 应用具有重要意义,会对AI产业上下游产生重大影响。

一场新的工业革命

“ChatGPT不是搜索引擎的加强版,也不仅仅是一个聊天机器人,它通过SaaS方式所提供的人工智能服务,将重塑所有的数字化应用和所有行业,为我们带来一场新的工业革命。”全国政协委员、360集团创始人周鸿祎表示。

今年两会期间,周鸿祎带来了关于以产研协同和开放生态模式推进人工智能大模型技术创新发展的提案。

采访中,周鸿祎详细阐述了ChatGPT背后的关键成功因素。

首先是“微軟+OpenAI”的产研协同模式。ChatGPT的成功是大型企业+科研机构协同创新的典范。微软在协同创新中充分发挥了大型科技企业的优势,一是对模型工程化调优的支持,二是大规模算力支持,三是训练数据的抓取,四是帮助改善用户体验,五是提供用户流量的支持,收集用户反馈提升强化学习效果,六是商业化模式的探索,七是基于浏览器、搜索引擎探索用户使用场景,八是巨大且持续的投资支持。在这样的全方位支持下,OpenAI可以专注于学术研究,在技术路线上坚持长期主义,不断吸引尖端人才,持续打磨算法和模型,不断向前推进技术边界。两方优势互补,二者缺一不可,共同支撑了这一重大的技术创新。

其次是基于开源和众包的开放创新模式。ChatGPT的成功也是开源、合作和众包的典范。一方面,没有开源就不会有ChatGPT的诞生,一是ChatGPT本身就是基于开源算法不断完善的结果,初代GPT建立在谷歌公司开源的Transformer算法之上,吸收了业界大量开源成果,并且GPT1、GPT2都已经开源;二是ChatGPT所使用的训练数据大部分是开源数据集,包括Common Crawl、WebText2、维基百科、书籍、期刊、开源代码等数据,比重超过90%。另一方面,开源也促进了整个产业的共同发展,而不是技术被垄断在少数公司手里。通过开放论文、开源代码,微软、谷歌、脸书等大型公司以及众多创新型中小公司齐头并进,不断推进着技术进步。另外,ChatGPT的训练和调优应用了大规模的众包模式,一是外包了人工标注和人工排序的工程性工作;二是通过开放接口,在供全球用户使用的同时也收集了海量的真实提问以及点赞或者负向反馈,使得模型不断调优。

第三是以通用大模型为中心的生态创新模式。ChatGPT是一个通用的大语言模型,只有开发出各种各样的垂类应用才能连接百行千业,服务于传统产业的数字化、智能化转型。OpenAI在应用创新上不搞一家通吃,而是把ChatGPT通用大模型作为一个操作系统或者应用商店,面向创业者和创新型中小企业开放能力,扶持上百家中小公司孵化各行各业的垂直应用,使得各行各业无需再“大炼大模型”,可以专注于开发行业领域的智能化应用。目前,引用ChatGPT开放接口的应用已多达上千个,各类问答、代码生成、内容创作等新应用如雨后春笋不断涌现,产业生态快速发展。

周鸿祎表示,面对ChatGPT为代表的人工智能大模型技术的巨大跃升,我国理应奋起直追。“我们在关注技术层面创新的同时,更要关注技术突破背后所依赖的创新模式。”

为此,周鸿祎给出了相关建议。一是建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+Open AI”组合引领大模型技术攻关。二是支持设立多个国家级人工智能大模型的长期开源项目,打造开源众包的开放创新生态。

猜你喜欢
开源聊天人工智能
五毛钱能买多少头牛
人工智能与就业
敞开门聊天
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0
开源计算机辅助翻译工具研究