从Chat到GTP

2023-06-07 16:31:17邱元阳

中国信息技术教育 2023年11期

邱元阳

2022年11月30日，OpenAI发布了其最新的聊天机器人模型ChatGPT。这一模型一经亮相就惊艳了全世界，因为它颠覆了人们对Chat（聊天）的认识，它不是简单的知识问答和聊天、搜索，而是具有内容生产能力的AI，可以帮你写论文、做报告，甚至写代码、进行程序调试……

半年过去了，ChatGPT依旧热度不减，并在进行升级进化，俨然是一个全能的“六边形战士”，还产生了一大批的模仿和追随者。

GPT全称是“Generative Pre-Training transformer”，直译过来就是“生成式预训练模型”，它使用了Transformer模型来进行自我深度学习和加强学习。不同于简单的Chat，ChatGPT是典型的AIGC（AI Generated Content，人工智能生成内容）或GAI（Generative AI，生成式AI），具有很强的内容生产能力。

AIGC被认为是继PGC（专业生产内容）、UGC（用户生产内容）之后的新型内容创作方式，其特点是高效的自动化生产。随着NLG（自然语言生成技术）和AI模型的成熟，AIGC目前已经可以自动生成文字、图片、音频、视频，甚至3D模型和程序代码。

目前，AI已经从理解内容走向了自动生成内容，包括AIGC用于作画、图文、视频等多类型的内容创作。当然，这其中也少不了机械的模仿和照搬，如曾经闹出把起重机画成鹤的笑话的文心一言，让人怀疑其文生图功能是中译英后“套皮”Stable Diffusion来生成图像，但其修正和完善之后却又似乎是因为采用了英文标注的图片素材。李彦宏在解释“胸有成竹”等成语生成图片因望文生义而尴尬时曾说，不能要求AI的各项能力都与人匹配，它不“像”人也没什么不好，而且我们的AI还正在成长中，初级阶段表現不佳也很正常，但是它会很快地进步。毕竟，就连ChatGPT这种偶像级的AI也一样犯过一本正经地证明27是质数这样的错误，GPT从1.0到4.0一路走来，也是比较漫长和曲折的。

2015年，OpenAI成立，次年推出初代GPT，2019年发布GPT-2，可以生成语言并在一定程度上准确识别语言；2020年发布GPT-3，可以生成各种类型的文本并理解文本的语义；2022年OpenAI推出的ChatGPT，正是在GPT-3模型基础上构建的，之后又发展到GPT-3.5。如今为大家所津津乐道的，已经是GPT-4了。

人工智能的重大研究方向之一就是NLP（自然语言处理），也就是让机器读懂人类的语言。NLP研究有两大方向，一个是谷歌的双向技术，以BERT为代表；另一个就是OpenAI的自回归技术，以GPT为代表。这两种技术方向的竞争，背后就是谷歌与微软的竞争。在Alpha GO之后，微软终于靠ChatGPT扳回一局。飞速进化的ChatGPT，已经有了引领第四次工业革命的趋势。

与以前的AI不同，ChatGPT解放的不是人的体力，而是脑力。如果它能取代人的部分工作，那么被取代的可能是脑力劳动而非体力劳动。想到这一点，不免让人有些脊背发凉。

从程序员的角度看，他们不会相信GPT能产生智慧，因为GPT底层算法的本质就是数学概率而已。但是从用户角度看，GPT的智能已经高得惊人，甚至到了需要叫停的地步。

计算机模型使用反向传播算法，可以以一种完全不同于人类大脑的方式运行，在算法模型下进行海量训练，会让AI飞速进化。深度学习之父、图灵奖得主杰弗里·辛顿在接受Emtech采访中公开警告AI风险：人类终结已近在眼前。