邱元阳
2022年11月30日,OpenAI发布了其最新的聊天机器人模型ChatGPT。这一模型一经亮相就惊艳了全世界,因为它颠覆了人们对Chat(聊天)的认识,它不是简单的知识问答和聊天、搜索,而是具有内容生产能力的AI,可以帮你写论文、做报告,甚至写代码、进行程序调试……
半年过去了,ChatGPT依旧热度不减,并在进行升级进化,俨然是一个全能的“六边形战士”,还产生了一大批的模仿和追随者。
GPT全称是“Generative Pre-Training transformer”,直译过来就是“生成式预训练模型”,它使用了Transformer模型来进行自我深度学习和加强学习。不同于简单的Chat,ChatGPT是典型的AIGC(AI Generated Content,人工智能生成内容)或GAI(Generative AI,生成式AI),具有很强的内容生产能力。
AIGC被认为是继PGC(专业生产内容)、UGC(用户生产内容)之后的新型内容创作方式,其特点是高效的自动化生产。随着NLG(自然语言生成技术)和AI模型的成熟,AIGC目前已经可以自动生成文字、图片、音频、视频,甚至3D模型和程序代码。
目前,AI已经从理解内容走向了自动生成内容,包括AIGC用于作画、图文、视频等多类型的内容创作。当然,这其中也少不了机械的模仿和照搬,如曾经闹出把起重机画成鹤的笑话的文心一言,让人怀疑其文生图功能是中译英后“套皮”Stable Diffusion来生成图像,但其修正和完善之后却又似乎是因为采用了英文标注的图片素材。李彦宏在解释“胸有成竹”等成语生成图片因望文生义而尴尬时曾说,不能要求AI的各项能力都与人匹配,它不“像”人也没什么不好,而且我们的AI还正在成长中,初级阶段表現不佳也很正常,但是它会很快地进步。毕竟,就连ChatGPT这种偶像级的AI也一样犯过一本正经地证明27是质数这样的错误,GPT从1.0到4.0一路走来,也是比较漫长和曲折的。
2015年,OpenAI成立,次年推出初代GPT,2019年发布GPT-2,可以生成语言并在一定程度上准确识别语言;2020年发布GPT-3,可以生成各种类型的文本并理解文本的语义;2022年OpenAI推出的ChatGPT,正是在GPT-3模型基础上构建的,之后又发展到GPT-3.5。如今为大家所津津乐道的,已经是GPT-4了。
人工智能的重大研究方向之一就是NLP(自然语言处理),也就是让机器读懂人类的语言。NLP研究有两大方向,一个是谷歌的双向技术,以BERT为代表;另一个就是OpenAI的自回归技术,以GPT为代表。这两种技术方向的竞争,背后就是谷歌与微软的竞争。在Alpha GO之后,微软终于靠ChatGPT扳回一局。飞速进化的ChatGPT,已经有了引领第四次工业革命的趋势。
与以前的AI不同,ChatGPT解放的不是人的体力,而是脑力。如果它能取代人的部分工作,那么被取代的可能是脑力劳动而非体力劳动。想到这一点,不免让人有些脊背发凉。
从程序员的角度看,他们不会相信GPT能产生智慧,因为GPT底层算法的本质就是数学概率而已。但是从用户角度看,GPT的智能已经高得惊人,甚至到了需要叫停的地步。
计算机模型使用反向传播算法,可以以一种完全不同于人类大脑的方式运行,在算法模型下进行海量训练,会让AI飞速进化。深度学习之父、图灵奖得主杰弗里·辛顿在接受Emtech采访中公开警告AI风险:人类终结已近在眼前。