荣智慧
生成式人工智能时代已经真正到来。
自从OpenAI的聊天机器人ChatGPT上线,科技新闻没有一天能离得开“人工智能”和“大模型”两大话题。在美国,包含大多数科技公司的标普指数500,上涨了8个百分点,卖处理器的英伟达股价翻了一番。
在中国,上百个“大模型”问世。“百模大战”令人遥想十年前的“百团大战”—多个电子商务网络平台争做“团购”业务,以线上补贴的方式刺激线下消费,烧钱力竭之后,网站也随之消失在历史的烟尘里,留下屈指可数的巨头。
穿过周期性的烟尘和语言学家乔姆斯基“对战”ChatGPT的失利,人工智能给经济带来什么,又能给文明带来什么?
大多数人的期望宏伟而热切。
高盛银行的最新研究表明:“人工智能的广泛采用,可能会在十年内推动全球年度GDP增长7%—总量增加超70万亿美元。”一份学术研究指出,采用该技术的企业,年增长率将提高三个百分点。Open Philanthropy的一项研究显示,得益于人工智能,本世纪某个时候发生“爆炸性增长”(全球GDP年增长10%以上)的可能性超过30%。
一些经济学家甚至半开玩笑地表示,无限增长也是可能的。
不过,金融市场的数据倒没有那么高涨。过去的一年里,人工智能相关公司股价表现,低于全球平均水平,尽管最近几个月有所上涨。也就是说,美国投资者并没有觉得人工智能的涨幅能跑赢利率。美国长期利率并不高,过去70年,平均值为4.90%,目前为4.38%,历史最高值是15.32%,那是1981年的事。
金融市场并不看好人工智能引发的增速,至少30到50年里都“没什么指望”。
单一技术的进步,能否“颠覆性”地改变经济发展轨道,珍妮纺纱机是个例子。一个普遍说法是,珍妮纺纱机开启了18世纪的工业革命。实际上,大量使用煤炭、严格受法律保护的产权和蓬勃的科学精神,都是工业革命发生的重要因素。
1964年,经济学家罗伯特·福格尔出版了著作《铁路与美国的经济增长:计量历史学文集》。将近30年后,这项研究为他赢得了诺贝尔经济学奖。研究挑战了人们习以为常的看法:铁路改变了美国的经济发展历程,将农业国转变为工业国。
在学术成果方面,中国几年前就已领先。2019年,中国AI方向论文的引用数超过美国。2021年,全球有26%的人工智能会议出版物来自中国,美国仅占17%。
福格尔认为,铁路的影响非常小,放在历史长河几可忽略不计。它所取代的技术—内河运输,本来也有机会做大做强。假如铁路压根没有发明出来,美国在1890年1月1日达到的人均收入水平,在1890年3月31日也会达到。
人工智能技术,很难被准确预测。好在福格尔的铁路研究提供了三个有效指标:垄断、劳动力市场和生产力。
按高盛分析师的估计,最好的情况下,全球上班族中1亿人都买一些智能“小玩意”,全球人工智能企业软件的年度收入增加约430亿美元。
430亿美元流向哪里?看起来会流向OpenAI。垄断产生的原因是,一个行业的固定成本很高,竞争对手又很难提供同样的产品或服务。客户除了洛克菲勒的石油别无选择,更没可能自己去挖。OpenAI有这个底子,其聊天机器人GPT4,训练成本超过100亿美元,还拥有大量的训练模型数据和用户反馈。
不过,一家公司超越整个行业的可能性很小。更常见的情况是少数大公司相互竞争,就像航空、百货和搜索引擎一样。沒有哪家人工智能产品是“独一无二”的,因为它们使用的模型大同小异,计算能力也是通用的,代码和提示技巧都可以免费在线获取—业余爱好者制作“小而美”的模型,反而更有商业竞争力。
劳动力市场的发展也并不悲观。
21世纪开始时,许多人担心外包造成富裕国家工人的贫困。2013年,牛津大学两篇被广泛引用的论文指出,自动化会在随后的十年消灭47%的美国工作岗位。最常见的说法是,即使没有广泛的失业,也会出现“空心化”,即高薪工作消失,没有技术含量的、低薪的角色取而代之。
实际情况正相反。过去十年中,富裕国家的平均失业率减少了大约一半。劳动适龄人口的就业比例处于历史最高水平。日本、新加坡和韩国等自动化和机器人技术使用率最高的国家,失业率最低。美国劳工统计局最近的一项研究发现,近年来,新技术威胁下“有风险”的工作,“没有表现出任何明显快速失业的总体趋势”。
通过降低生产成本,新技术可以创造对商品和服务的更多需求,从而增加工作岗位。像“美甲师”的工作,2000年才被正式添加到人口普查的列表里。“太阳能光伏电工”五年前才加入。人工智能可能会创造今天难以想象的新职业。
劳动力市场的变化,也会对生产率造成影响,但影响的速度,也没有人们认为的那么快。
美国的企业和家庭用电,19世纪末就开始了,而电力带来的经济繁荣,直到第一次世界大战结束才出现。智能手机出现了十多年,几十亿人使用高速互联网,超过1/10的美国员工都在购买了某种人工智能服务的公司上班,但是,全球的生产率增长依然相当疲软。
人工智能对经济的影响也许不那么明显,但对国家安全的影响非常明显。特工“007”詹姆斯·邦德之所以魅力卓绝,主要依靠层出不穷的新技术的加持—这是冷战时期美苏科技竞争的缩影。
今天,技术竞赛依然激烈。
去年9月,美国国家安全顾问杰克·沙利文表示:“少数技术将在未来十年发挥巨大作用。”ChatGPT诞生后的半年内,中国科学技术部重新组建,将有关农业、生态、环境、卫生健康等职能分割给相应部门,保留“国家基础研究和应用基础研究、国家实验室建设、国家科技重大专项、国家技术转移体系建设、科技成果转移转化和产学研结合”等国家战略职能。
在学术成果方面,中国几年前就已领先。2019年,中国AI方向论文的引用数超过美国。2021年,全球有26%的人工智能出版物来自中国,美国仅占17%。按照人工智能出版物的数量计算,世界十大出版机构里,九家在中国。计算机视觉方面,全球前五大实验室全部出自中国。
等到基础模型或“大模型”出现,美国体现出了领先的能力。无论是GPT背后的初创公司OpenAI,还是Anthropic或Stability等小公司,抑或巨头谷歌、Meta和微软(拥有OpenAI部分股权),都有人工智能技术的独家“秘笈”。
百度的“文心”(Ernie)大模型,目前代表了中国人工智能大模型的最高水平,但和ChatGPT同台竞技之后,人们不得不承认它有差距。中国其他两大科技巨头阿里巴巴和腾讯的人工智能水平尚不及此。
业界客观判断,中国的大模型落后于美国大概两到三年。其原因有三:
单一国家—美国或中国在人工智能方面,都不太可能拥有不可逾越的领先地位。
一是数据不够开放,更不够多。中国的视觉信息数据较多,但文字数据较少,近十年的文字数据更被微博、微信这种封闭式的“围墙花园”超级应用所隔阂,难以用搜索引擎索引。最著名的国家级大模型“悟道”也未能引起轰动,恐怕就在于有效、高质量的文字数据的缺乏,即使它的算法可能比GPT-4还复杂。
二是硬件因美国制裁而受限。去年,美国对人工智能方面的硬件实施了一波出口管制,其中包括云计算数据中心使用的微处理器,大模型就靠微处理器来学习;连中国自行建造此类芯片的设备工具也一并禁售。
英国智库人工智能治理中心分析了中国26款大模型的芯片,发现超过一半的处理器都依赖美国公司英伟达。而美国的制裁还在不断加码,甚至消费级的RTX4090显卡都不得出售给中国,一天后才澄清“有所误伤”。
三是專有技术和人才的缺乏。美国的新技术,主要靠移民。国际大型人工智能会议上发论文的美国人,有2/3是外国出生的。2019年时,中国工程师占到其中近1/3。此后,新冠大流行和中美较为紧张的局势,导致中国工程师难以拿到美国签证。关键是,技术和知识很难在相对封闭的、缺少交流的地方产生“创新”。
中国政府正在试图开放国有企业的数据,为大模型的开发者提供更多的资源集。拆除应用的“围墙”也提上了日程,但事关利益的企业还没有动手。
硬件方面,一些中国人工智能公司可以通过他国的云服务器来使用英伟达的处理器,或者干脆向英伟达“定制”不那么尖端的产品—比最新产品的运行速度慢10%~30%左右。当然,这肯定提高了成本。
大模型的“开源”模式,有助于解决硬件和人才的匮乏。模型工作原理可以任意下载,并根据用户需求进行微调。普通人也可以免费下载使用。斯坦福大学的研究人员就采用了Meta的模型LLAMA的权重,以不到600美元的价格创建了一个模型,在执行某些任务的效果上,它不比ChatGPT的原始版本差多少。
这些事实证明,单一国家—美国或中国在人工智能方面,都不太可能拥有不可逾越的领先地位。数年后,每个国家的人工智能水平可能大同小异,尽管制裁之下中国付出了高昂的代价。
以ChatGPT为代表的人工智能的崛起,挑战的是人类语言学问题,而不是模型到底能做多大的问题。
95岁的语言学家乔姆斯基,今年春天在《纽约时报》发文质疑,标题就是“ChatGPT的虚假承诺”,对人工智能的语言能力不买账。文中,他举了一个在所有著作中都提到的例句:John is too stubborn to talk to。乔姆斯基认为,人工智能会理解为“约翰太固执不愿意和人讲话”,而不是指出其本意“约翰不可理喻”。
好事的网友立刻把例句扔给了ChatGPT,结果打了乔姆斯基的脸。
大型语言模型采用“神经网络”技术,从网站、书籍和报纸上收集单词语料库,来做“完形填空”—预测给定句子或短语中的下一个单词。大模型会根据开发人员给出的示例进行模仿,然后判断自己的“答案”与正确答案的接近程度,依此进行调整。
重复以上过程,模型就形成了单词如何相互关联的“思维图”。模型的训练词汇越多越好,“学”得越多,“用”得越好。两年前,GPT-3训练的单词量还只有几十亿,去年DeepMind的Gopher模型已经用了近3000亿参数。
有些语言学家认为,非人类产生“语言”的事实,给研究者提供了一个人类如何学习语言的角度。
ChatGPT令人意识到,语言要比听觉和视觉更接近“人性”。人工智能在“聊天”而不是视觉识别、听觉识别上出现能力“爆发”,恰恰也验证了乔姆斯基的理论。
乔姆斯基不这么看。他是改变了语言学的人—在他之前,语言学是人文学科,在他之后,语言学是自然科学。他提出“思维即语言”,以此可以区分智人和其他物种。思想在先,交流在后,由于一次基因突变,十万年前的“人类”掌握了递归枚举的能力。认知科学家和进化心理学家都认同他的观点。
而大模型和ChatGPT证明,思维不等于语言。它们交流丝滑,却没有思想。而且它们处理“完形填空”的方式,完全是“暗箱操作”,那些对人类而言最重要的“中间任务”—单词、句法和语义分析,根本无需认真对待。
人人都说,NLP(自然语言处理)不需要语言学了。NLP界甚至有这样的笑话:每开除一位语言学家,NLP的系统性能就会上一个台阶。
其实,乔姆斯基并没有那么“过时”。
ChatGPT的G(generate,生成),就来自乔姆斯基1957年提出的理论“转换—生成文法”。其主要包括基础和转换两个部分,基础部分生成深层结构,深层结构通过转换得到表层结构。语义部分属于深层结构,它为深层结构做出语义解释。
这套理论,研究的是人类语言的标准,也指导了机器语言的运行规则。
同时,在来源方面,乔姆斯基自称“跳跃派”,认为语言是“突现”的:人类对使用语言有一种与生俱来的“理解”。他的妻子卡罗尔是麻省理工学院的生物语言学家,曾研究过两岁前患脑膜炎的儿童,他们丧失了视觉和听觉,但保有触觉,通过触觉补偿语言能力,从而能思维。
这证明,语言是比其他感知模式更加基础的官能。
同样地,ChatGPT令人意识到,语言要比听觉和视觉更接近“人性”。人工智能在“聊天”而不是视觉识别、听觉识别上出现能力“爆发”,恰恰也验证了乔姆斯基的理论。
也许,ChatGPT和大模型是弗洛伊德的“继任者”。哥白尼宣布,人类不再是宇宙的中心。达尔文表示,人类只是动物的一种,没有什么“上帝的恩赐”。弗洛伊德的贡献是,每个人都意识到“自我”并不是自己的“主人”。
而大模型终将告诉人类,世界不需要什么“主人”。