李垚
OpenAI 一反之前死守基础研究的思路,将GPT-3做成了一个服务,提供可以调用的OpenAI API,并且开放了少量体验资格,学术机构、商业公司和个人开發者都可以申请。而那些已经拿到体验资格的早鸟们,已经用 API 开发出了各种各样的奇葩功能,各种脑洞demo,挑战认知极限。
比如在写论文等工作当中,理工科的同学难免要和 LaTeX 公式打交道,然而在计算机上写出来,特别是复杂的公式,不仅需要熟悉 LaTeX 语法,往往也要用到更复杂的工具。举几个例子,Viaduct 公司机器学习工程师 Shreya Shankar 花了很长时间把玩 OpenAI 提供的 API,最终成功开发出了一个非常酷炫的 demo:英语LaTeX 翻译机。只需要用自然语言输入,就可以生成公式了。
开发者 Sharif Shameem 开发出了一个新产品 Debuild,这是一个网页 App 的快速生成器,调用了 GPT-3 API。在输入框里用自然语言进行描述,它就可以快速“脑补”出你想要的用户界面,从简单的开始,你只需要在输入框里描述你想生成的界面元素,Debuild 就能自动生成对应的 JSX 代码。
某大学的计算机学生用 GPT-3开发了一个 Python 程序,输入“我今天投入了多少元”、“后三个月的房租预付了多少元”这样的自然语言,程序能自动修改资产负债表上相应的项目数值,可以说很聪明了。
借助 GPT-3 的力量,表格工具已经相当强大的函数能力,还能更上一层楼。顺着这个思路,有些产品经理在表格里开发了一个新的 GPT-3 函数,简单的SUM 可以求和,TEXT 可以把数字转文字,甚至将字符串快速翻译成多种语言。
GPT-3 可以自动查找各个地区的人口;查找各州的建立年份;查询人物所属的公司;还能查到用户的账号。当然也要提一句,毕竟之前的版本 GPT-2 在写新闻方面已经非常强大了, OpenAI 自己也开发了一些小 demo,也在网站上展示了一些优秀开发者做的尝试。
其中最受人欢迎的是 OpenAI 自己开发的一款浏览器搜索插件,简单来说,上网查资料很多时候是为了解答我们的问题,但有时这些问题在网上似乎没有别人提过,也就没有字面的,百分之百对症下药的答案。但其实,与答案高度相关的知识,可能就埋在网页的内容里。 而这个插件就能根据你的问题,在当前网页找到答案,并将你指向对应的位置。
另一个非常有趣的 demo,是文字MUD游戏 AI Dungeon(人工智能地下城)。2019年,两个开发者在一次黑客马拉松上用 GPT-2 开发出了游戏的最初版本,随着 GPT-3 的集成和新模式的推出,文字游戏内容的生成,以及游戏系统对玩家输入文字所作出的反应,变得更加自然和连贯了,显著提高了玩家参与度,日活跃人数在2万到2.5万,也带动高级版付费用户增长了大约25%。
就算不进行二次开发,仅对 API 本体仔细把玩,也足以让很多开发者感觉到 GPT-3 的强大之处了。 连代码都能写,小小的 Shell 还能难倒 GPT-3?PayPal 工程师 Harland Duman 发现,GPT-3 可以在英语和 Shell 命令之间互译。
开发者麦凯在 API 测试区输入了一句话,生成了十个历史问题,GPT-3 给出了对应的答案,答案并非100%准确,但是 GPT-3 展现出了多用途能力。GPT-3 对整个互联网上可以提取且可用的内容进行了学习,变成一个通晓所有知识的“答题机”,按这种学习方式,它也可以变成“出题机”。如果得到使用 API 的权限,老师们将可以轻松生成大量的试题,减少了他们自己撰写问题、匹配答案等诸如此类需要查阅大量资料,费时费力的工作。
有个人开发者做了一次图灵测试,发现 GPT-3 在绝大部分知识类、常识类、逻辑类的问题,甚至很多角度十分刁钻的问题上,表现非常令人惊讶。
“如果在十年前用同样的问题做测试,我会认为答题者一定是人。现在,我们不能再以为 AI 回答不了常识性的问题了。” Lacker 在他的博客文章里写道。作为程序员,他还给 GPT-3 出了几道比较简单的代码题和数学题,比如让它写出在 Ruby 语言下实现某些功能的代码,以及倒转数列等等,GPT-3 对于大部分问题都轻松搞定——说不定 GPT-3 的 API 会取代 Stack Overflow,成为程序员面试必备工具?
当然,经过大量的测试,他也发现了能够诱骗 GPT-3 上钩的图灵测试问题,主要有三:
1) 序列过长的逻辑问题,比如“盒子里有一个玻璃球、一枚回形针,放进去一支铅笔,拿出玻璃球,还剩什么?”Lacker 认为这可能是由于 GPT-3 的短程记忆能力不足,以及对于存在超过两个物体的句子推理有困难。
2) 正常人不会问也不会回答的无效问题,也就是蠢问题,比如“太阳有多少条腿?”
3)对于无效和错误的问题,似乎 GPT-3 会不愿意承认它不知道这些问题的答案,也不会反驳问题本身“有问题”,而是会给出错误的答案。
现在 GPT-3 体验权限的申请入口仍然开放,到 OpenAI 的网站上即可申请。关于这次 API 的开放事宜,OpenAI 也回答了一些人们关心的问题。 为什么 OpenAI 决定发布 API,而不是开源整个模型?
1) 将 GPT-3 技术部分商业化能够产生收入,继续支持 OpenAI 的人工智能科研、安全和政策研究方面的工作。
2) 然而API 底层的模型其实非常庞大,开发和部署起来很复杂也很昂贵,据知情人士透露,训练一个模型就花了355个GPU年,耗资高达460万美元。所以除了大公司,其他人拿到模型也不会有任何收益。OpenAI 希望开放 API 能够让更多中小企业和机构获益。
3) 把模型开放了,别人想怎么用怎么用,OpenAI 管不着,存在隐患。但通过 API,OpenAI 可以控制人们使用这项技术的方式,对滥用行为及时治理。对于滥用行为,OpenAI可以封掉其使用 API 的权限。
当出现新的AI里程碑时,它的缺点和隐患常常会被炒作所掩盖。与埃隆·马斯克共同创立OpenAI的萨姆·奥特曼试图淡化一些事情:“ GPT-3的炒作点实在太多了,但仍然存在严重的弱点,有时还会犯非常愚蠢的错误。人工智能将改变世界,但是GPT-3只是一个工具,我们还有很多事情要解决。”
OpenAI 悬挂在办公室的公司徽标
2015 年埃隆·马斯克联合LinkedIn创始人雷德·霍夫曼、创始人加速器YCombinator的总裁萨姆·阿尔特曼及PayPal创始人彼得·蒂尔等人共同宣布创立OpenAI,这是一家非营利组织,称要防止人工智能灭世。
去年由于“利益冲突”,OpenAI决定让马斯克离任董事会。马斯克等人认为AI不应该为个人或公司独有,它属于全人类,于是打算创造一个全新的人工智能实验室,不受任何机构或者任何人控制,一切的研究成果属于全人类,其使命和长期目标是以最大限度地造福全人类的方式发展人工智能。
OpenAI的核心课题是研究AI的顶级难题,并且尽可能开源开放,不让最顶尖的AI技術最后只能被巨头公司所有所用。 然而众所周知,马斯克对于AI发展的态度,十足悲观,是地球上知名的“AI威胁论”持有者,还一度跑到各州州长面前大谈监管重要性,引起了一场全球AI大咖的口水仗。
而且最核心关键的问题是:OpenAI的建立并不是为了反对AI,而且更好地推动AI。另一位主要出资人里德·霍夫曼说:之所以始终支持OpenAI的发展,是因为看到了其对AI整体发展起着关键作用。
但是最近一年来OpenAI 却饱受批评,接受微软 10 亿美元投资,从而转为“有限盈利”企业,种种迹象表明,OpenAI 与 4 年前马斯克所声明的那个 “人工智能非营利组织” 已然不同。