王俊煜
“确定性满足了人们的基本需要”,这是ChatGPT告诉我的。一如既往,它无法给出这句话的依据。只是,鉴于这也和我们在日常生活中的感受相吻合,就不和它细究了。
作为一个创造东西的人,我是不太喜欢确定性的。至少理论上是这样。有不确定性,才有可能创新,才有机会,才能自由自在。一切都确定下来了,也就死气沉沉了。
所以,2020年说要给孩子买学区房的时候我觉得很自相矛盾。那套房子的卖点,是不但可以保证孩子上对口的小学,也有很高概率可以直升对口的初中。我那时候就在想,假如在我上小学一年级的第一天,爸爸就告诉我,你未来6年要在这里读小学,然后要在对面那座中学再读3年——都给你安排好了!那将是多么无聊的事情呀。
我们眼下在做的事情,是探索以大语言模型为代表的AI技术在“认真阅读”中能起到什么作用。这个工作本身在一年前完全不存在,它所依赖的大语言模型在一年前也不存在,以我们当时的视野也无法想象其可能性,更别说做什么规划了。毕竟,必须承认,是ChatGPT的发布启发了我们,而ChatGPT在一年前的今天(写这篇文章时)也还不存在。
这听起来可能很没有安全感,但我觉得还是挺让人兴奋的。
一年的时间,ChatGPT从无到有,按OpenAI在11月初的开发者大会上公布的数字,成长为拥有超过1亿周活跃用户的产品,被认为是历史上增长最快的、面向消费者的互联网产品(Meta的Thread可能可以与之匹敌)。在一年内,ChatGPT简单的设计成了行业标杆,是Bard等其他大厂产品复刻的对象。与此同时,其自身的迭代速度也很快。今天打开ChatGPT的界面,不但可以使用最新的、一次大约可以输入300页文本(是刚发布时的30倍)的GPT-4,在同一个界面中还可以上传图片、文件,供GPT解读、生成图片、和酷似费翔的合成语音聊天……
这一年再次证明人类技术的演进速度是非线性的、指数型的,而且不仅是在技术上,商业、资本方方面面的演进都是加速的。11月初熬夜看OpenAI开发者大会的直播时,我想起在上一个10年中,每年大概以类似心情期待的是苹果或Google的开发者大会,看看iPhone和安卓上有什么新技术,可以用来做什么新产品、新功能。仅仅一年而已,可以说OpenAI已经成为硅谷最受瞩目的技术公司。
我相信的是,应该有一个遥远的、在地平线上的目标,只要保证大概在往正确的方向前进即可。
连公司“政变”也加速了。写这段话的时候,也正值OpenAI开除CEO的戏剧性情节刚刚幕间休息。有人说,乔布斯从被董事会驱逐到回归花了12年。山姆·阿尔特曼只花了两个工作日。这本身又和技术的非线性演进有关,技术演进加速到一定程度是否会失控?一种猜测是,OpenAI的董事会是因为11月初OpenAI取得了某种“突破性进展”,担心威胁人类生存,才不得已试图驱逐不顾安全、执意“有效加速”的阿尔特曼。董事会原成员海伦·托纳(Helen Toner)在和高管沟通时说,毁灭公司也“符合OpenAI的使命”。目前,阿尔特曼回归公司,托纳等董事去职。而我们作为外界,此刻还不知道那个代号是Q*的“突破性进展”到底是什么,阿尔特曼是科幻电影中不顾一切的“科学狂人”还是人类命运的拯救者?暂时还不确 定。
但人总是会有自己能控制一切的幻觉。希望能预测、控制未来,也是人之天性。陪孩子玩飞行棋的时候,骰子掷不到想要的数字他总要哭泣,我就要帮助他理解“概率”或者“运气”,理解骰子掷到多少在一般情况下并非自己所能控制的,即使这种解释要接受起来并不容易。
人们愿意为确定性付出很大代价,这也是大多数人所追求的。这一点我们从小就知道,那是另一个类似的词,叫“稳定”。稳定的工作、稳定的家庭、稳定的住所——这是我们从小耳熟能详的、想象中的美好生活。
我猜测很多玄学便是由此而来。当一件小概率事件发生在自己身上,往往又是不好的事情的时候,人总是希望获得解释,想知道下次如何避免。但实际上大多数问题没有答案,科学和玄学在我看来最大的区别之一,就是科学会承认世界上的大部分事情我们还无法理解,尤其是对我们自己所知甚少。
所以我不喜欢为未来的某种可能性做过多的准备。在北大念书的时候我在实验班,在当时享有全校自由选课、自己安排自己的教学计划的“特权”(现在应该很普遍了)。有些同学利用这个自由度从大一开始就使劲做GPA优化,选一些老师给分给得松的课,为了之后在保研或者出国上有一些优势。这是我嗤之以鼻的。当下的快乐来自于学自己喜欢的东西,而不是为3年后的成績排名做准备,那是无趣 的。
不是说放弃对未来的一切努力。我相信的是,应该有一个遥远的、在地平线上的目标,只要保证大概在往正确的方向前进即可。至于今天走多少、明天走到哪里,尽人事听天命。远景是确定的,路径是未知的。就好比虽然AI的出现对我们来说是不确定性的一部分,但“认真阅读”对我们来说却是确定的。
GPT的接口中有一个有趣的参数叫temperature,“温度”,可以理解为是用来调整输出的不确定性。“温度”越高,回答的不确定性越高,创造性越强;“温度”越低,确定性越低。其实就如设定目标一样,回答的东西可能没有变化,但是怎么回答这个问题,可以千变万化。
有时候可能还是需要一些确定性。今天我在和同事盘算,为什么我们的产品到现在还没有办法发布?7月重新启动工作的时候,打算一周做一个原型,然后再花一个月把靠谱的原型做成可发布的产品。第一个原型实际上花了6周时间;而将其变为产品,到现在做了两个半月,估计还需要至少半个月。这里面当然也受很多不确定性的影响。作为一个重组的小微团队,个人有任何变故,对整体工作的影响立竿见影;AI应用有不同的开发模式,需要不断调整才能找到效果最好的做法,这点也有点像玄学,你的输入和输出之间不一定有很强的关联,不确定性比较大。开发过程中设计、测试、优化的方法,和过去不一样,这也导致工作方式需要调整。
OpenAI在11月初的开发者大会上直接放弃了4月公布的插件系统,而是推出了GPTs平台,让第三方可以在ChatGPT上发布自己制作的、基于GPT的聊天机器人。这一下子取代了许多市面上的产品、工具和平台。我也有些沮丧,尤其是动手试用了一下新的API之后。倒不是说我们正在做的产品也被ChatGPT取代了,它仍然无法被取代,也不会被取代。但GPT新的接口可以大幅简化开发过程,我们写了一两个月的东西,现在看起来,用GPTs花一两个小时就能完成一个60分水平的复刻。也就是说,制作门槛更低了,那就让我们的先发优势被削弱,相当于还是浪费了一些时间。那一刻,就还是埋怨自己做得太慢了。
但再仔细想想我们这几个产品截至目前的开发过程,如果带着今天的知识穿越回去,我们当然会知道有很多地方可以加速。但我们的目标没有变化,写下的每行代码都是确定的,走的每一处弯路也都是确定的,学到的每一个教训也是确定的。这么一说,我觉得我们还是在确定地、一步一步地往前走的,虽然确切的时间还不太确定。
AI让人重燃了创造的热情,这种热情也是确定的。这热情既在自己的身上,也在别人的身上。今年见到了许多乘着AI东风做事情的年轻人,这种眼睛里闪闪发光的创造的热情,我觉得很久没有见到了(其实还有乘着Vision Pro东风做XR的年轻人,同样也是眼睛闪闪发光 的)。
我最后还是买了那套房子。作为父母,好像还是想给孩子多一些确定性。大概就是不想把自己的价值观强加于人吧。其实可以理解为什么上一代人追求稳定,因为稳定在历史上远非常态。我们今天有能力追求不稳定,也是一种奢侈。