徐乃帅
机器人Figure 01
说起“人形机器人”,你会想到什么?
是《变形金刚》里,那庞大而充满金属质感的机械身躯?是《终结者》里,那几乎无所不能、冷酷无情的机器人杀手?还是像《我的机器人女友》中,那样栩栩如生,能够和人类谈恋爱的“完美恋人”?
在提出“机器人三定律”的科幻大师艾萨克·阿西莫夫的作品中,21世纪30年代的“智能机器人”已经普及到千家万户。但在现实中,距离阿西莫夫的“预言”的时间点近在眼前,机器人领域的发展仿佛依然差了些火候。
近日,英伟达、OpenAI两位举足轻重的科技巨头,接连宣布入局“人形机器人”领域,让世人的视线都被吸引了过来—人形机器人赛道,就是科技圈的下一个风口。
早在16世纪初,达·芬奇就画出了关于人形机器人的草图,迄今已有数百年。而今,人类一直以来所畅想的机器人时代,能否如期而至?
两次工业革命,彻底改变了世界,极大提升了人类的生产效率和生活质量。从那之后,人类就对“机器”产生了深度的依赖和迷恋,而“机器人”这一概念,正是这种情感最终极的体现。
电影《变形金刚:超能勇士崛起》海报
倘若机器人没有真正的“智能”,它就永远只能去执行被设定好的任务。
在科幻作品的想象中,无论是危险的勘探工作,还是繁重的体力劳作,乃至于家政服务业领域,机器人的身影无处不在。随着近年来相关科技的发展,部分想象中的图景正逐步成为现实。
但是,机器人领域始终有个绕不过去的“瓶颈”。
那便是,倘若机器人没有真正的“智能”,它就永远只能去执行被设定好的任务。哪怕教会机器人1000件任务,它也仍然对第1001件任务束手无策—这意味着机器人只能被限定在固定场景里,从事复杂性较低的工作。
因此,能够自主学习、应对各种复杂任务的“通用型”人形机器人,是近年来机器人领域的战略高地。如此前景下,快速发展的AI技术,可谓是为机器人注入了“灵魂”。
3月18日,在英伟达2024GPU技术大会(GTC)上,公司CEO黄仁勋以9款人形机器人压轴登场,推出了全世界第一个人形机器人通用基础模型Project GR00T,和新型人形机器人开发套件Jetson Thor。
英伟达称,由GR00T驱动的机器人,将能够理解人类的自然语言,模仿人类的肢体动作,观察真实世界并与之进行有效交互。在硬件方面,Jetson Thor计算平台所对应的,是未来人形机器人对强大边缘算力的渴求,这一领域英伟达本身就有着得天独厚的优势。
此外,英伟达还开发了用于大规模强化学习的轻量级应用Isaac Lab,该应用能够在設计、测试机器人,以及训练基础模型等方面为用户提供帮助。
“构建通用人形机器人大模型,是当今AI领域中最令人兴奋的课题之一。”黄仁勋在介绍产品时表示。
而稍早一些的时候,OpenAI也将视线投向了机器人领域。3月13日,OpenAI和机器人公司Figure AI联合发布了一段人机互动的视频:视频中,机器人Figure01能够准确理解人类的语言指令,完成递苹果、收垃圾等动作,并能和人类进行流畅的对话。
2024年3月18日,英伟达推出了全世界第一个人形机器人通用基础模型Project GR00T
Figure AI随后解释了该机器人的基本工作原理:Figure01可以理解看到的情况、理解语音信息、规划要做的行动等,而其中的绝大部分步骤,都并非预先输入的程序,而是链接了包括ChatGPT在内的多模态大模型去进行运算,再从现实的物理世界反馈给人类。
因此,这大概是史上第一次,机器人通过自身进行“思考”,在物理世界里和人类进行自然交互的场景,具有非同寻常的意义。
仅仅在几年前,要实现真正的人机交互,还是极其困难的一件事,而正是AI大模型的出现,为人形机器人领域注入了强大的能量。
如果说AI是人形机器人的灵魂,那“肌体”也是不可或缺的部分。
2022年9月,特斯拉推出了第一代机器人Optimus(擎天柱)。随后一年多时间,Optimus以肉眼可见的速度快速“进化”。到了2024年1月,第二代机器人Optimus Gen2已经可以做到叠衣服、拿取鸡蛋等细致的动作。
Optimus Gen2的手部拥有11个自由度,基本上可以做出人类手部的所有动作,手指末端装上了触觉传感器,可以精密控制手指的力道。而特斯拉本就处于优势地位的先进视觉识别系统,使得Optimus Gen2可以对现实世界进行3D建模,有了学习人类各种精巧动作的可能性。
在英伟达和OpenAI入局之前,特斯拉可谓是机器人领域风头最盛的“玩家”。在一次内部会议中,特斯拉CEO马斯克表示,Optimus机器人的成本将降到2万美元,在普及应用后,可以把人类从繁重的体力劳动中解放出来。
“Optimus有潜力成为特斯拉有史以来最具价值的产品。”马斯克还说。
但同时,现阶段Optimus行走时缓慢而笨拙的姿态,成为其最显著的短板而被广泛诟病。而在“行走”这一技术领域,另一家机器人公司波士顿动力(Boston Dyanmics)有着相当令人惊艳的表现。
波士顿动力推出的机器人Atlas,身高1.5米,体重80公斤,能走台阶、能跑、能跳跃,甚至还可以在半空中翻滚身体,在速度、准确性、平衡性等方面都表现得相当出色,因此该机器人的应用定位大致在搜索、救援、探险等领域。
值得一提的是,波士顿动力的成果颇受美国国防部青睐,双方曾有过合作研发项目。
特斯拉机器人Optimus Gen1(左)、Optimus Gen2
至于日本的研究人员,则在仿生机器人领域进行了深入的探究。早在2011年,日本Kokoro公司就推出了对标真人的机器人Actroid-F。从外观上来看,Actroid-F是一位二十多岁的年轻女性,会眨眼、点头,模仿人类的动作等,而到了最新一代的Actroid-DER2,已经可以精细控制面部,做出微笑等丰富的表情神态。
2017年,日本“机器人之父”石黑浩的科研团队研发出一款名为Erica的“美女机器人”,引起了互联网平台颇多的关注。Erica在仿生程度、语音交互、表情控制等方面取得了可观的进步,交流的时候已经十分接近真人。
该团队在一次接受采访时,表示希望能让Erica拥有“自主智能”。倘若继续按这样的趋势发展下去,不远之后的未来,搭载了AI的人形机器人,或许真的能够扮演人类的“情感伴侣”这一角色。
在中国,随着近些年来国家加大对人形机器人领域产业的扶植力度,已有超过30家企业和科研团队发布了人形机器人产品,宇树科技、智元机器人、小鹏汽车、优必选等企业开始崭露头角,在专利数据方面中国更是处于领先地位。
尽管目前来看总体表现较为低调,但中国在人形机器人领域具有产业集群和优势规模,实则有着巨大的技术潜力。
人形机器人领域涉及计算机科学、机械制造、人工智能、传感器、仿生材料等诸多前沿学科,代表了当今世界智能制造的最高技术水平,是人类智慧的结晶。目前,随着关键技术的相继突破,真正拥有一定智能的“人形机器人”的诞生,或许已临近“破晓”时刻。
但人类,真的已经做好准备了吗?
在谈论机器人可能带来的忧虑之前,或许另一个哲学命题更为关键,即为何是“人形机器人”?为何非得是“人形”?
从理性的角度上来说,这其实不难回答。我们所处的世界,是被人为所塑造过的。人类所制造出来的所有工具、物件,都是为了适应人类的活动而定制出来的,正如猫狗之类的动物无法拿起一杯水,鸟类无法打开一扇有把手的门……因此当人类想要偷懒,需要一个仆人帮助自己工作时,制造“另一个自己”,就成为了最有效的选择。
作为人类的“仆从”,人形机器人不仅需要在形态上和人类一样,还需要具有和人类相近的思维方式,拥有一定智能,才能在各个方面帮助人类。而当“主人”有情感需求的时候,真正去理解人类的情感,就成为了机器人的职能。
这便是最深层的动力,人类试图临摹自身的模样,为自己创造出完美的仆人。对于机器人的恐惧,实则源于对人类自身的恐惧。
最近两年,包括美国、韩国在内的诸多国家纷纷出台政策,加大了对人形机器人领域的扶植,无疑是有着现实利益层面的考量。
无论是《银翼杀手》系列还是《终结者》系列,那些耳熟能详的科幻电影中都涉及了“机器人士兵”这一概念。实际上,这正是人形机器人最有可能首先广泛应用的领域。此前,无人机已经极大地改变了战争的形态,而智能化的人形机器人很有可能成为另一个关键变量,颠覆、重构战争的意义。
而在工业生产领域,随着智能化机器的“攻城略地”,人类正在不断地丢失各种工作岗位,而通用人形机器人的到来,势必会把人类从传统的工作岗位上逼到墙角,届时引发的问题将数不胜数,传统社会形态将面临严峻的挑战。
波士顿动力推出的机器人Atlas
日本Kokoro公司推出的对标真人的机器人Actroid-DER2
至于“机器人叛乱”这一命题,更是科幻作品中的经典。或许我们应该确保,未来的智能机器人能够学会对人类“感恩”?
在自然进化过程中,人类为了应付纷繁复杂的自然生态环境,大脑中超过90%的神经元,以及绝大多数能量都被用于处理无意识的身体活动。
相比之下,诞生于高度工业化的世界,拥有机械身躯的机器人,可谓是降临在了“伊甸园”般的世界—没有自然界的天敌,没有各种微生物、病原体的袭扰,还享受着“造物主”无微不至的关怀。
在史蒂文·斯皮尔伯格導演的科幻电影《人工智能》开头,有这样一幕—博士向一位外观上和人类一模一样智能机器人“席拉”提问:“告诉我,什么是‘爱?”而“席拉”给出的回答是:“爱是先张开我的双眼,呼吸急促,体温开始上升……诸如此类。”在这里,机器人如白纸般单纯。
或许,机器人仅仅只是一面镜子,照射着人类自身的模样。
责任编辑吴阳煜 wyy@nfcmag.com