机器人革命

2021-11-09 09:47王姗姗
第一财经 2021年11期
关键词:波士顿马斯克特斯拉

王姗姗

波士顿动力的四足机器人Sport和两足机器人Atlas

2013年,Google一口气收购了8家机器人创业公司,后面几年中命途多舛的波士顿动力(Boston Dynamics)是其中之一。同年,亚马逊也在用名为Kiva的仓库机器人搬运包裹。

2014年年初,《經济学人》把人类与机器人和谐共处的图景搬上了封面:一个市郊公园里,机器狗在草地上玩耍;一台履带式机器人蹲在老人轮椅前喂饭;还有一位和成年人身高差不多的机器人,任由它的“食指”被一位两岁左右的孩子牵着散步;天空中的无人机则忙着四处送货。《经济学人》判断,芯片、数字传感器和宽带通讯能力将帮助机器人实现“质的突破”。

波士顿动力的四足机器人Sport和两足机器人Atlas

看看波士顿动力随后几年的命运,我们知道,上述判断下得过早—更强的计算能力、更丰富的数据维度、更快的传输速度,当然有助于机器人算得更快,但要实现“质的突破”,机器人还需要一场算法革命:工程师决定机器人如何行动,让位于机器人自主决策。

质的突破:从波士顿动力到ANYmal

2019年,位于瑞士苏黎世的机器人公司ANYbotics推出一台机器人,名为ANYmal,发音与animal(动物)相同,寓意它是一台更接近动物的自主机器人,而非完全听命于程序的提线木偶。

与之前所有机器人的研发理念(包括曾经名声大噪的波士顿动力)不同,ANYmal几乎不依赖工程师灌输的“知识”。刚被制造出来时,它不会站立,也不会走路,和刚出生的小狗没什么不同。但依靠内置的深度强化学习算法(deep r einforcement learning,简称DR L,将强化学习与深度神经网络结合),经过摔倒后就尝试站起来的试错训练,1500代之后,这只机器狗就可以从摔倒时的侧卧状态翻身站起来。

为加快ANYmal的学习速度,ANYbotics同时在电脑上构建了模拟器,让2000多只二维的机器狗一起学习走路、应对各种刁难,将这些二维机器狗学习到的运动策略转交给ANYmal,它也能迅速应用到现实世界中。

听起来和人工智能很像?ANYmal就是人工智能—准确说是深度学习(通过建构深度神经网络实现的学习)机器,只不过被赋予了物理身体。二者的结合革新了机器人行业。

《经济学人》2014年年初刊登封面文章《机器人崛起》(Rise of the Robots》。

2020年10月,这只名为ANYmal的机器狗登上了《Science》杂志子刊—《Science Robotics》的封面,再次激发人们对于机器人的兴趣,以及对机器人新范式—将深度学习与传统机器人结合—的讨 论。

而在差不多时间,波士顿动力的命运就没那么好了,它离开前东家Google已有3年,在新主人软银手中的状态则是又一次待价而沽。2021年7月,它被再次转手,成为现代汽车的子公司。

从外在表现看,波士顿动力在2020年推出的首款零售四足机器人Spot并不逊色于ANYmal,这只黄色的机器狗能够慢走、小跑、跳跃、飞奔。波士顿动力另一款两足机器人Atlas更是多次惊艳大众。2017年10月,Atlas就成功表演了空翻技能;2018年5月,它学会了室外奔跑;今年8月,在一则长达9 0秒的视频中,Atlas成功跑完了复杂的障碍赛。

然而无论Spot和Atlas的运动能力多么出众,它们都难以像ANYmal那样称得上“智能”。波士顿动力的机器人的动作多数是人类手动编写的,如果它要决定下一步如何行走,首先得查询一个步态行为库。

以Altas执行的跑酷行为来举例,波士顿动力的研发团队为机器人提供了一张地图,其中包括研发人员希望它到达的地方、路上存在的障碍以及沿途面对障碍它应该做出的动作。Atlas事先“知道”要去寻找需要跳的障碍盒子,如果盒子向侧面移动0.5米,Atlas能通过实时感知数据重新规划跳跃动作的执行时间。但如果盒子被移动得太远,Atlas就会因为找不到它而停下来。

今年8月特斯拉AI日上发布的人形机器人Tesla Bot。

自主学习机器人ANYmal。

换句话说,At las在跑酷中所做的每个动作,都是一个事先编辑好的行为库,它拥有一定的可选择性,但不能穷尽所有变化。

波士顿动力代表了机器人行业在ANYmal诞生之前的经典范式。不必惊讶,那些有着“工业机器人”之称、在工厂流水线上拧螺丝的机械手臂,以及在电商仓库中来来回回拣货的物流机器人,还有家里的扫地机器人……这些所谓“机器人”实现智能的方式都是如此,它们并不需要多聪明,更不需要自作主张,就能完成封闭空间内从A点到B点的移动。

波士顿动力也许代表着人类运用控制论操控机器实现自动化的巅峰,但它并不通向未来。

成长之路:向马斯克学习

控制?还是自主学习?两种完全不同的技术路径,将机器人行业在时间轴上划为新旧两个时代,也掀起了新一轮的机器人投资热潮。

2020年,国内机器人企业融资数为115起,这个数字很快就会被超越。仅2021年前4个月,同类投资项目已经达到67起,其中单笔融资金额达到亿元的项目超过30个。从分类上看,热门领域虽然仍属于工业、物流、医疗、家用等传统市场,但相较于上一轮投资热潮,新一轮投资开始关注自主学习的技术路线,并更多流入物流和家用等与移动相关的机器人。腾讯、美团、字节跳动等互联网公司押注的主要都是这类产品。

今年以来,腾讯Robotics X实验室推出自称越障能力更强的轮腿式机器人Ollie;小米和小鹏汽车两家公司炮制出了家庭陪伴场景下的机器狗产品,它们都与波士顿动力的Spot相似,在技术路径上并不先进,但这只是开端。

作为都拥有造车业务的公司,小米和小鹏的最终对标对象都是特斯拉。在今年8月的特斯拉A I日之后,马斯克已经将特斯拉定位为“全球最大的机器人公司”。

马斯克对于机器人的构想正在被更多人接受,那就是—未来所有的机器,都将是机器人。

如果此时你还在纠结人工智能、自动驾驶、机器人之间的差别,甚至聊天机器人算不算机器人的问题,那你不必纠结了,它们都为实现机器智能而分头寻找过出路,但正在融合。马斯克已经示范了如何从制造传统机器入手,最终制造出自主决策机器的路径。如外界所知,他从辅助自动驾驶开始,一开始仅将汽车的视觉问题即感知层面的问题交给深度学习接管;在决策层,由于深度学习的决策缺乏可解释性,在训练初期更缺乏安全性,所以特斯拉在驾驶决策中仍然采用传统的规划法,通过手动输入一些规则并创建一个有限状态机—与波士顿动力差不多,让汽车在封闭道路上实现相对可控的自动驾驶。

机器人简史

资料来源:根据公开资料整理

但马斯克并没有放弃完全自动驾驶,相反,他通过让系统跟人类驾驶员学习从而不断逼近自动驾驶。如今跑在全球道路上的数万辆特斯拉都是这样的学习机器,哪怕司机不打开自动驾驶功能,特斯拉也会有一个影子模式在时刻对比自动驾驶和人类驾驶员的操作,并上报两者的不一致。用这些被标注的数据训练,最终既可以教会机器开车,也能避免通过试错才能学习的可怕后果。

更进一步,8月20日,马斯克在特斯拉A I日上又发布了一款人形机器人Tesla Bot,搭载与汽车相同的智能相机Autopilot C ameras和自动驾驶系统FullSelf-Driving(FSD),两者都是特斯拉汽车的核心,前者解决感知问题,后者解决决策问题。Tesla Bot和特斯拉汽车产生的数据都会上传到名为Dojo的超级计算机,在此训练的Autopilot也将成为二者的共同大脑。这一点很容易就让人想到人工智能领域热衷谈论的终极目标—通用人工智能。

一个会开车的人形机器人会比其他同类聪明多少还很难说,但假如特斯拉让这款人形机器人做传统汽车的司机,它就能使传统汽车也变成自动驾驶汽车—这款机器人身高173厘米、体重56.7公斤,与普通成年人差不多。

正如通用的机械手臂并未完全取代工厂里的专用机一样,具备自主学习能力的机器人也不一定比自动化的机器更有未来。但只要创业者愿意,他们也可以像ABB、库卡、特斯拉一样,吃掉传统流水线和汽车厂商的可观市场。而且,只要他们愿意,还可以效仿马斯克,控制论和自主学习两条技术路线并行,最终创造出真正的机器人公司,前提是先在生产线上把机器成批制造出来。

迎接新客人

不管你有没有准备好,各种各样的机器人已经出现在我们的生活环境中:餐厅、酒店、住院病房、购物中心甚至家里的卧室。当机器人长得越来越像人,人类又该如何自处和与之相处?机器人进入具体应用场景后所带来的伦理问题和挑战,比单纯讨论AI技术要复杂得多。大多数这类主题的科幻小说,故事情节所反映出的看法都不怎么乐观。

挑战之一来自人如何从心理上接纳机器人。1970年,日本机器人學家森昌弘提出过一个“恐怖谷”假说,意思是当人发现机器人与人类在外表、动作上相似,会对机器人产生正面情感;但当相似达到特定程度,接近人可与之共情的同类,此时机器人如果偶尔表现出与人的差异,人类对机器人的反应就会突然变得负面,认为它“僵硬恐怖、犹如行尸走肉”,出现情感的波谷;只有当机器人与人的相似度继续上升,达到与人无异的水平,人类对机器人的情感才会再度回到正面,从而发生移情。中间的心理跳跃过程如同一个V字形的峡谷。

2019年,工业机器人安装量排名前5位的市场

资料来源:国际机器人联合会(IFR)

这种心理过山车的出现并不遥远。8月20日的特斯拉AI日上,马斯克已经宣布其人形机器人Tesla Bot的第一个实体版本明年就会面世。

就在几天前,搜狗创始人王小川还在社交媒体上评论一则视频新闻说,“不要虐待机器人”。在那条视频里,一位酒店客人将一台试图进入电梯的机器人踹倒在地。那台机器人的长相距离人类还很遥远—只是一个圆柱体的送货机—就已引发两派意见。一种是像王小川这样,认为机器人应该被友好对待,就像人应当相互友好对待一样;另一种态度则是,机器人不能和人搭同一台电梯,因为它终归是机器,有电池,有系统,它有可能爆炸,还有可能失控。

等着看吧,毕竟经过上百年发展,宠物在人类社会中的地位变得越来越高,在很多场所都可以与人平起平坐的时候,仍有很多社会在为能不能吃狗肉吵得不可开交,我们有足够的理由相信机器人的入世之途不会更顺遂。

机器人产业发展的3种模式

资料来源:波士顿咨询

当然,新一代机器人带来的更大挑战还在于深度强化学习本身。这项技术使得机器人不仅长得像人,决策也容易出人意料,甚至带来不可预知的后果。

简单解释一下这项技术背后的原理,你就会明白我们在担忧什么。相较于之前的人工智能技术—无论是被称作“专家系统”的控制论式智能,还是需要打过标签、有正确答案才能学习的有监督学习—深度强化学习更为智能,它不怎么需要人类专家的知识,也不需要标签样本,就能通过数字神经网络和奖励函数一点一点实现目标,相当于是通过不断试错学会东西的。

你可以从AlphaGo的表现上看出使用了强化学习算法的深度神经网络的强大力量。2017年,《麻省理工科技评论》将这种技术评为当年“十大突破性技术”之一。然而由于其决策的不可解释性,这项革命性的技术也被称为“黑盒”。不管人们认为人工智能有多愚蠢,并因此在智力上藐视它,都回避不了愚蠢的代价需要人来承担的事实。

2030年,专业服务机器人的市场规模将大大超过工业机器人和协作机器人

资料来源:波士顿咨询

迄今为止,各大公司仍然只敢将这项技术用于解决感知层面的问题,比如识别各种图片和声音,至多将其扩大应用至商品、广告、短视频、新闻等消费信息的推荐上,即便推荐得不合消费者心意,也不会危及生命。但汽车就不同了,所以如今跑在路上的所謂自动驾驶汽车都没有将决策真正交给AI(前面已经讲述了马斯克是如何巧妙解决这个问题 的)。

机器人司机自主决策的后果,会和自动驾驶汽车差不多,你准备好了吗?

猜你喜欢
波士顿马斯克特斯拉
特斯拉Model S Plaid
马斯克打脸简史
梅耶·马斯克的“育儿经”
走进波士顿,开拓新视野
你不能带绿气球进波士顿美术馆
真的“很香” 特斯拉Model3
波士顿狂飙
马斯克预计“猎鹰”9可在12月复飞
只因他是马斯克