《自然》8月30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,其驾驶无人机的能力可在一对一冠军赛中战胜人类对手。
该研究结果标志着移动机器人学和机器智能的一个里程碑,或可启发在其他物理系统中部署基于混合学习的解决方案,如自动驾驶的地面车辆、飞行器和机器人。
深度强化学习系统已在各类博弈中战胜过人类,包括雅达利(Atari)游戏、国际象棋、《星际争霸》(StarCraft)和GT赛车(Gran Turismo)。不过,这些比赛大部分是模拟和棋盘游戏环境,而不是物理世界的竞赛。
瑞士苏黎世大学的Elia Kaufmann和同事设计了一种自动驾驶系统,能以人类世界冠军的水准进行物理世界的竞赛。该系统将模拟的深度强化学习与物理世界采集的数据相结合。在由一位职业无人机竞速飞行员设计的现实世界赛道上进行的一系列比赛中,Swift与3名人类冠军对战,其中包括两项国际联赛的世界冠军。
人类飞行员有一周时间在真实赛道上训练,之后每位飞行员在多场一对一比赛中对战Swift。该系统在多个回合中击败了每一位人类冠军——25场比赛中共获胜15场,而且打破了比赛的最短用时纪录,比人类飞行员的最快速度还领先半秒。
为了在任何竞赛环境中都能打败人类飞行员,该系统必须能应对外部干扰,如风、光照条件变化、定义不太清晰的各种门、其他竞速无人机和许多其他因素——这都是AI技术需要应对的挑战。
◎ 來源|中国科学报