集群机器人系统特性评价研究综述

2022-06-18 10:36武文亮周兴社

自动化学报 2022年5期

武文亮周兴社沈博赵月

随着感知技术、通信技术、计算机与智能技术以及控制技术等的不断发展以及复杂应用场景的持续推动,集群机器人系统正在得到越来越广泛的研究与应用,并积累了大量理论、方法与技术研究成果,特别是在无人机(Unmanned aerial vehicle,UAV)集群系统协同控制方面[1−5].集群机器人系统的设计灵感最早起源于对自然界中蚁群、蜂群、鸟群、鱼群等社会性简单生物集群行为的观察与模拟[6−7].人们在研究过程中发现,尽管在这些生物集群中的个体都相对简单,但整个系统却能够通过个体间的相互通信与协作涌现出宏观有序的群体智能行为[8−9].相对于单体机器人系统而言,集群机器人系统具有许多明显的优势[10−11]:1)可以实现单体机器人无法实现的复杂任务;2)设计和制造多个相对简单的机器人比单个复杂机器人更容易、成本更低;3)多个机器人间的并行性可以极大提高系统执行任务的效率;4)针对不同的具体情况,可以提供更多的解决方案并优化选择方案;5)通过增加冗余度、消除失效点,可以增加解决方案的鲁棒性.因而,集群机器人系统更适合于区域监测/遍历、外界环境过于危险和具有冗余性要求的任务.在民用领域,集群机器人系统可用于勘探测绘、航空摄影、环境研究、核辐射探测等方面,又可用于水灾探测、防火和救援工作、电力线路检查等方面,同时在城区监视、大型牧场巡查等方面也具有非常广泛的市场前景.在军事领域,将大量的微型机器人迅捷地散布在敏感区域,可用以在大范围时空域内实时监控、感知敌情变化;由大规模UAV、无人坦克、无人舰艇等不同形态的机器人进行搜索、侦查、围捕、拦截与打击等作战任务,可最大限度地减少人员伤亡.

集群机器人系统是群体智能的一个重要应用研究领域,也是机器人系统未来发展的重要方向之一.人工智能在过去几十年中取得的快速发展很大程度上取决于人工智能系统及其算法的评价[12].已有研究成果表明,对机器人系统特性进行有效的评价或者制定相关的评价标准,具有技术引领作用,好的系统特性评价体系可以极大地促进机器人系统更好更快地向前发展.集群机器人系统特性评价问题相对复杂,不仅包含系统关键特性的评价,而且还包含系统综合特性的评价,同时不仅包含对单体机器人系统特性的评价,而且更为关注对整个集群机器人系统特性的评价.集群机器人系统具有自主性、智能性、协同性、灵活性、鲁棒性和可扩展性等诸多期望特性,这些特性是保证集群机器人系统安全、可靠并高效率完成任务的关键.近年来,越来越多的研究学者开始关注集群机器人系统特性的评价问题.适时地对这些研究成果进行总结与分析,对于集群机器人系统的研究、应用与发展具有积极的推动作用.

本文以集群机器人系统特性评价为核心,基本结构安排如下:第1 节概述集群机器人系统概念及其基本分类;第2 节梳理关键的集群机器人系统期望特性;第3 节介绍与比较代表性的集群机器人系统特性评价标准;第4 节述评已有集群机器人系统特性评价指标体系;第5 节总结与比较现有集群机器人系统特性评价方法;第6 节概括当前集群机器人系统特性评价研究工作的不足,并给出未来发展的主要方向.

1 集群机器人系统概念与分类

1.1 集群机器人系统概念

集群机器人系统具体指由一定规模的同构或异构的、单功能或多功能的单体机器人共同组成,在交感网络的支撑下,利用信息交互与反馈、激励与响应等交感行为,可实现单体机器人行为自主决策,集群机器人间行为协同,适应动态环境,最终产生能力涌现,共同完成特定任务的自主式移动机器人系统[13].构成集群机器人系统的个体可以是空中机器人、地面机器人、水面机器人和水下机器人等作业于不同空间的单体机器人.集群机器人系统不是多机器人的简单编队,其能力也不是多机器人单一能力的简单叠加,而是由多机器人通过科学的方法聚集后,经过集群自组织与行为调控机制的有机耦合,产生了新的能力或原有能力发生了质的变化.

目前国内外关于集群机器人系统的研究已相当普遍,典型的集群机器人系统主要包括:群智能机器人系统、自重构机器人系统、智能机器人协作系统和足球机器人系统.群智能机器人系统是由许多无差别的自主机器人组成的分布式系统,它主要研究如何使能力有限的个体机器人通过交互产生群体智能[14−15].代表性的群智能机器人系统主要有:Kilobot[16]、Kobot[17]、Khepera[18]、I-Swarm[19]、Pherobots[20]和SwarmBot[21]等.群智能机器人系统有别于传统意义上的多机器人系统,在个体自主性、功能、感知、通信能力、移动性、集群的规模、异构性、控制方式等方面都有一定的限制.自重构机器人系统以一些具有相同或不同功能的标准模块为组件,根据目标任务的需要,对这些模块进行相应的组合,进而形成具有不同功能的系统.代表性的自重构机器人系统主要有:CEBOT[22]、CKBot[23]、M-Blocks[24]、Ubot[25]和Sambot[26]等.智能机器人协作系统是指由多个具有一定智能的自主机器人组成,机器人之间通过高级通信实现相互协作,以完成复杂任务的系统.代表性的智能机器人协作系统主要有:ALLIANCE[27]、SDR[28]、ASyMITRe[29]和ASyMTRe-D[30]、CESAR Emperor[31]和CESAR Nomads[32]等.在上述三类集群机器人系统中,机器人之间的关系都是合作.而在足球机器人系统中,同队的机器人之间的关系是合作,不同球队的机器人之间的关系则是对抗.由于足球机器人系统的对抗性强,对个体间协作的实时性要求高,因而成为一个具有挑战性的课题.国际上专门设立机器人足球赛来促进该项研究,其中最具有影响的两项赛事分别是RWC (Robot-soccer World Cup,机器人足球世界杯决赛)和RoboCup (Robot World Cup,机器人世界杯足球锦标赛).

1.2 集群机器人系统分类

集群机器人系统可以依据控制方法、协作机制、组织结构、控制结构、通信方式和集群组成等多种属性分类.这些分类属性对集群机器人系统构建及其特性形成与表现程度具有重要影响.

1)按照控制方法的不同,可以划分为基于分层递阶的集群机器人协同控制和基于自组织的集群机器人协同控制.

分层递阶是一种经典的智能系统控制方法,最早由Lima 等[33]提出,主要由组织级、协调级和执行级组成,遵循 “精度递增伴随智能递减”的原则分级管理系统.受此启发,基于分层递阶的集群机器人协同控制结构被提出,具体如图1 所示[34].该结构包括3个决策层和1个控制层.第3 层基于市场机制进行编队任务分配;第2 层负责对编队成员间的协同任务进行协调,包括协同搜索、协同攻击、协同毁伤评估等;第1 层负责航迹规划;第0 层负责平台控制.这种基于分层递阶的集群机器人协同控制方法采用自顶向下的解决方案,有效地降低了问题求解难度,但这种逐层分解问题的过程也注定了集群机器人控制和决策的实时性难以保障.

图1 基于分层递阶的集群机器人协同控制结构Fig.1 Cooperative control process of swarm robots based on hierarchical structure

基于自组织的集群机器人协同控制最初起源于对简单生物群落的研究[35],并逐渐发展形成了群体智能理论[36].这类方法通过模拟蜂群、鸟群、鱼群等生物群体行为实现集群机器人分布式自组织控制,采用自底向上的数据驱动和建模策略,将简单对象构成大集合,通过简单智能主体的聚集协同来实现全局的智能行为.按照Boyd 提出的观察−判断−决策−执行(Observe-Orient-Decide-Act,OODA)环理论[37],基于自组织的集群机器人协同控制流程如图2 所示[38].

图2 基于自组织的集群机器人协同控制流程Fig.2 Cooperative control process of swarm robots based on self-organization

该结构主要包括协同观察、协同判断、协同决策和协同执行4个功能单元.协同观察单元负责分布式协同环境感知理解与分布式目标状态融合估计等功能,协同判断单元负责分布式协同任务决策等功能,协同决策单元负责分布式航迹协调规划等功能,协同执行单元负责分布式编队控制和集群蜂拥与集结等功能.不同于自顶向下的解决方案,该方法更加强调个体对环境的动态反应,以及多个个体之间基于规则的行为协调,以此来实现全局的智能行为,因此具有计算简单、鲁棒性好等优点.

2)按照协作机制的不同,主要可以划分为无意识协作和有意识协作.无意识协作主要模拟简单社会性生物群落的运行机制,利用大量简单的自主个体,通过局部交互和自组织作用,使整个系统呈现协调、有序的状态.有意识协作是多个个体通过信息交换来协调各自行为,共同完成某一任务或实现共同目标,主要用于异构集群机器人系统的协作技术研究,并更多依赖规划来提高协作效率.按照研究方法的不同,有意识协作又可以划分为协商反应式方法和多智能体方法[39].

3)按照组织结构的不同,主要可以划分为集中式、分布式和混合式.集中式结构适用于强协调任务,分主、从机器人,由主机器人负责系统协调,具有完全的控制权.该方式可减少协商通信的开销,并获得全局最优解,但实时性与动态性较差,结构灵活性不足、鲁棒性较差.分布式结构适用于弱协调任务,机器人之间无隶属关系,通过交互或通信实现协调.该方式可降低系统的复杂性,提高扩展性和鲁棒性,但对通信要求较高,不能保证目标的全局最优性.混合式结构本质上是一种层次结构,上层的领导机器人动态生成,且对下层的机器人只有部分控制权.该方式可实现集中式和分布式结构的互补,提高系统灵活性和协调效率,但复杂性高、实现难度大.

4)按照控制结构的不同,主要可以划分为慎思型和反应型.当一个团队在应对环境改变时可以根据策略重新组织整个团队的行为,则为慎思型结构.当团队中每个机器人在应对环境变化时,仅仅对自己所采取的策略进行重组,以更好地完成自身的任务,则为反应型结构.

5)按照通信方式的不同,主要可以划分为隐式通信和显式通信.其中,隐式通信主要利用个体行为对环境产生的变化影响其他个体行为,以此达到信息交流和自组织目的;显式通信通常需要专用硬件通信设备以及复杂的信息表示模型,个体之间可直接进行信息交换.按照通信范围的不同,显式通信又可进一步分为全局通信和局部通信.

6)按照集群组成的不同,主要可以划分为同构集群机器人系统和异构集群机器人系统.

除了上述分类方法外,集群机器人系统还可以按照团队规模、可重构性、作业空间、个体处理能力和协作能力等属性进行分类[40].通信作为机器人间相互沟通的基本手段,还可以按照通信拓扑、带宽和实现方式等进行分类.

2 集群机器人系统期望特性

尽管目前集群机器人系统研究已取得了大量成果,但针对集群机器人系统特性评价一直尚未形成通用的评价标准,研究者主要沿袭控制系统特性和生物集群系统特性对集群机器人系统的期望特性进行总结与描述.这些特性也被认为是研究集群机器人系统的动机.

1)自主性(Autonomy)

在很多相关研究中都对机器人系统自主性进行了定义,但以美国国家标准技术研究所(National Institute of Standards and Technology,NIST)无人系统自主性等级(Autonomy levels for unmanned systems,ALFUS)工作组[41]提出的定义比较全面和规范,该组织定义:自主性即无人系统拥有感知、观察、分析、交流、计划、制定决策和行动的能力,并且通过人机交互完成人类布置给它的任务.这里描述的无人系统即一般意义上的移动机器人系统.由该定义可以看出,自主性即机器人系统独立于操作者的管理程度和自我管理的能力.与很多自主性研究中提出的定义相似的是,机器人系统的自主性可以通过以下4 项基本功能实现,即观察、判断、决策和行动[42].考虑到自主性在计算能力、传感器的真实程度、人和计算机之间知识的传递障碍等方面的限制,为了确保机器人系统的独立性,同时又不限制操作者对于自主性局限性的弥补,一些研究学者也关注可变的自主性研究[43−44].单体机器人系统自主性是集群机器人系统自主性的重要组成,集群机器人系统自主性强调的是自主的单体机器人通过相互通信与协作在群体层面体现的自主,因此强调个体在上述4 项基本功能上的自主协同.

2)智能性(Intelligence)

从信息论的角度看,智能性具体指系统在一定环境下针对特定目标而有效地获取信息、处理信息和利用信息从而成功地达到目标的能力[45].集群机器人系统智能性主要通过群体智能实现.国内外很多研究学者都对群体智能的概念进行了研究[46−50],尽管在研究对象和关注点上有所不同,但这些学者一致认为,群体智能的本质内涵是群体具有优于个体或个体总和的智能性或能力.为了更具针对性,将信息论中关于智能性的定义、NIST ALFUS 工作组关于自主性的定义与上述群体智能本质内涵相结合,本文认为集群机器人系统智能性是指通过自主协同感知、分析、决策和判断等行为所涌现出优于个体智能或个体智能总和的群体行为特性或能力.

通过对比分析自主性与智能性内涵可知,自主表达的是行为方式,而智能则是完成行为过程的能力.两者间的关系为[51]:智能依赖自主,智能的等级取决于自主权的高低.智能生成的一般过程,是在自主的前提下综合运用各方面能力,去获取、处理并利用信息以尽可能达到符合自然规律的目的[52].

3)协同性(Cooperation)

集群机器人系统协同性是指多个机器人通过协同机制,可以完成单体机器人无法完成的任务的功能特性[53].通过适当的协同机制,集群机器人系统可以获得系统级的非线性功能增量[54],从而突破单体机器人系统在感知、决策及执行能力等方面受到的限制,从本质上提高系统的性能,甚至完成单体机器人无法实现的任务[55−56].

4)灵活性(Flexibility)

集群机器人系统灵活性是指集群通过多种不同的演化模式适应环境变化的特性[57].一个高度灵活的集群机器人系统具有重分配和再分配的能力[58],可以用相同的软件或软件的微小变化来处理不同的任务[15],能够针对不同任务产生模块化的解决策略,解决当前任务并响应环境变化[14].集群机器人系统中存在多样性、涌现性、局部交互性等多个侧面体现其灵活性[59].多样性指集群系统具有多种不同的演化模式,涌现性指集群系统可以根据环境的变化创造整体的新状态,而局部交互性通过分散的决策能力使得集群系统具有冗余.

5)鲁棒性(Robustness)

集群机器人系统鲁棒性是指集群即使在个体发生故障或环境干扰的情况下也能够坚持完成目标任务的特性[14].集群机器人系统的鲁棒性实现主要取决于系统冗余、分布式协调、个体简单化和感知多重性.系统冗余指集群系统中个体的损失和故障均可以通过另一个个体得到补偿;分布式协调指集群系统中的任一个体都不会阻碍系统的运行;个体简单化指相比于执行相同任务的单个复杂系统而言,集群系统中的个体相对简单;感知多重性即大量个体分布式的感知可以增加系统总的信噪比.

6)可扩展性(Scalability)

集群机器人系统可扩展性是指集群能够在各种规模下运行,并且保证系统运行的协调机制相对不受其规模变化影响的特性[14].可扩展性的实现要求集群系统中不能够存在中央控制节点[58],个体的感知与通信通力是有限的且个体间的交互是局部的,并允许个体在任何时刻加入或退出任务[15],使得它能够像自然界中的生物集群一样可以扩展至成百上千个节点.

在上述特性中,自主性、智能性与协同性主要针对的是一般的机器人系统提出的三个关键期望特性;而灵活性、鲁棒性与可扩展性主要针对的是集群机器人系统提出的三个关键期望特性,它们可以蕴藏于集群机器人系统自主性、智能性与协同性的实现中.除了这些特性之外,由于应用研究对象的差异与关注点的不同,适应性、可重构性、涌现性、稳定性、并行性、实时性、可靠性、安全性、经济性等[15,55,60−61]在一些研究中也被作为集群机器人系统的期望特性.由于这些特性的含义多与上述特性内涵相近或目前研究尚浅,本文不作详细阐述.

3 集群机器人系统特性评价标准

评价标准是人们在评价活动中应用于对象的价值尺度和界限.伴随着机器人系统应用研究的持续发展,许多组织机构和研究学者对机器人自主性(特别是自主性等级划分)与智能性评价设定了相关标准.其中,部分研究虽非直接针对集群机器人系统,但对持续深化集群机器人系统特性评价规范仍然具有一定参考价值.

3.1 系统自主性评价标准

国内外许多研究机构或学者都对机器人系统的自主性等级划分标准进行了研究,其中多数标准不仅可以度量单体机器人系统的自主性,也可以度量集群机器人系统的自主性,但目前多数机器人系统自主性等级划分基本还停留在较高层次的定性描述阶段,缺乏合理有效的理论支撑,也没有具体的定量指标.一些代表性的机器人系统自主性等级划分标准的综合比较如表1 所示.其中,Zeigler[62]将自主性等级划分为3 级,分别是:1)实现所描述目标的能力;2)适应主要环境变化的能力;3)发展自我目标的能力.Sheridan[63]提出的自动装置等级并不是直接针对机器人系统提出的,但因机器人系统本身大多是一种自动装置,因此该标准对机器人系统的自主性评价仍具有一定的参考价值,但该标准考虑的因素太过简单,也因此往往只能反映机器人系统某个侧面的自主性.

表1 不同自主性等级划分标准比较Table 1 Comparison of different autonomy level classification standards

美国国防部(Department of Defense,DOD)于2000 年发布第一版UAV 路线图[64]时就提出了自主控制等级(Autonomy control level,ACL)划分,2002 版和2005 版UAV 路线图也采用了同一划分[65−66].该划分主要包含遥控引导(1 级)、实时健康诊断、适应故障与飞行条件、飞行路径重规划、团队协调、团队战术重规划、团队战术目标、分布控制、团队战略目标和完全自主群体(10 级)共10个等级.其主要存在两方面缺陷:1) 对各个等级没有详细说明,且1～6 级划分偏细,而7～10 级过于粗糙,等级划分离散,关联度低;2) 该划分并非精准的量化标准,只能反映自主控制水平的模糊值和相对值,且代表性功能描述模糊、性能指标缺乏.美国国防部在2007 版和2009 版无人系统路线图中回避了自主性分级话题;在2011 版无人系统路线图中以人–机权限视角将自主性划分为人操作、人委派、人监督和完全自主4个级别[67−68];2013 版无人系统路线图仍沿用该划分,并指出该划分需改进.

美国陆军科学委员会(Army Science Board,ASB)[69]提出的标准主要面向陆地机器人,描述了一套从遥控到自主集结的自主水平集合.NIST ALFUS 工作组[41]主要从任务复杂度、环境复杂度和人机交互程度三个维度对各种移动机器人系统的自主性进行了等级划分.在实际应用中,这三个维度的因素如何度量、权值如何分配以及如何定义自主等级都是不容忽视的问题.在定义自主性等级时,不同的权值分配方案会产生不同的评价结果.

Draper 实验室[70]主要从运动控制、任务规划和状态理解三个维度,设置了4个等级评价机器人系统的自主性.美国空军研究实验室(Air Force Research Laboratory,AFRL)[71]对其进一步改进,按照OODA 模型确立了UAV 的自主性控制等级,分为遥控驾驶(0 级)、执行预先规划任务、可变任务、实时故障/事件的鲁棒响应、故障/事件自适应、实时多平台协调、实时多平台协同、战场认识、战场认知、战场集群认知和完全自主(10 级)共11个等级,各个等级对UAV 系统的OODA 基本要素提出了不同的需求.Suresh 等[72]对该标准进行了深入的研究,并通过大量文献对每一级自主性进行详细的解释,把每一级细分为几个亚层.NASA 飞行器系统计划高空长航部[73]认为AFRL 提出的划分标准对于预想中的高空长航程科学任务而言太多而且太细,于是采用了一种精简的自主等级,包含遥控(0 级)、简单的自动操作、远程操作、半自主、完全自主和协同操作(5 级)共6个级别,并且用了一个很直观的数据,即人在UAV 飞行中掌控时间的多少来显示自主性等级的高低.

考虑到OODA 模型在描述单架UAV 与其他作战单元或指挥控制单元之间的协同交互关系方面存在较大的缺陷,不能够表达单架UAV 的对外属性,国防科技大学的研究团队[74]建立了协同OODA 模型(Cooperation OODA,Co-OODA),具体如图3 所示.在该模型中,单架UAV 在完成自身OODA 决策循环的同时,还考虑到与操作员之间的交互过程以及与其他作战单元之间的协同过程,即增加了OODA 模型对协同和交互性能的描述.该模型能够从本质上描述UAV 系统的自主能力,构成了自主等级划分的直接依据,即通过任务情况、环境情况以及人机交互情况三方面对该模型的各个度量要素进行映射,明确任务能力对系统各个方面的能力需求,以感知与认知、分析与判断、规划与决策、协同与交互及执行性能5个度量依据细划了UAV 自主性等级划分.北京航空航天大学[75]的研究团队学习和引用DOD 所提标准中科学与合理的内容,从等级的命名上以及结构上作出了一些新的调整.与DOD 所提标准相比,取消了不能归为智能活动的分布式控制等级,修改了原有等级命名中技术层次的概括,修改后的等级命名全部反映该等级的军事应用特征,更适用于我国UAV 的发展状况.

图3 协同OODA 模型Fig.3 Co-OODA model

概括而言,上述标准整体上呈现由一维标准向多维标准扩展的趋势,并通过协同与交互/通信的度量强化了对集群机器人系统自主性评价的支持,有利于设计更完备、更详细的指标体系.但由于目前对各维度均采用的是定性的评价标准,因此在实施评价中都需要依赖于专家的主观经验,评价专家的专业性与权威性至关重要.针对这些定性评价标准实施系统特性评价,一种可行的途径是组织多名专家一起实施评价,另一种可探索的途径是采用模拟模糊思维的广义智能化评价方法使结果相对更为客观.

3.2 系统智能性评价标准

目前国内外直接针对机器人系统智能性的评价标准并不多见,有的标准只适用于单体机器人系统,有的标准既适用于单体机器人系统也适用于集群机器人系统,而有的则只适用于集群机器人系统.

无人车(Unmanned ground vehicle,UGD)是一种典型的地面机器人.针对UGV 系统智能性等级划分问题,北京理工大学的研究团队[76]依据NIST ALFUS 框架模型中的三个维度,即任务复杂度、环境复杂度和人机交互程度的等级划分,提出了UGV系统智能性等级分类标准.该分类标准的提出为推动我国UGV 智能驾驶行为的发展起到了积极的指导作用,为历届中国 “智能未来车挑战赛”在测试内容与测试环境的设计上提供了思路.该标准虽面向UGV 单体系统,但也可以扩展到集群机器人系统中.其优势在于,不仅支持细化的定性度量标准,同时还增加了一个通过细化的评价指标体系与方法支持的定量度量标准即行驶质量得分,因此可以局部支持客观的量化评价方法.

从本质上讲,机器人系统属于智能控制系统,因此智能控制系统的智能性评价标准仍然适用.按照智能性的高低,研究人员一般认为智能控制可分为初级、中级和高级三个层次[77].其中,初级智能控制具体指基于专家系统等人工智能技术与传统的控制理论相结合的控制;中级智能控制除了具有初级智能控制水平之外,还具有对新知识学习、生成和在线修改知识库及控制的功能;而高级智能控制除了具有初、中级智能控制水平之外,同时还具有仿人的组织、协商和决策的能力.在图灵测试和人类智商测评方法的启发下,一种广义智能评价理论体系被提出[78],具体包括1个定义、2个标准和3个规范.定义规定广义智能评价是专门针对机器或系统进行的智能评价.标准1 特指系统性能标准,定义如果系统具有自学习、自联想、自推理、自规划、自协调等拟人智能特性之一,那么该系统就是智能系统;标准2 特指系统技术标准,定义如果系统采用了专家系统、人工神经网络、模糊控制等人工智能技术方法之一,那么该系统就是智能系统.规范1定义如果系统具有的智能特性多且采用的人工智能技术方法多,则其智能性就高;规范2 定义如果系统具有的智能特性较多且采用的人工智能技术方法较多,则其智能性就较高;规范3 定义如果系统仅具有智能特性或仅采用人工智能技术方法,那么它也有智能,只是其体现的智能等级可能不同.广义智能评价理论体系在前人对智能测试的相关理论和方法的基础上,突出了对智能特性的区分和对智能性的测度,包括对人工智能技术方法运用状况的考察,留下了广义的空间来容纳对目前已有和将来可能有的智能系统进行智能测度和评价,因此既支持集群机器人系统智能性评价也支持单体机器人系统智能性评价.由于这两种标准通用性较高,因此适用于各类集群机器人系统智能性评价.

人们对群体智能系统性的认知最早来自于社会性生物集群行为的观察与模拟.Millonas[79]针对社会性生物集群提出了评判其是否体现为群体智能的5 项基本准则:1)邻近性:所有群体成员都应能够进行简单的空间与时间计算;2)品质性:群体成员应能够响应环境中的品质因子;3)多样性:群体行为范围不应该太窄;4)稳定性:群体不应在每次环境发生变化时都改变其行为;5)适应性:在所需代价不高的情况下,群体应能够适时改变其行为.该组准则的提出为我们认知简单生物群体智能的概念提供了极大便利,并且它们还被认为是简单生物群体行为演化的重要原则.在UAV 集群研究中,Banks 等[80]对UAV 集群作战行为进行了建模,并将上述5 项基本准则扩展为了评价UAV 集群是否体现为群体智能的基本准则.由于该工作主要是受社会性生物集群行为启发进行设计与实现的,因此这5 项基本准则也主要适用于基于自组织的集群机器人系统.

综上所述,目前绝大多数的标准是不区分集群机器人系统类型的,即使区分也只限于应用对象操作空间不同.由于这些标准不是仅为集群机器人系统而提出的,因此针对性相对较差.同时,由于研究角度的不同,实际上难以建立统一的评价标准以指导集群机器人系统特性评价.一种可行的途径是面向特定需求定义一种专用的评价标准,另一种可行途径是综合多个相近的需求共同定义一种较为通用的评价标准.

4 集群机器人系统特性评价指标体系

评价指标主要解决的是评价什么的问题.构建科学合理的评价指标体系是整个系统特性评价研究的重要环节之一,特别是针对受多方面因素影响的系统期望特性评价以及系统综合评价.

4.1 系统期望特性评价指标体系

4.1.1 系统自主性评价指标体系

针对机器人系统自主性等级评价问题,尽管多数研究机构与人员已经逐渐地将等级划分依据由一个维度向多个维度扩展,但在划分等级时大都缺乏详细且量化的指标支持.几种具有代表性的系统自主性等级评价指标体系的比较如表2 所示.其中,Draper 实验室提出用动态控制、任务规划和情景感知三个维度评价机器人系统的自主性,完全是从系统内部的自主能力出发的,各个维度也没有更详细的评价指标支持.AFRL 的自主性等级分类标准主要可以从感知、分析、决策和执行4个维度评价UAV 系统自主性等级高低.该结构能够从本质上反映UAV 系统的自主性,但各个维度同样没有更详细的评价指标支持.NIST ALFUS 工作组认为主要可以从任务复杂度、环境复杂度和人机交互程度三个维度评价机器人系统的自主性等级,并提出了一种通用的三轴评价模型,具体如图4 所示.该模型中,每个维度都涉及一组更加详细的评价指标.该指标体系虽比较详细,但实际上是混淆了内部的自主能力与外部的自主需求.

表2 系统自主性等级评价指标体系比较Table 2 Comparison of autonomy level evaluation index systems

图4 NIST ALFUS 的三轴模型Fig.4 3-axis model proposed by NIST ALFUS

国防科技大学的研究团队提出了一种基于任务层次模型和Co-OODA 模型关联映射的UAV 系统自主性等级划分,主要从感知、分析、规划、协同、执行5个维度评价UAV 系统自主性.该结构加入了对自主机器人间合作的衡量,也就是说能衡量群体的自主性,并且从任务复杂度和环境复杂度两个维度出发,建立了任务层次模型的量化指标体系,但并未指明这些指标如何量化.北京航空航天大学的研究团队从自主功能、自主类别、智能属性和信息互通能力4 方面评价UAV 系统自主性等级,进一步丰富了UAV 系统自主性的评价范围.杨哲等[81]在NIST ALFUS 所提3个维度的基础上,增加了系统状态稳定度作为第4个评价维度.尽管其对各个维度的相关影响进行了分析,但并未建立详细的评价指标.其中,自主性等级主要包含全手动式、监督式和全自主式3 种定性度量,而4个评价维度各含4 种定性度量.李静等[82]从体现UGV 系统自主性应具备的能力要素出发,分为感知能力、规划能力、运动控制能力、行为能力和学习能力5个维度,并且每个维度都设计了更详细的评价指标.尽管该结构相对更加详细,但对于各个指标并未给出量化标准.Zhang 等[83]针对UAV 在遭遇突发威胁时的规划问题,建立了UAV 系统自主性等级评价指标体系.该指标体系不仅设计相对详细,而且给出了所有指标的量化标准.其中,一级指标为UAV 自主性等级,主要包含半自主与全自主两种定性度量;二级指标包括UAV 规划能力、操作员的工作状态和威胁感知;三级指标包括任务影响程度、规划精度、规划时间、反应时间、工作强度、可控UAV 数量、威胁程度、威胁感知时间和威胁数量.各级指标主要基于模糊函数和层次分析法相结合实现自主性等级量化度量.

4.1.2 系统智能性评价指标体系

目前针对机器人系统智能性构建的评价指标体系并不多见,且主要以UGV 系统为评价对象.针对UGV 系统智能性等级分类问题,北京理工大学的研究团队依据NIST 提出的ALFUS 框架,设计了UGV 系统评测模型,具体如图5 所示[76].

图5 无人驾驶车辆评测模型Fig.5 Testing and evaluation model of UGV

该模型主要从任务复杂度、环境复杂度和人工干预程度三个维度划分UGV 系统智能性等级.其中,任务复杂度的评价因素主要包括完成任务的数量和完成任务的难度;环境复杂度的评价因素主要包括环境的类型(高速公路、城市道路、乡村道路等),关键交通环境元素(交通标志、交通信号灯、障碍物、行人等)的变化性及其数量,天气,光照条件和外界干扰等;人工干预维的评价因素主要为感知、理解、分析、规划和决策中的人工干预比率,但该结构并未给出详细的评价指标体系以及量化的评价标准.尽管智能与自主并非同一概念,但该指标体系用于评价UGV 智能性存在相似的问题,即实际上是混淆了智能的内部功能实现与外部需求.但从长远发展来看,该研究对UGV 的智能性发展仍具有一定的指导意义,且对于集群机器人系统的智能性评价也有一定的参考价值.针对UGV 系统智能性定量评价问题,北京理工大学的研究团队从基本车辆控制行为、基本行车行为、基本交通行为、高级行车行为、高级交通行为5 种智能行为出发,建立了详细的层次化UGV 智能行为评价指标体系.通过对各级指标和次级指标的量化,可以直观地得出UGV 哪几项指标存在不足,指出以后改进的方向,但该研究只适用于单个UGV 系统智能性评价.

基于人工生命的智能控制系统的提出,对于如何考虑与认识移动机器人系统等智能控制系统的智能性起到了很好的启示作用.北京科技大学的研究团队[84]基于人工生命智能控制系统的智能特征,从体系结构、智能感受器、智能控制器、智能执行器和控制效果5个维度出发,建立了详细的层次化智能控制系统的智能性评价指标体系.该结构也适用于机器人系统,但同样只适用于单体机器人系统的智能性评价.

北京理工大学和北京科技大学提出的系统智能性量化评价指标体系的比较,如表3 所示.尽管这两种评价指标体系均主要面向单体机器人系统,但对于集群机器人系统评价指标体系的构建在研究思路上具有一定的指导作用,即集群机器人系统的智能性评价指标体系面向实际需求并结合现实中的测试条件合理构建.

表3 系统智能性量化评价指标体系比较Table 3 Comparison of system intelligence quantitative evaluation index systems

4.1.3 系统协同性评价指标体系

集群机器人协同执行任务可以克服单个机器人资源、能力的有限性,但需要通过机器人间的通信交流,才能达到协同效果.因此,集群机器人协同完成任务的关键在于时空同步和自主决策.要实现集群机器人时空同步,需要各平台状态信息的共享.自主决策与协同的问题在于消除 “集体”和 “个体”之间的矛盾,这也是通过个体的信息共享来实现.基于上述分析,海军航空工程学院的研究团队[85]针对协同性评价提出了协同时间和协同数据量两个主要指标,并针对这两项指标,在总结各种集群机器人协同体系结构执行任务过程中的共性基础上,以感知单元、决策单元、执行单元和环境为系统组成构建了集群机器人协同体系结构,具体如图6 所示.由于该指标体系是基于通用的协同体系结构提出的,因此适用于各类集群机器人系统.

图6 协同体系结构Fig.6 Cooperative architecture

上述结构中,感知单元从环境中感知战场态势,将态势信息传递给决策单元;决策单元作出决策,将指控信息传递给执行单元;执行单元实施具体行为和动作.在一次协同过程中,协同时间具体由感知单元从环境中感知与接收战场态势的耗时、感知单元将战场态势传递给决策单元的耗时、决策单元的决策耗时、决策单元将决策得到的指控信息传递给执行单元的耗时和执行单元根据指控信息执行任务的耗时5 部分组成,而协同数据量具体由参与协同的单架UAV 感知到的战场态势信息大小和向参与协同的单架UAV 发出的指控信息大小两部分组成.

4.2 系统综合特性评价指标体系

社会性生物集群系统不仅是集群机器人系统设计灵感的来源,同样也是集群机器人系统评价灵感的来源.Camazine 等[86]最早沿袭传统控制理论中系统特性评价指标,对简单生物集群系统特性进行了总结与描述,认为生物集群系统应该具备鲁棒性、适应性和可扩展性3 项基本特性.受此启发,针对集群机器人系统特性评价问题,Sahin[14]把这3 项系统特性定义为集群机器人系统期望特性.虽然这3 项系统特性主要是受社会性生物集群系统启发提出的,最初也主要适用于基于自组织的集群机器人系统,但从系统控制需求的角度来看,基于分层递阶的集群机器人系统也具有对这3 项特性的需求.但无论针对哪类集群机器人系统,这3 项特性都已不能完备地反映当下集群机器人系统特性的需求与实现.

Oztemel 等[60]以医疗应用为背景研发的智能机器人集群系统(Intelligent robot swarm for attendance,recognition,cleaning and delivery,IWARD)为参照,提出了一种综合性的集群机器人系统特性评价指标框架,该框架具体由指标设定、报告、特性监控和特性评价4 元素构成.以提高系统的通用性为目的,该框架分别定义了通用指标与具体应用指标两类评价指标.其中,通用指标不涉及具体应用,具体包含个体功能性、健壮性、沟通技能与信息交互、及时性与响应性、同步性、群体智能、可靠性、可用性和可访问性9 类指标.尽管该框架对所有个体机器的所有指标均采用的是定性的等级评价,而且并未讨论如何对系统整体进行综合评价,但其所提的对系统特性指标进行分类的观点对于深化通用集群机器人系统特性评价框架研究仍值得借鉴.

综上所述,目前集群机器人系统期望特性的评价指标研究主要以自主性、智能性与协同性为主,而灵活性、鲁棒性和可扩展性等评价指标还有待于继续深化.系统综合特性评价指标体系研究相对较少,并且由于研究角度的不同,评价指标体系的完备性与可扩展性也存在着显著差异.

5 集群机器人系统特性评价方法

5.1 系统特性基本评价方法

评价方法主要解决的是如何评价的问题.从方法论角度看,集群机器人系统特性的基本评价方法主要包括基于解析的方法、基于模拟的方法和基于统计的方法三类.这三种方法各有长短,在实践中各有其适用范围,还常常混合使用,取长补短.其中,基于解析的方法和基于模拟的方法均是根据集群机器人系统基本原理特性构成模型,两者的区别是构成模型的方法不同,即从实际系统到模型的抽象方法不同,前者是用数学方法加以抽象,而后者是用模拟程序加以抽象.由于这三种方法具有较强的通用性,因此适用于各类集群机器人系统各种特性的评价.

5.1.1 基于解析的方法

基于解析的方法的特点是根据系统特性指标和给定条件(常常是低层次的特性指标和系统执行的所有任务与环境条件)之间函数关系的解析表达式来计算系统特性指标值,这些解析表达式可以直接根据概率论、随机过程论、排队论等数学理论来建立,也可以从用数学方法建立的特性方程中得到.基于解析法的系统特性评价与优化步骤为:1)对系统特性指标及其可能的影响因素进行初步分析;2)根据一定的限定条件和合理假设,对系统特性指标及其影响因素进行描述,确定系统特性指标及其参数之间的函数关系,抽象出系统特性指标的数学分析模型;3)利用数学分析模型对问题进行求解,根据求解结果分析影响系统特性指标的参数;4)找出影响系统特性指标的瓶颈参数,从而达到优化系统性能的目的.

针对集群机器人系统特性评价问题,Hecker等[87]以不同实验条件下的任务执行效率测量值为自变量,建立了蚁群机器人系统容错性、灵活性和可扩展性的量化模型.容错性的度量如式(1)所示,其中E1表示假设没有错误的演化策略的效率,E2表示存在错误的演化策略的效率.灵活性的度量如式(2)所示,其中E1表示给定资源分布演化的最佳策略的效率,E2表示针对不同资源分布演化但在给定资源分布上进行评估的替代策略的效率.可扩展性的度量如式(3)所示,其中E1表示单个机器人的效率,E2表示大规模集群中每个机器人的效率.

其他一些基于解析法的代表性研究如下.Harwell 等[57]分别以集群规模的变化值、预测与观察的性能增长值、预期与实际的性能损失值作为自变量,建立了集群机器人系统可扩展性和涌现性度量模型,并且基于曲线相似性的数学方法,提出了一种集群机器人系统适应性评价方法.Fukuda 等[59]将容错性和局部优势视为集群机器人系统灵活性的评价指标,并分别以任务执行效率与系统没有出错的比率之间的关系、交互的比率之间的关系度量建立了集群机器人系统容错性和局部优势量化模型.Szabo 等[88]以交互作为系统涌现性的度量,分别提出了绝对的和相对的评价标准,并通过实验对所提标准的优势与局限性进行了分析.Wang 等[89]提出了一种基于复杂网络理论的UAV 集群系统鲁棒性评估方法,该方法对UAV 集群的动态重构和信息失联的动态演化进行分析和建模,建立了综合的鲁棒性度量和两种评价策略.

基于解析的方法的优点是计算速度快,能够得到特性参数的公式解,可在系统特性参数和系统输入参数间建立起明晰关系,从而有助于更深入地了解系统的特性.其缺点是基本上纯数学解析问题,在工程实际中由于受到理论的不完善以及群体机理认识的不全面等影响,基于解析的方法在评价应用中受到很大的限制.

5.1.2 基于模拟的方法

基于模拟的方法的实质是以计算机仿真模型为基础,在给定数值条件下运行模型,对系统的全部或部分行为进行仿真,由实验得到系统进程和结果的数据,直接或经处理后给出系统特性相关信息.基于模拟法的系统特性评价与优化步骤为:1)明确和规范系统仿真所要研究的问题、目标及系统仿真描述特性参数,并针对仿真对象制定详细的计划,提出可行的研究方案;2)建立系统的概念模型和数学模型,搜集用于仿真实现和验证的相关数据,通过自行开发或使用仿真工具实现系统仿真模型,并验证其是否和实际系统相符合;3)利用仿真模型完成具体场景仿真,同时设计仿真实验序列,利用仿真工具进行仿真实验,并利用分析工具和数学知识进行仿真结果分析和处理.利用仿真方法获得可靠的系统特性指标参数,仿真工具的选择尤为关键.集群机器人系统的仿真工具可以选择自行开发,也可以使用现有的仿真工具,例如Matlab、Player/stage和Gazebo 等.

针对集群机器人系统特性评价问题,基于模拟法的代表性研究如下.Gazi 等[90]基于其所提的集群聚集与搜索行为连续时间模型,用理论证明和模拟实验的方法证明了集群能够成群的沿着环境梯度移动并最终稳定地聚集在目标区域内.Liu 等[91]基于其提出的具有固定通信拓扑结构的集群模型,给出了在感知延迟和异步存在的情况下集群也能在移动过程中保持凝聚力的条件,并通过模拟实验的方法进行了验证.陈世明等[92]基于其提出的基于个体局部信息的智能群体模型,通过模拟实验的方法验证了大规模智能群体动态行为的稳定性.薛志斌[93]采用仿真测试的方法验证了其基于拉格朗日框架构建的有限感知和指数型随机两类集群智能系统动力学模型的正确性与有效性,并针对集群智能系统协调行为的软控制中涉及到的一致性问题,用仿真测试的方法验证了这两类集群智能系统模型的稳定性.

基于模拟的方法的优点是可根据需求设计所需的系统模型,具有较强的灵活性,比真实实验高效,但也会受到模拟器的限制,同时真实度也要受到一定的影响.如果对系统行为有一个详细的仿真,那将会得到一个比用解析法更为精确的数值,而且模拟法还可以检测到不同的因素对系统特性的影响.但基于模拟的方法的计算量太大,没有解析法简单明了,如果仿真模型不正确,那么得出的结果和现实将大相径庭.因此,在分析研究系统特性上使用模拟法,必须对仿真模型进行仔细的推理和验证,确定完全正确后方能继续进行分析.

5.1.3 基于统计的方法

基于统计的方法的特点是运用数理统计方法,依据实验所获得的有效信息来评价系统特性,其前提是实验数据的随机特性可以清楚地用模型表示并相应地加以利用,其关键在于系统特性指标值的准确获取与分析.基于统计法的系统特性评价与优化步骤为:1)针对已运行的系统进行测量,收集各种参数;2)对收集到的各种参数进行数据分析与处理,对系统特性进行量化评价与优化.常用的统计法主要有抽样调查、参数估计、假设检验、回归分析和相关分析等.目前,集群机器人系统特性评价中,主要以基于对比实验所获得统计信息构建的图表模型为依据,对系统特性进行评价与相关分析.

针对集群机器人系统特性评价问题,基于统计法的代表性研究如下.Bahgeci 等[94]在利用进化方法开发集群机器人聚集行为的过程中,通过对对比实验的结果进行统计分析发现,集群机器人系统完成聚集任务的性能与进化参数间存在一些经验性规律.该研究同样可用于指导基于进化方法开发集群机器人的其他行为.Lerman 等[95]分别以简化了的和完整的搜索任务为典型应用场景,通过对对比实验的结果进行统计分析发现:1)在简化的搜索场景中,集群机器人系统总体的搜索性能会随着系统规模的增加而提高,但这种性能的提升是次线性的,即每个机器人个体的性能是随着系统规模增加而减少的;2)在完整的搜索场景中,集群机器人系统存在一个最佳的系统规模可最大限度地提高系统总体的性能.Rybski 等[96]通过对比实验的方法,定量分析了集群规模、目标的物理分布和环境中的障碍物密度都会对系统完成目标搜索任务的影响.Soysal等[97]在基于状态转移概率方法开发集群机器人聚集行为过程中,通过对比实验定量分析了集群规模、转移概率、等待时间、区域大小等参数变化对系统任务执行能力的影响.Sugawara 等[98]以搜索任务为研究对象,通过分析研究发现群体中个体数量与系统任务执行能力之间的关系和个体间相互作用的持续时间相关,并且无论在固定、不固定位置的资源分布情况下,该持续时间都存在一个最优值.

基于统计的方法不仅能给出系统特性的评价值,而且还能显示集群规模、任务与环境复杂性参数等内、外部参数对系统特性指标值的影响,从而为改进系统特性提供定量分析依据.对于集群机器人系统而言,基于统计的方法是评价其特性指标的基本方法,由于测量和评价真实系统的成本较高,且重新配置资源与场景较难,运用起来不灵活,因此该方法多与基于模拟的方法一起使用,在系统设计或建立之前预测其性能.

5.2 系统特性综合评价方法

除上述系统特性的基本评价方法外,有许多系统综合评价方法被用于求解机器人系统期望特性评价问题,这些方法各有利弊,有的研究虽不能直接应用于集群机器人系统,但方法本身并非不可借鉴.

5.2.1 机器人系统自主性评价方法

纵观目前国内外关于机器人系统自主性的评价方法,主要包括定性等级量表法、时间序列预测法、三维智能空间图表法、多维区间打分法、蛛网评价模型、模糊综合评价法和云重心评价法等.这些方法的简单比较具体如表4 所示.

表4 机器人系统自主性的不同评价方法比较Table 4 Comparison of different autonomy evaluation methods of robotic system

1)定性等级量表法

定性等级量表法是最容易操作且最为普遍应用的一类机器人系统自主性评价方法.系统评价者可以以已有的机器人系统自主性等级分类标准为依据,对机器人系统的自主性进行评价;也可以先按照预期的机器人系统自主行为特性或能力要求将其自主性划分为不同的级别,然后以此为依据,再对机器人系统的自主性进行评价.目前,国内外许多研究机构和学者都对机器人系统的自主性等级分类标准进行了研究.这种方法的优点是简便易操作,缺点是操作上的简便使人们容易做表面工作,在进行等级评定的时候容易敷衍了事,另外当评价标准表述的比较抽象和模糊时,可能会导致不同的人对同一系统的评定结果不一致的现象存在.

2)时间序列预测法

时间序列预测法综合考虑自主性等级和时间两个因素,自主性等级坐标轴上标注有自主性的等级和内涵,时间轴上依次标注有自主性发展的年代.通过双坐标轴可以清楚地看到,在特定的时间内、特定无人系统所达到的自主性等级.比较具有代表性的有DOD 提出的ACL 发展路线图,如图7 所示[66].该方法的优点在于,便于科研人员和政府部门按照机器人系统自主性等级实际情况对其未来发展作出科学合理的规划与决策.缺点是发展路线中的指定时间与机器人系统自主性等级的实现时间可能不完全吻合,并且由于自主性等级设定具有计划性,实际发展可能与预设等级有一定出入,因此按照该方法制定的发展路线需要周期性更新.

图7 ACL 发展路线图Fig.7 ACL development roadmap

3)三维智能空间图表法

Draper 实验室将Los Alamos 国家实验室的三维度量改为三维智能空间,即移动能力控制、任务规划和态势感知,每一维又分为了4个等级,当需要对一个机器人系统进行自主性等级划分时,其结果就会形成一张雷达图,如图8 所示.该方法看起来很直观,这让管理人员很愿意使用.但是该方法存在一些缺点,比如任务规划这个轴需要重新定义,因为有些自主系统完全是基于反应式行为的.

图8 自主控制系统初始ACL 雷达图Fig.8 Initial ACL radar chart of autonomous control systems

4)多维区间打分法

多维区间打分法是一种常见的综合评价法.该方法的基本操作是,首先按照预设的等级分类标准对各指标进行打分,然后再将单项评分基于确定好的权重通过线性加权求和得到综合评分.NIST ALFUS 工作组给出的无人系统自主性等级参考分类标准以及北京理工大学的研究团队提出的UGV 系统智能性等级分类标准就是基于多维区间打分法实施的,在具体实施过程中对各个维度的等级分类标准均为5 级,各个维度权重的确定采用的是等权法,然后以综合评分为依据,将机器人系统自主性等级和UGV 系统智能性划分为10 级.该方法可适用于非连续性变量的评价,且不受指标形式的限制,虽简便易操作,但过于粗糙.

5)蛛网评价模型

中国科学院沈阳自动化研究所[99]提出了蛛网模型用于机器人系统自主性评估,蛛网模型的每条轴代表不同的评估方面,每条轴上的等级代表不同评估方面的技术成熟度[100−113],不同轴上等级对应点连接起来构成一张 “蛛网”,具体如图9 所示.

图9 自主性评价的蛛网模型Fig.9 Cobweb model for autonomy evaluation

蛛网模型具有轴可扩展、等级可定制的特征,因此是一种普适性的方法.对于特定系统、特定任务,不同评估方面的等级评估结果连线构成其蛛网自主评估模型.蛛网评估模型中轴的定义以及轴上技术成熟度的定制是决定评估模型好坏的关键.

6)模糊综合评价法

模糊综合评价法最早由我国学者江培庄提出,该方法主要运用模糊变换原理和最大隶属度原则,考虑与被评价事物相关的各个因素,对评估对象作出综合评价.其主要思想为:首先定义一组评语集合;然后通过多个专家打分,获取所有评价指标的评价矩阵;接着利用一组设定的隶属度函数将所有指标的评价值转化为隶属度、隶属度权重,最终生成相应隶属度权重矩阵;最后通过引入指标权重向量,经过模糊变换运算最终得到一个具体的评价结果.通过对UAV 系统任务完成度、环境变化度、人机交互程度、系统稳定度以及UAV 平台的特征分析,杨哲等[81]确定了4 种不同程度的定性评价结果,并运用层次分析法确定了不同指标的权重,采用模糊综合评价法实现了UAV 系统自主性等级评价.考虑到UAV 在威胁情境下的重规划问题,Zhang等[83]以UAV 的规划能力、操作员的工作条件、UAV的威胁感知为主要评价维度,构建了UAV 系统自主性的评价指标体系,采用层次分析法确定了各级指标的权重,并采用模糊综合评价法实现了UAV系统自主性等级定量评价.该方法可将不完全、不确定的信息转化为模糊概念,使定性问题定量化,提高评估的准确性与可信性,且数学模型简单、易于掌握,但计算复杂,隶属度与权重的确定、模糊合成算子的选取等带有较强的主观性,且当指标集过大时,评价结果会出现超模糊现象,因此常和层次分析法一起使用.

7)云重心评价法

云重心评价法采用云理论将传统模糊集理论和概率论相结合,综合考虑概念的模糊性(边界亦此亦彼)与随机性(发生的概率),用云模型实现定性概念与定量数值间的转换.为解决地面智能机器人自主性评价过程中评价体系单一、未考虑评价过程及系统自身不确定性等问题,阎岩等[102]通过评价指标分类、评价值获取以及评价云的生成与综合等过程实现了地面智能机器人自主性定量评价.

云重心评价法适用于模糊性和不确定性的综合评价问题,是将定性评价转化为定量评价的重要手段,更符合专家评判的主观偏好,更好地满足了机器人系统自主性评价的实际需求,并为其他复杂智能系统的评估研究提供了可借鉴的方法.

由于这些评价方法具有较强的通用性,因此适用于各类集群机器人系统的自主性评价.除这些评价方法之外,也有研究者[103−104]采用公式法对机器人系统的自主性进行了定义.这种定义的好处是可以量化与规范化机器人系统自主性,但该方法通常对函数的设计、变量的选择和权值/指数的确定有很高的要求,需要大量的经验和数据作为基础,并且只针对特定系统.

5.2.2 机器人系统智能性评价方法

尽管目前国内外针对机器智能性评价方法的研究[105−107]已相当普遍,但其中绝大多数研究都是围绕计算机程序系统开展的,因此很难适用于机器人系统智能性评价.极少有直接针对机器人系统进行智能性的评价研究.

1)层次分析法与可拓层次分析法

针对UGV 系统智能性的评价,北京理工大学的研究团队分别采用层次分析法和可拓层次分析法确定了UGV 系统智能性评价指标权重,并采用成本函数法、模糊综合评价法对UGV 系统智能性进行了定量评价,其研究成果在 “第四届中国智能未来挑战赛”得到了实际应用.虽然该研究面向对象为单体机器人系统,但从评价方法上对于集群机器人系统智能性评价并非不可借鉴.

层次分析法是由美国著名运筹学家萨蒂创立的一种解决多目标复杂问题的系统分析方法.其基本思想是先按问题要求建立一个描述系统功能或特征的递阶层次结构,通过两两比较评价因素的相对重要性,给出相应的比例尺度,构成上层某因素对下层相关因素的判断矩阵,以给出相关因素对上层某因素的相对重要程度组成的重要序列[108].该方法的主要优点是具有较强的适用性、逻辑性、准确性和系统性,不仅能够吸收应用评价者的定性分析和逻辑判断,还能够基于不完全信息和精确数据进行一定的量化评价,使定性与定量方法相结合,能够得到比较科学的判据,并且其一致性检验能够保证评估结果的不确定性因素的影响降至最小,能够克服评价者在定性分析过程中可能出现的逻辑判断失误.该方法虽然能够实现UGV 系统智能性评价指标权重的获取,但在确定各指标权重时也存在一些缺点:a)模糊判断矩阵明确化;b)需要一致性检验.

为了解决上述问题,北京理工大学的研究团队在层次分析法中引入了可拓展理论,提出了可拓层次分析法,用区间数代替点值数构造可拓展判断矩阵,克服了层次分析法在解决专家经验方面的模糊性问题.将指标权重计算与判断矩阵一致性检验结合进行,并考虑专家判断的模糊性和多位决策者的实践经验,有效避免了层次分析法中的大量试算工作.这样既保证了专家判断结果的真实性,又保证了判断矩阵的一致性,使得确定的UGV 系统智能性各个评价指标的权重更加合理.

2)成本函数法

在我国UGV 智能性定量评价研究中,还引入了成本函数的方法对技术指标量化.采用技术指标成本函数为导向的评价方法,必然会促使参赛车辆在技术研究的过程中朝着成本函数最小的方向发展.这样就引导参赛车辆不仅要完成任务,而且要高质量地完成任务.从而提高我国UGV 的技术水平,进一步提高其自然环境感知与智能行为决策能力,最终达到甚至超过人工驾驶的水平.成本函数法以系统完成任务过程中的总成本为度量对系统进行综合评价,如式(4)所示.其中Ci为某项基本或高级智能行为的成本函数,它们可以采用相同的方法得到,未参加规定测试项时可通过倍增因子施以惩罚.针对不同的测试项可建立不同的成本函数,以 “更换车道”为例,可以用更换车道的时间与该时间内车辆所行驶距离的乘积表示.

通过定义成本函数的方法将不同层次的、不同形式的指标进行量化,其优点是可以使被评价系统朝着低成本的方向发展,缺点是成本函数的设计存在很大的人为主观性,不同的人很有可能得到的成本函数不同.

3)模拟人类智商评价方法

智商的全称为智力商数,是由美国心理学家特尔曼提出的一种客观度量人的智力高低的定量化概念,主要通过分类测试和数理统计的方法得到.北京科技大学的研究团队[84]借鉴人类的智商定义与智商测试方法,定义了智能控制系统广义智商量化模型,如式(5)所示.其中,M为中等智商值,F为系统个体得分,B为团体平均值,S为同类产品或系统测试得分的标准差.

不同的是,人的智商建立在所有人的智力遵从正态分布的前提下,而智能控制系统的智商建立在对某一类系统的一般需求之上.

智商不仅是用于测量人类个体智力高低的概念,而且之后被进一步扩展到人类团体.群体智能本质上也是一种智力,因此国外一些研究学者认为人类个体的智商测试方法完全可以用于群体系统智能性评价,这些方法对机器人群体智能评价同样值得借鉴.Brown 等[109]认识到群体智能同 “人的智商”一样能够被度量,设计出 “群体智商”作为群体智能的测度标准,以测定不同环境下群体智能的高低.Szuba[110]设计了度量群体智能的模型,提出了联合智商的定义,即 “在N元推理的时间和空间域范围内的概率函数,它反映了社会结构的推理”,用于测算群体智能的高低.此外,还有研究学者用团队智商记分卡来记录团队智商.团队智商记分卡着眼于高效团队应具有的态度、技能和原则,旨在分析团队现实能力和应用潜力之间的差异,通过支持团队创建进步路标,发现团队工作中的不足之处,作出及时调整,以使团队利益最大化.尽管有的方法并非直接以集群机器人系统为研究对象,在考虑评价指标时没有考虑到其运动特性,但也并非不能用于这类系统.

由于模拟人类智商的方法主要是通过测试对评价指标进行量化并通过特定系统综合评价方法进行综合量化的,因此对集群机器人系统的类型并不严格区分,分类属性本身可能被作为评价指标对待.

4)基于信息熵的方法

熵指的是体系混乱的程度,最早作为一个物理学概念被提出,之后被进一步发展到信息论等学科.在物理学中,熵作为沟通热力学宏观状态与微观状态间的桥梁,建立起了热力学宏观物理量和微观物理量之间的定量关系.在信息论中,熵作为现代信息论的基础,建立起了信息和知识的某种度量.考虑到自然界生物群体行为中的速度−精度权衡问题是群体智能行为的一个重要体现,其本质对应熵增−熵减的动态过程,Wei 等[111]从信息传递、系统结构、行为机制的角度出发,将熵理论引入群体系统智能行为的量化分析中,运用信息论的方法,提出了群体熵的概念与初步的群体熵模型.群体熵的组成结构具体如图10 所示.

图10 群体熵的组成结构Fig.10 Composition structure of swarm entropy

在该结构中,群体熵具体由环境熵、结构熵、行为熵和传递熵组成,各局部熵之间相互影响,但群体熵并不是各个局部熵的简单叠加,而是依赖于群体系统特征的各个局部熵的合成.以结构熵为例,该研究以群体系统中个体间信息的发送和反馈的时效性为基础,量化了系统组织结构优劣,具体如式(6)所示.其中,N表示群体规模,Pij表示系统中任意两个个体间的信息传递时效概率.

在实例分析部分,该研究以鸽群飞行实验数据为例,采用其所提出的群体熵模型对鸽群飞行行为进行了仿真分析.群体熵的概念和模型的提出为度量群体智能行为提供了一种新的工具.由于这种方法主要面向的是社会性生物集群系统,因此也主要适用于基于自组织的集群机器人系统.后现代的西方社会学家将熵的概念移植到社会学中,从宏观上表示世界和社会在进化过程中的混乱程度[112].相关研究成果显示:人类社会作为一个生物群落,也呈现出了高度的群体智能行为(技术进步),而社会熵恰好可以认为是对人类群体智能大小的度量.

在萨里迪斯的递阶智能控制理论中,智能控制系统的各级均采用信息熵作为测度[113].组织级涉及知识的表示与处理,具有信息论的含义,采用香农熵来衡量所需的知识;协调级采用信息熵测量协调的不确定性;执行级用博尔茨曼的熵函数表示系统的执行代价,它等价于系统所消耗的能量.把这些熵加起来成为总熵,用于表示控制作用的总代价,设计与建立智能控制系统的原则就是要使所得总熵为最小.由于这种方法本身是针对基于分层递阶结构提出的,因此也适用于基于分层递阶的集群机器人系统智能性评价.

5.2.3 机器人系统协同性评价方法

根据以感知单元、决策单元、执行单元和环境构建的多无人平台协同体系结构,海军航空工程学院的研究团队分别定义了一次协同时间模型和一次协同数据量模型,分别如式(7)和式(8)所示.

在式(7)中,T1、T3和T5分别表示感知单元从环境中感知与接收战场态势的耗时、决策单元的决策耗时和执行单元根据指控信息执行任务的耗时,T2和T4分别表示感知单元将战场态势传递给决策单元的耗时、决策单元将决策得到的指控信息传递给执行单元的耗时.在式(8)中,u1表示单架UAV感知到的战场态势信息大小,u2表示向单架UAV发送的指控信息大小,n表示参与协同的UAV 数目.在此基础上,还进一步分析与比较了基于地面站的、基于中心节点的、基于多Agent 的和基于工作流的4 种协同体系结构的一次协同时间和一次协同数据量,以及自主协同体系结构的系统协同性能.由于该方法是在基于通用的协同体系结构上提出的,因此适用于各类集群机器人系统.

除了上述系统综合评价方法之外,实际上还有许多系统综合评价方法都可以应用于集群机器人系统期望特性的综合评价,特别是一些现代智能化综合评价理论与方法,例如灰色系统综合评价方法、Vague集综合评价法、神经网络、支持向量机、物元分析法等.常规的系统综合评价方法偏向于用经典数学方法,处理实际复杂系统评价问题将日趋困难,其不足主要体现在很难结合或利用专家、决策者系统评价时所作选择和判断过程中所蕴含的经验、知识、智慧,很难利用评价过程中的思维规律和人脑的智能特征,很难进行定性分析与定量计算的综合集成.随着计算机技术的进步,智能化方法在社会生活中的应用越来越广泛.智能化方法具有自适应和自组织的能力,具有很强的鲁棒性、隐含的并行性,对于解决定性和定量问题、确定性和非确定性问题有着很强的优势.

6 结语与展望

梳理关键的期望特性是保证集群机器人系统研发质量的重要前提,这些特性受集群机器人系统分类属性等众多因素影响.集群机器人系统特性评价主要针对其动态行为进行研究和优化,不仅是集群机器人系统评价研究的重要内容,也是集群机器人系统理论研究、设计研发以及领域应用的重要支撑.其主要研究内容包括设定评价标准、构建评价指标体系和提出评价方法等,它们分别解决的是定义评价尺度、评价什么和如何评价的问题.其中,设定评价标准是实施评价的前提,构建评价指标体系是实施评价的基础,提出评价方法是对实施评价的支撑.尽管目前国内外在集群机器人系统特性评价研究方面已取得了一些研究成果,但相关工作仍有待于进一步扩展与持续深化,目前主要存在以下不足需要改善.1)相对通用的集群机器人系统特性评价规范尚未建立.由于研究领域和关注点的不同,有必要定义评价相关术语、目标、准则以及标准等,以促进集群机器人系统特性需求与实现表征相一致.2)部分集群机器人系统特性评价指标体系尚缺乏理论模型支撑,多以定性度量为主,缺乏大样本数据支持,评价过程很大程度依赖于专家的主观判断,需通过新型信息化手段提升评价的客观性,并进一步关注评价方法的可信度、难易度与区分度.3)现有集群机器人系统特性评价数据主要来源于系统仿真,需强化实际应用场景下的集群机器人系统验证,并构建真实测试场景与数据采集系统以支持集群机器人系统特性量化评价.

伴随着集群机器人系统应用研究的不断发展,集群机器人系统特性评价问题将变得日趋复杂,本文认为可从以下三方面持续深化研究.1)设计应用场景驱动的集群机器人系统特性评价方案.集群机器人系统特性通常与其应用场景相关,不同的应用场景对集群机器人系统特性的具体要求不同.如何准确定义场景和分析场景对评价结果的影响都需要进一步研究.2)构建合理且细化的评价指标体系.除了遵循评价指标构建的一般原则外,能够基于成熟的理论模型构建集群机器人系统特性的评价指标体系.对于多级指标间复杂关联,网状化的评价指标体系也值得探讨.3)应用智能化综合评价理论与方法.常规的系统评价方法偏向于经典数学方法,处理集群机器人系统特性评价问题将日趋困难,智能化综合评价方法应该逐渐成为解决此类问题的重要途径.