探讨多智能体技术在规划中的应用

2019-10-21 07:46黄梓轩

科学与信息化 2019年30期

关键词：规划

黄梓轩

摘要人工智能中的多智能体技术正被应用于许多领域，多智能体技术与经典规划方法集成所产生的多智能体规划具有巨大的潜力。本文概括性地介绍多智能体技术在规划中的一些应用进展。

关键词多智能体;规划;两段算法;非标准性适应;目标分配规划;传感器网络

引言[1-2]

多智能体系统（Multi-Agent Systems）正被应用于许多领域。具有巨大潜力的一个新研究领域是将多智能体系统与经典规划方法集成在一起，产生了多智能体规划（Multi-Agent Planning，MAP）这一子领域。

1多智能体规划的两段算法[2]

多智能体规划（MAP）研究由多个合作智能体组成的规划系统，这些系统基于长期目标进行推理，每个智能体保持其知识的私有性。近期以来，研究人员已经设计了一些新的MAP技术来提供有效的解决方案。大多数方法采用修正的规划器来扩展分布式搜索，并通过规划器进行公共信息交换。这些方法有两个缺点：它们依赖于规划器;而且需要高昂的通信成本。Daniel Borrajo和Susana Fernández提出了一种两段算法，每个智能体的搜索过程是单独规划的，不发生通信，MAP系统的任务收集不依赖于系统规划器。两段算法的第一阶段——分布式方法，首先将每个公共目标分配给每个智能体的子集，每个智能体通过接收前任智能体的规划、目标和状态来迭代地解决问题，通过复用前任智能体的规划生成新规划之后，他们与后任智能体共享新规划和一些模糊的私有信息;两段算法的第二阶段——集中式方法，每个智能体生成问题的模糊版本，以保护其信息的私有性，然后将其提交给MAP系统执行集中任务的规划器。他们所提出的方法是有效的，优于其他最先进的方法。

2多智能体规划的非标准性适应方法

在做决策的过程中，智能体希望遵从理想的行为或标准，但在现实中难以得到满足。Luca Gasparini等专家研究了如何规避该问题的多智能体设计方法，他们选择集体策略以避免智能体因违反标准而出现失败的状况。他们通过违背职责的义务和违反的严重程度对多智能体系统的规范需求进行建模，基于分散的部分可观马尔可夫决策过程（POMDPs），使用定性奖励函数来捕获遵从性的级别（n-Dec-POMDPs），提出了一种新的多智能体规划机制。通过实证分析，该新机制产生的集体策略与通过现有方法产生的策略一样好，但执行时间大大缩短。

3基于复用的规划合并多智能体规划

在多智能体规划MAP中，最大的挑战之一是如何处理每个智能体行为之间的交互问题。Nerea Luis和Susana Fernandez等专家提出了基于复用的规划合并算法（Plan Merging by Reuse，PMR），每个智能体自动调整其行为以适应交互级别。给定一个MAP规划任务，PMR将目标分配给特定的智能体，被选择的智能体解决各自的规划任务，然后将规划结果进行合并。由于合并的规划并不总是有效的，所以PMR通过复用来执行规划以生成有效的规划。Nerea Luis和Susana Fernandez等人还提出了一种随机规划复用方法（RRPT-PLAN），该方法组合了规划复用、标准搜索和抽样。他们进行了大量的实验，以分析PMR的性能与最新的多智能体规划技术的关系。

4基于预计算知识的多智能体目标分配规划

许多真实的机器人场景需要执行任务规划来决定行动方案。传统的集中式规划方法必须在搜索空间内找到一个解决方案，其中包含所有可能的机器人和目标组合，这会导致效率低下的解决方案。多智能体规划（MAP）为有效地解决这类任务提供了一种新的途径。现有的MAP方法将问题分解，以减少规划工作量，即将目标在智能体之间划分，但当智能体和目标的数量增加时，这些技术不能扩展，而且，在许多大的MAP真实场景中，目标可能不是每个智能体都能达到，所以它有一个相关的计算成本。Nerea Luis和Tiago Pereira等研究者将机器人技术和规划技术结合起来，采用“行动多智能体方法（AMs）”，以减少和促进目标分配过程的计算。AMs可以确定每个智能体的行动边界，因此可以提取特定的信息，以了解每个智能体可以实现哪些目标，以及廉价地估计使用每个智能体来实现每个目标的成本。实验表明，当AMs提取的信息被提供给多智能体规划算法时，目标分配过程要快得多，并大大加快了规划进程。实验同时也表明，AMs方法大大优于传统的集中式规划方法。

5大型传感器网络多移动智能体行程规划

传感器网络通常是网络物理系统的一部分。大型传感器网络通常涉及大数据采集和数据融合。在无线传感器网络（WSN）实现数据融合和能量平衡方面，智能体技术引起了人们的广泛关注。现有的多智能体行程算法在实践中要么耗时，要么过于复杂。Bo Liu和 Jiuxin Cao等人通过构造WSN节点生成树，为多智能体行程问题设计了一种路由行程规划方案。第一步，他们构造了一个多智能体分布式WSN模型（DWSN）和能量消耗模型;第二步，他們提出了一种新的路由行程算法DMAIP，该算法为智能体把所有传感器节点分组为多个行程路线，并将DMAIP进行了扩展，设计了DMAIP-E，避免了DMAIP中的长距离传输。评估结果表明，他们提出的路由行程规划方案在生命周期和能耗方面优于现有的WSN数据收集方案。

6结束语

人工智能、规划及相关领域的科研人员在多智能体规划的两段算法、多智能体规划的非标准性适应方法、基于复用的规划合并多智能体规划、基于预计算知识的多智能体目标分配规划以及大型传感器网络多移动智能体行程规划等方面进行了开拓性研究。

参考文献

[1] 蔡自兴，蒙祖强.人工智能基础（3版）[M].北京：高等教育出版社，2016：202.

[2] Daniel Borrajo.Susana Fernández： Effificient approaches for multi-agent planning[J]. Knowl Inf Syst，2019，（58）：425–479.