基于flocking的多智能体群集与避障算法研究与仿真*

2019-09-04 05:57朱永川何健辉

通信技术 2019年7期

刘婵，朱永川，白园，何健辉

（中国电子科技集团公司第三十研究所，四川成都 610041）

0 引言

随着人工智能和智能体技术的发展和社会需求的进一步提高，多智能体技术研究成为热点问题。多智能体系统不是单个智能体的简单堆砌，而是多个智能体的协同组合，不仅有效地避免了单个智能体的不足，同时充分发挥了智能体群体的优势。与单智能体相比，多智能体系统具有适合完成复杂任务、功能分布化、体系生存率、高效费比等优势。多智能体系统可以应用于星球探索、海洋勘探、无人机群、无人艇群、无人坦克群等领域，且能产生巨大的效益[1-2]。

多智能体运动规划问题逐渐成为智能体中研究的热点问题。多智能体运动规划主要包括路径规划、编队控制和避障避碰三种控制行为。1986年，Reynolds最早提出了模仿动物聚集行为的计算机模型，由三条基本规则构成，即聚集（Flock Centering）、结对（Velocity Matching）、避撞（Collision Avoidance）[2]。2006年 R. Olfati-Saber提出基于flocking的多智能体动态系统理论及算法，并提出了三种群集算法：（1）不存在目标时的群集算法；（2）存在追踪目标时的群集算法；（3）多障碍情况下的群集算法[3]。在此之后，许多学者对flocking算法进行了研究，包括该算法碰撞避免算法、离散时间算法、参数设置与优化等[4-7]。

本文主要介绍了基于分布式flocking的群集控制模式，根据Reynolds提出的三条规则，以及人工势场群集算法，实现了多智能体系统的集结与共识，使多智能体在运动过程中保持一致性，并为系统提供冗余性和结构的灵活性；同时对多智能体的避障控制和目标点控制开展了进一步的研究，解决群集避障问题，使得群体能够平滑地绕过静动态障碍物，在复杂环境下成功抵达任务目标区域；最后仿真结果显示多智能体能集结，并达成共识，最终越过障碍物抵达目标节点，验证了该算法的合理性和有效性。

1 多智能体群集与避障算法研究

采用分散控制的策略，将多智能体群体运动的总控制律分成三个子控制律，即编队控制、避障控制、目标控制，分别研究了多智能体运动中智能体之间位置和速度的协调、躲避障碍物和向目标点移动的控制，如图1所示。

图1 智能体集群运动模型

1.1 多智能体群集运动基本模型

根据图1所示的多智能体运动模型，假设第i个α-智能体的控制律为μi，则

式中，μiα为编队控制律，μiβ为避障控制律，μiγ为目标点移动控制律，第i个α-智能体的控制示意图如图2所示。其中三角形区域为α-智能体的目标区域，rβ为α-智能体的感知距离，dβ为β-智能体的影响距离，rα为α-智能体的通信距离，dα为α-智能体的安全距离，α-智能体的属性为[pi,vi]，β- 智能体的属性为 [p^i,k,v^i,k]，μi1α和μi2α为第i个α-智能体的编队控制律，μiβ为第i个α-智能体的避障控制律，μiγ为第i个α-智能体的目标点控制律。