高江徽 鲁力群 李辉
摘 要:在AGV(Automated Guided Vehicle)运行过程中,建立BP神经网络预测模型,对周围环境的智能移动体的运动轨迹进行综合动态预测和评估,结合纳什均衡理论建立移动机器人运动决策模型,使得AGV在运行过程中建立类人判断的能力即考虑AGV和其他移动智能体的相对位置的关系,对其他的移动智能体的预测价值可以有效的评估。文章通过构建动态博弈模型求解灰色碰撞概率,可以高效的为AGV防撞提供合理的参考。
关键词:AGV;BP神经网络;预测;灰色碰撞概率
中图分类号:U467 文献标识码:A 文章编号:1671-7988(2020)03-226-04
前言
移动机器人AGV(Automated Guided Vehicle)运动在复杂的环境下存在着诸多的问题,无法有效的判断其他移动智能体的运动意图、无法根据周围的环境进行导航方法的转变。为了解决上述问题,陈海燕[1]将进行协作的机器人个体看成具备自治能力的移动智能体,然而并没有解决机器人在运行中适应环境的问题。李洋[2]人提出将博弈论应用于多机器人目标追踪中,这种方法是基于各个智能体都建立通讯的基础上,无法应用于人与移动机器人共存的环境下。
为了解决上述问题,本文提出基于BP神经网络的AGV防撞避让评估方法。本方法利用预测价值判断避免过度主动跟踪、不需要建立通讯和计算博弈双方纳什均衡点的位置及其灰色碰撞概率,为移动机器人的决策提供参考,可以在不失去预测准确性的前提下,计算量大幅度下降。
1 防撞方法模型描述
在AGV運行过程中,由于外界环境的影响,总是需要进行一系列的决策,来保证移动机器人平稳有效的运行。AGV的一次决策过程分为两个阶段:预测分析阶段和评估阶段。在预测分析阶段,AGV通过自身携带的传感器计算自身位置和环境中其他物体位置的关系等进而分析自身与其他物体的碰撞可能性;在评估阶段,分析他们的运动轨迹作出价值评估,当价值比较低时,对移动机器人运动意图干扰较小,可不作考虑;当价值比较高时即对移动机器人运动意图干扰比较大时,作为监控预测对象,并且建立预测对象和移动机器人的博弈模型,通过基于BP神经网络构建灰色碰撞概率模型来为AGV防撞避让提供参考依据。
2 移动智能体轨迹预测及价值评估
2.1 基于BP神经网络预测模型
移动机器人AGV自身通过搭载的传感器可以对周围的智能移动体或人进行目标检测和跟踪以及运动数据读取。在完成传感器的数据获取之后,利用AGV搭载的上位工控机对获取来的数据进行融合并去除冗余数据。为了方便模型的建立与计算方便,我们把智能体归为一类,以不同的编号表示不同的移动体。选取数据集中的方向、速度、加速度、横向偏移为建模因子,对每个因子建立BP[3]神经网络来预测每个因子变化来完成轨迹预测,在实际的计算中可以简化为对坐标点位的预测。
2.2 各影响因子的BP神经网络建立
BP神经网络的结构如图1所示,其结构包含三层网络结构:输入层、隐含层和输出层[4]。BP神经网络一共分为三层,第一层为输入层,由信号源节点Xk(n=1,2,3…n)组成;第二层为隐藏层Hk(n=1,2,3…n),隐藏层中神经元的变换函数非负线性函数,该函数是局部相应函数,要设置相应的隐藏层神经元个数;第三层为输出层Yk(n=1,2,3…n),是对输入模式做出的响应,输出层是对线性权进行调整,采用的是线性优化策略,学习速度较快。
惯性评估,是处于轨迹预测之前的阶段,是在基于瞬时状态下,以一小段时间为周期,对未来位置的趋势进行的整体性评估,从宏观来衡量AGV与其他移动智能体的关系。如图4所示,A为AGV,B为其他移动智能体,A的速度为v0,B的速度为v1,则他们的相对速度为?v,且?v与相对位移方向存在夹角β。当β>0时,在宏观惯性预测下不具备碰撞的条件,然而AGV在实际中,并不是以一个运动的点存在,而是一个有相当体积的物体存在,考虑预测数值本身的细微误差,因此有必要设置一个安全圆距离。
如图5所示,给AGV设置安全圆距离r,当夹角β=θ0时,惯性运动轨迹与安全距离圆相切,令θ0为临界干扰角。当β>θ0时,宏观上不具备碰撞的条件,即预测价值较低;当β≤θ0时,宏观上具备碰撞的条件,即预测价值较高。
3 灰色碰撞概率求解
基于上文中已经对其他移动智能体进行了价值评估和预测,接下来需要对潜在的碰撞点和碰撞概率进行求解,为AGV的决策提供依据。关于博弈在对于碰撞概率和碰撞位置,是逆向求解的结果。在周期预测时间T中,对于预测价值高的移动智能体进行了BP神经网络的预测,在周期T中取n个时间节点,可以得到预测点位置Pi (i=1,2,3…n);假设一个周期总的移动位移为lzong,每个内移动的距离为li (i=1,2,3…n),有,设真实的点位置为Ci (i=1,2,3…n),作第i个时间节点真实位置与预测位置的绝对值差?li,在求解纳什平衡位置之前,需要对数据集的数据进行概率评价处理。由前文所述的部分,设为近域系数,将bi组成的数据集计为数据集H,以数据集H作为历史数据集,建立基于时间序列的BP预测模型,预测未来的近域系数。
由上述部分,可以归纳出:
式中:?li为第i个时间节点真实位置与预测位置的绝对值差,bt为t时刻的近域系数,lzong为一个周期内总的位移距离,lt,t+1为t,t+1时刻的距离差。
对于纳什平衡的计算过程,通过对移动智能体历史数据的推演得到t时刻的预测位置,根据移动智能体的近域系数进行预测,得到t时刻的bt。
当t时刻,AGV的既定规划路径和安全域产生重合时,发生博弈[6],双方存在对路径的使用的矛盾,即发生碰撞。按照各自利益最大化原则,即既定规划路径和安全区域圆的初始焦点位置是博弈双方的纳什均衡位置。
有了纳什均衡的位置,可以求解灰色碰撞概率。即在t时刻,AGV按照既定路径运行时发生碰撞的概率即灰色碰撞概率为:
(3)
式中:bt為近域系数。
在AGV的实际运行中,可以设定一个限定的概率值η,当P<η,AGV可以适当冒险,增加博弈带来的风险;反之,AGV可以通过提前加速、减速或绕行改变既定规划路线,来规避碰撞带来的损失。
4 算例验证
本次算例模拟场景选取T型路口,如图6所示,由4个移动智能体和AGV构成,使用计速器模拟数据采集,并对数据进行处理,作为数据的基础库。AGV由X前往Y,通过4个移动智能体随意走动,来进行算例验证。这里的验证设计并没有真正的AGV存在,算例验证是为了说明相对位置与时间的关系对防撞评估造成的影响。
由图6,经过惯性预测和价值评估,只有4号移动智能体的预测价值更大,本文一秒为30时刻,取42个时刻为预测时间段的历史数据集,以7个时刻为一个周期,预测AGV接下来7个时刻的横纵坐标的位置,经过BP神经网络的预测得的横纵坐标预测结果,如图7和图8所示。4号移动智能体横坐标值的维持在5.1-5.15m,纵坐标的变化区间在7.6-8.5m,预测效果较为平滑。
经过对4号移动智能体进行价值评估和轨迹点预测,接下来需要对潜在的碰撞点的碰撞概率进行求解,为AGV的避让决策提供依据。其近域系数如图9所示。以前42个时刻(6个时刻周期)为近域系数的历史数据集,得到接下来7个时刻下每一时刻对应位置的碰撞灰色碰撞概率。AGV可以利用此种方法通过加速、减速和绕行,甚至停止运行来减少碰撞的可能性。
图9 碰撞概率预测图
5 结论
(1)通过构建BP神经网络对目标移动智能体进行初步计算,有效地检验预测模型的有效性,进而获取较为理想的
近域系数。
(2)通过对目标移动智能体的惯性轨迹预测与预测价值判断,忽略预测价值较低的其他移动智能体,有效地减少了不必要的计算量,使得AGV运行更为高效。
(3)利用近域系数组成的历史数据集,构建基于BP神经网络预测模型,得到移动机器人在既定路径轨迹t时刻的灰色碰撞概率,为AGV的运动避让提供参考。
(4)不足之处在于,对于非线性位置关系的长期预测,不具有良好的鲁棒性。
参考文献
[1] 陈海燕.基于博弈论的多机器人个性化协作研究[D].中南大学, 2003.
[2] 李洋.基于合作博弈论的社会化多机器人协作方法研究[D].上海大学,2015.
[3] 吴微,陈维强,刘波.用BP神经网络预测股票市场涨跌[C]// Optimi -zation Method, Econophysics & Risk Management-proceedings of Ccast.2001.
[4] 李萍,曾令可,税安泽等.基于MATLAB的BP神经网络预测系统的设计[J].计算机应用与软件, 2008(04):155-156+190.
[5] 吴微,陈维强,刘波.用BP神经网络预测股票市场涨跌[J].大连理工大学学报,2001(01):12-18.
[6] 张菁,何友,彭应宁等.基于神经网络和人工势场的协同博弈路径规划[J].航空学报,2019(3):223-233.