刘善春,李 鲤(.兰州城市学院 培黎工程技术学院,兰州 730070; .兰州城市学院 培黎石油工程学院,兰州 730070)
用于冗余度机械臂避障神经网络控制器
刘善春1,李 鲤2
(1.兰州城市学院 培黎工程技术学院,兰州 730070; 2.兰州城市学院 培黎石油工程学院,兰州 730070)
目前,对机械臂避障控制器研究方法有多种,经分析现有的PD控制器追踪误差较大,效果较差.对此,提出了神经网络控制器并对其运动过程中避障追踪误差进行仿真验证.构建了机械臂转动关节避障的动力学模型,在延伸的笛卡尔空间中定义了未知函数.使用多层感知器神经网络逼近方法,分析了神经元自适应控制器系统的闭环稳定性,对系统的闭环稳定性进行了证明,得到了神经参数的自适应法则.结合具体实例,将机械臂避障神经网络控制器进行仿真,结果表明,机械臂末端执行器在移动障碍物的环境下具有优良的轨迹追踪效果.
机械臂; 神经网络; 控制器; 避障; 自适应法则;仿真
冗余度机械臂诞生于20世纪80年代末,在90年代得到了快速发展,广泛应用于医疗、航空、海洋等各种领域.在实际应用中,冗余度机械臂的主要优点在于它们具有灵巧性和避障能力.这主要由于它们的末端执行器的自由度数目超过了实现规定任务所需的自由度数.但是,冗余度带来了动力学控制器合成具有复杂性.PD控制器实现比较容易,无需系统的模型,在工业应用相对广泛,但是系统动态性相对较差.因此,高性能的机械臂控制一直是当今研究的热点.
当前,对机械臂控制器的研究方法有多种.例如:文献[1-3]主要研究了机械臂神经网络控制及应用.文献[4-6]对非完整移动机械臂考虑了一种由动力学条件耦合和输出反馈实现的自适应运动和力控制展开研究.文献[7-9]给出了在有不确定性和干扰存在条件下,对一个冗余驱动向移动机械手的鲁棒轨迹追踪问题.以往的研究都没有很好地解决冗余度机械臂避障问题.对此,本文采用了神经网络控制器对机械臂运动过程中避障进行控制.创建了冗余度机械臂避障数学模型,给出了机械臂避障的不等式.采取神经网络逼近方法,对神经网络控制器的稳定性进行了推导.采取3自由度机械臂避障控制器进行验证,同时与PD控制器进行了对比.带有神经网络控制器的机械臂在移动障碍物的环境下追踪误差较小,自适应反应时间较短,效果良好.
转动关节自由度为n的机械臂动力模型如下:
(1)
(2)
式中:J为雅可比矩阵.
如果机械臂上所有的点和一个移动障碍物间能一直保持一定间距,则机械臂在运动过程中能够避开该障碍物[10].对障碍物,更多地采用外凸的形状(球体、圆柱体等),特别是采用球体,因为容易计算球体和机械臂不同段之间的距离.
考虑k个障碍物被一个半径为rj、中心分别为笛卡尔坐标xoj=(x1oj,x2oj,x3oj),j=1,2,…,k的圆柱体包围,如图1所示.设dj为机械臂和障碍物中心j的最小距离.为了避免机械臂和障碍物相撞,沿着轨迹分布的能足够满足约束条件如下:
(3)
式中:Tj为障碍物的中心与机械臂的距离平方与障碍物半径平方之差.
图1 有障碍物的冗余机械臂Fig.1 A redundant manipulator with obstacles
图2 多层感知器神经网络Fig.2 Multilayer perceptron neural network
(4)
(5)
S形函数φ和它的导数φ′被划定了界限.有了式(5),我们便可以确定具有泰勒级数的逼近误差界限为
(6)
式中:c1,c2为误差系数.
3.1控制器分析
神经元自适应控制器的目标是让机器人末端执行器在具有移动障碍物的情况下,能够实现轨迹追踪.所需的轨迹便在操作增广空间给出的维度为n的变量:
e=Xd-X
(7)
式中:e为实际运动轨迹与理论运动轨迹误差;s和xr为机械臂误差控制函数;Λ为一个正对角矩阵.
在增广空间X内,所建立的控制法则为
(8)
K>0是一个增益矩阵.之后定义的标志ω,被用来补偿逼近误差.神经元的自适应法则由以下的等式给出:
(9)
在笛卡尔空间内的控制法则为
(10)
推导得到的最终公式为
(11)
(12)
(13)
式中:向量εφ为由于在第一阶逼近每一个泰勒级数时由逼近产生的干扰.
通过对矩阵使用弗罗宾尼斯范数,可以得到:
式中:Y{d,o}为两个有界限的标志;p{1,2}为Λ的正实数函数.
(16)
式中:a{1,2,3}为θmax,Yd,λ,φ的正实数常数函数,也具有使用过的神经网络θ{M,C,H}的逼近特性.
对由误差方程(12)定义的系统,有以下的补偿项:
(17)
有
ρω≥a3
(18)
对补偿项式(17)而言,针对‖θ‖max的评估是必须的.
3.2稳定性分析
定理1具有由式(9)给定的控制法则、神经元参数自适应法则式(10)和补偿项式(17)的在闭环系统中[11]是稳定的.
证明考虑以下候选的李雅普诺夫函数:
由式(9)、式(10)、式(13),可得到该函数对时间的导数为
(19)
因为
(20)
可以写为
(21)
(22)
由式(17)给定的ω的表达式,可得到以下的不等式:
(23)
如果
(24)
最后一个表达式等价于:
(25)
如果满足以下条件,则上式成立:
(26)
或者
(27)
用于仿真的机械臂是一个在垂直平面内进化的3自由度机械臂,如图3所示,长度为l1,l2和l3,所以n=3,m=2.所提议的控制器用于评估在XY平面内对椭圆的轮廓跟踪.机械臂的第一段被一个移动障碍物所约束,控制器必须能够避免机械臂与障碍物产生任何碰撞.
障碍物被限制在一个半径r=0.05 m、中心xo=(x1o,x2o)的圆内.在该圆内,我们可以认为有不止一个障碍物阻碍该机械臂在控制器的帮助下规避与该圆发生碰撞.障碍物的运动方程给出如下:
(28)
式中:fo=0.7 Hz.
所需的轨迹由以下的方程给出,它代表一个椭圆:
(29)
式中:fd=1 Hz.
上式给出了计算障碍物中心和机械臂第一部分l1的距离d的方法.有障碍物的机械臂在图3中表示.
图3 有1个障碍物的3自由度机械臂Fig.3 Three degrees of freedom manipulatorwith one obstacle
我们定义两个向量:v1=OA和v2=OD.障碍物的半径r由AC给出,距离d由AB给出.可以得到以下的公式:
v1·v2=v1v2cos(ψ)
(30)
从这里,可以得到:
所以可以得到:
(31)
因此,如果|x1ocos(q1)+x2osin(q1)|≤l1,约束不等式为
(32)
将在有障碍物的情况下追踪所需轨迹,同时最小化关节位移能量作为目的的要优化的判据由以下方程定义:
(33)
式中:α=0.01.
将一个隐藏层中具有5个隐藏细胞的神经网络和双曲正切函数用于激活函数.对控制法则参数的选择如下:
最后采取Matlab/Simulink对机械臂神经网络轨迹追踪误差进行仿真,并与PD追踪误差仿真结果进行了对比,仿真结果如图4所示.
图4 机械臂轨迹追踪误差Fig.4 Tracking error of mechanical arm trajectory
从仿真结果可以看出:PD追踪误差较大,最大误差达到0.11 mm,追踪误差自适应时间较长,大约1.2 s;神经网络追踪误差较小,最大误差达到0.09 mm,追踪误差自适应时间较短,大约1.0 s.因此,神经网络追踪效果较好.
本文介绍了机械臂的动力学,结构特点和障碍物避障,解决了神经元网络逼近.同时,对自适应控制器的设计和稳定性进行了推导和分析.最后,对神经元网络追踪控制器与PD追踪控制器所产生的误差进行了仿真和比较.神经元网络追踪控制器避开障碍物效果较好,有着重要的工业应用价值,为机械臂运动过程避开障碍物的研究提供了参考.
[1] 王良勇,柴天佑,方正.考虑驱动系统动态的机械手神经网络控制及应用[J].自动化学报,2009,35(5):622-626.
WANG L Y,CHAI T Y,FANG Z.Neural network control and application of robotic manipulators including actuator dynamics[J].Acta Automatica Sinica,2009,35(5):622- 626.
[2] WILAMOWSKI B M,COTTON N J,KAYNAK O.Computing gradient vector and Jacobian matrix in arbitrarily connected neural networks[J].IEEE Transactions on Industrial Electronics,2012,55(10):3784-3790.
[3] KUMARA N,PANWARB V,SUKAVANAMC N,et al.Neural network-based nonlinear tracking control of kinematically redundant robot manipulators[J].Mathematical and Computer Modelling,2011,53:1889-1901.
[4] LI Z,YANG Y,LI J.Adaptive motion force control of mobile under-actuated manipulators with dynamics uncertainties by dynamic coupling and output feedback[J].IEEE Transactions on Control Systems Technology,2010,18(5):1068-1079.
[5] BOUKATTAYA M,DAMAKT,JALLOULI M.Robust adaptive control for mobile manipulators[J].International Journal of Automation and Computing,2011,8(1):8-13.
[6] 王红旗,王庆林.移动机械手运动/力鲁棒自适应轨迹跟踪[J].控制与决策,2010,25(1):105-109.
WANG H Q,WANG Q L.Motion/force robust and adaptive trajectory tracking of mobile manipulator[J].Control and Decision,2010,25(1):105-109.
[7] XU D,ZHAO D,YI J,et al.Trajectory tracking control of omnidirectional wheeled mobile manipulators:robust neural network-based sliding mode approach[J].IEEE Transactions on Systems,Man,and Cybernetics,2012,39(3):788-799.
[8] 董立红.基于模糊补偿的机械手鲁棒自适应模糊控制研究[J].计算机工程与科学,2012,34(1):169-172.
DONG L H.Research on the robust adaptive fuzzy control of manipulators based on fuzzy compensation[J].Computer Engineering Science,2012,34(1):169-172.
[9] ZHANG L J,LIU J K.Adaptive boundary control for flexible two-link manipulator based on partial differential equation dynamic model[J].IET Control Theory and Applications,2013,7(1):43-51.
[10] 姬伟,程风仪,赵德安.基于改进人工势场的苹果采摘机器人机械手避障方法[J].农业机械学报,2013,44(11):253-258.
JI W,CHENG F Y,ZHAO D A.Obstacle avoidance method of apple harvesting robot manipulator[J].Transactions of the Chinese Society of Agricultural Machinery,2013,44(11):253-258.
[11] KUMAR N,PANWAR V,SUKAVANAM N,et al.Neural network-based nonlinear tracking control of kinematically redundant robot manipulators[J].Mathematical and Computer Modelling,2011,53(3):1890-1899.
Neuralnetworkcontrollerofredundantrobotarmobstacleavoidance
LIUShanchun1,LILi2
(1.Bailie School of Engineering & Technology,Lanzhou City University,Lanzhou 730070,China; 2.Bailie School of Petroleum Engineering,Lanzhou City University,Lanzhou 730070,China)
At present,there are many ways to study robot arm obstacle avoidance controller.Through the analysis of the existing PD controller tracking error,the error is bigger and the effect is poorer.To this,neural network controller is presented,obstacle avoidance tracking error is simulated in the process of movement.To build the dynamic model of robot arm rotating joint obstacle avoidance,in cartesian space extension defines the unknown functions.Using multilayer perceptron neural network approximation method,the closed-loop stability of the neuron adaptive controller system is analyzed.At the same time,the closed-loop stability of the system was proved,nerve parameter adaptive laws is obtained.Combined with concrete example,the robot arm obstacle avoidance neural network controller is simulated.The results show that the robot arm end executor has excellent effect of trajectory tracking under the environment of mobile obstacles.
robot arm; neural network; controller; obstacle avoidance; adaptive laws; simulation
TF 24
: A
: 1672-5581(2017)03-0267-06
甘肃省教育厅基金资助项目(GS[2013]GHB0894)
刘善春(1966—),女,副教授,硕士.E-mail:yuhl201603@sina.com