改进的RBF神经网络在机械臂控制中的应用研究

2020-09-25 06:03刘庆云刘泽浩

机电工程技术 2020年8期

廖凯，刘庆云，刘泽浩

（1.广东省智能制造研究所，广州 510070；2.广州绿源信息科技有限公司，广州 510610）

0 引言

机械臂一般是指由各类相对滑动、铰接的组件构成的具备多个自由度，并可进行移动或抓取物体的机器[1]，是机器人的重要分支，应用于农业生产[2]，食品加工[3]，航空航天[4]等多个领域。机械臂系统是典型的多输入、多输出非线性系统，其动力学特征具有很强的耦合性和时变性，对其控制方法的研究是当今热点之一。

传统控制策略是基于模型的控制，因此，以建立被控系统精确的数学模型为前提和基础，而机械臂系统作为非线性系统，其精确数学模型难以获得。基于此，利用神经网络的逼近能力，以神经网络对被控对象模型进行智能辨识的神经网络控制成为重要发展趋势。其中，RBF神经网络以其对非线性连续函数的一致逼近性，而且学习速度快，不存在局部最小值问题，成为最常用的模型辨识神经网络[5]。张雯等[6]针对干体炉非线性、时变、纯滞后的特性，提出一种RBF神经网络控制器设计方案。时尚等[7]提出一种模糊神经网络控制策略，用于解决大口径武器液压伺服系统控制时内部参数的不确定性和时变性问题。本文将对比RBF神经网络常用的学习算法，设计改进的RAN学习算法设计RBF神经网络，并设计基于该RBF神经网络的逆控制策略，将其应用于机械臂系统的控制中。

1 常用RBF神经网络学习方法

图1所示为典型的RBF神经网络结构，由图可知，RBF神经网络为3层前馈神经网络，其模型表达式：

式中：W为权值向量，H为径向基函数向量。Gaussian函数是常用的RBF神经网络径向基函数形式，其表达式：

由以上推导可知，RBF神经网络设计要点包括确定隐含层神经元个数、数据中心、扩展常数、各神经元的权值。其中，隐含神经元个数和数据中心是其中的关键，因为只要确定这2个要素，扩展常数和权值可通过数值计算即可获得。

图1 典型RBF神经网络结构

而RBF神经网络学习算法主要解决隐含神经元个数和数据中心的确定问题，大致分为2类：（1）随机选取或从输入样本中选取，包括OLS算法、ROLS算法、ESA算法等，这些算法件容易实现，但数据中心确定后将不再改变，数据中心选取的好坏具有随机性；（2）数据中心根据输入样本动态调整，如基于动态聚类的方法，RAN（Resource-Allocating Network）方法，变结构学习方法等。对比来说，第（2）类更适用于机械臂系统控制。

2 改进RAN学习算法的RBF神经网络

RAN是著名的在线构建算法，其原理是发现神经网络学习过程中“未建模”样本，并为其分配新的隐含层神经元。其具有学习速度快、可实现在线学习，且可构建一个结构紧凑的神经网络等优点。

RAN通过以下两个准则来分配新的神经元，设输入的样本xi，其期望输入为yi，其网络输出为y(xi)，当两者满足如下两个条件时，增加新的神经元。

式中：Cnearest为与输入样本最近的数据中心。

当满足以上条件，新增加神经元的数据中心、宽度以及权值由下式决定：

当检查式（3）和式（4），不需要新增隐含层神经元时，RAN网络通过Widrow-Hoff学习规则训练网络，减小误差，其目标函数为：

由于本次使用的RBF神经网络采用Gaussian函数作为核函数，而考虑其局部特性，即每个输入训练的样本只能影响该样本附近的隐含层神经元，因此，数据中心值按下式进行调节，以提高网络学习速度。

在RAN学习算法中，只有增加隐含层神经元操作，RBF神经网络的隐含层神经元会随着学习过程不断增加，而产生冗余，而RBF神经网络的网络规模越大，其精度虽然能满足要求，但是泛化能力却会随着变差，这给在控制系统中应用带来问题。因为一般在控制系统中的神经网络，训练数据是试验数据，不一定囊括被控对象所有的模态，因此在实际控制中，需要借助神经网络的泛化能力，对实际输入有一定的泛化能力。因此，针对这一点对RAN学习算法进行改进，即增加删除隐含层神经元操作。由式（8）、（9）和（10）可知，在RBF神经网络训练过程中，中心点会随着训练而不断调整，这时，会存在某些中心点非常接近，当2个中心点距离满足一个很小的值时，即将2个中心点对应的神经元合并为1个神经元，判断式如下：