基于CPG 的六足机器人运动控制方法研究综述①

2023-09-14 03:39刘天成卢振利单长考PENMarkoCAVICMajaROUMIANAIlievaMARJANMernik
高技术通讯 2023年7期
关键词:节律步态神经元

刘天成 卢振利 陈 勇 单长考 刘 燕 赵 宇* PENČIĆ Marko CAVIC Maja ROUMIANA Ilieva* MARJAN Mernik

(*盐城工学院机械工程学院 盐城 224000)

(**常熟理工学院电气与自动化工程学院 常熟 215500)

(***常熟理工学院商学院 常熟 215500)

(****诺维萨德大学技术科学学院 诺维萨德 21000,塞尔维亚)

(*****索非亚工业大学管理学院 索非亚 1000,保加利亚)

(******马里博尔大学电气工程和计算机科学学院 马里博尔462000,斯洛文尼亚)

0 引言

在探索陆地的未知环境时,移动机器人可以代替工作人员到达难以进入的位置进行勘察,这样既保证了人员的生命安全,又完成了任务。然而传统的轮式机器人已无法适应崎岖复杂的地形,因此足式机器人的开发研究由此展开[1]。六足机器人是一种步态灵活、较为可靠的机械构造,其足部接触地面的面积要比履式小,尽管运动速度相对较慢,但换取的是更加灵活、易操控的性能,可轻松完成避障和跨越,最终完成不同类型的作业[2]。

六足机器人研究涉及到多个研究领域,它的设计灵感来源于自然界的多足昆虫,涉及的学科有仿生学、机器人学、自动控制、人工智能等等[3]。通过解决一系列的技术问题,使机器人有较好的自动控制能力。目前核心问题是如何设计一套完善高效的控制系统,提高六足机器人步态行走的稳定性。六足机器人关节多,运动耦合关系较为复杂,如何合理进行步态规划,降低在实际情况中的控制难度,成为了研究工作中的难点和重点[4]。

在诸多新兴的控制方式中,基于中枢模式发生器(central pattern generator,CPG)控制方法是解决上述问题的有益探索。

1 CPG 控制原理

节律运动是生物常见的运动模式,由中枢模式发生器控制,在没有感知系统的反馈时,模型也能发生节律运动,具有适应能力强、调整性及稳定性好的特点。

对CPG 节律运动产生的原因有2 种观点:一种是节律运动是反馈的结果,即人们现在熟知的条件反射;另一种认为节律行为不需要外部环境的刺激,是本身自发的行为[5]。1914 年,文献[5]率先设计提出半自主振荡模型,并在2 个群之间加上抑制耦合神经元和疲劳机制,产生节律性运动[6]。

图1 所示的是典型的脊椎动物的运动控制系统。CPG 有产生周期节律信号的特性,可以控制肌肉做出相应的舒张和伸缩。而CPG 信号的输出又受高层中枢即动物大脑的控制。CPG 可以通过外部条件的反馈进行调节,从而适应不同的环境[7]。

图1 节律性运动控制网络

2 基于CPG 的六足机器人运动控制研究现状

2.1 六足机器人国外研究现状

1989 年,麻省理工人工智能实验室设计研发出第一款六足机器人——Genghis[8],如图2 所示。机器人Genghis 每条腿上有2 个自由度,控制方式采用伺服电机驱动,此外加入了电流测量装置,用来测量获取关节、力矩等数据。不过Genghis 的缺点是每条腿的自由度只有2 个,且模型整体的传感器较多,行走时的速度和效率会大打折扣。麻省理工学院在此基础上,又研发了另外一款六足机器人Attila,如图3 所示。Attila 采用模块化结构设计,每个模块由传感器、驱动器和微型CPU组成。同时每条腿上有3 个自由度,这使得机器人相比前代Genghis,其整体的稳定性得到大幅提高。此外,Attila 还可通过软件补偿提高机器人的容错能力和自我修复能力。

图2 机器人Genghis

图3 机器人Attila

2003 年,文献[9]利用硬件电路模拟了CPG(如图4 所示),并将电路作为控制网络加入到自研的机器人NEXUS 中,如图5 所示。通过硬件电路搭建中枢模式发生器的优点是在理论上可根据不同的需求重组模块。但此设计响应单一,只能依靠反馈进行相位调整,对于其他任意的激励无法做出响应,所以它的灵活性比较差,无法在复杂的地形环境中工作。

图4 CPG 控制网络

图5 机器人NEXUS

2007 年,文献[10]利用CPG 作为节律信号振荡器,设计出多功能和结构的六足机器人神经控制器。通过调整振荡器的连接权重可提高六足机器人的灵活性和自适应性。同时,机器人的每条腿部安装了多个传感器,接受信号进行简单的处理,产生对应的节律信号。此后人们又研发了一套可移植的自适应性神经系统,如图6 所示。信号发生器、神经单元、递归神经网络和腿部传感反馈组成该系统[10]。这套控制系统的响应速度非常快,使六足机器人能在各种复杂的地形快速准确切换步态。

图6 自适应神经元控制系统

2021 年,文献[11]基于Hopf 振荡器设计了一款六足机器人,如图7 所示。该机器人主要由CPG控制器、腿部轨迹发生器、逆运动学计算模块和蓝牙传输模块组成。其采用相位滞后的控制策略,机器人在步态转换时有平滑的过渡。实验验证了机器人在三足、四足和波浪步态下能够稳定行走。此机器人的控制参数相比于Matsuoka 模型要少,因此控制起来也相对容易。

图7 Hopf 振荡器六足机器人

2.2 六足机器人国内研究现状

2003 年,文献[12]对机器人运动控制进行建模、切换步态、归纳分析其使用情景。2004 年,文献[13]将Matsuoka 振荡器模型进行调整优化,设计出符合机器人运动的CPG 模型,建立了四足机器人控制系统;其分层结构和CPG 同比例积分相结合,通过仿真实验证明利用生物CPG 控制机器人运动是可行的,如图8 所示。但单个CPG 控制关节的方式,灵活性较差,且设计结构复杂,响应较慢。

图8 四足机器人Biosbot

2018 年,文献[14]在CPG 模型中添加了力反馈的闭环系统,创新设计出了三神经元CPG 模型。数据采集模块获取六足机器人足部数据,通过肌神经元实时反馈足部的压力信息,CPG 生成符合当前行进的振荡波形,提高了六足机器人在复杂地形行走的稳定性和避障能力,如图9 所示。

图9 三神经元振荡器模型

2019 年,文献[15]基于Rulkov 神经元搭建CPG 模型,在不同的屈肌和肌间加入突触来耦合各个关节,优化遗传算法的耦合矩阵,设计出GhostDog四足机器人,实验证明机器人在-1~1 cm 的扰动下依旧可以保持稳定的运行,如图10 所示。

图10 GhostDog 机器人

关于机器学习在六足机器人上的应用,文献[16]在线性离散化的步态研究中取得了优秀的成果,并将CPG 模型与反馈模型相结合,搭建了离散化步态模型,设计出符合六足机器人运动的自由步态规划算法。通过模仿生物的行走行为和搭建样机验证了此套规划算法的可行性,如图11 所示。

图11 六足机器人样机和步态规划算法

3 基于CPG 的控制系统设计与搭建

对于六足机器人的控制方式,通过上述国内外现状研究发现,现在其主要的设计方法为神经元振荡器。接下来将对此控制方法分类阐述。

中枢模式发生器(CPG)是一种神经系统电路,它能够在没有反馈或外部输入的情况下控制或协调运动。作为主流机器人的控制方法,CPG 模型目前可分为2 种:第1 种为基于神经元的模型,这种比较符合生物真实的控制方式,但模型复杂,如Kimura;第2 种是基于非线性振荡器的模型,即不同的数学模型。振荡器的研究相对成熟完善,是CPG 建模的主要方式。

建立控制系统,需要选择合适的数学模型。神经元模型的重点在于如何产生节律性活动,以及不同的振荡神经通过何种连接模式实现同步。两个神经元的连接有一个权重数,正数代表刺激性连接,负数代表抑制性连接[17],如图12 所示。

图12 神经元连接结构图

3.1 模型构建

建立模型的时候,需要定义以下标准。

(1)CPG 的体系结构,包括使用何种振荡器模型、神经元的数目和类型。

(2)联轴器的类型和拓扑结构,决定了振荡器的稳定相位关系。

(3)波形,将确定在一个循环周期内关节角度的执行轨迹。

(4)输入信号,包括频率、幅度、相位滞后等。

(5)反馈信号,根据环境条件如何反馈调节CPG 的活动。

CPG 数学模型目前可分为基于神经元的模型和基于非线性振荡器的模型两大类。神经元振荡器有Matsuoka 神经元模型、Kimura 模型等,此类模型更贴近于真实生物的运动机理,但参数较多,因此分析起来较为复杂。非线性振荡器有Hopf 振荡器、Kuramoto 振荡器等,此类模型的参数较少,分析较为容易,且目前研究也较为成熟。接下来将以Hopf 振荡器为例搭建CPG 模型。

Hopf 振荡器的数学模型如下:

它的输出结果是一个收敛的极限环,其中,x、y为振荡器的状态输出量;α是收敛速度系数,为正数值,α越大振荡器收敛到极限环的速度就越快;μ是极限环的半径,同时也是振荡器输出信号的幅值;ω是振荡器的频率。根据数学表达式,在Matlab 中利用Ode45 求解该微分方程,设置参数α=100,ω=2π,μ=1,同时给x与y设定一个初值,仿真结果如图13 所示。

图13 Hopf 振荡器极限环

由上图可知,当给x与y设置任意一个初值时,最终都会收敛于一个半径为的极限环上,由此可得出Hopf 振荡器最终会达到一个稳定状态。

给定同样的初值x=1,y=0.5,振荡器的输出信号如图14 所示。由图可知,Hopf 振荡器可以输出一个稳定的周期振荡信号。并且初值取任何值,最终都会达到稳定的振荡状态。

图14 Hopf 振荡器输出信号

单一的Hopf 振荡器只能产生上升沿和下降沿一样的信号,考虑到六足机器人摆动相和支撑相的时间比例会不一样,即不同的步态,在原有基础上进行改进,添加以下关系式:

式中,ωst和ωsw分别表示支撑相和摆动相的频率;β为占空比,范围在0~1 之间;参数α表达的意义为ω在ωsw和wst间的变化速度。结合式(1),通过调节β可控制摆动相和支撑相的时间,图15 和图16分别表示β=1/3 和β=2/3 时的振荡信号。由图可知,摆动相和支撑相的时间比发生了相应变化,达到了改进的目的。

图15 β=1/3 时x 的输出曲线

图16 β=2/3 时x 的输出曲线

3.2 网络拓扑结构

CPG 的基本单元,即神经振荡器以某一种连接方式形成具备输出特性的系统。目前,用于六足机器人控制的CPG 网络有环状和链状2 种。

环状网络连接是神经振荡器依次连接形成封闭的环状,任何2 个振荡器在环状中互相影响,改变之间的耦合关系,就能协调六足机器人各个腿的运动特性,使CPG 控制六足机器人执行不同的步态。六足环状的网络拓扑结构如图17 所示。

图17 CPG 环状拓扑结构

链状网络是神经振荡器以一排直线排列,振荡信号从第一个依次传递到最后一个,这种传递方式会让信号产生一定的滞后。链状网络连接一般应用在鱼类仿生机器人中。而六足机器人这种多足结构较适合环状连接方式。

3.3 Hopf 振荡器网络耦合

因为需要协调六足机器人各个腿的运动特性,通过上面的Hopf 振荡器来进行输出信号的相位耦合,其关系式为

由上式可知,在原有Hopf 振荡器的基础上加上了耦合项,其中∈是2 个振荡器间的耦合系数,为了使输出曲线较为平滑,经过测试发现∈=0.6 较为合适;θji表示i振荡器和j振荡器的相位差,即θi-θj,不同的步态相位差也不同,所对应的耦合项也需要调整,下文将依据三足步态做出仿真分析。

4 调节基于CPG 的六足机器人运动步态

步态规划对于仿生机器人的行走是非常重要的。不严谨的步态规划,会导致各个脚出现随意摆动而难以前进和保持平衡。六足机器人和四足相比没有太过丰富的步态,Porta 和Celaya[20]在研究六足时总结出一条重要法则,即如果要保持稳定地步态行走,两条相邻的腿就不能同时抬起,否则会出现倾角过大甚至失衡的现象。目前多足机器人比较主流的步态有三足步态、四足步态及五足步态。以下选择三足步态进行论述。

4.1 三足步态规划

三足步态是六足机器人在行走时3 条腿支撑在地,另外3 条腿抬起行走,此时机器人的占空比大于0.5,行走时较为稳定。将6 条腿分为2 组,实现和人类左右腿一样的行走效果。将6 条腿按顺时针进行编号,两两间隔分组,1、3、5 为第1 组,2、4、6 为第2 组,如图18 所示。

研究发现,三足步态适用于多种运动速度间自由切换,可以克服目前多数四足机器人在速度变换时需要切换步态的问题,这给控制提供了便利。

4.2 三足步态实验仿真

4.2.1 单腿关节映射函数

三足步态的特性为:相同组的腿相位差为0,不同组的腿相位差为π,即半个周期,占空比β=0.5。因为一条腿具有髋、膝、踝3 个关节,同时控制18 个关节会让仿真分析变得困难复杂,因此通过输出信号的映射实现关节控制。具体是x输出通过映射作为髋关节的转动角度,y输出通过映射作为膝关节和踝关节的转动角度,映射函数如式(4)所示[18]。

式(4)中,z1、z2、z3分别代表髋、膝、踝3 个关节的转动角度,单位为弧度(rad)。

根据式(3)和(4)在Matlab 中建立微分方程,设定参数α=100,β=0.5,ωsw=2π,μ=1,b=100,其仿真结果如图19 所示。

图19 三足步态输出信号

图19 中,从上到下6 张表分别表示1~6 号腿的关节控制信号,红色代表髋关节,绿色代表膝关节,蓝色代表踝关节,得到的这组数据可以作为控制六足机器人进行三足步态的数据。

4.2.2 六足机器人模型验证

本文采用Coppeliasim 软件作为机器人实验仿真平台,在Coppeliasim 搭建六足机器人模型,机器人的主板设计尺寸为长0.24 m、宽0.08 m、厚0.005 m,质量为0.5 kg;机器人腿部的3 段长度分别为0.02 m、0.04 m、0.08 m,质量分别为0.05 kg、0.1 kg、0.2 kg,结构模型如图20 所示。

图20 六足机器人模型

将之前Matlab 仿真得到的三足步态数据导出,在Coppeliasim 编程读取导出的数据,一组关节数据有18 个,按照腿部序号依次赋值给髋关节、膝关节和踝关节,同时调整关节的旋转方向,避免出现实际旋转方向和理论方向相反的情况。

点击运行仿真,观察六足模型运动时的步态动画,图21 是模型在一个周期内三足步态的仿真动画,其3 张截图分别对应t=0 s、t=0.5 s、t=1 s 时的运动情况。

图21 三足步态仿真图

从图21 可以看出,t=0 s 时六足机器人处于静止状态;t=0.5 s 时六足机器人的1、3、5 号腿作为摆动相向前爬行,2、4、6 号腿作为支撑相向后移动支撑;t=1 s 时第1 组腿反过来作为支撑相,第2 组腿作为摆动相,实验可满足六足机器人三足步态的要求。

4.3 基于CPG 原理的步态规划

从模仿生物节律运动的控制角度出发,通过周期性的振荡信号控制机器人的关节角度,实现机器人的前行,如图22 所示。用CPG 进行步态规划时,可以不需要传感器的反馈,通过简化结构,实现快速响应,但这会使机器人对环境的调整能力变差。在后面的研究中,文献[19,20]将反射模型加入,修正CPG 模型参数,实现了平稳运动。文献[21]提出了自由步态生成算法,这可以让机器人在持续运动的情况下提高稳定性。虽然诸多的模型进行了优化和融合,但对地形的适应能力仍然缺乏有效的步态调节策略,这也是研究的一大热点。

图22 CPG 控制步态模型

4.4 多足协调控制方法

六足机器人的每条腿都由CPG 单独控制,互不干扰,这就保证了每条腿的运动都不依赖其他腿的运动。通过CPG 的耦合性控制关节耦合运动,避免了用运动学进行复杂的解耦运算。但腿与腿之间的运动协调是不可少的,满足上述三足步态的2 组腿的协调。

动物行进时受到大脑皮层的运动区和小脑的控制协调。借鉴此结构,可以在CPG 的上层设计2 个相互抑制的神经元,每个神经元控制3 个CPG,建立起网络关系,这样动物的节律运动控制结构和六足机器人的控制结构形成映射关系,如图23 所示。

图23 六足机器人和动物控制结构映射

4.5 完善步态的选择

CPG 振荡器是非线性系统,输入参数与周期、相位、频率这些输出参数的关系难以确定。文献[22]在双足机器人的研究中利用综合轨迹规划和CPG控制相结合的方法,建立运动学模型求解关节角,生成步态,如图24 所示。这进一步验证了用单一CPG生成步态并不是唯一的选择,也对六足机器人的步态生成有很大启发。

图24 七杆双足机器人示意图

5 基于CPG 六足机器人控制是研究热点

针对基于CPG 的六足机器人运动控制可以在各种复杂的地形上规划出所需的步态,但过于机械行走不能灵活完成仿生运动以及对环境的适应力较差等问题依旧存在。为充分挖掘六足机器人未来的发展潜力,仍需要展开大量的研究。

5.1 考虑身体姿态的机身结构优化

目前,六足机器人的仿生结构重点仍局限于蚂蚁、蟑螂、蜘蛛的腿部结构仿生,而忽略了足部和机体的整体协调能力。未来的研究可以结合仿生学、机构学等,分析不同多足生物腿部结构的共同特性,构建可变形的关节结构,并优化多足的协调性能,设计出有多种运动模式的六足机器人,提高对地形的适应能力。

5.2 固定结构下的更有效的机器学习策略

CPG 模型在建立好后,需要获取参数进行训练学习,目前的机器学习方式有监督学习和非监督学习两种。

学习方式可根据有训练样本的时候用监督学习,没有样本的时候,进行人工区分改善条件使用监督学习。倘若不同的环境相同的样本存在大的偏移,则可使用非监督学习。

通过机器学习各种生物的步态,是基于CPG 的六足机器人具备生物一样的运动性能的未来发展趋势。

5.3 深度强化学习和变结构自适应

在非线性动态环境,如地震环境下,传统的算法无法做到很高的精度进行避障。近年来,深度学习由于其学习能力好、适应性强、可移植性好等优点得到了众多研究学者的关注。但传统的深度学习算法收敛性差,存在较大的偏差,这也会降低机器人的避障能力[23]。因此开发基于六足机器人的避障算法并应用于实际需要进一步的研究。

在通过增强学习实现各种步态行走方面目前未见合适的数学模型,难以让机器人自主进行学习。此外,当六足机器人发生故障时,内部的网络拓扑结构被破坏,原有的步态算法不再适用,最终无法保持稳定。因此,通过机器学习自适应结构变化,也是研究的一大热点。

6 结论

本文阐述了六足机器人及相关CPG 控制方法的发展现状,指出CPG 模型结构简单、稳定性好,可有效控制六足机器人的步态。以Hopf 振荡器为例,搭建了CPG 模型,研究发现其输出具有稳定特性;通过将其进行改进,添加支撑、摆动频率和耦合项,将仿真的数据放入六足机器人实验平台,以三足步态为例验证了此方法的可行性。此外,研究发现,不需要同时控制六足的18 个关节,振荡器模型输出的信号经过映射关系即可得到关节转动的角度。今后的研究则需要验证其他步态的可行性,提高六足运动的稳定性,提高机器人的避障能力,使六足机器人的运动控制具有更好的适应性和实用性。

猜你喜欢
节律步态神经元
步态异常,老年人应警惕这些疾病
《从光子到神经元》书评
基于面部和步态识别的儿童走失寻回系统
基于Kinect的学步期幼儿自然步态提取
跃动的神经元——波兰Brain Embassy联合办公
蚬木扦插苗人工幼林生长节律
基于二次型单神经元PID的MPPT控制
慢性给予GHRP-6对小鼠跑轮运动日节律的影响
毫米波导引头预定回路改进单神经元控制
便宜假肢能模仿正常步态