李晓光张 弼张道辉赵新刚韩建达
(1.中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁沈阳 110016;2.中国科学院机器人与智能制造创新研究院,辽宁沈阳 110016;3.中国科学院大学,北京 100049;4.湖州师范学院求真学院,浙江湖州 313000;5.南开大学人工智能学院,天津 300350)
形状记忆合金(shape memory alloy,SMA)是智能材料中的一种,具有功率/重量比大,驱动电路简单,驱动电压低,集驱动-传动于一身等优点,已经广泛应用在汽车、医疗、仿生、航空、机器人等领域[1-2].SMA的主要特性是形状记忆特性.所谓形状记忆特性是指SMA高温加热到某一阈值后能够恢复初始形状和尺寸.SMA由两种不同的固体相组成,即低温状态的马氏体相和高温状态的奥氏体相.SMA的形状记忆正是由于马氏体和奥氏体之间的相互转变实现的.然而,两种固态晶体之间的相互转换导致了SMA的非线性、迟滞特性.同时,影响SMA动态特性的因素较多,温度、马氏体体积含量难以测量,使得精确建模无法实现,从而为精确控制带来极大的挑战.
目前,关于SMA的控制主要集中在位置控制.许多学者采用基于SMA驱动器系统迟滞逆模型的前馈-反馈混合控制方法:迟滞逆模型置于前向通道,补偿迟滞对系统的影响;反馈控制消除模型误差,提高系统的跟踪精度[3-4].与建立迟滞逆模型不同,许多学者将SMA的迟滞作为系统未建模动态,采用鲁棒控制方法进行处理,例如滑动模型控制[5]、智能控制[6]、反步自适应控制[7]、反馈线性化控制[8]等.
SMA驱动装置与外界交过程中输出力控制起到决定性作用.然而,目前关于SMA输出力控制的文献相对较少.Grant等[9]针对拮抗机构的SMA驱动器,忽略了迟滞的影响,认为系统输出力与激励电流是线性关系,采用二级继电器控制方法实现了SMA驱动器的力控制.但是,在信号跟踪中有极限环的存在.Teh Y H和Featherstone R[10]针对单根SMA,利用小信号频响函数构造了SMA驱动器系统的二阶传递函数,利用该传递函数确定了PID控制算法的增益参数,避免了极限环的存在,实现了跟踪信号的快速收敛,保证了跟踪精度.但是Teh Y H和Featherstone R对SMA组件进行了约束,限制了关节的转动.Tai N T等[11]在SMA弹簧驱动的机构上采用模型预测控制实现了输出力控制.虽然转轴可以实现自由转动,但是模型预测控制器设计复杂,系统的实时性难以保证.Oliveira S D等[12]在同样的机构上,依靠模糊控制算法实现了位置、力的控制.但是在力控制中仍然存在抖动,跟踪精度较差.Pai A等[13]采用切换控制策略实现夹钳输出力控制.夹钳首先在位置控制模式下工作,位置控制器由逆模型控制器和NPID控制器两部分组成.当力误差或者温度误差小于设定阈值时,切换为力控制模式.采用滑模变结构控制方法实现夹钳力控制.Mirzakhani F等[14]对二自由度拟人手指指尖输出力设计了逆模型与比例-积分-微分(proportion integral differential,PID)相结合的控制器,实验结果表明相对跟踪误差为11%,最大超调量为35%.
工程实际应用的控制器应该设计简单、调参方便.然而,目前并没有一种可靠的手段既能确保算法简单、方便又能够保证力控制的精度.导致上述问题出现的主要原因是没有一种行之有效的手段能够准确、实时地获取系统的未建模动态特性.或者即便获取了系统的未建模动态特性,但并没有对其进行有效补偿.如果能够掌握SMA模型误差对系统输出响应的影响信息,那么就可以解决上述问题.自抗扰控制技术是一种针对不确定系统的自适应控制方法,首先由韩京清教授[15]提出,美国克里夫兰大学高志强教授[16]进行了改进.其中心思想是主动消除系统的不确定性,使系统转变为积分器串联标准形式.该控制方法无需精确建模,只需要知道系统相对阶次和控制量增益,算法简单.
为了解决手指与外部交互中的力控制问题,实现SMA驱动器输出力的精确控制.本文搭建了SMA驱动的手指实验装置,手指关节可以自由灵活转动.根据SMA的相变机理,建立了一阶非线性模型.考虑到SMA的相变迟滞特性难以精确建模,借鉴线性自抗扰控制技术思想,将未建模动态、外部扰动等信息集总为系统总扰动.采用状态观测器实时估计系统总扰动,提出了基于扰动补偿策略的输出力自适应控制算法.为了验证状态观测器的性能以及本文所提方法的有效性,对阶跃信号和正弦信号进行了跟踪实验.同时为验证系统的扰动抑制能力,开展了负载扰动实验.实验结果表明本文所提算法跟踪精度较高,能够适应系统动态特性的变化,抑制负载的扰动,鲁棒稳定性强.
本文的主要创新点总结如下:
1) 对SMA相变机理过程分析,建立了一阶SMA力模型,降低了系统模型的复杂度,避免了过多参数的辨识;
2) 提出了基于扰动补偿策略的SMA输出力自适应控制算法,提高了系统的鲁棒性;
3) 不需要考虑SMA的多映射迟滞特性,采用前馈-反馈混合控制方法,能够适应与外界交互中负载波动对SMA动态特性的影响,提高了系统的跟踪性能.
本文余下内容安排如下:第2节介绍了手指实验装置,建立了一阶SMA输出力模型;第3节进行了控制器设计及稳定性分析;第4节在手指实验平台上验证了本文所提方法的有效性;第5节进行全文总结.
如图1所示为SMA驱动的手指实验装置.手指关节采用绳驱动方式,其运动和动力由SMA提供.在结构上,SMA一端与拉力传感器相连,另一端通过绝缘线与手指相连.为了防止SMA松弛,实验中对SMA施加了预紧力.SMA采用电阻加热方式,当SMA产生的驱动力大于手指关节处弹簧的弹性力时,手指弯曲;合金丝自然冷却并由弹簧带动手指复位.本文的合金丝是Dynalloy,Inc公司生产的Flexinol wires actuator,其奥氏体截止温度为90◦C.实验中的SMA直径为0.1 mm,长度为340 mm.选用倍福端子模块对输入、输出信号进行处理,并与倍福工控机进行通信.为了防止SMA过热,整个实验中最大输入电压值为10 V,采样频率设定为200 Hz.
图1 SMA驱动的手指实验装置Fig.1 The finger experiment setup actuated by SMA
SMA的机理模型主要由3部分组成,即本构关系模型、相变模型和热力学模型.
2.2.1 本构关系模型
本构关系模型描述了SMA的应力σ、应变ε、温度TSMA和马氏体体积分数ξ之间的关系[17],四者的关系如下:
式中:Θ为热弹性模量;TSMA为SMA温度;Ω为相变张量;E为SMA的杨氏模量.
2.2.2 相变模型
相变模型描述了SMA马氏体体积分数ξ与温度TSMA之间的关系[18].ξ=1 表明SMA完全处于低温马氏体相状态,ξ=0表明SMA完全处于高温奥氏体相状态,ξ ∈(0,1)表明SMA处于马氏体相和奥氏体混合状态.SMA的迟滞特性主要体现在相变过程中马氏体相和奥氏体相的相互转换.马氏体向奥氏体转变的相变模型为
2.2.3 热力学模型
2.2.4 输出力模型
从上式可以看出,驱动器系统输出力模型是由一阶惯性环节a0FN1+b0u、难以测量的非线性迟滞部分φ1及可测量的φ2这3部分综合构成的.
受到自抗扰控制思想的启发[19],将迟滞、建模误差、外界扰动集总为系统总扰动,提出基于主动扰动补偿策略的SMA输出力自适应控制方法.
线性自抗扰控制的核心是线性扩张状态观测器,其设计不依赖于系统精确的模型信息.设计思想是将系统未建模动态作为内部扰动,与外部扰动总和为总扰动,并增广为系统新的状态.利用状态观测器对系统状态进行观测的同时实时估计系统的总扰动.
根据式(14),系统输出力模型可以采用如下状态空间表达式描述:
式中:x1为系统输出力;fL(·)为表征系统总扰动的迟滞非线性函数,包含系统的内扰(a0FN1+φ1+φ2)和外部扰动ω(t);y为系统输出;x1(0)为系统初始状态.
值得指出的是式(15)相对于式(14)增加了外部扰动信息ω(t).在系统与外界交互中会与不同负载交互,或受到外部载荷冲击,因此增加外扰更合理.与文献[9-14]相比,考虑更周全,所得的模型更符合实际.
本文所提的自适应控制器的设计思想是实时估计输出力模型中的fL(·),从而将fL(·)信息实时补偿,设计的控制律为u=的 估计.如果,那么非线性迟滞系统转变为积分器串联形式,进而可以采用线性控制策略设计u0,实现精确控制.
注1SMA输出力模型包含不确定项,且不确定项的微分有界.滑动模型控制算法是典型处理非线性不确定系统的控制方法,但该方法为保证系统的鲁棒性,通常会取较大的不确定项上界,系统存在抖振.而本文所提方法是实时估计系统不确定项,并进行补偿,更贴近实际.
假 设1系统的总扰动fL(·)可微=h(t),且有界|h(t)|≤M1.
令x2=fL(·)为系统的扩张状态,则系统状态空间表达式转变为
为了估计x,SMA驱动系统的扩张状态观测器[20]设计如下:
注2理论上,只要ω0>0,观测器的特征根在左半平面,系统稳定.而实际中观测器带宽根据系统总扰动带宽来确定.如果带宽ω0的取值过小,观测器响应滞后,不能有效观测到系统的总扰动,观测误差较大;如果带宽ω0的取值过大,观测量振荡加剧.因此在实际使用时,依据系统的总扰动选取合适的ω0数值.
设计自适应控制律为
式中:rd为期望信号;k为控制器带宽,k >0.
综上所述,SMA驱动器系统输出力的自适应控制框图如图2所示,图中虚线部分为扩张状态观测器.
图2 SMA驱动器系统控制框图Fig.2 Block diagram of the force controller
3.2.1 观测器的收敛性
3.2.2 控制器的稳定性分析
方程(22)的跟踪误差表达式与文献[21]Theorem 4具有相同形式,文献[21]Theorem 4的成立条件是系统总扰动可微,且有界.本文SMA驱动器系统是内部稳定系统,即当SMA的温度超过Af时,SMA产生最大形变量,同时输出力也相应达到最大值.因此模型(15)的总扰动满足文献[21]Theorem 4成立条件,故可以得到系统跟踪误差|e|≤ρe,ρe=
本部分主要对状态观测器的性能和自适应控制算法的有效性进行实验验证.在实验中首先进行观测器的模型输出精度验证;其次,跟踪了阶跃、正弦两种期望信号,同时为验证系统的鲁棒性,开展了抗负载扰动实验.
为了验证扩张状态观测器的有效性,在预紧力F0=0.89 N的情况下分别对系统输入频率Hz的U=1.5(1−cos(2πft))V形式的余弦激励信号,本文选取观测器带宽为ω0=5.将系统响应、名义模型输出(无扰动补偿的模型)和观测器估计结果进行了对比,如图3(a)-3(c)所示.从图3中可以看出,在不同激励频率下,观测器能够较精确地补偿系统的总扰动,提高了模型的精度.
为了定量描述状态观测器的估计精度,选取均方根误差(root mean squared error,RMSE)指标函数来定量描述模型精度,表达式如下:
式中:Ns为采样的总数据量,为力传感器检测到的第i个系统输出量,为对应的第i个模型预测值,脚标nm/em分别代表名义模型和状态观测器估计输出.
图3 U=1.5(1−cos)不同激励频率响应的模型验证Fig.3 Model verificationforU=1.5(1−cos)
对比结果如表1所示.从表中也可以看出,采用扩张状态补偿的模型精度高于名义模型的精度.
表1 模型均方根误差指标RMSETable 1 The RMSE index for model error
由于预紧力的变化、温升的快慢将导致SMA马氏体体积含量发生变化,从而改变了SMA的动态特性.在预紧力为F0=1.29 N,对系统输入频率为f=Hz形式为2.5(1−cos(2πft))V的激励信号.系统输出与名义模型预测、状态观测器估计对比结果如图4所示.从图4中可以看出即使预紧力增加、温升速度提高,但状态观测器能够补偿系统动态特性变化引起的扰动,估计的输出力仍然具有较高的模型精度,
图4 U=2.5(1−cos)输出响应的模型验证Fig.4 Model verificationfor U=2.5(1−cos)
基于以上几种情况的分析,可以得出如下结论:1)采用扩张状态观测器对系统输出的预测不需要精确建模;2)扩张状态观测器补偿的模型能够适应系统动态特性的变化,保障模型的输出精度.
注3SMA驱动手指系统响应速度取决于SMA降温速度,本文SMA致冷方式为空气自然冷却,故本文系统响应频率低.提高响应频率的方法可以采用拮抗驱动类型,或者采用风冷、水冷、油冷等方式,该部分内容不作为本文主要研究内容.
为了验证本文所提方法对扰动的有效补偿,首先进行了阶跃信号和正弦信号的跟踪实验.其次,进行了抗负载扰动实验.在所有控制实验中分别将本文所提的动态扰动补偿方法与无扰动补偿的状态反馈控制方法、逆模型PID控制方法进行对比.逆模型PID控制方法借鉴文献[14]的设计思想,实现对扰动的静态补偿.在以下对比实验中,红色实线“-”代表期望信号,蓝色点线“:”代表无补偿策略的状态反馈控制方法对应的实验曲线,紫色点划线“-·”代表逆模型PID控制方法对应的实验曲线,黑色虚线“--”代表本文所提算法对应的实验曲线.每幅图中都有(a)-(c)3张图,图(a)为3种控制方法对应的输出力跟踪对比曲线,图(b)为3种控制方法对应的力跟踪误差对比曲线,图(c)为3种控制方法的控制电压对比曲线.在对比实验中,状态反馈控制算法与本文所提算法所取增益参数相同.综合考虑动态响应特性和控制量抖振,在本文所有实验中,状态反馈算法和本文所提算法的增益参数取值为k=15,逆模型PID算法中参数的选取为kp=20,kI=0.1,kD=1.
4.2.1 阶跃信号跟踪实验
阶跃信号跟踪实验中设定值分别为1.3 N,1.6 N,2.0 N,2.6 N,1.8 N,1.2 N.为了防止SMA松弛,实验中预紧力为1.08 N,实验结果如图5(a)-5(c)所示.
图5 阶跃信号跟踪对比曲线(F0=1.08 N)Fig.5 Experimental results for tracking a step signal (F0=1.08 N)
从图5中可以看出,状态反馈控制方法由于未对系统的扰动进行补偿,模型误差较大,因此存在较大的跟踪误差.逆模型PID控制方法在设定值发生变化时,存在较大的超调.产生该现象的原因是SMA金属丝在温度变化时动态特性发生变化,静态扰动补偿方式不能较准确补偿扰动,故动态误差较大.而本文所提算法由于能够实时动态补偿扰动,适应系统动态特性变化,跟踪精度较高.
定义平均绝对误差(mean absolute error,MAE)指标函数度量跟踪误差,其表达式如下:
式中:脚标“sf/逆模型PID/ad”分别代表状态反馈控制、逆模型PID和本文所提的自适应算法;Ms为采样的总数据量;为第i个期望信号;yi为第i个传感器检测的力信号.
状态反馈控制方法的MAE值为0.27,逆模型PID控制算法的MAE值为0.02,本文所提出算法的MAE值为0.01.本文所提的方法相对于状态反馈控制方法跟踪精度提高了96.3%,相对于逆模型PID控制提高了50%.
4.2.2 正弦信号跟踪实验
SMA在不同的温升速率下动态特性完全不同,表现为多映射迟滞特性.为了验证系统的动态跟踪性能,进行了正弦信号跟踪实验.首先在预紧力F0=1.08 N的情况下,跟踪频率f分别为Hz的幅值范围为1.3 N~2.3 N的正弦信号.由于SMA的输出力小于手指关节处弹簧的弹性力,故在这组实验中手指没有产生运动.跟踪对比效果如图6-8所示.
从图6-8中可以发现,对于不同频率的正弦期望信号,本文所提方法能够动态补偿马氏体奥氏体转换过程中的未建模动态、参数摄动等扰动,因此具有较高的跟踪精度.
图6 rd=1.8−0.5cos跟踪对比曲线Fig.6 Experimental results for tracking rd=1.8−0.5cos
图7 rd=1.8−0.5cos跟踪对比曲线Fig.7 Experimental results for trackingrd=1.8−0.5cos
图8 rd=1.8−0.5cos跟踪对比曲线Fig.8 Experimental results for trackingrd=1.8−0.5cos
状态反馈控制方法由于没有扰动补偿,不管在什么频率下,跟踪效果都较本文所提算法差.而本文所提算法相对于逆模型PID控制算法跟踪精度显著提高.3种控制算法对应的MAE值如表2所示.表2表明本文所提算法的跟踪精度相对于状态反馈控制算法提高了80%以上,相对于逆模型PID控制方法提高了50%,从而再一次验证了本文所提方法的有效性.
不同的预紧力对SMA的动态特性也会产生影响.在本组实验中加大SMA的预紧力(F0=1.44 N),并增大跟踪信号的幅值(1.6 N~3.6 N).由于期望输出力大于手指关节处的弹簧的弹性力,实验中手指弯曲.实验对比结果如图9(a)-9(c)所示.从图9中可以发现状态反馈控制算法仍然存在较大跟踪误差,MAE值为0.26.本文所提算法即使在初始状态改变(预紧力增大)、幅值提高(马氏体奥氏体大范围相互转换)的情况下仍能较精确地跟踪期望信号,MAE值为0.02.逆模型PID控制算法的MAE值为0.06.实验中由于在降温过程中手指关节的快速复位,不同于图7实验,在每个周期关节角回复到零位时,在惯性力作用下会产生冲击,如9(b)中棕色框所示.本文所提方法产生0.06 N的最大误差,而逆模型PID控制算法产生了0.15 N的最大误差,超过本文所提方法的2倍多.因此可以看出本文所提算法相对于逆模型PID控制算法具有较强的稳定性和鲁棒性.
表2 平均绝对误差指标MAETable 2 The MAE index for tracking error
图9 rd=2.6−cos跟踪对比曲线Fig.9 Experimental resultsfortracking rd=2.6−cos
注4SMA驱动灵巧手的输出力控制非常重要,它的位置控制同样也具有重要的研究意义.将位置反馈作为外环,力反馈作为内环可实现灵巧手的柔顺抓取.由于篇幅有限,本文不再详述.
4.2.3 抗负载扰动实验
为了进一步验证本文所提方法的扰动抑制能力,本部分将开展两组负载扰动实验:第1组实验中,对手指关节施加瞬时负载扰动,使手指关节角回复到零位;第2组实验中,在手指末端增加/卸除定值负载,具体过程如下详述.
首先,在设定值(rd=2.0 N)跟踪实验中,实验初始时刻预紧力F0=0 N,SMA松弛.初始状态手指关节依靠外部装置弯曲45o,在输出力达到设定值后,手指关节将始终保持弯曲45o.在15 s时刻撤除外部装置,并将手指迅速恢复至零位,SMA瞬间被拉紧,并保持在零位.实验对比结果如图10所示.从图中可以看出,状态反馈控制算法虽然能够克服系统的扰动,保证系统的稳定性,但跟踪精度仍然很低.本文所提算法在经历了0.69 s调整后能快速回到了期望轨迹,扰动产生0.26 N的最大误差.逆模型PID控制算法经历了2.3 s的调整后返回期望轨迹,最大误差为0.75 N,调整时间是本文所提方法的3倍多,最大误差是本文所提方法的2倍多.因此在图9的基础上进一步证明本文所提方法具有扰动抑制能力,鲁棒性强.
其次,在设定值(rd=2.0 N)跟踪实验中,在15 s时对系统加载200 g负载;20 s时卸除200 g 负载;在25 s时刻施加300 g负载;30 s时刻卸除300 g负载.实验结果如图11(a)-11(c)所示.实验中由于200 g负载较轻,加减负载产生的扰动小于加减300 g负载产生的扰动.从图中可以看出状态反馈控制算法稳定性较好,但跟踪精度很低.本文所提方法在所有加减负载过程中都保持较高的跟踪精度及较快的回复速度.在300 g负载卸除时产生0.09 N的最大跟踪误差,经历1.08 s调整返回设定值.逆模型PID控制算法在300 g负载加载后已经无法返回到设定值,在300 g负载卸除后产生0.31 N的最大跟踪误差,经历4.9 s返回设定值.从而可以证明本文所提方法相对于逆模型PID控制算法具有更强的抵抗负载扰动能力,鲁棒稳定性强.
图10 脉冲干扰条件下设定值跟踪实验(F0=0 N)Fig.10 Experimental results for setting value tracking under pulse disturbances(F0=0 N)
本文搭建了SMA驱动的手指实验装置,手指关节可以自由灵活转动.根据SMA的相变机理,建立了一阶SMA输出力模型.将系统的迟滞、未建模动态和外部扰动集总为总扰动,提出了基于扰动补偿策略的自适应控制算法.将该算法进行了阶跃信号、正弦信号的跟踪实验,同时开展了抗负载扰动实验.实验结果表明本文提出的方法不需要系统精确建模,参数调节方便,在保证系统的稳定性和跟踪精度的同时,对扰动具有较强的鲁棒性,为接下来的手指末端接触力控制打下了良好的基础.另外本文提出的方法也可适用于其他具有非线性、迟滞特性的智能材料的跟踪控制,可移植性强.
图11 加减负载条件下设定值跟踪实验(F0=1.08 N)Fig.11 Experimental results for setting value tracking under variable loads(F0=1.08 N)