杨婧,熊超,许红娟
(1.石家庄工程职业学院信息工程系,河北石家庄 050000;2.陆军工程大学火炮工程系,河北石家庄 050000;3.石家庄工程职业学院教务处,河北石家庄 050000)
当涉及到需要机器人与操作环境进行精确交互的控制任务时,例如工业部件的抛光和去毛刺,机器人直接控制是一个广泛的首选解决方案。间接控制器(例如阻抗和刚度控制器)使用末端执行器的运动信息来调节环境相互作用,而直接控制器使用力传感器来测量和调节接触力。因此,直接控制的优点是对环境不确定性的反应更快、力的相互作用更精确,从而使它非常适用于需要高带宽/频率控制的机器人模型。
然而,稳定性是机器人直接控制的主要挑战之一。其中,有些因素(比如由于连杆和关节的灵活性、传感器动力学、测量力中的延迟和噪声、离散化效应等而导致的非协同传感器)会使机器人在与操作环境接触时很容易变得不稳定。因此,许多学者提出通过无源性方法来提高系统的稳定性。无源观测器方法是从能量角度出发,充分利用系统模型中的能量交换和耗散特性进行控制器设计,具有结构简单、物理意义明确等优点,因此在机器人等系统模型中得到了大量应用。文献[7]中针对具有柔性关节的上肢康复机器人,提出了一种基于模糊推理与无源性理论的柔顺控制方法,实验结果表明:该方法具有较好的稳定性和鲁棒性。文献[8]中基于单端口网络的无源性理论,建立机器人的端口网络系统,给出触力柔顺控制所需的无源性条件,仿真和样机实验结果表明:所设计的算法可将触力控制在稳定吸附阈值和冲击阈值内,实现了足壁触力的无源柔顺。文献[9]中针对全方位移动机器人轨迹跟踪控制中存在的外界干扰和系统参数不确定性问题,提出基于无源性的自抗扰控制方法,仿真结果表明:所提出的控制方法响应速度较快、控制精度较高、对系统外扰和模型参数不确定性具有较强的鲁棒性。文献[10]中提出一种基于时域无源性控制的六足机器人双边触觉遥操作方法,仿真实验平台验证了所提出方法在松软地形条件下能够保证六足机器人遥操作系统的稳定,且兼具较好的持续跟踪能力。然而,上述方法没有从能量及其控制的角度出发对机器人系统进行仿真分析。
对此,本文作者建立机器人的系统结构模型,并对机器人施加力,作为控制器的计算信号。针对经典的无源观测器会发生能量积累的问题,提出改进的新型无源观测器方法,并对它进行理论验证。该方法可提高机器人系统的鲁棒性能,从而实现系统的全局渐近稳定和对外部扰动的鲁棒性。采用MATLAB软件对机器人系统模型在和方向上的速度、位置和力反馈跟踪进行仿真实验,并与经典的无源性观测器方法进行比较分析。
图1所示为机器人的系统结构。在机器人的表面施加力,并通过连接在机器人和工具之间的传感器来测量力。由于传感器的灵活性会使系统的动力学更加复杂,并可能成为系统的不稳定因素。因此,本文作者考虑固定基座机器人及齿轮的阻尼,忽略关节的柔韧性。力传感器由1个弹簧和1个阻尼器构成。工具/末端执行器是第2个质量块,牢固地连接到传感器上。此外,对机器人施加力,作为控制器的计算信号。
图1 机器人系统结构
根据前文所介绍的机器人系统模型,采用基于经典时域无源性方法(TDPA)的无源观测器对机器人系统进行控制。该方法涉及到获取用于构建端口网络模型的功率相关变量。基于该端口网络模型,应用TDPA无源观测器和控制器。
在某些情况下,需要首先建立系统的电路模型,否则很难识别功率相关变量。机器人的电路模型中左回路、中回路和右回路分别由PID力控制器、跨阻抗(电流控制电压源)和机器人系统模型表示。在左回路中应用基尔霍夫定律(在拉普拉斯域中):
(1)
在中回路中,相关电流源在电阻上产生电压:
()=×()=[()-()]·
(2)
式中:是期望力;是感测力;、和分别是PID控制器的电阻、电感和电容;是跨阻抗电阻。将公式(2)与PID控制器的拉普拉斯域方程进行比较,则:
(3)
式中:为比例增益;为积分增益;为微分增益。
通过辨识电路模型中所有功率的相关变量,导出端口网络模型,其结构如图2所示。第1块模型是控制器的期望输入,第2块模型是控制器本身,第3块模型代表机器人系统模型。
图2 端口网络模型结构
由于经典的无源化方法会监控供应给机器人系统的能量,而每当这些能量变为负值时,系统就会受潮,导致能量积累的发生。因此,为避免能量积累的问题,提出一种新的方法来监测能量。该方法不会跟踪已经消耗的能量,并且可以更快地检测出系统的不稳定性,从而提高机器人系统的鲁棒性能。该方法中提出2个新的无源性观测器,分别为窗口无源性观测器(WPO)和重置无源性观测器(RPO)。
窗口无源性观测器的目的是在有限的范围内跟踪系统的功率输入。为正的时间步数,则窗口无源性观测器的功率为
(4)
如果窗口无源性观测器对所有都是正的,那么改进的的新型无源性观测器对所有也是正的,即:
[∀≥0,()≥0]⟹[∀≥0,()≥0]
(5)
因此:
(6)
这意味着,如果改进的新型无源观测器变为负,那么窗口的无源观测器也将变为负,因此窗口无源观测器能发现系统的不稳定性,从而快速地检测出系统的行为。
重置无源性观测器(RPO)的目的是避免能量积累问题的发生,即从中减去一个以前的值。由于需要减少能量消耗,只删除正值。另外,重置时间的最佳选择是出现局部电源最小值时,且RPO值为正时。这样,由于噪声或系统中的小振荡,复位将经常发生。因此,重置无源性观测器定义为
(7)
式中:()通过以下算法得到:
主程序r(N)
如果:N<2则
返回0
如果: isLocalMin(ps, N-2)
且Pr(N-2)≥0则
r(N)=N-1
否则:
r(N)=r(N-1)
主程序isLocalMin(f, k)
返回f(k-2)≥f(k-1)≥f(k)
且f(k)≤f(k+1)≤f(k+2)
在该算法中可以看出:当时间步长为-2时,系统提供的功率为局部最小值。这是因为将局部最小值定义为超过5个点的最小值,以避免过多地考虑噪声,因此在测试最小值之前,需要访问这5个样本。
假设:
∀≥0,()≥0
(8)
初始化:
(9)
式中:(0)=(1)=0。
设≥2,假设对于所有≤,则:
(10)
则(+1)=()。
通过递归假设,可以得到:
(11)
这种情况下,由于≥2,所以(-1)定义为
(12)
因此:
[(+1)-1]=[(-1)-1]+
(-1)≥0
(13)
从上式可以看出,第1项和第2项都是正的。最后可以得到:
∀≥0,()=[()-1]+()≥0
(14)
如果重置无源性观测器对所有≥0都是正的,那么改进的新型无源性观测器对于所有≥0也是正的,从而证明了RPO理论的有效性。
为验证所提方法的有效性,从理论上验证其系统的稳定性。首先,考虑一个非线性系统:
(15)
式中:为系统输入;为系统输出;为系统的状态向量。
当系统为零样本目标检测(Zero Shot Detection,ZSD)时,即系统为零输入时,则可以观察到零输出,状态也趋于零。因此,当时间≥0时:
(16)
改进的新型无源性观测器可以看作是系统每个端口的输入和输出:
(17)
式中:Δ是采样时间;()和()是功率相关量,使得当能量流入系统时,()、()为正值。在时间为时向系统提供功率:
(18)
则:
(19)
因此,依据Lyapunov理论,从理论上验证了该系统是稳定的。
改进的新型无源性观测器采用增益修正无源控制器,从而有效降低经典无源性观测器中(公式(3))的PID控制器的增益。因此,可以应用改进的新型无源性观测器来提高系统的稳定性。
为进一步验证机器人系统模型采用改进的新型无源性观测器的控制效果,采用MATLAB软件对机器人系统模型在和方向上的速度、位置和力反馈跟踪进行仿真实验,并与经典的无源性观测器方法进行比较分析。
图3所示为机器人系统在和方向上的速度跟踪曲线。可以看出:当机器人刚运作时,由于系统的输出电压较大,采用改进的新型无源性观测器的机器人系统速度不断增加,经历短暂超调后,约在=6 s时趋于稳定,跟踪速度最大为6 cm/s;而采用经典无源性观测器的机器人系统速度在=6 s时达到7 cm/s,且波动明显,一直无法趋于稳定。说明采用改进的新型无源性观测器可以使机器人系统长时间稳定运行。
图3 速度跟踪曲线
图4所示为机器人系统在和方向上的位置跟踪曲线。可以看出:无论是经典无源性观测器方法还是改进的新型无源性观测器方法,都能对机器人系统实现一定的跟踪控制效果;但是,相比于经典无源性观测器方法,采用改进的新型无源性观测器的机器人系统位置跟踪曲线抖动较少,曲线更加平滑,保持在[-4,4] cm内匀速变化。说明采用改进的新型无源性观测器可以提高机器人系统的控制稳定性。
图4 位置跟踪曲线
图5所示为机器人系统在和方向上的力反馈跟踪曲线。可以看出:系统在=2 s时发生明显的力反馈现象,这是因为控制器有阻抗干扰,导致能量积累的问题产生;而采用改进的新型无源性观测器的机器人系统明显抗干扰能力更强,最大力反馈为2 N,相比于经典无源性观测器方法降低了约33%。说明采用改进的新型无源性观测器可以保证机器人系统的稳定性,从而提高其控制鲁棒性。
图5 力反馈跟踪曲线
本文作者建立了机器人的系统结构模型,并对机器人施加力,作为控制器的计算信号。针对经典的无源观测器会发生能量积累的问题,提出了改进的新型无源观测器方法,并对它进行了理论验证。利用MATLAB软件对机器人系统模型在和方向上的速度、位置和力反馈跟踪进行仿真验证,并与经典的无源性观测器方法进行比较。仿真结果表明:相比于经典无源性观测器方法,采用改进的新型无源性观测器的系统在速度、位置和力反馈上都有较好的控制鲁棒性,从而可以提高机器人系统的稳定性。