基于改进DRNN的机电作动器PI控制方法研究

2022-01-05 10:51赵世超赵东标支程昊
微特电机 2021年12期
关键词:控制算法权值神经元

赵世超,赵东标,支程昊

(南京航空航天大学 机电学院,南京 210016)

0 引 言

机电作动器(以下简称EMA)由于其质量轻、灵活性高、控制精度高、维护方便且在运行过程中噪声小等优点,近年来在各类航空航天飞行器中得到越来越广泛的应用[1]。EMA的工作环境往往比较复杂,给系统的稳定运行带来了很大的挑战,因而对EMA伺服系统高性能控制策略的研究就显得尤为关键[2]。

EMA作为一个非线性、多变量、强耦合的伺服系统,采用传统的控制方法难以满足其复杂工况下的性能要求。近年来,各种先进的非线性控制方法得到迅速发展,神经网络控制由于其强非线性拟合能力,已然成为该领域的研究热点。文献[3]设计了一种神经网络与滑模控制相结合的方法,利用神经网络观测系统集总不确定性,提高了航空作动器控制器的参数适应性和抗干扰能力。文献[4]将BP神经网络与PI控制方法结合,用于电梯用永磁同步电机的调速控制,改善了电梯的快速性和舒适性。文献[5]提出一种基于单神经元的永磁同步电机解耦控制策略,实现了d-q轴电流解耦,使系统具有快速的响应能力和良好的静态性能。

由于对角递归神经网络(以下简称DRNN)动态特性可以很好地对非线性时变系统进行控制[6],本文为改善EMA系统控制性能,将DRNN与PI控制相结合,使得DRNN在系统运行过程中可以实时调整PI的最佳参数;同时,设计了一种自适应学习率方法,使控制器的学习能力和在线修正能力得到了提高。仿真实验表明,改进后的DRNN-PI控制方法增强了EMA速度环的响应能力和抗干扰能力,并改善了EMA整体系统的静、动态性能。

1 EMA系统数学模型

1.1 EMA机械传动模型

EMA根据其作动形式可分为旋转式和直线式,本文的EMA采用直线式作动形式,其结构简图如图1所示,以永磁同步电机(以下简称PMSM)作为驱动电机,通过离合器、滚珠丝杠将旋转运动转变为推杆的直线运动,进而带动舵面、起落架等实现期望运动[7]。

图1 EMA机械传动结构

采用弹簧-阻尼-质量模型对EMA结构等效简化,由欧拉定律,建立EMA的数学模型如下:

(1)

式中:J为负载折算到电机的转动惯量;θ为电机位置输出量;Te为电机的电磁转矩;B为作动器系统折算到电机的粘性阻尼系数;TL为负载转矩。

1.2 PMSM数学模型建立

本文EMA驱动电机选用表贴式PMSM,假设磁路不饱和,忽略磁滞和涡流损耗,磁场空间呈正弦分布,在d-q轴系有如下数学表达式:

(2)

式中:id,iq为定子绕组在同步旋转坐标系下的电流分量;ud,uq为定子绕组在同步旋转坐标系下的电压分量;Rs,L=Lq=Ld分别为定子的电阻和电感;ωr为转子的电角速度;ψr为转子永磁磁链;p为极对数。

2 DRNN-PI控制器设计及改进

2.1 DRNN-PI控制器原理

DRNN与BP神经网络相近,由输入层、隐含层和输出层组成,不同点在于前者在隐含层增加了自反馈环[8],其网络结构如图2所示。

图2 DRNN结构

DRNN输入层单元接收输入信号,隐含层接收输入层信号及其自反馈信号,经激励函数传递给输出层计算完成前向传播;然后根据输出层输出结果与期望值误差进行反向传播,动态调整网络连接权值,从而使得输出层结果不断趋近于期望值。

增量式PI控制算法输出表达式:

u(k)=u(k-1)+Kp[e(k)-e(k-1)]+Kie(k)

(3)

式中:e(k)和e(k-1)分别为控制器最近2次所采集的系统误差;u(k)为控制器k时刻输出;Kp和Ki为控制器增益参数。

(4)

式中:ωih为输入层连接隐含层各神经元间的权重;ωhh为隐含层自反馈连接的神经元权重。σ(·)为隐含层激励函数,在此选取双曲正切函数,其表达式如下:

(5)

(6)

式中:ωho为隐含层连接输出层各神经元间的权重;输出层输出为控制器增益参数Kp和Ki,分别对应:

(7)

由于增益参数均为非负值,故选取输出层激励函数为非负Sigmoid函数,其表达式如下:

(8)

经上述前向传播可得到控制器所需的增益参数,进而根据式(3)得到控制器输出量作用于PMSM,使得EMA产生相应动作。DRNN的学习基于反向传播算法,将误差信号沿前向传播路径反传,从而调整各神经元间的权重值,使得系统误差不断减小。定义系统的性能指标函数如下:

(9)

式中:r(k)为系统期望值;y(k)为实际值。对于本文的EMA伺服控制系统而言,r(k)即为速度环控制器期望值,y(k)为实际的PMSM转速。

采用最速梯度下降法对网络权重值进行调整,其调整公式如下:

(10)

式中:η为学习率;α为使得搜索快速收敛的惯量因子。

据上式,可得输出层到隐含层各神经元间的权重调整公式如下:

(11)

式中:∂Δu(k)/∂y(k)未知,本文在此采用近似计算方法,利用符号函数sgn(·)对其近似替代,由此带来的计算不精确影响可以通过调整学习率进行补偿[9-10]。则该项可表示如下:

(12)

(13)

(14)

式中:

(15)

2.2 学习率自适应优化

由DRNN学习算法可知,学习率η的选取直接决定了DRNN的收敛速度和学习效果。当学习率η的选取较大时,理论上可以提高神经网络的收敛速度,但是可能会引起权值在最优点附近振荡,从而影响控制器的控制效果[11],导致电机转速在一定范围内振荡,不利于EMA伺服系统的稳定运行。学习率选取较小,虽然可以避免上述情况的发生,但同时也会影响DRNN的收敛速度,在应对复杂环境时可能无法及时对控制器参数进行调节,从而也会一定程度上影响控制器的性能。因此,提出一种自适应学习率的方法来替代固定学习率,以期兼顾系统的稳定性和快速响应能力。调节公式如下:

(16)

同时,注意到采取上述自适应学习率调整公式时,不可避免地导致学习率最终仍处于一个相对较小的值,在面对转速突变时,无法保证权值的及时调整。因此,采取下式对学习率进行修正:

(17)

式中:η0为修正学习率,当k时刻的转速误差值减k-1时刻的误差值大于阈值Δω时,便激活式(17)对学习率进行修正。

2.3 基于改进DRNN的PI控制器

结合自适应学习率优化的DRNN与PI控制器对EMA速度环进行控制,其控制框图如图3所示。

图3 DRNN-PI自适应控制框图

算法流程如下:

(1)确定DRNN神经网络结构,初始化权重值,选取合适的学习率和动量因子,令k=1;

(2)采样得到k时刻输入量r(k)和输出量y(k),并计算得到偏差量e(k);

(3)输入e(k)、e(k)-e(k-1)和u(k-1)到DRNN中,计算得到输出量,即Kp和Ki;

(4)根据式(3)计算得到该时刻控制输出u(k);

(5)计算当前时刻学习率,根据反向传播公式调整网络权值系数,实现自适应控制;

(6)令k=k+1,返回步骤(2)。

3 仿真实验

为了验证上述系统的控制性能,在Simulink中搭建了改进前后DRNN-PI控制、模糊-PI控制以及传统PI控制的EMA伺服控制系统,进行仿真对比研究。EMA主要参数如表1所示。

表1 EMA主要参数

对于传统的PI控制方法,转速环和电流环均采用PI控制器,速度环的PI参数为kpv=10,kiv=200;d、q轴电流PI控制参数均为kpd=5,kid=300。DRNN的初始权值为[-0.5,0.5]的随机数,学习率η=0.002 ,缩放因子β=1×106,γ=0.9,修正学习率η0=0.001;电流内环控制器的参数与PI控制下的参数一致。

(1)转速跟踪:初始给定电机转速为2 500 r/min;在0.15 s时转速设定为3 000 r/min;在0.3 s时设定转速为1 500 r/min。仿真结果如图4所示。

从图4可以看出,采用传统PI控制算法跟踪转速变化会出现较大的超调量,超调量近100 r/min,采用DRNN-PI控制方法时超调量较小,模糊-PI没有明显的超调,但其稳定时间较长,达到0.1 s,而采用改进DRNN-PI控制时可以达到几乎无超调并且可以更快地达到稳定转速。

(2)额定转速下突加突卸负载:给定电机额定速度3 000 r/min,在0.2 s时,加10 N·m的负载,在0.4 s时卸掉负载。仿真结果如图5所示。

图5 额定转速下各控制算法突加突卸载荷曲线图

从图5的仿真曲线可以看出,采用传统PI控制算法,转速出现3.3%的超调,在负载突变时,转速出现35 r/min的变化,且需约0.05 s的时间恢复转速;对于改进前后的DRNN-PI控制算法而言,可以看出转速的超调量、负载突变时的转速变化和恢复时间均有所减少;其中改进后DRNN-PI控制算法可以实现转速几乎无超调,达到额定转速,负载突变时转速变化量较改进前减少约5 r/min,恢复时间缩短0.01 s;模糊-PI在负载突变时转速变化量与改进DRNN-PI相近,但其恢复时间更长,约0.04 s。由此可见,改进DRNN-PI具有更快的响应能力和更强的抗干扰能力。

(3)为验证控制算法在EMA伺服系统中的整体性能,给定EMA位置阶跃信号为20 mm,并引入如图6所示的随机变负载干扰(0~3 N·m)。其中,EMA位置环采用比例控制,为方便对比,比例参数均取相同的值,仿真结果如图7所示。

图6 负载转矩随机变化曲线

图7 给定20 mm位置阶跃下各控制算法响应曲线

从图7(a)可以看到,内环采用传统PI和DRNN-PI控制时,其位置响应均产生超调,采用模糊-PI和改进DRNN-PI控制算法均未出现明显位置超调,系统可以平滑地达到指定位置,但模糊-PI的响应速度较慢;且EMA到达指定位置时,在随机负载干扰下,内环采用改进DRNN-PI可以使得EMA位置波动更小。图7(b)是对应EMA位置阶跃20 mm下电机转速响应变化,可以看到,内环采用模糊-PI和改进DRNN-PI算法使得电机转速变化具有更小的超调量,但模糊-PI达到稳定转速所需时间较改进DRNN-PI约长0.02 s,且在转速平稳时,改进DRNN-PI受随机负载影响转速波动更小,具有更强的抗干扰能力。由上述可知,内环采用改进DRNN-PI控制算法能够改善EMA伺服控制效果,使EMA伺服控制系统整体性能表现更好,鲁棒性更强。

4 结 语

本文针对EMA速度环设计了一种DRNN与PI相结合的控制方法,考虑学习率对控制性能的重要影响,引入自适应学习率来动态调整DRNN的权值,提高了控制器学习能力和在线修正能力。仿真结果验证了改进DRNN-PI控制方法在响应能力和抗干扰能力方面均优于传统PI控制、模糊-PI以及固定学习率的DRNN-PI控制方法,增强了EMA整体系统的稳定性和鲁棒性。

猜你喜欢
控制算法权值神经元
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
纺织机械手专利瞄准控制算法
跃动的神经元——波兰Brain Embassy联合办公
基于ARM+FPGA的模块化同步控制算法研究
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制
基于航迹差和航向差的航迹自动控制算法