阮伟,陈根,刘国安
(浙江中控研究院有限公司,杭州310027)
由浙江大学、浙江中控技术股份有限公司联合北京东土科技股份有限公司、上海自动化仪表有限公司提出的分布式环形网络冗余技术(DRP),解决了传统主从式环形网络冗余恢复技术存在的故障风险高度集中的问题,实现了网络化控制系统的高可用性。该技术被国际电工委员会IEC正式接收为国际标准IEC62439。
笔者在分析DRP的基础上,建立了环网故障切换模型,并结合网络化控制系统丢包稳定性模型,对基于DRP的环形网络控制系统稳定性进行了分析,得出环形网络化控制系统稳定性条件,并提出了构建稳定的、基于DPR的环形网络控制系统的方法。
基于DRP的环形网络控制系统中的传感器、控制器及执行机构,通过支持DRP协议的交换设备实现互联,如图1所示。
在环形网络系统中普遍采用禁用备用路径的方式,从而避免了由于数据在环网内无休止的回环而形成广播风暴。图1中的交换设备1与交换设备8之间存在物理通路。但是,该物理通路不进行数据传输,在逻辑上形成断路。因此,该环形拓扑在逻辑上退化为线性结构,有效避免了广播风暴的产生。
在DRP环形网络控制系统中,通信时间被分成多个宏周期,如图2所示。
为了实现快速的故障探测和恢复,DRP同时采用环路探测和链路探测技术,分别针对交换设备故障和物理链路故障进行探测,并根据故障探测的结果实现快速的故障切换。
图1 基于DRP的环形网络控制系统结构
图2 DRP故障探测和恢复机理
在一个宏周期内,t设备报警只有一个交换设备广播链路报警帧进行环路故障探测。而每个交换设备节点在t链路探测发送链路探测帧,同时进行一次链路故障探测。
在故障情况下,为了保证控制系统的稳定性,需要分析DRP方法的最大故障恢复时间。要求控制系统在故障恢复时间内,仍然能够保持系统稳定。根据DRP进行故障探测和恢复的原理,建立DRP系统故障恢复时间模型。
DRP环形网络控制系统的故障恢复时间:
式中:Tw——最大故障自恢复时间;Tti——两个Linkcheck帧发送之间的时间,也就是一个Macrocycle;Tto——接收Linkcheck的延时,代表从一个设备发送出这个数据帧,经过最大逻辑链路路程以后的收到时间;Tpf——在交换设备节点内部对DRP帧进行处理的延时(包括交换设备的接收相应延时和处理器的处理延时);Ttt——交换设备节点内部DRP帧发送延时;Tph——1km距离的双绞线传送延时;Lph——DRP网络内双绞线的长度;ND——DRP网络内交换节点的数量。
DRP环形网络控制系统在发生故障后,传感器、控制器以及执行机构之间的数据通信中断,出现丢包的现象。只有在DRP环形网络故障恢复后,传感器、控制器与执行机构之间的数据通信才恢复正常。因此,故障恢复时间的长短直接决定着控制系统丢包的数量,进而影响控制系统稳定性。
如果在冗余切换过程中,即备用链路尚未转换为工作链路的情况下,需要进行采样和控制数据的传输,那么将出现丢包现象。假设控制系统采样周期为T,故障恢复时间为Tw,任意一个交换设备故障的概率为u,传感器与控制器之间的交换设备数量为n。
进一步假设:q1为上一次和下一次采样均发生丢包的概率,而q2为上一次和本次采样均没有发生丢包的概率。其中q2完全取决于系统采用的交换设备和通信线缆的可靠性。交换设备和通信线缆可靠性高,发生故障的概率小,采样数据丢失的概率也相应减小。根据T和Tw的关系,分以下两种情况讨论。
在Tw<T的情况下,发生故障后,故障在一个T2内恢复。因此不一定会出现丢包。其丢包概率q1=Tw/T·n·u。进一步得到的上一次和本次采样均没有发生丢包的概率为q2=1-Tw/T·n·u。
在Tw>T的情况下,分三种可能,可能出现连续丢包状态:故障已经恢复,但再次发生故障,必然丢包,其概率为n·u。后两种情况按照下一个周期不丢包的情况进行分析。如果在下一个宏周期的开始时间(即发包时间)故障仍没有恢复,则继续丢包。如果故障已经恢复,则不丢包。故障恢复时间为Tw,可能发生的丢包次数有两种可能:
故障发生的时间在一个宏周期的区间[0,T-(Tw-T×floor(Tw/T))]内,该次故障一共将导致发生mod(Tw/T)次丢包。因此,综合考虑上述情况,得到Tw>T的情况下:
上一次和本次采样数据均没有发生丢包的概率为q2=1-n·u。
根据建立的DRP环形网络化控制系统的丢包模型,分析该控制系统的稳定性。在基于DRP环形化网络的系统中,构建状态反馈闭环控制系统。假设传感器采用时钟驱动方式,传感器的采样周期为Th,一般情况下,控制系统的采样周期T与传感器的采样周期Th一致。控制器和执行机构采用事件驱动,系统的被控对象所有状态均可测,忽略系统中的测量噪声。
如图3所示,系统采用比例控制,其离散模型为u(kTh)=-K x∧(kTh)。其中,u——系统的状态输出变量;x——系统的状态变量;K——比例控制器参数。
令z(k)=[xT(kTh),x∧T(kTh),u∧T(kTh)],可得到:z((k+1)Th)=Φiz(kTh)。其中,
图3 基于DRP的网络化控制系统
分别对应4种状态:i=1时,S1断、S2断;i=2时,S1通、S2通;i=3时,S1断、S2通;i=4时,S1通、S2断。
任意一个通路的通断状态转移概率矩阵有:传感器与控制器之间通路的转移矩阵:
式中:qsc1——传感器与控制器之间,上一次与下一次采样均发生丢包的概率;qsc2——上一次和本次采样数据均没有发生丢包的概率。
控制器与执行机构之间通路的转移矩阵:
整个控制系统的状态转移矩阵:
其中i=1时,S1断、S2断;i=2时,S1通、S2通;i=3时,S1断、S2通;i=4时,S1通、S2断。
目前,常用的现场总线仪表通常将控制功能集成在现场仪表中。因此,不可能出现CA通路上的“断”,即。i只可能为2,4,则Q简化为
根据上述状态转移矩阵,分析控制系统稳定性,稳定性判断矩阵E为
系统的稳定性由E的谱半径决定。若E的谱半径小于1,则控制系统稳定。若谱半径大于1,则被控参数将产生振荡。
DRP故障丢包模型分为Tw>T和Tw<T两种情况讨论。因此,基于DRP的环形网络化控制系统同样分两种情况讨论,分别将Tw>T和Tw<T情况下的q1和q2丢包模型带入式(6)得:
图4 系统稳定区域
综上所述,在分析DRP协议的基础上,得到DRP环形网络控制系统的稳定性与采样周期和系统交换设备数量之间的定性关系,为构建环形网络控制系统提供指导。
另一方面,在环形网络控制系统中,现有的稳定性条件假设基于故障恢复前后数据传输延时不变的情况,存在一部分节点在故障恢复后,由于经过的交换设备数量不同,出现传输延时变化的情况,需要在现有模型基础上经过进一步优化后进行后续研究。
[1] NILSSON J.Real-time Control Systems with Delays[D].Lund:Ph.D.Dissertation,Dept.Automatic Control,Lund Institute of Technology,1998.
[2] ZHANG W,BRANICKY M S,PHILLIPS S M.Stability of Networked Control Systems[J].Control Systems Magazine,IEEE,2001,21(01):84-99.
[3] COSTA L V,FRAGOSO M D,MARQUES R P.Discretetime Markov Jump Linear Systems(Probability and its Applications)[M].California:Springer,2004.
[4] HONG S P,KIM Y H,DON S K.A Scheduling Method of Network-based Control Systems[J].Control Systems Technology,IEEE Transactions on,2002,10(03):318-330.
[5] MEIER S,WEIBEL H.IEEE 1588Applied in the Environment of High Availability LANs[C]//Precision Clock Synchronization for Measurement,Control and Communication.2007:100-104.
[6] KIM S H.Design and Analysis of High-speed Ring-based Networked Control Systems for Real-time Applications[D].Berkeley:University of California,2006.
[7] International Electrotechnical Commission.Industrial Communication Networks High Availability Automation Networks-Part 1:General Concepts and Calculation Methods,IEC 62439-1[M].Swizerland:International Electrotechnical Commission,2009.
[8] BYRES E J.Designing Secure Networks for Process Control[C].Pulp and Paper Industry Technical Conference,1999:63-67.
[9] International Electrotechnical Commission.Industrial Communication Networks High Availability Automation Networks-Part 6:Distributed Redundancy Protocol(DRP),IEC 62439-1[M].Swizerland:International Electrotechnical Commission,2009.
[10] HASSIBI A,BOYD S P.How Control of Asynchronous Dynamical Systems with Rate Constraints on Events[C].IEEE Conference on Decision and Control,1999.
[11] SCHEER G W,MOXLEY R E.Digital Communications Improve Contact I/O Reliability[C].Power Systems Conference:Advanced Metering,Protection,Control,Communication,and Distributed Resources,2006.