曾哲璇,岳作功,袁 烨
(华中科技大学人工智能与自动化学院,湖北武汉 430074)
动力系统的可辨识性是描述其模型参数能否被唯一确定的性质,对动力系统的模型进行可辨识性分析是系统辨识理论研究中不可或缺的子问题[1],且在各应用领域的建模研究中发挥了重要作用.本文对感兴趣的系统进行建模时,通常结合先验知识构建一个含有参数的模型,并通过采集的输入输出数据估计其中的未知参数完成系统辨识.这种结合机理与数据的系统辨识过程在经济学、生物科学、控制工程等数据驱动的建模中是必不可少的一步.在辨识问题中,“可辨识性”是模型的参数能够由实验数据进行辨识的必备性质.模型参数若不可辨识,即存在两个或两个以上不同参数化的模型产生的观测数据完全等价,那么在没有其他先验知识的情况下,基于数据对参数进行估计将产生多种可能,且无法识别描述真实系统的模型.当辨识电力系统[2]、航天系统[3]等涉及到关键安全的控制系统,以及当描述系统的模型参数具有实际物理意义时,保证可辨识性则更为重要.
对可辨识性的研究可追溯到19世纪中期,一些经济学家从统计推断模型中首次提出了“辨识”的概念,而后这一概念在控制科学中得到了巨大的发展[1].由于计量经济学中的经济模型需要从模型结构推导出可被辨识的条件,从1934年到1975年,一批科学家对可辨识性问题进行了深入研究,做出了里程碑式的理论奠基工作[4–10].直观上,可辨识性的概念很容易理解,但在具体情况下具有不同的数学描述和丰富内涵.Koopmans和Reiersol[5]从统计学的角度对可辨识性进行阐述,即通过给定的数据变量的概率分布,能得到唯一的模型结构.1970年,Bellman和Åstrm[8]首次提出了模型的结构可辨识性概念及其充分条件,并开始研究线性状态空间模型的结构可辨识性判别方法及其所需的实验要求.随后的二十年,诸多领域的学者对状态空间中动态模型可辨识性进行了系统研究,关于这一主题的研究工作大量涌现,研究了“输出可区分性”[11]、“结构输出可分性”[12]、“敏感可辨识性”[13]等一系列可辨识性相关概念.1985年,Walter[14]对7次IFAC(international federation of automatic control)会议的“辨识和系统参数估计”研讨会上的论文进行了改进和合并编写,提供了较为完整的成果集.近二十年来,在网络重构研究的推动下,动力学网络可辨识性得到广泛关注,传感器设计[15]、控制器设计[16–17]等也得到了深入研究.
可辨识性问题大致可以分为两类,一类是理论(结构)可辨识性,一类是实际(数值)可辨识性.结构可辨识性问题是为了探究构建的模型结构是否合理,以使其参数能唯一地拟合无限的高质量(连续、无噪声)数据,即合适的模型结构必须足够复杂,能够刻画相应的系统行为和机理,同时又要足够简单,能够适应数据[18].因此,研究该类问题时,通常在理论上分析模型结构对参数辨识的影响,而与数据无关,即假定用于辨识的数据是完美的(无噪、连续、无限),可辨识性仅仅受模型内部结构的影响,如参数间耦合等.由于实际情况下的实验与参数估计过程不可能满足完美数据的条件,建模误差、数据测量误差等因素不可避免,因此需要考虑实际可辨识性.实际可辨识性的问题研究通常转化成了数据的敏感性分析或最小方差值的分析.相对于结构可辨识性,实际可辨识性更符合实际情况,然而结构可辨识性是实际可辨识性的前提,在不能保障结构可辨识性的前提下进行实际可辨识性分析是毫无意义的.需要注意的是,由于历史文献中有许多学者研究可辨识性具体特性时用“结构”为定语进行命名,且在系统辨识经典文献[19]统一后,实际(数值)可辨识性研究内容属于系统辨识的实验设计研究范围,与模型结构有关而与数据质量无关的理论(结构)可辨识性即为一般意义上的可辨识性,因此为了避免混淆,下文即称之为“可辨识性”.
可辨识性问题已在静态/动态、线性/非线性、离散/连续时间模型等各方面取得了系统性的研究成果.学者们在控制工程[11]、生物科学[20]、生态环境[21]等领域中开展了一系列可辨识性的理论研究,除此之外,还在电力系统[22]、机械装备[23]等实际应用场景中开展了一系列可辨识性的应用研究.其研究内容通常可分为两类: 第一为理论或方法研究,即针对一般或具体的问题或模型,研究可辨识性的具体定义、保障可辨识的理论条件、可辨识性的测试方法等;第二为可辨识性的应用研究,如保障可辨识性条件下的模型选择、数据采集、算法设计等,这类研究往往可以得到保障可辨识性的合适的模型、数据需要满足的必要条件、必备的实验设施条件、增强可辨识性的算法等.
可辨识性的理论分析方法十分丰富.由于可辨识性是模型的基本性质,因而其研究对象十分广泛,如统计框架下的概率模型、描述动力系统的状态空间模型、动态网络模型等,针对模型的线性/非线性、离散/连续等特征,学者们发展了一系列丰富的可辨识性分析方法[14,24].线性情况下,分析可辨识性的方法有传递函数方法(Laplace 变换方法)、Markov参数矩阵方法等,分析实际可辨识性的方法有Fisher信息矩阵方法等;非线性情况下,分析可辨识性的方法有泰勒级数方法[25]、局部状态同构方法[26–27]、微分代数方法[28–29]、系统等价方法[30]等.Walter等[14,24,31]总结了分析可辨识性的经典方法,其中文献[14,24]总结了经典的线性时不变模型、简单非线性或线性时变模型的可辨识性分析方法,文献[31]着重于非线性时不变模型的可辨识性测试方法.
随着数字时代的到来和多动力系统智能互联的需要,数据驱动建模背景下数据合理性研究需求越来越高,以及动力学网络建模越来越普遍,如电力网络、传感器网络、机器人网络等.因此,保障可辨识性的数据合理性研究和动力学网络的可辨识性理论研究引起了学者们广泛关注.由于近年来产生了许多新的研究成果,大数据时代对可辨识性问题研究趋势具有新的引导,本文对其研究发展进行综述.
本文的内容分配如下: 第2节介绍可辨识性研究中出现的重要概念及其研究发展,并简要说明相关概念之间的关系;第3节分别阐述动力系统的线性时不变模型、非线性时不变模型和时变模型、时间延迟模型中可辨识性的主要研究成果;第4节介绍动力学网络中可辨识性的研究进展和主要成果;第5节总结全文并对未来可辨识性问题的发展进行讨论.
可辨识性是系统辨识领域中的重要概念,属于参数可辨识性的范畴.系统辨识通过在合适的参数区域中将模型集参数化来搜索“最佳模型”,可辨识性则是指参数化的模型集能否由数据产生唯一参数解且该解对应真实系统的性质[19].因此可辨识性包含两个层面: 第1个层面为数据的信息充足性,即数据(实验条件)是否足以区分不同参数表示的模型,这要求输入信号满足持续激励的相关条件,该层面的研究一般属于系统辨识的实验设计部分,对数据的具体讨论可见文献[19]的第8.2节和14.2节;第2个层面为模型结构的可逆性,即是否存在不同的参数对应相同的模型,该层面的可辨识性讨论一般与数据质量无关,且为一般的可辨识性研究内容.以下首先介绍可辨识性经典定义(定义1),然后分别介绍用于不同模型或从不同角度诠释可辨识性相关定义(定义2–7),并总结其本质和内在联系.注意明确本节所提的(结构)可辨识性与网络拓扑(结构)可辨识性的区别,前者描述参数化模型的唯一性,后者描述网络拓扑的唯一性(参数可能不唯一),两者定义的区分可见文献[32].
定义1(可辨识性[19]) 记候选模型集为S,模型结构S:θ→S(θ)∈S由参数向量θ∈Θ⊂Rq描述,其中Θ为参数空间,若参数空间中的在θ0足够小的领域内,S()=S(θ0)有唯一参数解=θ0,则模型结构S在θ0是局部可辨识的;若∈Θ,且S()=S(θ0)有唯一参数解=θ0,则模型结构S在θ0是全局可辨识的.
据文献[33]记载,可辨识性的概念最初在多个学科几乎同时发展起来,如物理学[34]、计量经济学[9]、理论生物学[8,35]、系统和控制学[11,36–37]等,以下介绍从不同角度诠释的可辨识性具体表述.
在计量经济学理论中,需要从特定模型结构推导出参数可被辨识的条件,由于参数辨识本质上是估计问题,因此在概率框架的模型中可以自然地定义可辨识性,如Rothenberg等[5,9]和Bowden[38]在统计期刊和经济学期刊上定义的概率模型中的(局部)可辨识性,描述如下.
定义2(概率模型的可辨识性[9]) 若随机实验的输出y∈Rn是随机变量且y的分布具有参数表示,模型结构S由参数向量θ ∈Θ ⊂Rq描述,其中Θ为参数空间,θ1,θ2∈Θ,当且仅当θ1=θ2时,概率密度函数p(y,θ1)=p(y,θ2),那么该模型结构S是可辨识的.
以下介绍的可辨识性定义基于动力系统的模型,模型描述如下:
其中: 系统状态x(t,θ)∈Rn,输出y(t,θ)∈Rm;时间t≥0;参 数θ ∈Θq;输入u(t)∈U1,U1为Rl的开子集,U2:R+→U1为输入的分段连续函数集合.
在理论生物学中,模型结构的可辨识性的概念很大程度上源于生物系统辨识中的特殊问题[8,35],且在生物化学、内分泌学和新陈代谢中找到了重要的应用.1970年,Bellman和Åstrm[8]在生物学期刊上首次利用最小平方误差,从全局最优解和局部最优解的角度提出了模型的“结构可辨识性”概念,因此也可称为(全局/局部“最小二乘可辨识”.由于原文中提出“结构可辨识”一词易与定义1中模型结构S的可辨识性和网络拓扑可辨识性产生混淆,这里称之为“最小二乘可辨识性”,定义如下.
定义3(最小二乘可辨识性[8]) 输出数据由含有参数θ0的系统S(θ0)∈S产生,(t,θ0)为给定输入u(t)时系统测量输出,y(t,θ)为含有参数θ系统输出,若平方误差函数V(θ)=dt在θ=θ0处具有局部最小值,那么模型结构是局部可辨识的;若该最小值是全局最小值,则该结构是全局可辨识的.
在系统与控制学中,Walter[24]从参数和系统输出之间一对一映射的角度,定义了模型结构的输出全局可辨识性和局部可辨识性,相关定义如下.
定义4(输出可辨识性[24]) 对模型(1)中给定任意可获得的输入u(t)和参数空间中任意两个参数向量,θ0,若输出y(u(t),)=y(u(t),θ0)在θ0足够小的邻域内有唯一参数解=θ0,则模型结构是局部可辨识的;若y(u(t),)=y(u(t),θ0)在∈Θ有唯一参数解=θ0,则模型结构是全局可辨识的.
定义4所考虑的输出轨迹y(u(t),)中,忽略了初始条件x(0)对输出轨迹的影响.Wu等[39]的工作表明,给定初始条件可以提高参数估计的可靠性,尤其对于初始条件敏感的动态系统,给定初始条件有助于系统辨识更多的参数.当可辨识性必须考虑初始条件且初始条件未知时,则将x(0)视为附加的未知参数考虑,当已知初始条件为x(0)时,许多学者进一步对其进行了可辨识性研究[27,40–43],例如Tunali 和Tarn[27]提出了当初始状态已知时的“x0–可辨识性”,定义如下.
定义5(x0–可辨识性[44]) 对由模型(1)描述的系统,给定与参数θ无关的非平衡点的初始状态x(t0)=x0,对任意定义在[t0,t1]的输入u(t),在参数开集Θ中任意两个不同的参数向量θ1θ2,在时间区间[t0,t0+ϵ],(0≤ϵ≤t1-t0)上给定输入u(t)时的状态变量x(u(t),θ,t)存在,且相应的输出y(u(t),θ1,t)y(u(t),θ2,t),则该系统结构是x0–可辨识的.
以上可辨识性相关定义保证了可从输入/输出数据中推断出模型,而在故障检测[45]、混合系统识别[46]和多模型自适应控制[47]等应用中,只需保证从有限个动力系统族中辨识出真实系统所属的系统族[48],Grewal和Glover[11]首次定义了与输出可辨识性密切相关的可区分性概念,即如果系统可通过某种输入信号来辨识,那么它可以与具有相同结构的任意其他系统区分,并且Grewal和Glover研究表明“局部输出可区分性”和“局部(最小二乘)可辨识性”是等同的.相关定义如下.
定义6(输出可区分性[11]) 基于模型(1)描述的动力系统,对参数集Θ中的参数θ1θ2,若给定任意(x0,u(·)),都有输出y(u(t),θ1,t,x0)=y(u(t),θ2,t,x0),其中t∈[t0,t1],u(·)∈U2,参数θ1,θ2是不可区分的.
随着所考虑条件的进一步细化,引申出一系列分析性的可辨识性相关概念,例如扩展到考虑整个参数空间的“结构全局/局部x0–可辨识性”和“结构全局/局部x0–可辨识”[27]、考虑采样频率对可辨识性影响的“系统混淆”等概念[49].与之对应的,定义refdef6(输出可区分性)也扩展到了不同参数化模型的“结构输出可区分性”[12]、考虑所有输入信号的输出均可区分的“绝对可区分性”[48]、考虑使输出信号在任意初始条件下可区分的“受控可分性”[50]等相关概念.
随着可辨识性分析方法发展,引申出一系列代数引导的可辨识性相关概念,例如由系统输出的参数敏感性分析的“敏感性可辨识性”[13]、通过Kullback–Leibler散度分析的“KLID–可辨识性”[51]、通过代数的系统参数与输入输出一对一映射关系的“代数可辨识性”[28](定义如下)等.
记M为初始状态空间,[t0,t1]为时间区间[t0,t1]内可获得的最高N次可导的输入函数集合.
定义7(代数可辨识性[28,44]) 针对由方程(1)描述的系统,假设函数f(x(t,θ),u(t),t,θ)和h(x(t,θ),u(t),t,θ)是θ的多项式,针对系统状态x、输入u、输出y,如果可以经过有限的代数计算或微分操作,构造一个函数Φ=Φ(θ,u,,···,u(k),y,,y(k)),使之对Θ×M×[t0,t1]的密集开子集中任意(θ,x0,u),在时间区间[t0,t1]上满足Φ=0,,则该系统结构是代数可辨识的.
以上定义可视为在不同条件下或通过不同分析方法对可辨识性内涵的具体诠释,其本质意义均是在(相应的)模型结构中分析唯一的参数解,其中描述动力系统的模型(1)的部分可辨识性定义内在联系与研究脉络见图1.注意本文仅介绍了部分可辨识性定义及其研究思路,还有大量考虑不同的条件、分析方法等可辨识性相关概念.另外,针对可辨识性、可区分性以及控制理论中的定义之间的充分或必要性关系,许多学者进行了深入的研究.如DiStefano等在文献[33,52]中研究了系统可观性、可辨识性、可区分性、敏感性可辨识性等相关概念之间的关系,并针对不同的可辨识性相关概念进行了统一论述.Lecourtier和Walter[53]进一步补充了较为明朗的统一定义表,理清各个领域不同表述的可辨识性定义内涵,Anstett-Collin等[54]将可辨识性具体定义分为了分析性定义与代数性定义,并详细地研究了相关定义之间的充要性关系.
动力系统的可辨识性分析用于评估参数辨识的模型结构是否合理,其不可辨识问题大多是由只有部分观测数据(即观测矩阵不满秩)或结构内部的耦合性(如参数相乘等)造成,其前提假设是已有明确的模型结构和完美的测量数据.需要说明的是,这两个假设不够切合实际,但可辨识性是系统辨识的前提条件,仍然具有理论研究价值.另一方面,与数据相关的实际可辨识性分析则用于评估实际情况下数据驱动准确辨识模型参数的能力,它将许多实际因素考虑在内,比如最常见的数据测量噪声对参数估计的影响.引起实际不可辨识的原因十分直观,大多是由于数据的测量噪声等因素引起.一般在采集数据之前进行可辨识性分析,即保证模型的可辨识性,这能为模型选择、实验设计等操作提供理论指导,如研究模型性能提高方法[55]、数据测量条件[15,44]、控制器设计[16–17]等.在模型满足可辨识的基础上,进而可以对模型进行参数估计、实际可辨识性分析和模型的进一步修正[20,56].
可辨识性研究非常广泛,涉及各类模型.本节侧重于介绍模型结构的可辨识性分析研究进展和部分成果,以下内容分别对线性时不变系统、非线性时不变系统和时变系统、时间延迟系统的可辨识性分析相关工作进行阐述.
线性时不变系统是最早开始研究可辨识性的模型类别,目前针对线性时不变系统的可辨识性研究已经产生了许多经典的一般性结论.本节介绍此类系统中的主要经典结论和重要应用.由于许多工作基于概率模型中的研究成果,且动力系统中的可辨识性结论通常可以与之产生联系,因此本节首先介绍Rothenberg[9]提出的概率模型的可辨识性(定义2)相关结论,即局部可辨识性与信息矩阵的联系,相关定理如下.
定理1(可辨识性[9]) 若随机实验的输出y∈Rn是随机变量且y的分布由参数θ描述,其连续的概率密度函数为p(y,θ),其中y是随机变量,θ是参数空间Θ中的未知参数,即θ ∈Θ ⊂Rq,信息矩阵为
其中:i,j∈Z,1≤i,j≤q,若信息矩阵的元素eij(θ)存在且为θ的连续函数,且存在θ0∈Θ,使函数矩阵E(θ)在θ0的开邻域内是非奇异的,则θ0是局部可辨识的.
以矩阵参数化模型(3)描述的线性动力系统如下:
其中: 系统状态x(t)∈Rn;输出y(t)∈Rm;参数θ ∈Θ ⊂Rq;输入u(t)∈U1,U1为Rl的开子集;系统矩阵A(θ)∈Rn×n;B(θ)∈Rn×l;C(θ)∈Rm×n;D(θ)∈Rm×l.
Glover和Willems[10]提出了线性情况下参数化模型的全局可辨识和局部可辨识的充要条件,其分析直接源自定义1,结论与系统矩阵的秩相关.1970年,Bellman和Åstrm提出了连续时间线性系统的最小二乘可辨识性(定义3)充分条件,即当所估计参数的损失函数V(θ)对参数的二阶偏导矩阵是正定时,该模型是最小二乘可辨识的.基于定理,Bellman和Åstrm讨论了分室模型可辨识的结构.该定理直接与基于判断标准V(θ)(见定义3)的定义有关,且作者在文献[8]中阐述了该条件的概率意义,即当损失函数取为似然函数的负对数时,二阶偏导矩阵为信息矩阵,与概率模型中的可辨识性结论相符.Grewal和Glover[11]提出了两个参数的可区分性(定义6)充要条件,得到了线性模型输出可区分满足的矩阵关系,定理意味着θ1和θ2参数化的两个系统具有相同的传递函数和脉冲响应,则可推导出输出不可区分性.相关定理如下.
定理2(可区分性[11]) 对动力系统的模型(3),当且仅当参数空间Θ中的参数θ1θ2满足以下条件时,
其中i=0,1,2,···,θ1和θ2是不可区分的.
在此基础上,许多学者进一步研究了更复杂的系统中的可辨识性问题,如Yuan[57]等研究了参数化的线性切换系统可辨识性与线性时不变系统全局可辨识性的等价性,并对该切换系统提出了可辨识性新的充要条件.除此之外,许多学者研究了更具体的可辨识性与可区分性概念的理论条件,如“结构输出可区分性”[12]、“绝对可区分性”[48]、“受控可区分性”[50]等概念的充要条件.
然而,经典的可辨识性的分析方法计算量较大,一些学者利用过渡矩阵简化定理[58]、符号计算[14,59]等提出了简化的可辨识性测试方法.此外,学者们还发展了在离散时间线性系统[60]、偏微分方程描述的系统[61]等不同系统中的可辨识性研究工作,如Nakagiri[61]提出的与线性算子理论相关的一系列可辨识性结论.
基于前述的理论结果,许多学者将可辨识性理论应用到实验设计中,常用于观测数据采集[15,44,62–63]、控制器设计[16–17]中.如Xia和Moog[44]研究了四维艾滋病毒模型的可辨识性,得到辨识所有参数所需的最少测量次数及进行测量的最佳时间段,有助于制定临床实践的指导方针.Gut¸˘a和Yamamoto[63]将经典的线性系统结论推广到物理量子系统上,研究给定条件下可辨识的参数种类、重构系统参数方式,以及提高估计精度的输入输出测量设计结论.除此之外,Nabavi和Chakrabortty[15]针对传感器位置和算法设计展开研究,即保证可辨识性的输出条件.Tesi和Battistelli[16]在切换系统中研究了保障可辨识性的时变反馈控制设计问题.
线性时不变系统的可辨识性分析经典方法已经有非常详尽的总结文献.1985年,许多学者总结了分析线性时不变状态空间方程的可辨识性经典方法和应对大规模问题的分析方法[14].Walter系统地介绍了线性动力系统的可辨识性分析方法[24],其后又发展了许多针对性能提升的可辨识性分析方法[18,31,59].
由于非线性和时变性在实际物理系统中广泛存在,因此学者们针对此类系统展开了系统辨识相关研究[19,64–65].由于其复杂性,对具有非线性和时变性的系统进行可辨识性分析比线性系统要困难许多.以下简要介绍在非线性时不变系统和时变系统中的可辨识性分析方法和相关研究.
3.2.1 非线性时不变系统
目前非线性可辨识性研究成果大多都是在具体的研究背景下,针对某些特殊形式的非线性系统研究可辨识性的分析方法,并得到相关结论.考虑非线性连续时间模型如下:
研究非线性系统可辨识性或可区分性的方法主要包括微分代数方法、泰勒级数方法、生成序列方法和局部状态同构方法[14,20,31].根据方法的分析思路和理论依据,这些方法大致分为输入输出关系方法、输出相等方法和局部同构方法[66].
1)输入输出关系方法.
输入输出关系方法通常基于代数分析的定义7,在一定条件下,该方法一般可以推导出可辨识性的充要条件.在连续时间的情况下,通过消除未知的状态变量,原系统可以转化成一个只取决于输入、输出及其导数和参数的系统.若参数能写成仅取决于输入、输出和它们的导数的唯一解,它们就是可辨识的.许多方法能用来消除状态变量[67],如微分代数方法[68]可通过将微分添加到相关代数式中,利用矢量场来消除状态变量,从而得到只有所估计参数的微分、已知变量及其导数的输入输出关系,由此可以研究代数可辨识性.在离散时间情况下,该方法中的导数可由迭代数取代[69].目前利用微分代数研究非线性系统可辨识性的方法已经取得许多成果[28,31,70–75],例如Audoly等[72]提出了非线性动力学的全局可辨识性的测试方法,该方法可以处理很多生物模型.
然而,由于未知状态变量在替代处理过程中被消除了,输入输出关系方法一般不会考虑状态的初始条件.Saccomani等[43]和Denis-Vidal等[76–77]的研究显示了初始条件对辨识和可辨识性的重要作用,且在特定的初始条件下输入输出关系方法不再适用,因此需要其他的可辨识性测试方法来保障特殊初始条件下可辨识性分析的有效性.
2)输出相等方法.
输出相等的方法通常源于通过系统输出定义的可辨识性概念,如定义4,并且可以分析给定初始条件的可辨识性问题,如定义5,但由此一般只能推导出可辨识性的充分条件.输出相等方法是在两个参数下测试来自同一初始条件的两个输出轨迹是否相等.如果参数可辨识,则相同的输出轨迹意味着参数相等.这种方法包括生成序列法[14]、泰勒级数法[25]等.
生成序列方法是将非线性输出相对于输入域在初始点进行线性化展开.针对系统(5),该方法将系统输出扩展成时间和输入的序列,序列中每一项的参数是观测函数h沿向量场于初始点x(0)的Lie导数,即Lf0···Lfjh(x(t),θ)|0,其中fj为向量场f的第j个组成分量,则输出相等问题转化成生成序列的参数相等问题.该方法在文献[14]第5章有详细介绍.
泰勒级数法是将非线性输出相对时域在初始点进行线性化展开,将输出相等问题转化成t→0+时输出对时间的k阶导数相等,即如Godfrey和Fitch[78]应用该方法分析药物动力学方程的可辨识性,得到了参数的相关特性.在离散时间模型中,输出轨迹的等价性则是通过逐个样本测试进行验证.
3)局部状态同构方法.
局部状态同构方法基于同构定理[79],可以分析由系统输出定义的可辨识性,如定义4,以及给定初始条件的可辨识性问题,如定义5,并且利用同构唯一性和可辨识性的联系,一般可以推导出可辨识性的充分必要条件,但该方法可能会带来很大的计算量.该方法的基本理论为:对满足局部可观和可控的系统,若该系统与另一个系统共轭(或同构),且该同构满足唯一或等价条件,那么该系统是可辨识的.在连续时间系统中,Tunali和Tarn[27]最初研究了给定初始条件的局部强可辨识性充要条件,Vajda等[26]利用局部状态同构理论将相似变换方法扩展到非线性情况中.后来局部状态同构方法在离散时间的多项式模型中也得到了相应的应用,并得到了可辨识性的充要条件[66].
此外,近几年符号计算工具[80]也有长足发展,如与生成序列方法相关的GenSSI(generating series for testing structural identifiability)[81],对多项式或有理常微分方程描述的线性/非线性动力系统,基于微分代数方法的DAISY(differential algebra for identifiability of systems)[82],COMBOS[75],STRIKE-GOLDD(structural identifiability taken as extended-generalized observability with lie derivatives and decomposition)[83],SIAN(structural identifiability analyser)[84–85],其中Hong等在文献[84]中对GenSSI,DAISY和COMBOS的可辨识性分析性能进行了评估和比较,在文献[85]中提供了SIAN的理论基础.
总之,学者们针对非线性模型的可辨识性测试已经提出了许多方法,但没有通用方法适用于所有的非线性情况,且很难事先选择最合适的方法[54],对这些方法的具体学习可以参考引言中相关文献和较新的对可辨识性分析方法的综述文献[86–88].以下对几种方法的特点作简要总结: 输入输出方法和局部同构方法通常可以推导出充要条件,其中输入输出方法适用于多项式或有理函数的模型,通过利用符号计算工具,其在大型动力系统的(局部)可辨识性分析上有较高的效率,但可能不适用于处理给定初始条件的可辨识性问题.局部同构方法在给定初始条件下仍然有效,但可能会带来较大的计算量.输出相等方法,如泰勒级数和生成序列方法,可以处理给定初始条件下的可辨识性问题,但需要函数可导的相关条件,可能需要求解复杂的代数方程,因此这些方法可能仅适用于小规模的系统,通常只能得到充分条件.
3.2.2 时变系统
时变模型在生物系统[72]、信息物理系统[65]等实际系统的建模研究中很重要.大部分非线性时不变系统的可辨识性分析方法也适用于时变系统[14,24–25,72].
最初时变系统的可辨识性问题的研究较为局限,主要取决于可获得的先验信息量,如参数时变特性等.学者们一般在参数的某些时变先验条件已知情况下分析时变系统的可辨识性[89–91].1982年,有学者开始研究自由变化参数的模型和离散模型的可辨识性.如Sufleta[92]在线性模型的参数周期性变化情况下研究了参数唯一辨识的充要条件.在连续的非线性情况下,Audoly等[72]在研究非线性生物系统全局可辨识性问题时,提出了测试非线性动力模型的全局可辨识性的算法,这种算法也可以用来测试时变模型.在离散线性时变模型中,Silvestre等[93]研究了绝对可区分性问题,研究得出了时变系统的可区分性的激励条件.
3.2.3 时间延迟系统
在实际建模过程中,数据测量、设备物理特性等因素可能造成信号的延迟.Nakagiri和Yamamoto[94]首次在时间延迟系统中提出了可辨识性问题.下面分别从线性与非线性来介绍时间延迟系统的相关研究.
在线性时延模型的可辨识性一般是在已知输入量某些先验条件的情况下进行的.非连续的控制输入描述如下
其中:0=τ0<τ1<···<τd为时间延迟;系统状态x(t)∈Rn;输出y(t)∈Rm;输入u(t)∈U1,U1为Rl的开子集;参数θ ∈Θ ⊂Rq;Ai∈Rn×n;Bi∈Rn×l;Ci∈Rm×n.
在自治系统中,Verduyn Lunel[95]利用算子理论,在已知特解的前提条件下研究得出了模型的可辨识性充要条件;在考虑输入时,研究表明弱可控性与可辨识性的联系紧密[96–98],进而Belkoura等[99]研究了输入信号构建,完成参数可辨识性分析的实用框架、Orlov等[100]研究了非光滑输入信号的构建,使系统传递函数可辨识.
研究非线性时延模型的可辨识性分析方法可从前文介绍过的泰勒级数法、生成序列法、微分代数法等扩展而来.如Denis-Vidal等[3]将文献[11]中的可辨识性分析方法扩展到时间延迟系统中,通过在平衡点线性化方法使得文献[100]中线性系统的可辨识结论可以使用,并在非线性时延的航空模型下得到了验证.Zhang等[42]在非线性时间延迟系统中类比定义了“几何可辨识性”、“代数可辨识性”、“给定初始条件的可辨识性”等可辨识性概念,并提出了这些概念的特征和判定标准,研究了时间延迟系统中这些概念的相互关系.
随着研究对象越来越复杂,许多复杂的系统可以被建模为动力学网络,如生化反应过程、关键基础设施、社交媒体和无线网等[62].动力学网络由系统状态、外在激励与噪声的相互关系构成,它不仅可以用来描述子系统之间的互相作用,还可以表示节点信号的因果推断关系,下文将其简称为网络.
网络模型由状态空间模型引申而来.考虑部分状态观测的系统,描述如下:
其中:x(t)=[yT(t)zT(t)]T∈Rn是系统全状态量;y(t)∈Rm为观测状态;z(t)∈Rn-m为隐藏状态;u(t)∈Rr是系统输入量;A∈Rn×n;B∈Rn×l;C=[I0]∈Rm×n为系统矩阵,这里I∈Rn×n为单位矩阵.该动力系统的完整网络结构,即描述输入变量和状态变量之间因果关系的图,可以从系统矩阵A和B中得到.当部分状态量可测,Gonc¸alves和Warnick[101]引入了不含隐藏状态结构信息的动力学结构函数(Q,P)表示输入和观测状态的因果关系,作为该系统的动力学结构表示.记Y,Z,U分别为y,z,u的Laplace变换,则系统的输入输出可以由网络结构完全解耦的系统来描述,得到
其中:Q∈Rm×m为Yk到Yj(1≤k,j≤m,k≠j)的转移函数的矩阵,P∈Rr×m表示Uk到Yj(1≤k≤r,1≤j≤m)的传递函数的矩阵.经过一些学者研究和讨论,网络模型演化为一般的因果线性传递模型,节点代表测量的内部信号,节点间的有向边代表信号传递,模型描述如下:
其中:w(t)∈Rn为节点信号;r(t)∈Rl为激励信号;y(t)∈Rm为观测节点信号;v1(t),v2(t)∈Rn为噪声信号;R(q)∈Rn×l为激励矩阵;C∈Rm×n为观测矩阵;G(q)∈Rn×n为传递矩阵;q-1是单位延迟算子,即q-1w(t)=w(t-1).
除此之外,还可以将每个子系统视为节点进行网络动态描述.针对由N个子系统构成的线性时不变网络化动态系统,其第i个子系统可以如下描述[102]:
其中:δ(·)为函数对时间的求导算子或前向时移算子,x(t,i)为第i个子系统于t时刻的状态向量,v(t,i)和z(t,i)为第i个子系统于t时刻的内部输入/输出向量.记v(t),z(t)为网络中内部输入和输出向量,子系统之间的连接可以如下表示:
其中Φ为系统连接矩阵,描述了节点之间的相互作用.网络的拓扑结构为:以每个子系统为节点,系统连接矩阵的非零元素为边来构建的图模型.许多学者对该类模型进行了深入的可辨识性研究,如针对能否从数据中发现微分代数方程网络中的相互作用的问题,文献[103]得到了与网络的拉普拉斯矩阵的特征向量相关的条件.在子系统之间特定连接的情况下,即Φ满足一定条件,文献[102]理论提出并数值验证了网络拓扑结构的全局可辨识的充分必要条件.
由于实际情况下网络结构和动态规则是未知的,从观测的时序数据中恢复网络结构,是动力学网络研究中的一个重要研究课题,称为网络重构.网络的可辨识性(可重构性)是指利用节点信号和激励信号等测量数据能够唯一重构一个模块或整个网络结构的性质.若需重构部分网络或整个网络,必须要满足可辨识性的相关条件.因此越来越多的学者对网络的可辨识性研究感兴趣.
相对于动力系统的可辨识性概念,动力学网络的可辨识性概念内涵更为复杂,不仅包括网络模型参数的唯一性,还包括网络拓扑结构的唯一性.其具体定义和总结可见文献[104]第2章.影响网络可辨识性的因素包括网络拓扑结构、外部激励信号的性质和位置以及被测节点信号的选择.针对以上影响可辨识性的因素,许多学者开展相关研究工作,研究问题包括空间信息缺失的网络可辨识性问题[15,62,101,105–114]、考虑局部网络恢复的模块可辨识性问题[115–119]、时间信息缺失的可辨识性问题[49]、噪声引起的可辨识性问题[120–121]等.
2008年,Gonc¸alves和Warnick[101]发现在网络部分状态可测情况下相同的传递函数可能对应不同的网络结构,即存在传递函数揭示的网络结构信息量少的问题,他们研究并描述了恢复线性时不变动力系统中网络结构所需的额外信息.自此许多学者开始进行网络的可辨识性研究,比如Yuan等[121]在Gonc¸alves和Warnick的研究基础上考虑额外的噪声,计算了辨识网络结构所需的测量数据与特定网络结构生成数据之间的最小距离.此外,许多学者针对网络中感兴趣模块的辨识问题展开了研究工作,如Weerts等[116]提出了“模块可辨识”的定义,并研究了模块可辨识性的拓扑条件,Shi等[119]提出了分配激励的方法等.
本节主要针对方程(7)–(8)描述的网络可辨识性研究进行介绍,其通常在4 种网络环境下进行讨论,即全部节点观测时部分节点激励(C=I,B≠I)、全部节点激励时部分节点观测(CI,B=I)、部分节点激励和部分节点观测(CI,B≠I)以及全部节点观测的自治系统(C=I)这4 种情况.
1)全观测部分激励系统(C=I,BI).
在全观测部分激励的情况下,许多工作研究了保障可辨识性的激励条件.例如Cheng等[113]研究了网络可辨识的激励节点的条件,得出在非连接集的顶点分配激励的结论,并提供了合成方法来分配激励,以及Weerts等[109]考虑了干扰信号影响下,可辨识性对激励信号的要求.
2)全激励部分观测系统(CI,B=I).
在全激励部分观测的情况下,相应地可以研究网络可辨识的观测条件.例如Nabavi和Chakrabortty[15]针对加权一致网络提出了全局可辨识的图论条件,并研究了传感器的放置方式,Hendrickx等[106]针对已知拓扑结构的网络,研究了部分节点可测和激励信号已知的条件下恢复整个网络结构的的图论条件,进而可以分配观测节点.
3)部分观测部分激励系统(CI,B≠I).
当综合考虑以上两种因素,即部分观测和部分激励的情况,许多学者研究了实际因素影响的可辨识性问题,如Hayden等[120]考虑了本质性噪声(输入)的网络可辨识性,即研究未知的噪声作为输入时的可辨识性条件.除此之外,一些学者提出分配激励和观测信号的方法.如Bazanella等[122]对通用可辨识性的观测和激励条件进行了研究,得到了辨识给定边集的条件,即与需要辨识的边相连的节点必须是被激励的或被测量的,或者同时被激励和测量.Cheng等[123]提出了在激励或分配的个数限制下,在完全测量或激励的网络中分配激励或测量的算法.
4)全观测的自治系统(C=I).
在全观测自治系统情况下,学者们不再讨论空间信息缺失对可辨识性的影响,转而讨论时间信息缺失带来的可辨识性问题.由于测量数据始终是通过采样得到的离散值,往往会损失系统动态信息,因此对时间上的采样问题带来的可辨识性问题也逐渐受到学者们的关注.2013 年,Bennett等[21]在研究环境模型的性能时提出了采样慢带来的混淆问题,并说明反馈的存在可能可以提高可辨识性.2020年,Yue等[49]考虑了时间上数据信息缺失对线性时不变网络的可辨识性带来的影响,首次定义了低采样率造成的“系统混淆”概念,利用矩阵理论、连续时间状态空间模型和离散时间状态空间模型之间的系统矩阵关系进行研究,得到了最小采样频率的结论.该结论与连续系统矩阵特征值的虚部密切相关,即特征值虚部绝对值的最大值与采样频率最小值成反比,与特征值虚部与系统振荡特性相关的研究成果相符.这启发了在数据的本身特性的约束下进行可辨识性理论研究的思路.
系统辨识是许多研究领域普遍而基本的问题,可辨识性是进行辨识必须满足的模型性质.本文围绕着可辨识性概念发展和相关研究工作进行综述,分别在线性系统、非线性系统与时变系统、时间延迟系统和动力学网络中阐述了可辨识性的主要问题,对相关结论进行了简单的总结,介绍了可辨识性分析经典方法.虽然国内外众多学者对动力系统可辨识性问题的研究已经取得了一系列重要进展,但由于实际系统具有未知性,测量数据具有不连续性、异构性等,目前的研究成果还存在着很大的局限,很多有意义且具有挑战性的问题还需要进一步深入研究,如保障可辨识性的“合格数据集”研究.
由于数字化时代下海量数据在各行业得到了广泛应用,保障可辨识性的数据条件研究将更加关键,即在具体背景或系统中研究具有辨识价值的数据所需的特性,以完善可用的“合格数据集”的标准.因此,考虑具体数据特性的可辨识性分析将受到更多关注,如Yue等[49]研究的问题,针对某个线性系统的离散采样数据,采样频率需要满足什么条件才是“合格”的.这引发思考,在含噪声的测量数据中,噪声的统计特征需要满足什么条件才是合格的;以及非线性系统下的情况.传统可辨识性分析方法可指导采集空间信息充分的数据,但由于这些方法一般需要借助导数、微分等方法,难以用于考虑数据离散性的可辨识性研究.为了考虑这些问题,必须扎根数学的土壤,将实际问题与数学理论联系在一起,即在数学定理中寻找能够解决实际问题的对应,求证在实际情况下能否满足所需的数学假设,或寻求构建实际条件的方式来满足数学前提条件,再将数学描述的解转化为实际背景下的物理解释.因此,随着新的时代需求出现,可辨识性也会出现新的问题和挑战需要解决和克服.