张佳琛,郭庆来,王志伟,孙 勇,李宝聚,尹冠雄,孙宏斌
(1.清华大学 电机工程与应用电子技术系,北京 100084;2.国网吉林省电力有限公司,吉林 长春 130012)
传统的电力系统、供热系统、天然气系统通常独立规划运行,彼此间缺乏协调,存在能源利用效率低、故障跨系统蔓延等问题[1]。随着现代工业生产中各类能源转换设备的快速发展与部署,不同能源子系统间的耦合进一步增强[2]。为了更高效地实现对能源系统的调度优化,学者们提出了电、气、热、冷集成的综合能源系统(integrated energy system,IES),能有力推动能源系统低碳化转型[3]。
为了保证IES 的安全、可靠、优质、经济运行,需要建立对多能流统一管理和科学调度的IES 能量管理系统。IES 能量管理系统的运行依赖于对IES 全面、实时的精确感知,因此需要引入IES 状态估计。IES状态估计对原始量测数据进行滤波,剔除量测数据中的坏数据,为IES 能量管理系统提供数据基础。在IES 状态估计中,热网状态转移过程由偏微分方程(partial differential equation,PDE)描述,其时间常数远大于电力系统。因此,热网动态状态估计的主要难点在于PDE 实时求解。根据简化方法的不同,衍生出了不同的模型驱动方法。文献[4]使用节点法,将管道中的水流划分为质块,以质块的流动来模拟管道的热动态过程,而无须进行空间上的差分。文献[5-7]使用差分法,将管道内的动态过程进行不同格式的离散,将无穷维的函数空间的优化转变为有限网格点中的优化。文献[8-9]使用能路法,将时域中的非线性关系转换为频域中的线性关系,显著加快了计算速度。基于以上简化模型,文献[10-11]类比电力系统传统状态估计方法,使用加权最小二乘法构建了多能系统的优化问题。文献[12-13]将管道动态方程差分后得到一组线性方程,进一步运用卡尔曼滤波器对管道内部温度/流量进行动态估计。已有的研究对热网状态估计做出了巨大的贡献,但是仍然存在着以下的不足。
1)考虑热网动态特性时必须引入PDE。依赖差分法的动态估计模型,计算精度取决于PDE 的差分格式和差分步长的选取。为了保证实时计算效率,差分步长往往较大,这将产生较大截断误差[5]。
2)在已有研究中,往往需要热网提供全量测配置[14],同时要求所有的量测完全同步[15],否则需要进行插值处理,这使得已有方法在实际的应用中受到了限制。
3)模型驱动方法对参数依赖性较高。当前关于热网参数的不确定性和校准方法的研究都非常有限[16],所以当热网提供的模型参数不准确或缓慢时变时,将显著影响估计精度。
4)已有热网状态估计方法的坏数据辨识主要借鉴电力系统中的最大正则化残差法[17],并未考虑热网慢动态特性下部分状态变量的可预测性对坏数据辨识的作用。
神经网络等数据驱动方法具备从数据中发现信息的能力。文献[18-19]利用多任务学习和长短时记忆网络,提升了IES 负荷预测精度,且通过与已有模型结合,能得到更加有效的结果。文献[20]提出了一种物理信息神经网络(physics-informed neural networks,PINNs),巧妙地将已有的PDE 模型融合到神经网络的训练之中,实现对PDE 的求解。实际物理系统因为数据获取成本较大,能获得的数据集往往较小,而PINNs 能够用较小的数据集进行高效训练,在实际应用中具有优势。电力系统中发电机的运行也通过微分方程来描述。文献[21]首次将PINNs 应用于电力系统,通过该方法成功预测了发电机暂态过程中的转子角,并实现了对系统惯量和阻尼系数的识别,取得了良好的研究成果。随后,文献[22]在此基础上进一步构建了基于PINNs 框架的机器学习方法,将其应用于电力系统稳定性分析。
本文结合已有热网模型,提出了基于PINNs 的热网动态状态估计方法,本文的创新点归纳如下。
1)构建了基于PINNs 的热网状态估计模型,将带PDE 约束的优化问题转化为神经网络的训练问题。后者避免了对PDE 的简化,能够得到更精确的结果。同时PINNs 的损失函数也是待辨识参数的函数,将热网参数辨识过程和损失函数优化过程相融合,实现了对参数的实时辨识校正,降低了对模型参数的依赖性。
2)提出了一种滚动时域热网动态状态估计方法,实现相邻时间窗的内部变量初值和神经网络参数的信息传递,使基于PINNs 的热网状态估计模型能够应用于在线实时估计,并适应不同量测配置与量测频率,动态追踪热网状态量的变化。
3)提出了一种基于PINNs 预测能力的高效坏数据辨识方法。通过扩展PINNs的PDE 配置点的时间范围,使得通过训练得到的模型具有对未来一段时间状态的预测能力。通过对比预测值和量测值完成坏数据的辨识,提高了坏数据辨识的效率。
PINNs 是一种求解监督学习任务的神经网络,可以作为非线性PDE 求解器。一般使用的神经网络通过大量的输入和输出数据来训练得到直接的映射,但是并不会用到某些领域中的先验知识。PINNs 的核心思想在于将已有的PDE 模型编码到学习算法中,这将增强神经网络从数据中获取信息的能力,使其能够更快逼近真实解并在训练数据较少的情况下具有良好的泛化性。
对于一般形式的PDE,可以用式(1)表示。
式中:t为时间变量;x为空间变量;u(t,x)为隐式的解;N[u(t,x)]表示对u(t,x)进行的各种非线性运算;Ω为空间位置的边界;[0,Tw]为时间范围。大多数的PDE 无法获得解析的u(t,x),可以利用神经网络U(t,x)这一通用函数近似器来逼近u(t,x),U(t,x)的表达式如下:
式中:U(t,x)共有D层(不含输入层);“∘”为复合函数算子;Lk(zk-1)(k=1,2,…,D)为仿射变换,将k-1层的输出zk-1使用权重wk和偏置bk仿射变换为k层非线性激活函数σ的输入,通过式(4)计算得到k层的输出zk,而z0是输入的(t,x)。激活函数的非线性赋予了神经网络强大的函数表达能力。
自然地,U(t,x)在近似u(t,x)的同时,也应满足对应的PDE。由于U(t,x)具有显式的函数表达式,可以获得解析的对t和x的偏导数。在主流的机器学习库如torch 库中,神经网络结构以计算图的形式存储,自动微分技术使得求取神经网络对输入的偏导数变得非常便捷。因此,用U(t,x)近似u(t,x)时在PDE 中的失配量f( )t,x如式(5)所示,具体而言,f(t,x)可以通过torch库中的autograd函数计算得到。
大多数情况下,u(t,x)不具有解析的表达式,所以只能通过差分得到数值导数。热网动态状态估计是带PDE 约束的优化问题,因此,常规做法需要使用差分法处理PDE 约束,得到大量需要求解的状态量和线性方程约束,最后通过求解优化问题得到状态量的估计值。而PINNs 的巧妙之处在于使用U(t,x)近似u(t,x)后获得了解析的导数,在不依赖差分的情况下天然内嵌了PDE 约束,从而将带PDE约束的优化问题转化为神经网络的训练问题,后者依赖于机器学习的优化器,求解更为容易。
传统差分法将偏导数转化为数值导数。在本文应用中,时间步长取值即为量测间隔,考虑热网的实际量测配置,这一取值往往较大,同时为了保证差分稳定性,空间步长取值也不会太小,这增加了数值方法计算的截断误差,影响整体计算精度。而本文方法使用了神经网络的解析导数,从而避免了这一截断误差,能获得相对更高的精度。
PINNs 示意图如图1 所示。图1 的左半部分是全连接神经网络,输入为归一化后的时间和空间坐标,经过由权重参数、偏置参数和非线性激活函数组成的多层隐藏层后,输出得到神经网络的计算结果U(t,x)。
图1 PINNs示意图Fig.1 Schematic diagram of PINNs
而PINNs 与一般神经网络的主要差异在于损失函数的构造。由于适定的PDE 需要给定边界条件,所以神经网络U(t,x)的训练损失来源于两部分:边界采样数据和PDE 约束。其参数可以通过最小化式(6)—(8)所示的均方误差学习得到。
式中:L为总损失函数;δ为权重系数;为U(t,x)的边界采样数据,其中i=1,2,…,Nu,Nu为边
界采样总数;Lu为边界采样数据的训练误差;为f(t,x)的PDE约束配置点,其中i=1,2,…,Nf,Nf为配置点总数;Lf为在有限个配置点处根据PDE 计算得到的失配量。文献[23]指出PDE 中存在不合理的系数时,方程呈现病态。训练过程中,损失函数对不同的损失项的梯度差异较大,导致其对初值和边界条件满足情况较差。所以在式(6)中引入权重系数δ,将不同损失项对参数的梯度平衡到接近同一数量级,提升训练效果。
在将2种类型的损失项加权求和后,通过图1下半部分所示的梯度下降方法完成对参数θ的训练更新。在torch 库中内置了各种参数更新的优化器,本文使用其中的L-BFGS优化器,学习率设置为1。
另外,PINNs 对噪声数据输入具有较强的鲁棒性。一方面,由于训练神经网络的损失函数中包含边值条件和PDE 残差损失项,防止了网络对噪声的过拟合;另一方面,使用对神经网络的自动微分计算偏导数,而非使用含噪声数据的数值导数,避免了传统方法中低精度差分格式带来的不良影响。
一个典型的5节点热网拓扑及其参数见附录A,包括热源(热电联产机组)、热负荷(换热站)、供水和回水管道,供水网络和回水网络对称设计运行。
热网由水力系统和热力系统构成。目前广泛采用的调度方法为质调节,即在热源处只改变网路的供水温度,而网路的循环流量维持设计流量不变。同时,区域供热网中压力变化比温度变化的传播速度快了1 000 倍,在热动态过程中,水力工况可近似认为是稳态。综上考虑,水力系统和热力系统相对解耦,可以分别进行计算。因此本文的状态估计仅针对热力系统,并假设水力工况已知,在本文中考虑的量测配置对应为节点的温度量测和热源及热负荷的热功率量测。
1)普通管道建模。
尽管神经网络有着强大的模型表达能力,但是如果用一个神经网络构建整个热网量测量和状态量间的映射关系,则模型参数和约束都会过多,进一步引发收敛性和实时性的问题,所以为热网中每条管道构建各自对应的PINNs模型。
在忽略邻近流体间热传导项的情况下,一维动态热网管道的温度时空分布物理特性可以用如下PDE表示[24]:
式中:c为水的比热容;ρ为水的密度;A为管道横截面积;m为管道流量;T(t,x)为t时刻距管道首端x处的净温度,表示水温与环境温度差值;μ为管道散热系数。
对于非热源或换热站等效的普通管道,用深度神经网络u(t,x)近似T(t,x),即式(9)的解。同时,定义f(t,x)为给定方程式(9)等号左侧的式子:
2)等效管道建模。
对于连接供水网络及回水网络的热源和换热站,为保证拓扑分析的一致性,将其等效为管道支路处理。在热源和换热站中存在热功率量测,与温度的对应关系为:
式中:Φp(t)表示t时刻等效为管道p的热源或换热站的热功率,其值大于0 表示消耗热功率,反之则表示产生热功率;Tp(t,0)和Tp(t,1)分别为t时刻管道p在首端和末端的净温度。下文中,上标p表示管道p对应的相关变量。需要注意的是,在热功率计算中使用的温度为热源或换热站等效管道的首末端温度,而非节点温度。
热源和换热站等效管道并没有PDE 的约束,只有式(11)所示的线性等式约束,所以可以用较小的神经网络u(t,x),结合温度量测及热功率量测,近似时间窗内换热站首末端的温度变化。u(t,x)中t的取值同普通管道,但是由于等效管道不具有实际物理长度,x有意义的取值设定为0 和1,u( )t,x在这2 个位置的取值分别对应进入、离开热源或换热站后的温度。
在2.1 节中建立的模型仅针对单个热网管道或等效管道,而整个供热系统还存在其他用静态方程描述的约束,包括节点温度方程式(12)和汇流混合方程式(13)。类比式(6)—(8)构建的损失函数,这些静态方程也可以以损失函数的形式加入PINNs 的训练过程中,从而保证整个网络估计结果的合理性。
式中:N为热网节点集合;为从节点n流出的管道集合;Tn(t)为t时刻节点n温度,当节点存在量测时,温度也取该值为从节点n流入的管道集合;xe为管道长度。式(12)表示某节点流出管道首端温度等于该节点温度;式(13)表示当存在汇流节点时,节点温度等于汇流管道末端水流混合后的温度。式(13)等号左侧涉及多根管道的PINNs 模型,为了充分利用这部分量测数据,这些网络将共享损失函数。因此根据网络的拓扑结构,训练模式也分为对单个神经网络的训练和对多个神经网络的联合训练。
在拓扑识别中,首先识别有多根管道输入的汇流节点,若汇流节点存在量测,则所有输入该节点的管道的神经网络将进行联合训练,其余管道的神经网络将进行单独训练。
1)单独训练。
单独训练的损失函数由边值条件损失项(Lu)、PDE损失项(Lf)和温度差量测损失项(Lh)组成。
2)联合训练。
联合训练的损失函数由边值条件损失项(Lu)、PDE损失项(Lf)、温度量测损失项(Lh)和汇流方程损失项(Lk)组成。
在热网汇流节点处需要引入额外的约束。在汇流节点测得的温度不等于管道末端的温度,而是多根管道水流汇合后得到的温度。使用该点测得的数据来对流入管道的温度分布进行估计,应该利用式(13)这一代数方程约束对多个网络同时进行训练。对于汇流节点n所涉及的所有流入管道,它们除了自身的均方误差之外,还将共享利用汇流混合约束得到的均方误差,即Lk。
式中:tik为汇流节点温度量测时刻数据,i=1,2,…,Nk,Nk为温度量测时刻总数;μk为Lk对应的权重系数。
传统状态估计方法要求所有数据都有统一的时间坐标,对于时间不一致的量测数据,需要通过插值获得统一时间坐标的结果。而从Lu的计算式式(14)可以看出,对使用的样本数据ui并没有时间坐标统一的要求。由于PINNs 训练过程的本质是拟合最符合量测数据的连续函数,所以不需要提供同步的量测值,异步的量测数据对模型都有着修正的作用。这对于实际中量测时间或间隔不一致、量测延迟等问题有着很好的适用性。
对损失函数做进一步的讨论,可以发现用PINNs 近似状态变量时,Lu相当于原状态估计问题的优化目标,Lf相当于PDE 约束,Lh和Lk相当于其他伪量测约束。PINNs 的训练过程实际上是对这一优化问题的另一种求解思路。
当PDE 中含有未知参数时,通过观测数据进行参数反演被称为PDE 的逆问题。逆问题比正问题的求解往往更为困难,因为它要从有限的数据中直接推断方程的信息。微分方程参数反演的基本数值方法为构建待反演参数的最小二乘泛函,结合正则化技术,通过极小化来逼近原问题的解。但是传统方法存在的主要问题包括:正则化参数对拟合效果的影响极大,选择合适的正则化参数较为困难;求解该问题需要迭代优化,计算精度要求较高时产生的大量网格导致大量的计算开销;仅对特定逆问题的求解有效,并不是普适方法。
PINNs 为逆问题的求解提供了新的思路,它更自然地将数据融合到求解过程中,对PDE 正问题和逆问题的求解在形式上并无太大差别,适用范围更广,这正是其巨大优势之一。PINNs 在含噪声观测数据中依然能够发现最能拟合观测数据的PDE 参数,同时获得利用神经网络得到的近似的解。含有未知参数的PDE可以表示为:
式中:λ为f的未知参数。类似神经网络中的权重和偏置参数的训练方式,同样可以通过自动微分获得损失函数对λ的梯度,进而能通过梯度下降等方法训练得到估计结果。文献[20]指出采用PINNs 进行参数辨识时,其对噪声干扰有很好的鲁棒性,相较于高斯过程回归和稀疏回归有更好的效果。
文献[20]提出的PINNs 只是作为定边界条件下的PDE 求解器来使用。热网运行过程中节点温度都在实时发生变化,PINNs 训练的边界条件也在不断发生变化,模型需要实时训练。为了使PINNs 能够追踪热网状态量的变化,下面提出基于PINNs 的滚动时域动态状态估计方法。
定义时间窗为当前动态状态估计计算的时间范围。当出现新的量测时,时间窗需要不断向前滚动。定义时间窗窗宽为式(1)中的最长时间Tw,时间窗间隔为ΔTw。
在时间窗滚动的过程中,本次估计在中间某时刻的估计值将作为初值提供给下一次的估计,从而保证了估计的连续性。
式中:Tn(0,x)为第n个时间窗0时刻距管道首端x处的边界采样数据;un-1(ΔTw,x)为第n-1 个时间窗ΔTw时刻距管道首端x处的状态估计结果。
在热网量测有限的情况下,动态状态估计的冗余度体现在时间窗窗宽Tw的选取上。随着Tw的增加,历史量测断面逐渐增多,通过PDE 产生的时空耦合约束也随之增多,相应的测量冗余度也会提高,计算效果更佳。而时间窗窗宽Tw的选取涉及权衡取舍的问题。一方面,时间窗太短会导致时间窗中训练数据不足,难以反映PDE 所描述的热动态特性,影响计算精度;另一方面,时间窗太长会导致训练代价增加,而且在时间窗内可能出现的参数变化会导致参数辨识精度降低。所以需要在保证估计精度的情况下,根据热网运行周期选择尽可能短的时间窗。
借鉴迁移学习中的经验,PINNs 的训练同样也不需要在时间窗滚动后随机初始化全部参数重新训练。由于热网温度变化较慢,所以相邻时间窗的边值条件相差较小。当前时间窗网络参数初始化过程中,直接使用上一个时间窗训练得到的网络参数,将显著加速PINNs 的实时训练过程。滚动时间窗PINNs状态估计示意图如图2所示。
图2 滚动时间窗PINNs状态估计示意图Fig.2 Schematic diagram of rolling time window PINNs state estimation
神 经 网 络u(t,x) 的 默 认 输 入 范 围 是x∈Ω,t∈[0,Tw]。但在实际过程中,由于热惯性的存在,当管道首端温度发生变化时,并不会即时影响末端的温度变化。换言之,通过添加Tw<tf<ξTw(ξ>1)的PDE 约束配置点训练得到的模型,当u(t,x)中的输入为Tw<t<ξTw时,仍然能得到准确的结果。
温度变化的传递伴随着热水质块的流动,所以PINNs 能预测的时间范围可以由流速大致估计得到。定义管道的特征时间函数,即热水从管道首端流到距首端x处的时间t(x)为:
为了使模型具有预测能力,PDE 约束点取值范围变为xf∈Ω,tf∈[0,Tw+γt(xe)],其中γ>1,为保证计算精度而留有一定安全裕度。
状态估计的另一个重要作用是辨识坏数据。考虑实际过程中容易出现的2 类坏数据:由于仪表故障、通信干扰等导致的较大的量测误差;由于数据丢失导致量测值为0或丢失。
在4.1 节中,PINNs 方法通过对PDE 约束点的配置,在当前时间窗实现了对下一时间窗状态量的预测。当下一时间窗的量测与基于这一预测步的结果之间存在较大的差异时,可据此完成坏数据的辨识。该坏数据辨识算法基本示意图及流程图见附录B。
在传统电力系统状态估计方法中,先进行状态估计,再利用正则化残差法剔除坏数据。循环以上过程,直到没有新的坏数据产生或达到迭代次数上限。由于本文方法对新的时间窗内量测的变化已经有了一定的估计,可以设定一个阈值,将预测和量测之间的绝对值误差超过阈值的量测判定为坏数据,在训练前就进行剔除,这样避免了多次状态估计的重复计算,同时对多种坏数据的形式都有较好的滤除作用。阈值的选取可以根据概率分布的参数选择。假设噪声服从高斯分布时,可以根据历史经验确定噪声大致分布的方差,进一步根据期望置信度得到的分位数确定门槛值。
但这种预测能力仅限于流入管道不含热源/换热站等效支路的节点,这类节点量测定义为Ⅰ类节点量测,其他节点量测定义为Ⅱ类节点量测。Ⅰ类节点在新的时间窗内的预测值可以用上一个时间窗内得到的PINNs 模型直接计算得到;Ⅱ类节点预测通过等效支路相连的Ⅰ类节点预测叠加热源/换热站的热功率量测得到。由于热功率量测中可能含有噪声,所以Ⅱ类节点对于坏数据的判定范围也会相应增大。
下面首先使用5 节点算例验证本文方法在动态状态估计、参数辨识及坏数据辨识方面的有效性,5节点算例拓扑及参数见附录A。算例数据和神经网络的参数设定见附录C。同时,使用量测误差统计值和估计误差统计值来表征状态估计的性能。
量测误差统计值可以表示为:
估计误差统计值可以表示为:
式中:N为蒙特卡罗仿真次数;l为时间窗内量测的数量;分别为第n*次仿真中第i个量测值、估计值和真值;σi为第i个量测值量测误差标准差。
由于假定量测噪声服从高斯分布,所以SM的值接近于1。因此,可以用SH/SM来评价状态估计性能,该值小于1 表示进行状态估计后效果优于不进行状态估计,并且该值越小,状态估计效果越好。
本文仿真程序均基于Python 编写,处理器为Intel®CoreTMi5-8279U@2.4 GHz,8 GB内存。
考虑非全量测配置情况,在节点0、1、3 — 5、8、9引入温度量测;在所有热源/换热站等效支路设置热功率(温度差)量测。通过拓扑分析得到的估计方式为:管道0、3、4、6 — 9 单独训练;管道1 和2、5 和11、10 和14、12 和13 联合训练。同时考虑量测并不同步,节点1 量测间隔设为80 s,节点4 量测间隔设为90 s,其余节点量测间隔设为60 s。温度量测中加入了标准差为0.35 ℃ 的高斯噪声,温度差量测中加入了标准差为0.14 ℃ 的高斯噪声。
图3 展示了经过100 次蒙特卡罗仿真后的不同时间窗的SM、SH计算结果。全时间段SH/SM的平均值为0.124 2,同时相较于差分法的状态估计结果,本文方法有着更低的SH,验证了本文方法具有很好的状态估计精度。另一方面,本文方法在不同时间窗计算得到的SH一直在较低的值附近波动,没有出现较大的偏移,验证了本文方法在不同样本数据下能够得到相似的状态估计精度。
图3 蒙特卡罗仿真误差统计值计算结果Fig.3 Calculation results of Monte Carlo simulation error statistics
基于本文方法得到的部分估计结果与含噪声量测和真值之间的对比如图4 所示。可见本文方法得到的估计结果与真值基本一致。而且在非全量测配置的情况下,节点2、6、7 的温度不能直接通过量测得到,本文方法可以根据历史数据并结合热网模型,准确推断得到非量测配置点的温度动态。
图4 部分节点状态估计结果Fig.4 State estimation results of certain nodes
本文方法同时提供了管道内部任意时空的温度估计。图5 展示了管道0 内部全时空分布的温度估计结果与真实分布的对比,估计绝对误差最大值为0.208 22 ℃,平均值为-0.000 56 ℃,可以发现本文方法对内部不可观变量有着非常准确的估计结果。
图5 管道0内部温度估计结果Fig.5 State estimation results of internal temperature in Pipeline 0
在计算效率方面,由于滑动时间窗之间参数的传递,相比于全随机初始化效率更高。平均每次时间窗估计时间约为10 s,远小于时间窗之间的间隔,能适用于在线应用的需要。并且表征不同管道的神经网络在没有伪量测生成的依赖时,能够并行训练,计算的时间将进一步降低。
1)恒定参数辨识。
仍然使用5.2 节中的5 节点算例,温度量测中加入了标准差为0.10 ℃ 的高斯噪声,温度差量测中加入了标准差为0.10 ℃ 的高斯噪声。首先指定辨识参数为各管道中的流量。由于水力工况已知,所以此处流量被视作热网动态状态估计的模型参数而非状态量。
在参数估计中一方面需要更多的数据对参数进行拟合,所以将估计的时间窗从原来的2 h 延长为4 h;另一方面需要神经网络有更强的函数逼近能力,所以在神经网络层数不变的情况下适当增加了每层神经元的个数,设置为每层有15 个神经元。网络模型使用的流量初值均指定为100 kg/s。
下面对比在模型参数不精确的情况下,本文方法与基于差分法的动态状态估计结果。以供水网络中的管道为例,差分法计算中给定的流量参数均为真值的70 %。
部分节点的估计结果如图6 所示。可见本文方法在提供参数不准确的情况下较好地追踪了热网状态量的变化。而差分法则由于对参数的强依赖性,给定流量参数比真值偏小时,整体估计结果向右偏移,计算结果出现较为明显的偏差。
图6 不精确参数下状态估计结果对比Fig.6 Comparison of state estimation results under imprecise parameters
恒定参数辨识结果如图7 所示。可以看出即使指定不精确参数初值离真值较远,本文方法依然较好地追踪到了网络参数。这说明本文方法能够自适应修正网络参数,相较差分法可以得到更好的估计结果。
图7 恒定参数辨识结果Fig.7 Identification results of constant parameter
2)时变参数辨识。
本文方法也可适用于辨识缓慢时变的参数。辨识结果为时变参数在时间窗内变化的平均结果。以单根管道为例,取5 节点热网中的管道0 估计,管道流量缓慢时变。
时变参数辨识结果如图8 所示。可见本文方法依然较为准确地追踪了参数的变化,最大相对误差为7.06 %,平均相对误差为0.49 %。从信息的角度出发,时变参数在分立时刻提供了不同值对应的信息,要从观测数据反演每个时刻时变参数的准确值几乎是不可能的,所以本文方法提供了相对折中的方案。
图8 时变参数辨识结果Fig.8 Identification results of time-varying parameters
坏数据辨识仍然使用5.2 节中的5 节点算例。在每个节点全时间段(00:00 — 24:00)共1 440 个量测数据中,随机选择20 个数据更改为坏数据。坏数据中有1/3 的概率为0 值量测(表示丢失量测);有1/3 的概率额外引入了1.75~2.8 ℃ 的较大噪声;有1/3 的概率额外引入了-2.8~-1.75 ℃ 的较大噪声。坏数据辨识阈值设定为1.4 ℃,部分温度量测坏数据辨识结果如图9所示。
图9 部分温度量测坏数据辨识结果Fig.9 Bad data identification results of certain temperature measurements
进一步,定义坏数据检测指标如下:
式中:P为查准率;NTP为所辨识坏数据是预设坏数据的数量;NFP为所辨识坏数据不是预设坏数据的数量;R为查全率;NFN为未能辨识的预设坏数据数量。查准率表示判定正确结果占判定结果的比例,而查全率表示判定正确结果占预设结果的比例。
本文方法在所有等效节点辨识结果如表1 所示。可见本文方法针对坏数据辨识的查准率和查全率都有很好的结果。事实上,额外判定的坏数据也往往与真值相差较大,可以认为是量测质量较低的数据,在坏数据检测部分剔除反而可以提升估计的精度。
表1 坏数据辨识对应指标计算结果Table 1 Calculation results of indicators of bad data identification
为了进一步验证本文方法对坏数据的辨识能力,更改上述算例中的坏数据占比,并进行100 次蒙特卡罗仿真,辨识结果如表2 所示。可以看出,随着坏数据占比的增加,查准率变化幅度较小,保证了坏数据辨识的正确性。另一方面,随着坏数据占比的增加,查全率有所下降,这是由于坏数据占比的增加减少了用于估计的合理数据的数量,导致估计效果下降,坏数据辨识范围更加模糊。整体而言,SM随着坏数据占比增加显著增大,而SH依然保持在较低的水平,这说明在坏数据占比较高的情况下,本文方法依然有效过滤了量测噪声,保持着状态估计的精度。
表2 不同坏数据占比下的坏数据辨识结果Table 2 Bad data identification results under different bad data proportion
27节点热网测试算例结果见附录D。
热网作为IES 的重要组成部分,其状态估计结果的准确性将影响整个系统后续依赖熟数据的高级应用部分。本文构建了一种模型-数据联合驱动的热网状态估计方法,利用PINNs 和热网管道PDE 模型,建立了热网的滚动时域状态估计模型,准确感知管道内部温度变化情况。在此基础上,将其应用于热网的状态估计中,并且得到了较为准确的结果。同时验证了本文方法能够利用历史数据完成对热网管道参数的估计,能在运行过程中不断对模型内部参数进行修正,提升模型估计的精度。最后利用PINNs 的预测能力,实现了温度量测中对坏数据的更高效辨识。
实际上,在IES 中,同样极为重要的天然气系统管道运行中的压力和流量之间的动态关系也可以通过PDE 描述。因此,可以进一步扩展并适当修改这一方法,将其应用于天然气系统的动态状态估计中,从而为不同类型的能源系统提供更准确的状态估计,有助于优化能源系统的运行和管理。
未来的研究工作中,笔者将进一步在实际更大规模算例中对本文方法进行验证,以探究系统规模对计算效率的影响。并研究新的物理融合的模式,使本文方法能适应更为复杂的实际情况。
附录见本刊网络版(http://www.epae.cn)。