胡 阳,简睿妮,房 方
(华北电力大学控制与计算机工程学院,北京 102206)
随着国内经济的高速发展及人民生活水平的不断提高,全国集中供热面积与用热量同步快速增长.截止2020年底,我国北方供暖地区城镇集中供热面积已突破130亿平方米.为实现能源可持续发展,热电联产(combined heat and power,CHP)机组成为我国主要集中供热源.然而,CHP机组往往采用以热定电工作模式,且供热网在实际运行中表现出热电供需总量、空间、时间难以匹配的问题[1],节能减排潜力尚未充分挖掘.针对此现状,基于电力市场交易引入风电清洁供暖,构建以CHP机组为基础的电热协同利用系统[2],大力促进高比例风电并网消纳.
根据现有研究,CHP机组发电灵活性释放及风电促消纳往往归结为静态调度问题[3–5];然而,电热协同供给过程需充分利用供热灵活性,进一步释放CHP机组供电灵活性,故供热侧运行控制水平亟待提高,以通过更为精细化的方式改善供热过程控制性能,保证电热协同利用的经济性和环境价值.在此背景下,深入研究供热管网动态特性等值建模是解决上述问题的关键.
目前,数据驱动的热网动态建模方法通常采用黑箱模型逼近实际非线性动态,模型精度受限于训练数据量及其多工况均匀性,模型的全局适应性难以保证和评判,且黑箱模型可解释性差.此外,采用机器学习算法进行黑箱建模时,所得模型一般难以用于凸优化求解及稳定控制器设计.相对地,分布式参数机理建模复杂度较高,而集总参数机理建模精度受限,两者难以合理平衡建模复杂度与模型精度[6].针对上述问题,受分段仿射含输入自回归建模[7]方法启发,本文提出有限差分域–混合半机理(finite difference domain–hybrid semi-mechanism,FDD–HSM)建模方法.首先,简化供热管道的长距离、多高度、多管径和多拐头等复杂拓扑结构,基于供热管道热力输运原理推导其低阶等值机理模型结构,解决模型可解释性差的问题;然后,采用模型输入、输出变量及延迟阶次构建有限差分回归向量以考虑供热过程时延性;接着,利用热网实测运行数据进行高维聚类和超平面参数估计,对有限差分回归向量所张成的有限差分工作空间进行紧致凸划分,实现复杂非线性运行工况识别并得到若干有限差分工作域;此后,在各工作域内进行混合半机理(hybrid semi-mechanism,HSM)建模,增设偏差动态补偿项,以任意精度逼近不确定干扰下的实际运行动态;最终,形成FDD–HSM建模方法.
综上,本文针对复杂拓扑供热管道非线性动态逼近问题提出FDD–HSM建模方法,合理平衡建模复杂度与模型精度,实现了供热管道全工况下非线性运行动态的低阶机理线性等值;同时,提出有限差分域–自回归(finite difference domain-auto regressive exogenous,FDD–ARX)建模方法、有限差分域–长短期记忆(finite difference domain-long short-term memory,FDD–LSTM)神经网络建模方法进行对比;最后,基于某供热管网运行数据进行验证分析.
根据现有研究,集中供热网的热量传输动态及蓄热状态是电热协同控制的核心,其直接决定对随机性风电的兼容及对CHP机组发电灵活性的释放;围绕集中供热网络,可通过开放式扩展得到不同电热协同利用模式.因此,集中供热系统在电热协同利用中扮演重要角色.然而,由于广域分布、拓扑结构复杂、本质非线性等因素,供热网络动态建模成为关键难点.
热网通过管道和热媒将热能输送到热用户,以如图1所示的供热管道为例,建立其偏微分机理模型.
图1 某段供热管道示意图Fig.1 Schematic diagram for a section of heating pipeline
供热管道的输出供水温度关于供水流量、输入温度呈非线性变化.针对其非线性关系可用如下公认二元偏微分方程描述:
其中:t为时间(s);x为管道某处相对于初始点的距离(m);Tw(t,x)为管道某处水温(℃);uw为水流速度(m/s);Tam(t)为环境温度(℃);α为管道中水流与环境之间的对流换热系数(J/(m2·℃·s);L为管道周长(m);F为管道横截面积(m2);cw为水的比热容(J/(kg·℃);ρw为水的密度(kg/m3).
对于长距离、多管径的复杂拓扑供热管道,建立如式(1)所示微元模型以表征微元管道的传热动态,采用分布参数法以不限数量的管道微元模型相连接[8],可建立长距离管道动态模型.采用式(1)进行热网建模,模型复杂度较高,模型参数辨识不易,且不利于后续优化控制设计.此时,若设定管道长度为x,通过偏微分方程数值求解得到管道输出温度的解析解如下:
其中:∆t为从初始点到距离x点的水温变化时延,仅当水流速度uw保持不变时,∆t=x/uw;当uw变化且难以准确估计时,若热网规模较大或管道距离较长,易产生较大动态累积误差,恶化模型精度.因此,式(2)仅能在uw不变时表征管道的稳态特性,但因其代数表达形式大大简化了基于节点法的热网集成建模复杂度[9],可在电热协同利用的可行性探索中得到广泛应用.
为简化模型结构并降低参数辨识难度,基于式(1)并采用集总热容法可得如下近似常微分方程模型[10]:
其中:管段中水热容量Cw=Fdcwρwuw(J/℃);d为管道长度(m);质量流量Qm=Fdcwρwuw(kg/s);管道传热面积St=Ld(m2).
模型(3)作为一种集总参数模型结构,等效参数易辨识;同时,长距离传热管道的水温时延动态特性可由常微分方程表征,并可转化为低阶状态空间模型结构,用于热网的优化控制设计等[11].同理,基于集总热容法可将该非线性常微分方程模型结构扩展至热源、换热器、用户等,实现对供热网络的整体等值.
所提出的FDD–HSM建模方法如图2所示.
图2 有限差分域–混合半机理动态等值建模方法Fig.2 FDD–HSM dynamic equivalent modelling method
实际供热网络系统运行易受外部环境、信号测量与传输等随机不确定性干扰影响.同时,系统性能劣化、缓变故障或突发故障等也会产生大量异常数据.这些数据与有效数据互相混合,一定程度上损害了数据质量,危害到数据驱动类应用结果的可靠性,故进行异常数据清洗等数据预处理是非常必要的.在此,提出随机抽样一致[12]结合多项式最小二乘拟合的数据预处理算法,对供热系统运行数据进行稳态检测与提取.该方法可解决多项式滤波算法无法有效检测、剔除局外点和噪声数据的问题.
随机抽样一致结合多项式最小二乘拟合算法应用于稳态工况提取的流程如图3所示.由式(3)可知,供热管道的非线性主要来源于随时间变化的瞬时流量Qm,故对瞬时流量提取稳态数据.提取稳态流量数据之后得到对应稳态标签,根据稳态标签寻找其他数据的对应稳态数据.首先,通过对一定窗口内瞬时流量数据进行随机抽样一致算法确定“内点”数,即实际需要的稳态数据;再通过最小二乘法拟合出窗口内的瞬时流量曲线模型(4)
图3 供热管道瞬时流量稳态数据提取流程Fig.3 Steady-state data extraction process of instantaneous flow for a section of heating pipeline
模型(4)有两方面的作用,一方面通过该函数对各采样点进行回归,得到抽取样本的滤波值;另一方面,该模型参数含有过程变量变化信息.表示窗口内均值大小,表示变量随时间变化的斜率,即变化的快慢.考虑供热网络运行过程的前提,通过曲线模型定义稳态判别指标:
1) 瞬时流量数据最小二乘拟合后曲线模型多项式滤波值的最大与最小值差值小于给定阈值;
2) 随机采样一致算法筛选出的“内点”的瞬时流量数据最大与最小值差值小于给定阈值;
3) 曲线模型P1系数小于给定阈值.
该稳态数据预处理算法具有较强的抗噪声和抗异常点干扰能力,可有效提高稳态数据提取质量并利于模型相关变量的运行工作域划分.流程如图3所示.
为明确线性模型适用的工作域,需合理划分非线性空间.基于所提取稳态运行数据,这里提出更为便捷、高效的数据驱动差分域划分方法.
考虑输入输出变量的延迟特性,建立有限差分回归向量xRV(k)=[yT(k−1)yT(k−2)··· yT(k−na)uT(k−1)··· uT(k−nb)].其中,y(k)为输出,u(k)为输入,na和nb分别为输入和输出的延迟阶次.
2) 特征向量和有限差分工作域个数的确定.首先,以数据点(xRV(k),y(k))为数据中心,建立局部数据集Ck[13].Ck包含数据中心与其邻近的c −1个数据点(xRV(j),Ck(j),y(j))(j=1,2,···,k −1).邻近数据点(xRV(j),Ck(j),y(j))应满足各点回归向量与数据中心−1)]T间具有最小欧氏距离.
基于Ck中的数据,利用最小二乘计算公式求其参数向量PVk;结合Ck中回归向量的均值Mk;两者共同构成特征向量FVk=[(PVk)TMk]T.
计算PVk的经验协方差矩阵Vk[14],并计算用于度量类内离散度的散度矩阵Qk[15]如下:
将特征向量视为服从高斯分布的随机向量,则特征向量的协方差估计为Rk=[Vk0;0Qk].依据高斯分布特性,特征向量取值为均值时置信度wk[16]为
最后,采用K-Means[17]算法对所有特征向量聚类,将特征向量代表的稳态数据划分成S组,即S个有限差分数据集.分别记作D1,D2,···,DS.
3) 有限差分工作域边界估计.基于数据驱动的模式识别算法估计各工作域的边界,即求取S组稳态数据集间的超平面.借助支持向量机算法[18]获取各超平面方程的系数.由于每类数据之间不一定可清晰划分,故采用鲁棒性和泛化能力更好的软间隔支持向量机算法[19],其优化目标为
其中:ϕ和g分别为切换面的法向量和偏移量;γ为惩罚系数,表征对于错分样本进行惩罚的程度,取值范围为(0,1);ζk为松弛变量,反映数据是否满足硬间隔约束yk(ϕTxk+g),主要对最大分类间隔和最少错分样本进行折衷考虑;yk是数据分类标签,有1和−1两种取值;m为用于分类的数据总数量.
求解上述软间隔优化目标即可得到最佳分割的超平面方程系数,各切换面组合构成有限差分工作域,便于后续动态子模型的切换应用.
定义1定义如下有限差分回归向量:
由变量xRV,i(k)(i=1,2,···,n)所围成的空间即为有限差分空间.ny和nu为输出和输入向量维数,xRV,i,min和xRV,i,max为变量xRV,i(k)的变化范围.
定义2第S个有限差分回归向量
由变量xRV,i,S(k)(i=1,2,···,n)所围成的空间即为第S个有限差分工作域.每两个有限差分工作域的交集为空,所有有限差分工作域的并集形成有限差分空间.xRV,i,S,min和xRV,i,S,max为变量xRV,i,S(k)的变化范围.
合理划分有限差分工作域后,在各工作域建立动态等值子模型,通过多个子模型线性动态特性逼近系统全局非线性动态特性.根据式(3),选取合适状态变量,建立供热管道的连续状态空间模型
由于式(10)中的系统状态量可观测,在各工作域内进行参数辨识,得到各机理子模型参数.水流速度uw和对流换热系数α可由对应工作域的瞬时流量和输入输出数据辨识得到.将上述连续状态空间模型离散化,得到其离散状态空间表达式
由于低阶等值模型对复杂非线性动态逼近精度有限,引入具有长时记忆功能且可处理时间序列建模问题的LSTM神经网络算法[20]对模型(11)偏差动态进行补偿.建立基于有限差分工作域划分的供热管道机理模型与LSTM神经网络模型结合的FDD–HSM模型.
其中f(kT)为偏差动态补偿项.
至此,得到具备任意精度逼近能力的FDD–HSM模型通用表达式,相关定义如下.
定义3供热管道FDD–HSM连续模型结构
其中:Ac,B∗,c,Cc,D∗,c和E∗,c为系数矩阵;zc为状态向量;qc为控制输入;wc为干扰输入;δc为偏差动态补偿项;yc为模型输出.
定义4将式(13)离散化,得到FDD–HSM离散模型结构
其中:Ad,B∗,d,Cd,D∗,d和E∗,d为系数矩阵;qd为控制输入;wd为干扰输入;δd为k时刻的偏差动态补偿项;yd为模型输出.
为与上述FDD–HSM模型对比,在各工作域分别建立数据驱动的FDD–ARX模型和FDD–LSTM神经网络模型,并比较不同建模方法的逼近精度.
根据供热管道机理先验信息确定两输入单输出,可得到供热管道的FDD–ARX模型辨识结构如下[21]:
同理,考虑系统输出相对于输入的延迟特性,确定FDD–LSTM神经网络算法的输入输出和各工作域训练数据与上述建模方法一致.最终,建立FDD–LSTM神经网络模型.
统一有效的性能指标已被用于不同研究结果的比较,明确的指标定义有利于评价建模方法的优劣性.所用常见指标为均方根误差(root mean squared error,RMSE)、平均绝对误差(mean absolute error,MSE)和平均绝对百分比误差(mean absolute percentage error,MAPE).评价指标数值越小,表明模型性能越好.
其中:ye为预测温度;y为实际温度.
后续仿真中,采用上述指标评价FDD–HSM、FDD–ARX和FDD–LSTM 3种模型对供热管道实际运行特性的逼近性能.
采用某供热网络集控换热站和热源数据共计10931 组作为建模数据,采样数据为Tin(t),Tam(t),Tout(t)和Qm,采样间隔为5 min,采样总时间长度约37天.所研究供热管网局部地理信息如图4所示,黄色管道为建模管道,管道总长6.468 km,存在多弯头、多高度、多管径等复杂拓扑结构.
图4 供热网局部地理信息图Fig.4 Local geographic information map of heating network
为保证数据质量和可靠性,对采样数据预处理,提取稳态数据用以差分工作域划分和建模.输入、输出数据为U(k)=[Tin(t)Tam(t)],Y(k)=Tout(t),如图5所示.
图5 用于辨识的系统输入和输出信号Fig.5 System input and output signals for identification
进行稳态数据提取,剔除2691组非稳态数据,剩余稳态数据如图6所示.按照稳态流量数据范围,划分两个稳态工况,作为后续建模所用.
图6 稳态处理后的系统辨识信号Fig.6 System identification signals after steady-state processing
在数据驱动下,对两个稳态工况分别构建回归向量.选择适宜的局部数据集c1=55,c2=25,计算对应特征向量并进行聚类,工作域个数分别为S1=3,S2=2.
其中,稳态工况1划分为3个有限差分工作域,稳态工况2划分为2个有限差分工作域.利用数据特征向量聚类对应得到Tin–Tam–Tout空间中数据的完整工作域,划分结果如图7所示,5种颜色分别标记各工作域.
图7 Tin–Tam–Tout空间的有限差分工作域划分Fig.7 Finite difference working domain partition of Tin–Tam–Tout space
基于各工作域稳态数据,首先对各工作域模型的对流换热系数α和瞬时水流速度uw参数辨识,再计算各模型其余参数,最后应用LSTM神经网络算法动态补偿,得到包含5个工作域的FDD–HSM模型,如下:
其中:XHSM(k+1)=Tout(k+1),UHSM(k)=[Tin(k)Tam(k)],fn(k)(n=1,2,···,5)为各工作域模型对应的LSTM神经网络偏差动态补偿项.
此外,建立FDD–ARX模型与上述FDD–HSM模型对比,简化描述FDD–ARX模型,如下所示.
其中:XARX(k+1)=Tout(k+1);UARX(k)=[Tin(k)Tam(k)c(k)],c(k)为常数干扰.
在各工作域内建立ARX模型和未考虑补偿项f(k)的低阶机理模型,检验两种模型的辨识精度.选取一组未参与建模的实际运行数据,对该数据稳态提取后对各模型进行验证.将两种模型的预测输出和实际输出相对比,如图8所示.
图8 低阶机理模型和FDD–ARX模型单工作域性能对比Fig.8 Performance comparison between low-order mechanism model and FDD–ARX model on single working domain
由图8可知,低阶机理模型和FDD–ARX模型的均方根误差分别为0.9483和0.4466,故FDD–ARX模型具有较好的跟踪性能,可实现更为精准的动态特性逼近;集总参数低阶机理模型可解释好,但动态逼近精度有限.故两者建模效果有所差异且建模精度有待提升.
分别建立FDD–ARX模型、FDD–HSM模型(已加入动态补偿)和FDD–LSTM神经网络模型,用同一验证集验证不同建模方法在某单工作域的预测效果,如图9所示.3种动态建模方法都能准确预测该工作域的输出趋势,且FDD–HSM模型精度相对于未加补偿时显著提高.
图9 单工作域下不同建模方法性能对比Fig.9 Local geographic information map of heating network
单工作域内各模型性能评价见表1,前两种模型的各性能指标相近,模型精确度较高.FDD–LSTM神经网络模型预测效果不如另两种模型,由于仅采用单工作域3570组数据,学习效果欠佳.
表1 单工作域下各模型性能指标Table 1 Performance indexes of models on single working domain
图10为多工作域切换时不同模型逼近性能的对比结果.3种动态建模方法不仅能准确地跟踪系统输出,还能克服工作域切换扰动,实现多工作域动态切换时的高精度逼近,达到了多个工作域子模型逼近全局非线性动态特性的目的.其中,从各工作域均匀采样并汇总,用于LSTM神经网络建模,提高建模样本量.由于训练数据充分,故学习效果良好,模型具有良好性能.
图10 多工作域不同建模方法性能对比Fig.10 Performance comparison of different modeling methods on multiple working domains
对多工作域切换时各模型评价指标见表2,结果表明在多工作域切换下各模型均保持较好的逼近性能,模型精度较高,均能实现良好的动态跟踪能力.
表2 多工作域下各模型性能指标Table 2 Performance indexes of models on multiple working domains
基于两台不同性能计算机测试一定时间段内不同模型多工作域切换验证时的计算速度,计算机1和2为AMD Ryzen 7 4800U (1.80 GHz 16.0 GB)和Intel (R)Core(TM)i7-8700 K CPU(3.70 GHz 16.0 GB).如表3所示.
表3 不同性能计算机的计算速度Table 3 Calculation speed on different computers
经上述仿真验证,表明了所提的供热管道FDD–HSM建模方法可合理平衡建模复杂度与模型精度,具有全局非线性工况下的高精度逼近性能和良好的可解释性.此外,基于数据驱动,所提出的供热管道FDD–ARX建模、FDD–LSTM神经网络建模方法也具备对复杂非线性运行动态的全工况高精度逼近能力,对于多节点动态传递网络系统建模具有巨大的潜在应用价值.基于3种建模方法各自特点,可应用至不同场合.
本文提出一种基于FDD–HSM模型的复杂拓扑供热管道动态等值建模方法.提出有限差分空间概念,采用高维聚类和超平面参数估计进行凸划分并得到若干有限差分工作域;在各工作域分别建立混合半机理模型,可实现对全局复杂非线性动态的任意精度逼近,通过实际运行数据验证了方法的有效性和准确性,得出以下结论:
1) 基于运行数据划分有限差分工作域,适用于应对全局复杂非线性问题,数据划分方法效率较高;
2) FDD–HSM建模方法可合理平衡建模复杂度与模型精度,模型精度高、计算速度快,所得线性低阶模型可广泛应用于控制设计、快速仿真与数值优化计算等领域,对于信息–物理融合具有重要支撑作用;
3) 基于有限差分工作域划分,所提出的供热管道FDD–HSM、FDD–ARX和FDD–LSTM 3种模型结构,均可实现复杂非线性运行动态的高精度逼近,适用于多节点动态级联下的区域热网动态建模,在电–热协同利用领域具有良好的应用前景.