数据驱动的蒸发器在线建模方法

2022-11-23 09:06丁绪东杨东润赵星凯

计算机与现代化 2022年11期

丁绪东，杨东润，刘慧，赵星凯，张迎，孙梅

(1.山东建筑大学信息与电气工程学院，山东济南 250101； 2.山东省智能建筑技术重点实验室，山东济南 250101)

0 引言

蒸发器是制冷系统核心部件，蒸发器的建模在制冷系统优化运行控制中起着至关重要的作用。由于蒸发器内的制冷剂通过相变进行换热，两相区与过热区的换热面积随工况条件实时变化，而2段区域的换热系数巨大的差异会引起蒸发器换热效率的巨大变化[1]。而在蒸发器的理论建模过程中，换热面积等几何参数必须预先给定，实时变化的2段换热区域的换热面积导致蒸发器的理论模型在实际应用中精度较差。因而在制冷系统优化控制中，往往采用基于数据的经验建模方法或混合建模方法对蒸发器进行建模。

经验建模方法不需要深入理解蒸发器内部的工作机理，而是利用蒸发器输入输出变量的数据建立模型的方法，其模型也称之为“黑箱”模型。张腾等人[2-3]模拟跨临界CO2热泵获得蒸发器侧的输入输出数据，并基于BP神经网络建立了制冷量的预测模型。张浩等人[4]基于“整数梯度下降”算法提出了蒸发器流路优化模型。

混合建模方法是经验建模和机理建模2种建模方法的有机结合，利用机理建模方法来构造模型的结构，利用训练数据来辨识模型的参数，既充分利用了2种建模方法的优点，又弥补了两者之间的缺陷。Xu等人[5]用物理建模和人工神经网络相结合的方法，提出了蒸发器和空调系统中各组件的混合模型，用于空调系统的优化控制。Ding等人[6]通过对蒸发器工作原理的分析，选取蒸汽压缩式制冷系统中易测量、可控制的变量作为模型的输入输出，基于能量守恒和质量守恒的基本定律建立了蒸发器的混合模型，模型辨识方法采用最小二乘法。Kong等人[7]基于蒸汽压缩式制冷系统中蒸发器及其他组件的混合模型[8-9]，提出了一种自适应的差分进化(SADE)算法用于系统的全局优化，从而在保证制冷量的情况下使系统能耗最小。

以上2种建模方法所建立的模型精度与参与模型参数辨识的观测数据范围密切相关。当测量数据在观测数据范围内时，模型精度较高；当测量数据超出观测数据范围时，模型精度较差。因此，蒸发器模型的参数在离线辨识时，需要让制冷系统在各种工况下进行仿真实验，取其稳态运行数据作为观测数据来辨识模型的参数，进而确保模型在各工况下的精度，而大量采集的观测数据中往往包含着很多特性相同的数据，这些数据在模型参数的辨识过程中起着相同的作用，这些具有相同特性的数据在模型参数辨识中的重复利用，对模型参数的贡献度不大，却会增加模型辨识的运算量。聚类算法可以根据数据特征的相似性将数据划分为若干个簇，聚类后同簇数据特征相似，而异簇之间的数据特征相异。高放等人[10]将K均值算法与传统的递归最小二乘法结合，提出了一种高光谱图像无损压缩的方法，消除了像素的冗余。孙浩等人[11]采用高斯混合聚类的方法对机载实时模型的输入输出数据进行数据压缩，减小了模型的误差。陈上等人[12]基于模拟玉米生长的CERESMaize模型，采用改进的K-NN聚类方法筛选出与历史数据相似的气象数据，以此来预测玉米的产量。吉文鹏等人[13]基于扩张搜索聚类算法提出了一种双酚A生产装置软测量的多模型建模方法，提高了模型的估计精度。尹林子等人[14]基于K-means++算法，对铁水含硅量的数据进行了优选。王振杰等人[15]在深海定位中，对检测距离的声速剖面数据进行K-means++聚类，并合并相似的类别，得到了精简后的声速剖面，提高了深海定位的计算效率。上述方法在图像识别、系统辨识和数据预测等领域中利用聚类算法分别对各自领域的数据进行聚类分析，剔除了冗余数据，减少了建模的计算负担。在蒸发器模型辨识的过程中，若利用聚类算法对观测数据进行聚类筛选处理，选择每类数据中最具代表性的聚类中心代替该类数据进行模型参数辨识，必将大大减小辨识模型的运算量，同时又能保留该类数据的基本特性。

尽管离线建模方法在采集观测数据时，会充分考虑所采集数据的范围来确保模型在各种工况下的精度，然而在实际的应用中采集的观测数据很难涵盖系统所有的运行工况。因此，充分利用系统实时的运行数据，对模型参数进行在线修正，可以不断扩大模型的应用范围，提高模型在各种工况下的精度。而系统在线运行数据庞大，所有在线运行数据不加筛选处理的全部参与模型参数的辨识，随着数据量的增加必将导致运算系统崩溃，因此利用聚类算法对辨识模型的观测数据进行聚类分析，根据在线数据的数据特性对其进行筛选处理，保留对模型参数产生影响的观测数据修正模型参数，将实现模型在线辨识的功能。

基于以上分析，本文在前期工作[6]的基础上，根据蒸发器模型观测数据的特点，改进了K均值聚类算法中分类数K和初始聚类中心的确定方法，并用此方法对模型观测数据进行聚类筛选处理，选择每类数据中最具代表性的聚类中心辨识模型参数，进而提出了一种蒸发器在线建模的方法。该方法可以利用小工况范围内的少量观测数据建立蒸发器的初始模型，利用在线数据不断修正模型参数来扩大模型的适用范围，既保证了模型各工况下的精度，又减少了模型辨识的运算量。

1 蒸发器的工作原理与模型结构

根据传热介质的不同，空调系统中的蒸发器通常采用风冷和水冷2种结构。风冷蒸发器的传热介质为空气，其结构多采用翅片管式；水冷蒸发器是利用水作为传热介质，其结构有板翅式、套管式、管壳式等不同的形式。尽管风冷和水冷蒸发器的结构和传热介质不同，但是其工作原理相似，可简单地用图1所示的形式来近似地描述蒸发器中2种工作介质的换热过程。图1上面的管道模拟制冷剂循环，其内流动的工作介质是制冷剂，描述的是制冷剂相变换热的过程；图1下面的管道模拟冷冻水循环(以水冷蒸发器为例)，其内流动的工作介质是水，描述的是冷冻水显热换热的过程；制冷剂和冷冻水被传热介质隔开，它们之间的能量交换是通过传热介质与2种工作介质的接触面以热传导的形式实现的。在制冷剂循环内，从冷凝器出来的高压低温的液态制冷剂在膨胀阀的节流作用下变为低压低温的气液两相态，进入蒸发器参与换热。由于传热系数的不同，制冷剂在蒸发器内的换热过程通常分为两相区和过热区2个部分。在两相区，气液两相态制冷剂不断地通过传热介质从冷冻水中获得能量而不断汽化，直至全部相变为气态，该区域的换热系数较大，其温度为制冷剂的饱和相变温度。从制冷剂全部相变为气态开始，直至蒸发器出口这段区域为过热区，在该段区域内，制冷剂以气态的形式通过传热介质与冷冻水进行换热，换热系数较小，其温度随着从冷冻水内吸收能量的增加而升高，表现为一种过热状态。在冷冻水循环中，冷冻水的能量不断地传递给制冷剂，其温度不断降低。根据热力学第二定律，能量只能从高温向低温传导，因此冷冻水的温度取决于制冷剂压力所决定的饱和蒸发温度，通过调节蒸发压力来改变蒸发温度，实现冷冻水温的间接控制。

图1 蒸发器工作原理图

由于蒸发器内制冷剂的相变过程是动态的，两相区与过热区之间的边界随着相变换热的过程不断地移动变化，导致两相区和过热区的换热面积也不断地变化，而这2段区域的换热面积是理论建模的重要参数，所以理论模型在实际的应用中受到一定的约束。文献[6]从能量守恒的角度出发提出了一种蒸发器的混合建模方法，采用该方法所建立的混合模型保留了理论模型的结构特点，而理论模型中的换热系数等经验参数和换热面积等几何参数被集总为少量的未知参数，这些未知参数可以通过模型辨识方法，利用实验数据辨识获得。该方法充分利用了理论建模的优点，同时有效地克服了理论模型在实际应用中的局限性。其模型结构如下：

(1)

(2)

(3)

其中，ei和hi分别为利用制冷剂饱和特性拟合的多项式系数；Heri为蒸发器制冷剂的入口焓值，由于蒸发器入口的制冷剂为气液两相态，其焓值无法利用制冷剂的流体特性获得，而蒸发器前的电子膨胀阀的膨胀过程是一个等焓变化过程，没有能量的交换，所以可以利用电子膨胀阀入口制冷剂焓值代替蒸发器入口制冷剂焓值，其值可由制冷剂流体特性拟合的多项式，根据电子膨胀阀入口的制冷剂压力Pvi和温度Tvi计算获得，如下式所示：

(4)

式中：uij为由制冷剂流体特性拟合的多项式参数；Pvi为电子膨胀阀的入口压力；Tvi为电子膨胀阀的入口温度。

公式(1)中的Qea为蒸发器的制冷量，可以通过下式计算获得：

(5)

式中：cp为冷冻水的比热容；Tcwi和Tcwo分别为冷冻水的入、出口温度，可以由安装在蒸发器冷冻水循环出入口处的温度传感器测量获得。

由于蒸发器内部的相变换热过程是动态变化的，所以其模型具有较强的非线性特性。为了确保模型在各种工况下的精度满足要求，辨识模型参数的观测数据应包含各种工况下的稳态数据，而大量采集的观测数据中往往包含着很多特性相同的数据，这些数据在模型参数的辨识过程中起着相同的作用，这些特性相同的观测数据的重复利用，对模型的精度贡献不大，但会大大增加模型辨识的计算量，因此利用数据筛选的方法选择这些数据中具有代表性的数据参与模型参数辨识不仅不会降低模型的精度，而且会大大减少模型辨识的计算量。

对数据进行筛选处理的方法有很多。由于K均值聚类算法具有结构简单、易于理解的优点，故本文选用K均值聚类算法对模型辨识数据进行筛选处理。

2 基于K均值算法的数据筛选方法

K均值算法是一种基于距离度量的聚类分析方法，由James MacQueen于1967年提出并使用[16]，在系统建模或模式识别领域通常被用作数据处理或者数据压缩的方法。该算法的思想为：首先，根据经验给定一个合理的分类数K，这个K值是欲把观察数据聚类的簇数。并在观测数据集内随机选取K个观测数据作为聚类中心。然后，根据每个观测数据到各个聚类中心的距离对所有的观测数据进行分类，将距离某个聚类中心最近的观测数据分类到该聚类中心所在的簇内，再用各簇数据的均值重新确定该簇的聚类中心。若所有簇新产生的聚类中心均与上一次分类时的聚类中心相同，就认为该算法收敛，停止运算；若有一个簇新产生的聚类中心与上一次分类时的聚类中心不同，那么就认为该算法没有收敛，需要重复前面的聚类运算，直至收敛为止。

Step1输入分类数K和观测数据集D。

Step2从观测数据集内随机选取K个观测数据作为聚类中心对其进行初始化，用c=[c1，c2，…，cK]7×K表示，计算每个数据点Xi(i=1，2，…，N)到每个聚类中心cj(j=1，2，…,K)的欧氏距离d(Xi，cj)，如下式所示：

(6)

若在K个聚类中心到数据点Xi的距离中，聚类中心cj到数据点Xi的距离最短，那么将点Xi归类到cj所在的簇中。其他数据点依次同样处理，直至将所有数据点归类结束后进行下一步操作。

Step3利用求均值的方法重新确定聚类后的每一个新簇的聚类中心，利用Step2的方法根据新的聚类中心对所有的观测数据重新进行分类。

Step4重复Step3，若满足终止条件之一，则算法结束。其中，终止条件为：1)已达到算法的最大迭代次数；2)所有簇新产生的聚类中心均与上一次分类时的聚类中心相同；3)满足算法误差平方和SSE(c)(1≤j≤K)局部最小[17]。

(7)

Step5将最终的K个聚类中心作为辨识模型参数的观测数据。

上述的K均值算法对K值和初始聚类中心的设置很敏感，对聚类结果影响较大。在模型辨识的过程中，若K的取值过大，则对数据的特征分类过细，导致聚类簇数过多，增加参与模型参数辨识的观测数据量，增大模型辨识的计算量；若K的取值过小，则对数据的特征分类过粗，导致聚类簇数过少，一些具有不同特征的数据因被聚在同一类中而被聚类中心所代替，不能参与模型参数的辨识，从而降低了模型的精度。因此，合理地选择K值对模型参数的辨识至关重要。对于初始聚类中心的选择，因为K均值聚类算法是一种启发式算法，其聚类过程与初始聚类中心有关，若从观测数据中随机选取，往往会导致聚类过程迭代运算量的增加，而且很有可能使聚类中心陷入局部最优[18]。为此，最优的分类数K*确定后，最好再利用优化算法确定聚类中心的最优初始值。基于上述分析，本文首先利用Davies-Bouldin(DB)准则提出确定最优分类数K*的方法，寻找K-means算法的最优K值，也就是确定观测数据聚类的簇数，然后利用粒子群(PSO)算法提出了基于误差平方和(SSE)函数的初始聚类中心的寻优方法，来确定每簇观测数据的聚类中心，以此来提高模型观测数据聚类筛选的精度，减少聚类算法的迭代次数，加快算法的收敛速度。

2.1 K值的确定方法

常用的K值确定方法主要有手肘法[19]、轮廓系数法[20]和戴维森堡丁指数(Davies-Bouldin Index(DBI))法3种方法[21]。手肘法根据不同K值的误差均方和函数值来确定最优的分类数K，该方法在误差均方和函数曲线较平滑时，“肘点”很难确定，无法给出最合理的K值。轮廓系数法是通过轮廓系数来确定K值，而轮廓系数的确定需要计算每个观测数据到其他观测数据的平均距离，计算量较大，不适合蒸发器模型参数辨识的观测数据的筛选。与以上2种方法相比较，DB指数法可以反映数据的类内和类间的相似性，计算量较小且具有唯一的取值，因此，本文采用DB指数法来确定K均值聚类算法的K值。

DB指数是一种利用类内紧致性和类间分离性评价聚类有效性的指标函数[22]，如下式所示：

(8)

其中：

式中：ci、cj分别表示第i类Ci和第j类Cj的聚类中心；Rij表示第i类Ci和第j类Cj的相似度，其值越大则表明Ci和Cj有较小的相似度，其值越小则表明Ci和Cj有较大的相似度；Si为第i类Ci中的观测数据Xi与聚类中心ci欧氏距离的均值，Ni为第i类Ci的观测数据量。Si表示类内数据的紧致性，其值较大表明第i类中的数据距离聚类中心ci较远，类内的紧致性较差；其值较小表明第i类中的数据距离聚类中心ci较近，类内的紧致性较好。Mij为第i类的聚类中心ci与第j类聚类中心cj的欧氏距离，其值的大小体现出了类间分离性的好坏，其值较大说明第i类的聚类中心ci和第j类的聚类中心cj距离较远，类间分离性较好；其值较小说明第i类的聚类中心ci和第j类的聚类中心cj距离较远，类间分离性较差。

当K取不同数值时，DB指数值不同。DB指数越小，表示聚类的有效性越好，因此，DB指数最小时的K值即为最佳的分类数K*：

(9)

2.2 初始聚类中心的优化方法

粒子群优化(PSO)算法具有结构简单、算法易于实现、需要调整的参数较少等优点，本文选用PSO来对聚类中心的初始值进行寻优。

公式(6)所描述的误差平方和是所有簇中观测数据到该簇聚类中心欧氏距离之和的总和，描述了数据的类内紧凑性，在分类数K确定以后，其值越小越好。由于标准粒子群算法在寻优的过程中通常寻求适应度函数的最大值[23-24]，因此，本文把误差平方和函数改写为公式(10)所描述的形式作为PSO算法的适应度函数。

(10)

式中：c=[c1，c2，…，cK*]7×K*为聚类中心，即为粒子群算法中的一个粒子，若初始化种群的粒子数为m，则该粒子可以表示为xi=[c1，i，c2，i，…，cK*，i]7×K*(1≤i≤m)，该种群可以表示为PS=[x1，x2，…，xm]m×K*×7。每个粒子xi的约束条件为蒸发器模型输入输出变量的边界条件。利用粒子群优化算法对辨识蒸发器模型参数的观测数据聚类中心进行寻优的详细步骤如下：

Step1初始化参数：分类数K设置为前面所确定的最优值K*；为了兼顾算法的搜索效率[25]，种群的个数设置为20；粒子的初始速度v(0)在[-2，2]之间随机选取；粒子的初始位置x(0)在观测数据的边界范围内随机选取；个体加速度a1和群体加速度a2为学习因子，通常取a1=a2=2；随机数r1，r2∈[0，1]；惯性权重ω通常设为0.7。

Step2利用公式(10)计算每个粒子的适应度函数值，然后根据公式(11)和公式(12)确定粒子群的个体最优位置和全局最优位置。

(11)

(12)

Step3把Step2确定的个体最优位置和全局最优位置代入公式(13)，更新每个粒子的速度和位置。

(13)

3 模型参数辨识方法

本文沿用文献[6]所采用的Levenberg-Marquard非线性最小二乘法辨识蒸发器模型参数，其目标函数可描述为：

(14)

为了寻找到目标函数的最优解Θ*，将参数作为未知变量对其进行求偏导，可得到Jacobian矩阵为：

(15)

进而模型参数的最优解可以通过公式迭代求出：

(16)

式中：g(Θ)=[f1(Θ)，f2(Θ)，…，fK*(Θ)]，通过迭代可以求出P(l)，其表示为梯度下降的方向，λ为一个足够大的矩阵。若满足|Θ(l+1)-Θ(l)|<μ(μ∈[1×10-6，1×10-5]，为一个较小的正数)，则算法迭代终止，输出最优值Θ*，即为模型的3个参数θ1、θ2、θ3。

4 模型验证与比较分析

4.1 实验装置

图2 蒸汽压缩式制冷装置

为了验证上述模型辨识方法的有效性，本文利用山东省智能建筑技术重点实验室的蒸汽压缩式制冷装置进行观测数据的采集，实验装置如图2所示。该装置主要用于蒸汽压缩式制冷系统智能控制技术的研究，由制冷循环、蓄水循环和风机盘管水循环3个部分构成，其原理如图3所示。制冷循环包含压缩机、冷凝器、电子膨胀阀和蒸发器4个主要部件，其工作介质为R134a；蓄水循环包含蒸发器、循环水泵和储水箱3个部分，其工作介质是冷冻水；风机盘管水循环包括储水箱、循环水泵和风机盘管3个部分，其工作介质是冷冻水。室内环境的热负荷通过风机盘管的换热作用进入冷冻水，并在循环水泵的驱动下存储于储水箱；储水箱中的冷冻水存储的能量在循环水泵的驱动下，由冷冻水带入制冷循环的蒸发器；在蒸发器内，冷冻水的能量传递给制冷循环的制冷剂；在制冷循环中，在压缩机做功和电子膨胀阀节流的双重作用下，制冷剂所带有的能量由冷凝器排到室外环境之中，往复运行，达到制冷的目的。实验装置还安装了2个控制器用于控制蒸发器出口的过热度和系统的制冷量。通过调节电子膨胀阀的开度把蒸发器出口的过热度控制在5～10 ℃，来确保蒸发器的换热效率，同时防止压缩机发生液击现象[26]；当制冷温度达到设定值时，通过调节压缩机的工作频率，改变系统的制冷量，使其与室内热负荷达到平衡，实现系统的变频控制。本文在实验的过程中，为了精确地模拟室内热负荷的各种工况条件，在储水箱中安装了加热器，利用调功器改变加热器的加热量来模拟风机盘管水循环从室内环境中所获得的能量。

该实验装置中的压缩机、冷凝器风机、电子膨胀阀、循环水泵、加热器等可控部件及其执行机构的相关参数如表1所示。所有可控部件均由PLC输出模块发出的控制信号通过其执行机构进行控制。压缩机、冷凝器风机、循环水泵均带有变频器，由PLC模拟输出模块发出的4～20 mA控制信号对其进行工作频率的调节；储水箱中的加热器带有调功器，同样也可由PLC模拟输出模块发出的4～20 mA控制信号对其加热功率进行连续调节；电子膨胀阀由PLC数字输出模块发出的正、反脉冲数通过步进电机控制器对其进行正反转和开度的控制，正、反向最大脉冲步数为500。上位机利用Labview软件的串行通讯模块给PLC发送控制信号，对各执行机构实现调节控制。

表1 可控部件及执行机构

该实验装置为了记录实验过程中的实时数据，安装了压力、温度、流量等传感器对实验数据进行实时采集，传感器的安装布置见图3。

图3 蒸汽压缩式制冷装置原理图

各传感器的型号、测量范围、测量精度等参数如表2所示。温度传感器与PLC温度模块相连，负责采集各测量点的实时温度；压力、流量传感器与PLC的4～20 mA模拟输入模块相连，负责采集各测量点的实时压力与流量。PLC所获得的实时数据通过485总线传递给上位机，上位机利用Labview软件的串行通讯模块接收PLC发送来的实时数据，并以Excel表格的形式把数据存储在计算机内，以备系统建模使用。

本文因预建立蒸发器模型，故利用蒸发器输入输出口的传感器采集建立蒸发器模型所需的相关数据，模型变量与测量传感器之间的对应关系见表2。

表2 传感器及相关参数

4.2 观测数据的获取

为了提高蒸发器模型在各种工况下的预测精度，在实验的过程中应尽可能地模拟系统运行的各种不同工况条件，获取实验系统在各种工况条件下的稳态数据作为模型参数辨识的观测数据。本文应用的实验装置是一压缩式制冷系统，其主要工况条件有2个：一是室内热负荷；二是室外环境温度。室内热负荷也就是制冷系统需要从室内排到室外的热量，对制冷系统来讲也就是室内温度达到设定值时的制冷量。本文利用调功器改变储水箱内加热器的加热量来模拟室内热负荷的变化。实验装置的冷凝器安装在另一个空调房间内，利用房间内的空调可以调节房间内的温度，用于模拟实验装置的室外环境条件。

本文实验的工况条件以及辨识蒸发器模型所需各变量的工作范围如表3所示。在表3所示的工况条件范围内，依次改变室外环境温度和热负荷的大小，选择80种工况条件分别进行实验，当系统稳定后，记录各模型变量的稳态值作为模型参数辨识的观测数据，共1027条。在实验的过程中，系统从一种工况到另一种工况的变化过程中以及执行机构调节变化的过程中，系统变量在稳定之前是动态变化的，为了获得系统变量的稳态数据，往往采用连续测量的多个数据进行判断，若这些数据均在某个测量误差范围之内，则认为该变量已基本稳定，对这些数据求其平均值作为观测数据，以消除其测量误差。

表3 蒸发器的运行参数及工况条件

另外，观测数据的量纲和取值范围各不相同，在对观测数据聚类筛选之前必须对其进行预处理。

4.3 观测数据的预处理

本文利用以下方法对观测数据进行预处理：

1)数据标准化。为了消除属性之间的量纲和取值范围的差异，提升聚类算法的精度，需要对所采集的稳态观测数据进行标准化(归一化)处理，即将数据按比例缩放至一定区间内[27]，如下式所示：

(17)

2)数据反标准化。当聚类算法结束后，需要利用公式(18)对聚类中心的数据进行反标准化，将反标准化的聚类中心数据作为模型参数辨识的观测数据。

(18)

4.4 辨识结果与验证分析

为了验证模型的有效性，本文选用均方根误差(RMS)、相对误差和平均相对误差来分析模型的有效性，这几种误差的计算方法如式(19)～式(21)所示：

(19)

(20)

(21)

式中：Nt表示拟合点的个数，Qeai表示蒸发器的第i个实际制冷量，Qei表示蒸发器模型预测的第i个制冷量。

本文用于模型辨识的观测数据维数较多，对其进行聚类筛选时极易出现过拟合现象，为此，根据模型的结构特点，令ΔTcw=Tcwi-Tcwo，ΔTcwst=Tcw-Tesat，ΔHe=Heg-Heri，以此来减少观测数据的维数，提高K均值算法的精度。图4描述了K值在[3，「1027 ⎤]间的DBI函数值，由图可以看出，当K=5时DBI函数值最小，根据DB准则可知最优的分类数K*=5。

图4 基于DB准则的聚类分离测量图

K*确定后，利用前面所讲述的PSO算法确定最优的初始聚类中心，再利用K均值聚类算法获得最终的聚类中心，C*其值如表4所示。

表4 聚类中心

本文利用上述方法获得的聚类中心数据代替实验观测数据，使用最小二乘法获得的模型参数为Θ*=[1.92，1.00，2.13]。为了验证模型的准确性，把辨识的模型参数代入模型中，使用实验观测数据中模型的输入观测数据通过模型预测蒸发器的换热量，与实测换热量进行比较，其结果如图5(a)所示。为了进一步说明模型的预测精度，使用辨识模型的观测数据和实验观测数据分别计算模型的训练相对误差与测试相对误差，结果如图6(a)～图6(b)所示。从图中可以看出，所建立的模型能够很好地预测蒸发器的换热量，其误差在±3.5%之内。

利用本文获得的实验观测数据，使用文献[6]所述的建模方法获得的模型参数为Θ*=[0.32，1.95，2.64]，模型预测值与实际测量值之间的比较关系如图5(b)所示。比较结果显示，模型的预测误差在±3%之内。

(a) 本文方法

(b) 文献[6]方法图5 蒸发器制冷量测试值与模型预测值的比较结果

(a) 模型训练相对误差

(b) 模型测试相对误差图6 2种建模方法相对误差的比较结果

为了进一步说明模型观测数据进行聚类筛选的优点，对于2种建模方法所建立的模型误差进行对比分析，结果如表5所示。从表中的数据可以看出，本方法建立的模型平均相对误差和均方根误差与文献[6]建立的模型相比均有所增加，但增加量很小，在误差允许的范围之内，然而文献[6]建立模型使用了80组实验观测数据，而本方法建模仅使用了6组观测数据，与文献[6]相比，本文的建模方法大大减少了计算量。

表5 模型参数及平均误差

5 在线建模

利用上述方法建模时，若采集的观测数据涵盖了系统所有运行工况所产生的数据，则所建立的模型可在系统不同的工况下使用，不需要对模型参数进行修正。然而，这样做的前提是必须进行大量实验，获得系统各工况下的数据，工作量较大。若采用小工况范围内的观测数据先辨识模型的初始参数，然后利用超出初始工况范围的在线数据对模型参数进行修正，来扩大模型的适用范围，不仅可以使模型在各种工况下的精度满足要求，而且可以大大减少模型辨识时的实验工作量。

1)利用新观测数据与K*个聚类中心的欧式距离确定新观测数据最近的聚类中心Cmin。

2)确定Cmin所在簇的最远边界点到聚类中心的欧氏距离df。

3)根据新观测数据到各聚类中心欧氏距离的最小值dK*min来判断该观测数据是否隶属Cmin簇：若dK*min≤df，表明该观测数据与Cmin具有相似的数据特征，即该观测数据隶属于Cmin簇；若dK*min>df，表明该观测数据与Cmin的数据特征差别较大，即该观测数据不隶属于Cmin簇。

若新观测数据隶属于已有的簇，其数据特征可由已有簇的聚类中心来近似描述，不用对模型参数进行修正；若新观测数据不隶属于已有的簇，说明该观测数据与已有簇具有不同的数据特征，需要把该观测数据加入到已有的观测数据之中，利用本文所提出的建模方法重新对模型参数进行辨识，建立新的模型。

为了验证在线建模方法的有效性，本文首先利用前面讲述的建模方法，使用系统制冷量在1 kW～4 kW范围内的观测数据对模型参数进行辨识，获得了最优分类数K*=3，聚类中心如表6所示，模型参数Θ1=[1.0，1.97，1.91]。然后逐一选取制冷量在1 kW～4 kW范围之外的观测数据，模拟系统在线测量的观测数据，使用上述在线建模的方法对模型参数重新辨识，最终获得的最优分类数K*=11，聚类中心如表7所示，模型参数Θ2=[1.0，2.9，2.9]。

表6 初始模型的聚类中心

表7 在线模型的聚类中心

为了进一步说明在线建模方法的优点，对于初始模型和在线模型的平均误差进行了对比分析，结果如表8所示。从表中的数据可以看出，对于小工况范围内的观测数据所建立的初始模型，其训练平均误差较小，而超出训练工况范围之外的测试平均误差较大，使用在线数据对模型参数修正后，模型的各平均误差均有显著减小。同时，由于在模型辨识前，对辨识模型参数的观测数据进行了聚类筛选处理，大大减少了建模过程的运算量。

表8 在线模型参数与平均误差

6 结束语

针对蒸汽压缩式制冷系统的多变量、非线性、工况范围广等特点，本文在蒸发器混合建模方法[6]的基础上，提出了一种基于数据聚类的蒸发器在线建模方法。该方法保留了文献[6]所推导出的模型结构以及参数辨识方法，主要完成了辨识模型参数观测数据的筛选处理，实现模型的在线辨识功能。根据制冷系统变量的数据特点，选用K均值算法对模型辨识的观测数据进行聚类处理，利用DB准则提出了最优分类数K*的确定方法，使用PSO算法提出了初始聚类中心的优化方法，大大减小了聚类算法的计算量，提高了算法的收敛速度，同时避免算法陷入局部最优。实验数据的验证结果表明，对辨识模型的观测数据先进行聚类筛选再进行模型辨识，不仅没有牺牲模型的精度，而且可以大大减少模型辨识的运算量。同时，在此基础上提出的在线模型辨识方法对辨识模型参数观测数据的测试范围要求降低了，超出测试范围所产生的模型误差可以通过模型参数的在线修正来弥补。

本文所提出的在线建模方法并不仅仅适用于蒸发器的建模，对于制冷系统的冷凝器、压缩机、电子膨胀阀等部件以及其他工业过程部件的建模同样适用。随着数据孪生、大数据、智能控制等技术在制冷系统的应用，本文所提出的在线建模方法必将具有广泛的应用前景。