杨鑫宇,吕 政,赵 珺,王 伟
(大连理工大学控制科学与工程学院,辽宁大连 116024)
离心式水泵作为一种常用的液体运输机械,在土木建筑、农业水利、电站、化工、石油工业、矿山冶金、轻工业、船舶等领域中,发挥着重要的作用,水泵的性能指标直接影响到整个系统的运行状况.
水泵性能指标预测主要是通过水泵入水口流量对水泵扬程、功率等指标进行预测,其模型主要受到水泵叶片数、叶片旋转角、转速等因素影响.针对离心式水泵性能指标预测,主要分为两类方法:一类是通过水泵机械原理推导出的公式推理法,另一类则是对水泵特性曲线分析后通过机器学习方法预测.然而,前者难以达到高精度的要求,后者难以应用于多工况环境.针对这一模型难以达到要求的挑战,学者们进行了广泛的研究.对于离心式水泵机械原理,已经有一些学者进行了研究.目前,学者们都认可了泵的无限多叶片基本方程,在有限叶片数的公式上还未能找到一种高效精准的数学模型.M.Stefanizzi等人通过对单级离心泵进行直接和反向实验,提出了一种适用范围更广的涡轮泵模型[1];王欣永等人基于重整化群(renormalization group,RNG)k–ε湍流模型,引入动网格技术,应用FLUENT软件,对单吸式清水离心泵水流流动特性进行模拟[2];朱迪等人对双吸泵的蜗壳和叶轮的干涉作用进行研究,说明了双吸离心泵蜗壳面积对水力性能的影响[3];王凯等人采用Lighthill声类比理论研究多工况下五级导叶式离心泵由偶级子声机器产生的水动力噪声,并通过实验说明其预测方法具有一定的可行性[4].李慧文等人创建了二维轴对称的单侧线圈模型泵和内外侧线圈布置比例为1和0.5的双侧模型泵,并通过实验验证其可有效提高流动的均匀性[5].以上几种方法都是在经验公式或理论公式的基础上进行推导,由于总结经验公式的环境与实际环境存在一定的差异,理论公式又存在大量近似计算,预测结果很难达到更高的精度要求.
由于离心式水泵扬程性能曲线存在一定的规律性,所以越来越多的学者们开始尝试将机器学习方法应用到离心式水泵扬程性能曲线预测上,并取得了一定的研究成果.TAN Minggao 等人采用商业代码FLUENT对不同速率下的速率进行了仿真,该方法采用了标准k–ε湍流模型和压力耦合方程组的半隐式方法(semi-implicit method for pressure linked equation consistent,SIMPLEC)算法,最终表明其对离心式水泵性能曲线预测是可行且准确的[6].Kchaou Nouha等人针对离心泵缺乏启停过程瞬态特性的问题,通过考虑实际电机转矩的方法,对离心泵启停过程的动态特性变化进行了数值模拟研究[7].Xiaohui Wang等人根据泵作为压力涡轮与外部特性的相关性,提出了一种基于泵的特性(几何特性和水力特性)的理论方法来预测压力涡轮在最佳效率点性能[8].刘厚林等人以一台五级导叶式离心泵为研究对象,研究了流体激励下泵的辐射噪声特性.通过外场噪声试验结果与计算结果之间的对比,验证了多级离心泵辐射噪声数值预测方法的有效性[9].这些方法都是运用机器学习的方法,提高了离心式水泵扬程性能曲线的精度,但上述方法只针对单一工况有效,无法适用于多工况切换的场景.为了能够同时保证算法的预测精度以及算法的适用性,引入迁移学习的方法就极为重要.
迁移学习作为一种新的机器学习方法,主要是将已经存在的知识应用到其他相关领域的方法.它放宽了传统机器学习中的两个基本假设,目的是迁移已有的知识来解决目标领域中仅有少量有标签样本数据甚至没有的学习问题[10].陈仁祥等人针对实际工程中滚动轴承受工况、运行环境等因素影响,导致获取的数据不易满足传统机器学习条件的问题,提出一种改进迁移自适应提升(transfer adaptive boosting,TrAda-Boost)多分类算法的滚动轴承故障诊断方法[11].Sinno Jialin Pan针对跨域室内WiFi定位和跨域文本分类问题,提出了一种特征提取方法,可以显著地减少域分布之间的距离,通过降维实现潜在空间中的距离适应[12].Mingsheng Long等人提出了一种新的迁移学习方法,称为联合分布适应(joint distribution adaptation,JDA).JDA 的目标是在原则性降维过程中共同适应边缘分布和条件分布,并构造新的特征表示.大量的实验证明,JDA在4种类型的跨域图像分类问题上可以明显优于几种先进的方法[13].Ying Wei等人通过对迁移学习的思考,提出了一种迁移学习框架称为学习迁移(learning to transfer,L2T),该方法利用以前的转移学习经验,自动确定什么是最好的以及如何转移,并通过与几种最先进的转移学习算法进行实证分析,证实其优越性[14].Jia Ye等人提出了一个基于神经网络的文本到语音合成系统,并通过实验证明其方法可以生产训练集中不存在的合成语音[15].以上迁移学习方法在其领域都有着不错的表现,但这些方法都偏向处理离散有标签的文本、图像数据等,针对于工业系统中的不同环境下的连续数据,这些迁移学习方法难以表现出很好的预测效果.
为了解决离心式水泵机理模型精度低和机器学习难以适应多工况的问题,本文采用归纳式的学习方法,并基于关系进行迁移,提出了一种基于最小二乘法的归纳迁移学习模型,并将其应用到离心式水泵的扬程曲线预测问题中.根据离心式水泵扬程性能曲线特性,通过最小二乘支持向量机来获取迁移学习知识,再通过将知识映射到高维空间,构建了一个归纳迁移学习模型,最后通过反向利用最小二乘支持向量机,来获取所需工况的模型.为了验证本文方法的有效性,将本文方法与机理建模方法以及机器学习方法进行对比.结果表明,本文方法能够构建一个精度更高,适用范围更广的离心式水泵性能预测模型.
离心式水泵(见图1)性能曲线一般是在生产厂家生产后,在同系列中进行抽样试验,实测出不同流量下的扬程、功率、允许吸上真空度及转速等性能参数的数据,然后进行测试数据的处理,绘制出一组曲线.用户在安装之后也要对水泵性能进行测定,整体的工作过程比较繁杂.随着计算机技术的发展,人们逐渐摆脱了设备因素的限制,逐渐开始利用机器学习的方法实现对水泵性能指标的预测.
水泵扬程作为性能曲线中的一个重要参数,其预测对整个工业系统都有着重要的影响.在离心式水泵运行过程中,涉及到很多复杂的机械原理.就离心泵理论扬程而言,在无限叶片和有限叶片下的理论扬程存在巨大差异,主要是由于液体惯性引起的滑移.通过分析理论公式,笔者发现有限叶片扬程受到叶片数、叶片安装角度、轮机转速、轮机外径等因素影响.当这些因素发生变化时,离心式水泵所处的工况也就发生改变.此时,传统的机器学习方法将不能适用于新的工况,需要重新获取数据并重新训练模型.理论推导都是建立在经验公式的基础上,实际效果往往不能满足更高的精度要求.传统机器学习的方法能够提供较高的精度要求,但当工况发生改变的情况下,就需要对系统重新进行测量,耗费人力物力.
离心式水泵作为常见的工业设备,其理论模型已经相对完善,其性能曲线包括扬程、轴功率、转速、效率等.对性能曲线进行精确预测,能够更好地进行系统优化调度.由于基理模型中存在理想条件的假设,计算出的结果与实际值会存在较大的偏差.传统的机器学习方法不适用于多工况的环境.因此本文针对水泵的工况变化问题,提出一种基于迁移学习的水泵性能预测模型,如图2所示.模型主要通过核函数和最小二乘的思想来提取迁移特征,再利用本文提出的归纳式迁移学习模型进行迁移,最后通过LSSVM反向应用实现预测,当获得新的工况数据时,更新迁移模型.
图2 基于最小二乘的归纳迁移学习模型Fig.2 Inductive transfer learning model based on least squares
以离心式水泵扬程曲线为例,真实环境下的扬程曲线受到叶片数,叶片安装角度,轮机转速,轮机外径等因素影响.将这些影响因素组成一个标签数组Wi,即为扬程性能曲线的工况因素,其中i表示不同的工况.
单一工况下,水泵性能曲线可以转换成y=α×x+b的形式,其中:y表示水泵的性能曲线,x表示性能曲线的输入参数.此时,本文的目标是构建一个模型ϕ(x),使其近似于y.当多工况时,构建模型ϕS(x),此时,本文的目标是尽可能地通过ϕS(x)去训练出ϕT(x),并且这个ϕT(x)近似于yT.为了能够更好的进行迁移学习,需要在特征提取的过程中,尽可能的保留源域数据的特性,并排除尽可能多的无关因素,本文提出了一种基于性能曲线预测的特征提取方法.该方法通过核函数计算、最小二乘的思想来提取性能曲线特征.迁移学习中,S表示源域,表示所要学习的对象,即要迁移的对象.T表示目标域,表示要赋予知识的对象,即将源域数据迁移到的对象.ϕS(x)和ϕT(x)分别代表源域和目标域数据中,输入和输出对应的预测模型ϕ(x).当工况状况不变时,ϕS(x)和ϕT(x)表达式一致,若有足够数量的xS和yS已知,可以通过传统的机器学习方法解决问题.然而当系统工况发生变化时,ϕS(x)和ϕT(x)表达式不一致,就需要一个利用ϕS(x)去获得ϕT(x)的方法.首先,根据ϕS(x)和ϕT(x)存在关系进行迁移,需要尽可能的将ϕ(x)展现出来,以便于从ϕS(x)中提取所需的知识,因此,暂时不考虑迭代的算法,选择用SVM方法训练ϕS(x),通过SVM计算,可以获得一个数列α和和一个单值b.然而通过核函数法获取的α难以呈现出特定的规律性,而b相当于曲线的幅度,可以作为一个衡量幅度的有效指标,能代表曲线的部分特性.因此,先将b作为一个迁移知识.根据SVM方法,
A是SVM方法中定义的高维空间矩阵,其表达式为
Ω为经过核函数变换后的矩阵.在SVM方法中b的求解是在α之后进行的,而本文暂时是不需要α值的,因此改用LSSVM的方法,直接推导出b,根据最小二乘法:
根据式(2)和式(3),可以将b化简为
通过最小二乘法,获得了一个只有迁移知识b和预测目标y的式(4),b和y的维度不一致,还需要提取之前忽略的α中的特征,来构建对y的表达式.由于α中的特征不容易获取,需要一个更容易获得的特征来代替它.如果将式(4)转化为y的表达式,无法直接将矩阵进行变换,只能将其转化为式(5):
为了获得y,构造一个向量Y,使其满足式(6):
通过矩阵变换,发现Y是y对应的的趋势,即满足yT=k×YT,k为一个常量.由于离心式水泵扬程曲线较为简单,可以通过最小二乘法对其进行n阶曲线拟合,其推导如下:
其中:R表示残差平方和,用于衡量拟合效果;yi表示y中的第i个变量;p表示要提取的趋势特征,由于存储曲线趋势,pi表示p中的第i个变量.
用式(7)对其中的pi分别求导,获得n个线性方程式,将这n个线性方程式与式(7)组成一个线性方程组联立求解即可获得p.
通过对yS(x)进行核函数处理和最小二乘拟合之后,通过式(4)获得bS,并通过式(7)计算出方程组后求解出pS,与当前所对应的工况因素WS联系在一起,分别将bS和pS作为目标值,将WS作为输入,通过最小二乘拟合构建高维空间模型,此时可以根据一个工况因素W计算出对应的b和p.
进行预测时,只需要获得当前工况WT,将其代入高维空间模型获得bT和pT,再根据得出的pT,求取曲线趋势YT,再利用式(6)中反向实现LSSVM获得yT,并通过yT和bT,计算出αT,从而得到一个所需工况的性能曲线迁移特征集,最后通过这个由本文归纳迁移学习模型推导出的对应工况LSSVM模型完成预测.
为了避免大规模的重复训练,当获取一组到新的yS和xS时,可以将新得到的一组与之对应的bS和pS,直接代入到高维空间中去更新模型,这样每次更新就只需要进行一次新生成的bS,pS计算以及高位空间模型个数次的修正模型的计算,大大提高模型的效率.
算法的具体步骤如下:
步骤1获取各工况下的yS和xS.
步骤2通过式(4)获取bS,根据WS通过最小二乘拟合构建关于b的高维空间模型.
步骤3通过式(7)计算出偏微分方程组后求解出获取pS,根据WS通过最小二乘拟合构建关于p的高维空间模型.
步骤4根据WT计算出对应的bT和pT.
步骤5利用pT计算曲线趋势WT.
步骤6通过反向LSSVM,计算出所需yS,以及模型参数αT.
步骤7当获得真实yT时,将xT和yT计算重新导入模型,实现模型更新.
为验证本文所提方法对离心式水泵扬程性能曲线预测的有效性,对离心式水泵杨程曲线的相关性进行理论分析,最后通过与理论模型和传统机器学习进行比较,表明本方法的优越性.
由于本方法需要大量的数据,所以采用斯托道拉离心式水泵理论模型的仿真数据作为数据集,选择每种工况数据200条.为验证本文方法可行性,选取其他工况一致但叶片旋转角度不同的7组数据作为本实验的数据集,其中选取6组作为训练集,一组作为测试集,另选一组角度数据作为测试集.通过本文中方法,分别得到了一条幅度变量b与旋转角度的关系曲线和两条趋势变量p与旋转角度的关系曲线.其中直线代表b和p的预测曲线,星号代表b和p的训练集.
由图3和图4可知,b和p随着旋转角度增加成规律性变化,通过比较预测值与真实值的对应关系,可以看出单一工况下b和p的预测有着很好地效果.
图3 b与旋转角度的关系曲线Fig.3 The relation curve of b with blade rotation angle
图4 p与旋转角度的关系曲线Fig.4 The relation curve of p with blade rotation angle
为了进一步说明本文方法的有效性,对多因素变化的情况下进行建模,选取其他工况一致但叶片旋转角度和叶片数目不同时相同的13组数据作为本实验的数据集,其中选取12组作为训练集,一组作为测试集.通过特征提取方法,获得b和p与叶片数和叶片旋转角度的高维空间模型.
图5和图6中所标记出的两个点分别为对应工况叶片数为8片,旋转角度为20◦时的实际和预测的b与p值,其坐标轴分别对应叶片数、叶片旋转角以及目标值(b或p),曲面表示预测值,圆圈表示训练集,星号表示预测集.由图可知,预测值和真实值相差较小,说明b和p与叶片数和叶片旋转角度存在着一定规律性,所提取的特征与工况因素和性能曲线存在对应关系,表明了所提取特征与水泵性能曲线存在相关性,符合实际预测需求,从而表明了本文方法的的可行性.
图5 b与叶片数和叶片旋转角度的关系曲线Fig.5 The relation curve of b with blade number and blade rotation angle
图6 p与叶片数和叶片旋转角度的关系曲线Fig.6 The relation curve of p with blade number and blade rotation angle
通过对单一工况变化情况下和多种工况同时变化情况下的b和p模型与实际b和p值进行比较,表明了离心式水泵扬程性能曲线符合一定的规律性,其提取出的特征也存在一定的规律性,表明了离心式水泵扬程性能曲线的可迁移性.本文方法所获得的高维空间模型能有效地找出其规律性,同时也表明了本文特征提取方法的有效性.
为了验证本文中实验的有效性,选择与Pfleiderer公式的机理模型和LSSVM方法进行对比实验.表1是在旋转角作为工况因素情况下,工况n表示数据所处工况叶片旋转角度为n◦,LSSVM后的括号表示LSSVM训练集所对应的工况,a训练集表示当前工况为所对应表中第a个方法的训练集.本文采用均方根误差(root mean square error,RMSE)和平均绝对百分误差(mean absolute percentage error,MAPE)来衡量训练效果,其中RMSE和MAPE的计算公式为
表1 叶片旋转角度变化性能预测Table 1 Prediction of blade rotation angle change performance
其中:n表示预测点的数量,Zi表示第i个真实值,Fi表示第i个预测值.比较3种方法的效果,由于机理模型方法选取的不同,其一直存在较大的偏差,平均绝对百分比误差均在2%以上.LSSVM在训练工况下的预测效果优于LSITL.虽然LSSVM对单一工况的预测效果较好,但当工况发生变化后,LSSVM平均百分比误差发生突变,预测效果较差,主要原因是由于工况的变化,所对应的系统模型也发生了变化,导致原模型不匹配.LSITL则克服了这一缺点,在保证精确度满足一定条件的前提下,可以根据工况变化变换模型,从而获得更准确的预测结果.
表2是叶片数和旋转角均作为影响因素情况下,工况m−n表示数据所处工况叶片数为m,叶片旋转角度为n◦,LSSVM后的括号表示LSSVM训练集所对应的工况,a训练集表示当前工况为所对应表中第a个方法的训练集.比较3种工况的效果,单工况和多工况下基理模型的MAPE一直维持在稳定的范围内,LSSVM在非训练工况下,存在较大的误差.在训练集预测上LSSVM能取得更好的效果,但在其他工况的情况下,本文中方法存在明显优势.通过单工况与多工况变换情况下的对比试验,能很好地表明本文方法对离心式水泵扬程性能预测有着较高的精度和很好的适用性.针对本文中的方法,在训练集工况7∼24处效果好于训练集工况7∼18的效果,是由于训练过程中,模型会向更具适用性的方向发展,从而损失一定的精度,而7∼24的数据与适应性模型更为稳合,所以得到了更好的预测效果.
表2 叶片数与叶片旋转角度变化性能预测Table 2 Performance prediction of blade number and blade rotation angles
由于本文中方法训练过程中,需要足够的工况作为数据集用于训练,随着训练集数量和的变化,预测效果也会发生改变.
表3为7组和13组训练集的对比试验,a训练集表示当前工况为所对应表中第a个方法的训练集.根据本文方法的理论公式以及实验的结果表明,随着训练集的增加,模型能更大范围的达到更好的效果,但大范围的适用性也使得部分点的预测精度有所损失,尤其是训练集部分的精度往往不如LSSVM方法.训练集的分布也会影响到不同工况的预测结果,训练集如果集中在同一区域内,该区域周围的预测结果会明显优于外侧的预测结果,即有越多训练集包围的点预测效果更加准确.当训练集数目越少时,在训练集部分越接近于LSSVM,当训练集数量只有一个时,相当于构建一个LSSVM.13组训练集在训练集部分的效果也存在一定差异,主要原因是由于13组训练集的分布并不是均匀的,其对生成的高维空间的影响也存在一定的差异,从而导致其与预测结果的差异不同.
表3 不同训练集数目性能预测结果Table 3 Performance prediction results for different numbers of training sets
表4是转速作为影响因素情况下,工况k表示数据所处工况叶片转速为kr/min.从实验结果可以看出以转速为可变工况能够获得很好的预测效果,进一步说明本文方法在不同影响因素下的有效性.
表4 转速变化性能预测Table 4 Performance prediction of rotate speed
通过与基理模型和LSSVM对比,表明了本文方法具有较高的精确度和很好地适用性,并通过改变训练集数目进行比较,说明了训练集数量对预测结果的影响,验证了本文方法的有效性和合理性.
本文针对离心式水泵扬程特性曲线预测问题,提出了一种LSITL算法用于水泵扬程预测,方法利用核函数和最小二乘的思想提取迁移学习知识,并通过构建一个归纳迁移学习模型,解决了机理模型方法的不确定性和机器学习适应性差的问题,构建了一种准确度高,适用范围广的神经网络模型.经过对仿真数据的实验验证,并与机器学习方法进行对比,表明了所提方法的有效性,可以顺利的应用到离心式水泵系统当中.后续工作中,将针对趋势曲线空间建模,通过引入核函数的办法使其适用于更为复杂的系统.