基于随机森林算法的阀冷系统膨胀罐液位预测

2022-05-13 08:51张浪文邹培炯
科技资讯 2022年6期
关键词:液位决策树预测

张浪文 邹培炯

摘要:直流输电电流转换过程中产生大量的热量,阀冷系统的作用是对热量进行及时消散,以保证系统稳定运行,是直流输电工程的核心设备。膨胀罐是保证阀冷系统压力稳定的关键,提前预测膨胀罐排气、补气阀状态能提高系统运行效率。膨胀罐液位是反映其状态的重要指标,该文建立基于随机森林算法的阀冷系统膨胀罐液位预测方法。首先,采集阀冷系统重要参数数据,包括电极功率、环境温度、内冷进(出)阀温度等,分析关联数据对膨胀罐液位的影响关系;其次,开发随机森林回归算法,利用训练集数据对膨胀罐的液位进行预测建模,得到预测模型;最后,利用测试集数据对所建立的预测模型进行综合仿真,结果表明模型预测数据能够很好地与实测数据拟合,说明该文膨胀罐液位预测模型的有效性。

关键词:阀冷系统膨胀罐随机森林液位预测模型

中图分类号:TM721.1文献标识码:A 文章编号:1672-3791(2022)03(b)-0000-00

Liquid Level Prediction Model of Expansion Tank in Valve Cooling System Based on Stochastic Forest Algorithm

ZHANG Langwen  ZOU Peijiong

(Yueyang Goaland Energy Conservation Equipment Manufacturing Co., Ltd., Yueyang, HunanProvince, 414000 China)

Abstract: A large amount of heat is generated in the process of DC transmission current conversion. The function of valve cooling system is to dissipate the heat in time to ensure the stable operation of the system. It is the core equipment of DC transmission project.Valve cooling system is the core equipment of DC transmission project. The function is to effectively dissipate the heat in the process of current conversion. Expansion tank is the key to ensure the pressure stability of valve cooling system. Predicting the exhaust and air makeup valve status of expansion tank in advance can improve the operation efficiency of the system. The liquid level of expansion tank is an important index to reflect its state. The liquid level prediction method of expansion tank in valve cooling system based on random forest algorithm is established in this paper. Firstly, important parameter data of valve cooling system is collected, including electrode power, ambient temperature internal cooling inlet (outlet) valve temperature. The influence relationship of the correlation data on the liquid level of the expansion tank is analyzed; Then, a random forest regression algorithm is proposed. A training dataset is used to predict and model the liquid level of the expansion tank. To this end, we get the prediction model; Finally, a test dataset is used to comprehensively simulate the established prediction model. The results show that the model prediction data can fit the measured data well, which shows the effectiveness of the liquid level prediction model of expansion tank in this paper.

Key Words: Valve cooling system; Expansion tank; Random forest; Liquid level; Prediction model

高壓晶闸管换流阀是大型高压直流输电系统的关键设备之一,晶闸管工作过程中会产生大量热量,导致阀体过热,损坏输电的核心器件。因此,亟需对器件进行散热,水冷是目前主要采取的降温方式。水冷系统是换流阀的必要辅助设备,其作用主要是保证换流阀在安全的温度下运行[1]。水冷系统稳定运行的核心是氮气稳压系统,由氮气瓶、氮气管路、膨胀罐等组成。

膨胀罐的作用是缓冲冷却水因温度变化而产生的体积变化,保证管路系统的压力稳定[2]。膨胀罐的工作状态对管路的安全稳定运行具有重要作用,为对膨胀罐进行有效的控制,需要预测其排气、补气阀的工作状态,通过阀门的开关来实现管路的压力调节,膨胀罐内冷却水的压力(液位)决定了阀门的开和关[3]。因此,对膨胀罐的液位进行建模预测对高压直流输电系统稳定运行与否十分关键。

目前,由于膨胀罐系统复杂,直接对液位或压力进行建模较为困难,因此通常采用数据驱动的建模方式。随机森林算法是一种通过输入输出数据进行拟合的机器学习方法,得到了较为广泛的应用。刘琴等人针对断路器分合闸线圈的故障电流预测问题,建立了基于随机森林算法模型,对电流进行拟合[4]。方晨研究了一种基于随机森林回归算法的无人机边坡破损辨识方法[5]。王仁明等人则在电能直流扰动识别中应用了分段改进S变换和随机森林算法[6]。而针對变电站计量装置全寿命,寇德谦开发了随机森林算法,进行计量装置管理和评估[7]。在体育领域,针对运动员损伤可能性监测,马东开发了基于DWT和随机森林算法[8]。

在换流站直流运行状态下,该文建立基于随机森林算法的阀冷系统膨胀罐液位预测模型,基于实际数据对模型进行验证,对阀冷系统膨胀罐阀门的未来工作状态进行预测。

1问题描述

换流站内水冷系统通过冷却介质的循环带走热量,循环回路主要部件包括主循环泵、换流阀组、脱气罐、过滤器等;外水冷系统组成包括软化单元、反渗透处理单元、平衡水池、喷淋泵、高压泵、工业泵、盐池等。主回路中的一部分水将流过水处理回路,包括原水罐、补水泵、膨胀罐和离子交换器等,为避免系统最高点出现真空,导致系统不能正常循环,必须保证系统最高点压力为正,因此装有膨胀罐,膨胀罐与高压氮气瓶通过控制阀相连,在膨胀罐中形成高压气垫,确保内冷水系统的基准压力。

控制系统通过监控膨胀罐中的水位变化来判断内冷水系统泄漏的情况,实际应用中,如发生泄漏才对系统采取措施往往不能保证事故处理的及时性,为尽可能减少氮气浪费及防止消缺,需要对膨胀罐补气阀、排气阀的工作状态进行预测。

该文研究某换流站阀冷系统膨胀罐水位的随机森林预测,经过分析实测数据,将以功率、高端阀厅环境温度、高端阀冷内冷水进阀温度、高端阀冷内冷水出阀温度为输入,以高端阀冷膨胀罐的液位为输出,建立基于随机森林算法的液位预测模型,为现场调控提供指导。

2基于随机森林算法液位预测建模

随机森林是一种集成的学习算法,有多颗决策树组成而成的一个树形分类器。通常随机森林的构建过程有:(1)数据集抽取。即抽取每棵树的测试集,从实际数据集中抽取测试子集,包括放回抽样和不放回抽样两种,该文采用有放回Bootstrap重抽样法;(2)根据子测试集构建每棵决策树。决策树的构建主要包括选择特征变量和结点分裂两个步骤;(3)组合所有决策树,构建随机森林模型。

给定输入变量X与独立同分布随机变量 ,随机森林预测器可表示为h(X,θ),根据不同的随机变量 确定多颗决策树,通过加权平均输出结果得到预测结果。假设待测试的输入( )输出变量( )是独立分布的,每个预测器的平均泛化误差定义为EX,Y[Y-h(X)]2。

随机森林是通过关于树个数 的预测器[h(Xk,θ)]取平均值得到,当树的个数 趋向无穷时,得到EX,Y[Y-ak(Xk,θ)]2→EX,Y[Y-Eθ(Xk,θ)]2,其中ak(Xk,θ)为预测器[h(Xk,θ)]的平均值,每一颗决策树的平均泛化误差值为:

随机森林的泛化误差表示为:

公式(2)的右边部分是收敛的,可以表示为 ,其中 , 相互独立 和 的相关系数,定义残差 和 之间的加权相关系数为:

那么得到 ,如果对于所有 ,有 ,进而得到:

由(4)可以看出随机森林的回归预测精度得到提高,通过引入随机变量 和 ,与树的泛化误差相比,随机森林的泛化误差下降了 倍。该文使用袋外数据估计模型的性能。

随机森林回归算法的步骤具体如下。

第一,从数据集中抽取 组训练样本数据,未被抽取到的 组数据作为 个袋外数据集。

第二,对抽取到的样本集生成回归树,从 个特征集中随机抽样 个特征,从中选择最优分支进行生长,训练得到回归决策树的个数 和随机选择特征变量的数目 ,通常有: ;

第三,将 棵决策树的预测结果取平均,即为最终预测值。

上述完成了随机森林算法模型的构建,下一步将此模型应用到阀冷系统膨胀罐液位预测模型测试。

3阀冷系统膨胀罐液位预测模型测试

根据阀冷系统膨胀罐实测数据,将以功率、高端阀厅环境温度、高端阀冷内冷水进阀温度、高端阀冷内冷水出阀温度为输入,以高端阀冷膨胀罐的液位为输出,构建关于膨胀罐液位随机森林算法模型。本文使用均方误差(Mean Squared Error, MSE)来定量的分析比较本文所建立的随机森林阀冷系统膨胀罐液位的预测精度,来评价预测结果, 的定义如下:

式(7)中, 代表选取的样本总数, 为的预测模型的输出值(即预测值),  为阀冷系统膨胀罐的液位的测量值。如果建立的模型越准确,MSE的数值将越小。

随机森林算法需要调整的参数少,通过数据训练得到预测模型后,可获得特征的重要性程度。随机森林模型需要给定决策树数量和每棵树的特征量,图1为误差比率和决策树数量的关系,可知模型误差比率随着决策树数量的增加而变小,从中可以选择合适的决策树数量。

图2给出了训练集对比图,图3展示了测试集对比图,结果显示,无论是训练集和是测试集,该文建立的随机森林算法模型输出均能够很好地拟合实际液位测量;训练集得到的均方误差MSE=0.003184,测试集的均方误差MSE=0.003283,验证说明了随机森林模型预测结果的准确性。图4是以实测数据为横坐标,预测数据为纵坐标,建立的y=x拟合图,可以看出,训练集和测试集的数据都在斜率为1的直线左右分布,说明模型能够较好地拟合实测输出。

4结语

该文研究基于随机森林算法的阀冷系统膨胀罐液位预测方法,采集阀冷系统重要参数数据,开发随机森林回归算法,利用训练集数据对膨胀罐的液位进行预测建模,得到预测模型,结果表明模型预测数据能够较好地拟合实测数据,说明该文膨胀罐液位预测模型的有效性,对阀冷系统安全稳定运行具有一定的参考意义。

参考文献

[1]赖桂森,雷庆山,梁家豪,等.换流站阀冷系统压力的滑动窗口LS-SVM预测模型[J].电子技术与软件工程,2020(19):147-149.

[2]赖皓,雷庆山,尹海涛.换流站阀冷系统冷却水进阀温度预测方法研究[J].电工技术,2021(12 ):21-22,179.

[3]赖桂森,吴安兵,李剑芳,等.基于电去离子技术在换流站冷却系统中的应用[J].广东化工,2020,47(22):62-63.

[4]刘芹,彭在兴,王颂,等.基于随机森林算法的断路器分合闸线圈故障电流曲线识别[J].高压电器,2019,55(7):93-100.

[5]方晨曦.基于随机森林算法与无人机在边坡破损辨识中的应用[J].福建交通科技,2020(1 ):30-34.

[6]王仁明,汪宏阳,张赟宁,等.基于分段改进S变换和随机森林的复合电能质量扰动识别方法[J].电力系统保护与控制,2020,48(7):19-28.

[7]寇德谦.基于随机森林算法管理和评估变电站计量装置全寿命[J].计算技术与自动化,2020,39(4):106-111.

[8]马东.基于DWT和随机森林算法的运动员损伤可能性监测系统研究[J].哈尔滨师范大学自然科学学报,2020,36(4):33-38.

作者简介:张浪文(1986—),男,博士,助理研究员,研究方向为大数据建模与分析。

通信作者:邹培炯(1983—),男,硕士,高级工程师,研究方向为机械制造工艺与设备,E-mail:zoupj@goaland.com.cn

猜你喜欢
液位决策树预测
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
除氧器液位控制器切换异常原因分析及应对措施
简述一种基于C4.5的随机决策树集成分类算法设计
天然气车辆液位测量系统相关性的研究
决策树学习的剪枝方法
TEP除气装置液位控制及故障分析
《福彩3D中奖公式》:提前一月预测号码的惊人技巧!
决策树在施工项目管理中的应用
智能液位控制器在排水系统中的应用