基于支持向量机的变压器碳排放预测模型

2024-01-20 06:15陈远东孟辉李猛克张海龙张超梁伟韩钰姬军
包装工程 2024年1期
关键词:铁芯特高压高斯

陈远东,孟辉,李猛克,张海龙,张超,梁伟,韩钰,姬军*

基于支持向量机的变压器碳排放预测模型

陈远东1,孟辉1,李猛克1,张海龙1,张超1,梁伟1,韩钰2,姬军2*

(1.国网内蒙古东部电力有限公司内蒙古超特高压分公司,内蒙古 通辽 028000; 2.国网智能电网研究院有限公司,北京 102209)

解决变压器中主要设计参数影响下的碳排放量预测问题。本文利用随机森林(Random Forest,RF)算法和支持向量机(Support Vector Machine,SVM)算法进行对比,构建一个变压器碳排放预测模型。通过对变压器的全生命周期进行评价,确定铁芯的长宽比为影响碳排放量的主要因素,对给定参数下的碳排放量进行预测,并与实际值进行对比分析得出,3类预测模型中,SVM高斯核模型的平均绝对误差值约为5.37,与碳排放实际值最为接近,故采用高斯核函数的非线性支持向量机预测模型最优。证明支持向量机高斯核函数预测模型更具有预测准确性和有效性,以期能为生产企业进行低碳设计提供参考依据,为电力行业生产设备的可持续设计研究提供一定的借鉴意义。

碳排放预测;变压器;支持向量机算法;随机森林算法

碳排放量化是国家寻求低碳发展路径的重要基础,它不仅可以为低碳路径研究提供数据基础,还能进一步探明排放的碳源,确定各行业的低碳化路径及低碳技术。电力部门作为碳排放大户,如何在电力领域实现碳排放量化,对我国双碳目标的实现具有重要意义[1]。

800 kV特高压变压器是电力系统中用于变换电压的关键设备,其零部件的生产设计很大程度上影响着变压器设备的碳排放总量。特高压变压器生产过程中产生碳排放的机理是能源消耗和化石燃料的使用。例如,特高压变压器的铁芯通常由硅钢片构成,生产过程中涉及钢材的提取、冶炼和加工等步骤,这些过程会使用大量能源,尤其是在冶炼过程中需要高温,因此会产生大量碳排放。特高压变压器的线圈是由导电材料制成,通常是铜或铝。这些材料的提取、加工和制造过程也需要能源,并且产生碳排放。此外,用来保护线圈和其他部件的绝缘材料,以及用来确保正常运行温度的冷却系统,均使用了化石燃料以及燃煤电厂提供的电力。电力生成过程中产生的碳排放将间接影响到变压器的碳排放。

碳足迹(Carbon Footprint)是测算和衡量研究特定过程或活动中产生温室气体的多少,进而评价这种过程或活动所产生温室气体的量,以及对环境所造成的影响程度。国内外学者对此方面的研究也从未停止过,Barthelmie等[2]按照地域划分,将碳足迹定义为一定区域内消耗能源(包括交通)过程中产生的CO2的总量,间接排放的CO2也在测算范围内;Hertwich等[3]也按照地域划分,将碳足迹定义为产品生产、消费、服务顾客过程中所产生的CO2的总量。

随着人们对碳足迹的认识逐步加深,人们开始逐渐采取措施以减少碳排放量,并逐渐出台政策法规。Wang[4]从我国环境管制政策对碳排放的间接效应研究,认为我国现行的环境规制政策能够有效抑制碳排放,实现预期的碳减排目标。钟军[5]在碳排放量测算方法上,根据产品全生命周期中能量的轨迹及变化,分析研究建立了根据动态特征的产品生命周期能量模型。杨东等[6]在产品生命周期评价方面,以风力发电机为研究对象,测算出各个生命周期所占碳排放总量的比例,找出影响碳排放量最重要的因素是废弃处理过程。王亮[7]针对已有的生命周期评价(Life Cycle Assessment,LCA)模型,以压缩机转子为研究对象,利用生命周期清单分析(Life Cycle Inventory,LCI)方法对环境影响进行评价,确定了选取生命周期评价的方法准则,并对清单数据进行有效分析与质量评估,将投入产出法应用其中,设计出新的生命周期评价模型。在碳排放评价方面,王路洋等[8-9]从微波炉、电冰箱等家用产品的全生命周期角度入手,对家用产品碳排放评价指标体系进行研究,产品碳排放的研究开始贴近日常生活。

除了预测模型之外,还有一些其他的碳排放评价方法。例如,边际排放分析(Marginal Emissions Analysis,MEA),该方法通过评估新增产品或服务对系统整体碳排放的边际影响来衡量其环境影响,它可以帮助确定新项目或决策对碳排放的贡献,但需要准确的基准数据和边际变化的评估;能源管理系统(Energy Management System,EnMS)是一种组织管理方法,通过监控和改进能源使用情况,从而减少能源消耗和相关碳排放。它可以帮助企业在生产过程中识别和改进能源效率,从而减少碳排放。然而,EnMS主要关注能源管理,可能无法全面评估碳排放的其他来源。

现阶段,国内外学者研究LCA概念和理论的居多,对产品碳排放量的不确定性研究较少。对于不确定性问题,只考虑LCI方法的影响也不够全面,对基于产品生命周期碳排放量的预测问题,其方法和准确度仍有很大的研究空间。

在变压器碳足迹分析预测领域,随机森林(Random Forest,RF)和支持向量机(Support Vector Machine,SVM)拥有明显优势,因而得到广泛应用。首先,RF能够解决预测过程中的过拟合问题,并且在变压器碳足迹分析中,有效处理高维度特征数据,并对其重要性进行评估,保证预测结果的准确率和稳定性。其次,SVM可以在高维空间中构建决策边界,处理碳足迹分析中特征较多的数据集,并通过最大化边界来确定分类决策,具有较好的泛化能力,同时使用核技巧解决变压器碳排放预测中的非线性分类问题。

因此,本文构建一种变压器碳排放预测模型,提出将随机森林、支持向量机等智能算法运用在变压器的设计过程中,以期能够解决实际生产过程中碳排放量的收集和测算难度较大的问题。满足企业对碳排放量的设计需求,以达到节能减排效果。为电力行业的低碳可持续设计研究提供依据,推动该行业向绿色可持续化方向升级。

1 碳排放预测模型的构建

为了使提出的变压器碳排放预测模型具备更好的适用性,本文分别基于随机森林和支持向量机2种智能算法构建预测模型,其中基于支持向量机的预测模型又分为线性核SVM和高斯核SVM 2种类型,通过对3种模型的预测能力进行对比分析,得到变压器碳排放最优预测模型。本文结构框架如图1所示。

1.1 基于随机森林算法模型

随机森林(Random Forest,RF)是由决策树建成的“森林”,随机森林决策过程中需要建立一定数量的决策树,并通过这些决策树进行投票决策[10]。其原理如图2所示。

图1 变压器碳排放预测模型

图2 随机森林算法原理

在碳排放预测过程中,运用随机森林进行预测碳排放量,可以对训练样本和特征参数同时进行采样,保证每棵决策树之间的独立性,预测结果更加准确。随机森林预测模型保证了数据选取的随机性,而且随机性在数据树中的节点分裂也同样存在。这2个随机性保证了即使在决策过程中没有对树剪枝,其预测出的数据也不会出现过拟合现象[11]。运用随机森林的预测模型训练与测试过程如图3所示。

1.2 基于支持向量机算法模型

图3 随机森林预测模型训练与测试过程

同时,支持向量机拟合函数的优化目标可以表示为在约束条件式(3)下的最小化问题:

式中:为惩罚系数。

对式(3)的求解通过拉格朗日方程法和对偶原理转化为二次规划问题,其对偶优化问题可以表示为:

对训练集数据来说,不能严格满足线性函数,因此需要引入高斯核函数,转换为式(5)。

最终求解后,可以得到碳排放量基于核函数SVM的预测回归方程为:

支持向量机相较于随机森林算法的优点是:在样本数据有限的情况下,可以在复杂的模型与学习能力之间寻求最佳,以求获得最优的泛化能力[12-14]。其过程如图4所示。

图4 SVM预测模型训练与测试过程

Fig.4 Training and testing process of SVM prediction model

2 实例仿真与分析

铁芯是特高压换流变压器的主体,其体积的大小很大程度上影响着特高压换流变压器的碳排量。本文选取铁芯为研究对象,以铁芯的设计为出发点,从长宽比、厚度和材料密度3个特征参数测算对碳排放的综合影响,分别计算出各个特征参数之间的相关程度,同时计算出每个特征参数对碳排放量的贡献度,并选取一定量的参数数据作为训练集和测试集;用基于随机森林和支持向量机算法的预测模型,预测出相应参数下的碳排放量,优化得到碳排放量预测误差最小的预测模型。

2.1 确定关键参数并收集数据

特高压换流变压器碳排放预测的关键参数即为对碳排量贡献值(相关度)大的参数,关键参数通过查阅文献和调研数据确定,不同的参数值下的铁芯碳排放量不同,是由于铁芯质量不同导致的。确定关键参数的目的是减少无关和相关程度小的变量,减少计算量的同时保证碳排放量预测的准确度[15]。

本文根据调研数据,以800 kV特高压换流变压器为例,对碳排放预测模型进行验证分析,各阶段碳足迹计算结果如表1所示。

表1 各阶段特高压换流变压器碳足迹计算结果

Tab.1 Carbon footprint calculation results of UHV converter transformers at each stage

2.2 计算关键参数相关性

用皮尔逊算法对关键参数的相关性进行计算。所谓相关性指用一个参数变量去预测另一个参数变量的精确程度,相关系数越高,2个参数变量之间的共变部分就越多,就可以通过其中的一个参数变量的变化来获取另一个参数变量的变化趋势[16]。

2个参数变量仍用和表示,则皮尔逊相关系数的计算见式(7)。

利用皮尔逊算法计算特高压换流变压器铁芯各个特征之间的相关性,互相影响程度。通过皮尔逊算法还可以计算出关键参数对特高压换流变压器铁芯碳排放量的贡献值,并通过相关性热力图分析出两两参数之间的相关性,其结果如表2所示。

表2 参数间的相关性系数

Tab.2 Correlation coefficient between various parameters

从表2中就能看各参数之间的影响程度,以及各个参数对碳排放量的贡献值。其中,铁芯长宽比对碳排量的贡献值最大,密度次之;与长宽比相关性最大,即影响最大的是材料密度,说明在考虑特高压换流变压器铁芯选材时首先要考虑到材料的长宽比。

2.3 关键设计参数下的碳排放量

通常情况下,特高压换流变压器铁芯的长宽比为1∶1.5~1∶6(即0.17~0.67)时,材料密度的最大值为8.03 t/m3、最小值为7.5 t/m3,厚度范围为6~12 mm。根据企业现场调研和现有行业规定标准选取50组数据作为碳排放量的测试集,以1∶5的比例选取数据作为训练集。

2.4 碳排放量预测模型

将上述主要设计参数下的碳排放量数据带入基于随机森林和支持向量机算法的训练模型,根据特征变量预测出特高压换流变压器铁芯的碳排放量,并对不同模型的预测结果进行对比分析。通过调整模型的参数,提高模型的碳排放量预测精度,减小模型与实际碳排放量的误差值[17]。

2.4.1 基于随机森林的预测模型

随机森林算法的参数设置:树的数量为500;树的深度为20;节点划分方式为信息增益。将数据带入基于随机森林的预测模型运行,得到结果如图5所示。

图5 随机森林运行结果

数据中的均方根误差(RMSE),也称为标准误差,用来衡量这组数据的离散程度;平均绝对误差(MAE)是真实值与预测值的平均相差程度,预测数据如表3所示。

表3 随机森林运行后预测结果

Tab.3 Prediction results of random forest after running kgCO2e

由基于随机森林的预测模型预测出的数据可知,预测结果与真实值1 614.518 788之间的均方误差和平均误差分别为44.688 7、37.805 8,此误差值未能达到较好预期。由基于随机森林预测模型所得到得数据图也可以看出,数据都集中在极值的两端,且数据得拟合程度不好,数据呈集中状态,预测结果不太理想。

2.4.2 基于支持向量机的预测模型

将数据带入上述基于支持向量机的预测模型,支持向量机主程序运行结果如图6~7所示。其中,图6为线性核函数SVM运行结果,图7为高斯核函数SVM运行结果。

图6 线性核SVM运行后预测结果

图7 高斯核SVM运行预测结果

其中,线性核SVM模型的均方误差为644.627 842,均方根误差为25.389 522,平均绝对误差为19.420 924;高斯核SVM模型的均方误差为55.184 126,均方根误差为7.428 602,平均绝对误差为5.368 300。线性核预测结果为[1 666.745 709 01 1 656.102 141 42 1 661.545 666 42],高斯核预测结果为[1 708.639 245 42 1 713.303 579 13 1 721.003 550 98]。

通过结果可以观察到,特征变量与预测值(即碳排放量)之间呈现出非线性函数关系[18],具体来说是高斯核函数关系。此外,从绝对误差值和预测图中可以得出结论,支持向量机高斯核函数预测模型在预测效果上优于随机森林预测模型。这意味着在特高压换流变压器铁芯制造阶段的碳排放量预测中,特征变量与预测值之间的关系并非简单的线性关系。相反,采用高斯核函数可以更准确地捕捉到特征变量之间的非线性关系,从而提高了预测模型的性能。

进一步观察绝对误差值和预测图表明,支持向量机高斯核函数预测模型相较于随机森林预测模型具有更好的预测效果。这表明在该碳排放量预测问题中,支持向量机高斯核函数模型能够更准确地预测变压器的碳排放量,提供更可靠的预测结果。

2.5 预测模型分析

将上述3种预测模型的结果误差值进行对比分析,如表4所示。

表4 预测模型数据分析

Tab.4 Prediction model data analysis kgCO2e

随机森林模型的均方误差最小,其次是支持向量机高斯核函数模型,而支持向量机线性核函数模型的均方误差较大。这说明特高压换流变压器铁芯的碳排放量与特征参数之间并不是线性关系。

从平均误差值的角度来看,支持向量机高斯核函数模型的平均绝对误差值最小,为5.368 3,而支持向量机线性核函数模型和随机森林模型的预测数据具有较大的平均绝对误差。与实际铁芯碳排放量相比,高斯核函数模型的预测值与实际值之间的误差程度仅为0.3%左右。这充分说明了预测模型的准确性和有效性。

根据得到的结果可知,支持向量机高斯核函数模型在预测特高压换流变压器铁芯的碳排放量方面表现出色。它能够更准确地捕捉到特征参数与碳排放量之间的非线性关系,提供更精确的预测结果。相比之下,支持向量机线性核函数模型和随机森林模型的预测效果稍逊,其预测误差较大。

综上所述,可以得出结论,支持向量机高斯核函数模型是一种准确且有效的预测方法,能够在特高压换流变压器铁芯的碳排放量预测中提供较优的性能。因此,企业可以通过收集与变压器结构设计相关的数据,包括铁芯的长宽比、绕组设计、材料选择等,从中选择与碳排放量相关性较高的设计参数作为特征。将设计参数进行组合、转换或生成新的特征,利用支持向量机高斯核函数回归模型,对变压器的设计参数进行优化,优化目标设置为最小化碳排放量,同时还需满足其他设计约束和要求。根据实验结果,对支持向量机高斯核函数模型进行迭代和改进。经多次优化和调整后,获得变压器设计参数的最优方案,以显著减少变压器制造过程的碳排放量。

3 结语

本文选择了特高压换流变压器的主体部分——铁芯作为研究对象。以铁芯的设计为出发点,考虑了长宽比、厚度和材料密度这3个特征参数对碳排放的综合影响。通过计算各个特征参数之间的相关程度,评估了每个特征参数对碳排放量的贡献度。建立了一种基于非线性核函数支持向量机的碳排放预测模型。该模型运用了相关智能算法进行对比分析,如随机森林、线性核函数支持向量机以及高斯核函数支持向量。通过预测模型可以在设计阶段预测变压器的碳排放量,有助于制造企业在产品设计和工艺选择时考虑碳排放因素,从而实现低碳设计目标。

此外,预测模型还可以通过反复迭代和优化,确定最佳的设计参数组合,以实现最低的碳排放量。通过调整铁芯的长宽比、厚度和材料密度等参数,可以最大程度地减少变压器的碳排放。

该模型不仅可以帮助企业预测碳排放量以满足环保要求,还可以为政府的监督管理提供算法依据。这解决了实际生产过程中碳排放量收集和测算的难题。该模型有助于推进电力设备生产行业向可持续绿色化方向升级,并支持可持续发展战略的实施。

通过将预测模型应用于变压器设计优化,可以实现低碳设计目标,满足环保要求,并提供决策依据,推动电力设备生产行业向可持续发展方向迈进。

[1] 鲁非, 张露, 卢仰泽, 等. 基于电网全过程链的变压器碳排放测算与评价研究框架及应用展望[J]. 湖北电力, 2022, 46(4): 113-119.

LU F, ZHANG L, LU Y Z, et al. Transformer Carbon Emission Measurement, Evaluation Research Framework and Application Prospect Based on Whole Process Chain of Power Grid[J]. Hubei Electric Power, 2022, 46(4): 113-119.

[2] BARTHELMIE R J, MORRIS S D, SCHECHTER P. Carbon Neutral Biggar: Calculating the Community Carbon Footprint and Renewable Energy Options for Footprint Reduction[J]. Sustainability Science, 2008, 3(2): 267-282.

[3] HERTWICH E G, PETERS G P. Carbon Footprint of Nations: A Global, Trade-Linked Analysis[J]. Environmental Science & Technology, 2009, 43(16): 6414-6420.

[4] WANG X L. Study on the Indirect Effect of Environmental Control Policy on Carbon Emission in China[J]. Journal of Applied Science and Engineering Innovation, 2020, 7(3): 2-3.

[5] 钟军. 液压机低碳制造及其实施关键技术研究[D]. 合肥: 合肥工业大学, 2015.

ZHONG J. Research on Low-Carbon Manufacturing of Hydraulic Press and Its Key Technologies[D]. Hefei: Hefei University of Technology, 2015.

[6] 杨东, 刘晶茹, 杨建新, 等. 基于生命周期评价的风力发电机碳足迹分析[J]. 环境科学学报, 2015, 35(3): 927-934.

YANG D, LIU J R, YANG J X, et al. Carbon Footprint of Wind Turbine by Life Cycle Assessment[J]. Acta Scientiae Circumstantiae, 2015, 35(3): 927-934.

[7] 王亮. 基于多种清单分析方法的压缩机转子生命周期评价[D]. 大连: 大连理工大学, 2017.

WANG L. Life Cycle Assessment of Compressor Rotor Based on Various Inventory Analysis Methods[D]. Dalian: Dalian University of Technology, 2017.

[8] 王路洋, 符永高, 王玲, 等. 微波炉全生命周期碳排放评价[J]. 日用电器, 2014(12): 84-86.

WANG L Y, FU Y G, WANG L, et al. Evaluation on Life Cycle Carbon Emissions of Microwave Oven[J]. Electrical Appliances, 2014(12): 84-86.

[9] 张北鲲, 万超, 王玲, 等. 家用电冰箱碳排放评价指标体系研究[J]. 日用电器, 2016(9): 29-32.

ZHANG B K, WAN C, WANG L, et al. Research on Household Refrigerators’ Evaluation Index System for Carbon Emission[J]. Electrical Appliances, 2016(9): 29-32.

[10] EL H, SETTOUTI N, EL A, et al. A new correlation-based approach for ensemble selection in random forests[J]. International Journal of Intelligent Computing and Cybernetics, 2021(2): 251-268.

[11] 崔兆亿, 耿秀丽. 基于随机森林和量子粒子群优化的SVM算法[J]. 计算机集成制造系统, 2023, 29(9): 2929-2936.

CUI Z Y, GENG X L. SVM Algorithm Based on RF and Quantum Particle Swarm Optimization[J]. Computer Integrated Manufacturing System, 2023, 29(9): 2929-2936.

[12] 陈雨桐. 集成学习算法之随机森林与梯度提升决策树的分析比较[J]. 电脑知识与技术, 2021, 17(15): 32-34.

CHEN Y T. Analysis and Comparison of Random Forest and Gradient Lifting Decision Tree with Integrated Learning Algorithm[J]. Computer Knowledge and Technology, 2021, 17(15): 32-34.

[13] 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.

ZHOU Z H. Machine Learning[M]. Beijing: Tsinghua University Press, 2016.

[14] ANON. Machine Learning; Findings in Machine Learning Reported from University of Oxford (H-patches: a Benchmark and Evaluation of Handcrafted and Learned Local Descriptors)[J]. Journal of Robotics & Machine Learning, 2020, 5(3): 144-147.

[15] 曹婷. 啤酒发酵设备的LCA碳足迹分析及其不确定性研究[D]. 天津: 天津科技大学, 2019.

CAO T. LCA Carbon Footprint Analysis of Beer Fermentation Equipment and Its Uncertainty Research[D]. Tianjin: Tianjin University of Science & Technology, 2019.

[16] WIEDERMANN W, HAGMANN M. Asymmetric Properties of the Pearson Correlation Coefficient: Correlation as the Negative Association between Linear Regression Residuals[J]. Communication in Statistics- Theory and Methods, 2015, 45(21): 6263-6283.

[17] 曹正凤. 随机森林算法优化研究[D]. 北京: 首都经济贸易大学, 2014.

CAO Z F. Research on Optimization of Random Forest Algorithm[D].Beijing: Capital University of Economics and Business, 2014.

[18] MEGRI A, EL NAQA I. Prediction of the Thermal Comfort Indices Using Improved Support Vector Machine Classifiers and Nonlinear Kernel Functions[J]. Indoor and Built Environment, 2014, 25(1): 6-16.

Transformer Carbon Emission Prediction Model Based on Support Vector Machine

CHEN Yuandong1, MENG Hui1, LI Mengke1, ZHANG Hailong1, ZHANG Chao1, LIANG Wei1, HAN Yu2, JI Jun2*

(1. Inner Mongolia EHV and UHV Company, State Grid Inner Mongolia East Power Co., Ltd., Inner Mongolia Tongliao 028000, China; 2. State Grid Smart Grid Research Institute Co., Ltd., Beijing 102209, China)

The work aims to solve the problem of predicting carbon emissions under the effect of main design parameters in transformers. Random forest (RF) algorithm and Support Vector Machine (SVM) algorithm were compared to build a prediction model of transformer carbon emissions. Through the assessment of the life cycle of the transformer, length-width ratio of iron core was identified as the main factor affecting the carbon emissions and the carbon emissions under the given parameters were predicted and compared with the actual values. According to the analysis, among the three prediction models, the average absolute error of SVM Gaussian kernel model was about 5.37 and the prediction value was the closest to the actual value of carbon emissions, so the nonlinear support vector machine prediction model with Gaussian kernel function was the best. It is proved that the support vector machine prediction model with Gaussian kernel function has more predictive accuracy and effectiveness, aiming at providing reference basis for low-carbon design of production enterprises and certain reference significance for sustainable design research of production equipment in the power industry.

carbon emission prediction; transformer; support vector machine algorithm; random forest algorithm

TM402

A

1001-3563(2024)01-0254-08

10.19554/j.cnki.1001-3563.2024.01.030

2023-04-25

国家电网公司科技项目(526608210002)

猜你喜欢
铁芯特高压高斯
一种橡胶圈内置铁芯压合自动化生产线的备料系统
数学王子高斯
天才数学家——高斯
卷铁芯自耦变压器的结构设计与分析
1000kV特高压输电线路失效绝缘子判断的仿真计算
我国最长距离特高压输电工程开工
有限域上高斯正规基的一个注记
特高压输电塔双重非线性分析
千亿投资助推特高压审批开闸2014年迎来特高压大年
变压器铁芯故障接地的分析与处理