廖志伟,陈琳韬,黄杰栋,张文锦
(华南理工大学电力学院,广东广州 510640)
为进一步下调电价与优化电力上下游企业的利润分配,自2016年全国各地区电力交易中心成立以来,电力市场化交易量不断攀升.目前能源互联网战略明确指出能源系统与电力生产消费协同一体化目标,保障电力市场出清电价贴合发电与输电成本.煤炭作为我国当前发电的主导能源,预测电煤价格使其“透明-可见-可知”对进一步扩大电力市场化交易与完善电力系统的规划调度具有重要意义.
电煤价格预测分为长期预测、中短期预测和超短期预测,中短期电煤价格的准确预测是实现能源互联网与电力成本透明化的重要任务.国内外煤炭价格预测研究大多将煤炭价格作为一种价格时间序列,研究中往往基于数理统计学和随机过程理论[1-6]建立线性时间序列预测模型.文献[7]运用协整分析方法,构建向量误差修正模型(vector error correction,VEC)较好地反应煤炭价格的变化;文献[8]分析线性回归模型在电煤价格时间序列预测中适用性;文献[9]运用自回归滑动平均模型(auto regressive moving average,ARMA)实现了对煤炭价格长期趋势预测.根据数理统计分析构建的电煤价格线性预测模型,往往只适用于平稳的时间序列;考虑到我国于2013年正式确立了煤炭价格市场化机制[10-12],上述仅考虑电煤价格自身波动规律的预测模型,无法反映复杂的市场化特征对电煤价格的影响.近几年,模式识别和机器学习的方法被应用于电煤价格预测中.文献[13]根据模式匹配法建立了煤炭价格的非线性短期预测模型,并利用秦皇岛与山西的煤炭价格进行了分析;文献[14]根据BP神经网络建立了电煤特征与价格之间的非线性关系;文献[15]建立了PSO-RBF(particle swarm optimization-radial basis function)电煤价格预测模型,对秦皇岛港煤价进行预测分析.上述机器学习模型在电煤价格预测中取得了一定的效果,然而在中短期电煤价格滚动预测过程中,单一模型在不同的时间节点的预测精度存在差异.在滚动预测过程中,特征量动态波动,各个特征变化程度不尽相同.那么从算法的性能上来看,不同算法的学习模型或者相同算法不同参数的学习模型,各自对数据的学习方式与认知形式都具有一定的差异性,导致彼此的决策边界与数据感知灵敏度不相同,这将导致不同算法对某些特征波动感知不灵敏,出现灵敏度盲区.为改进对电煤价格的预测,文献[16]通过串行和并行两种方式对ARIMA(auto regressive integrated moving average)与SVR(support vector regression,支持向量回归模型)进行组合优化以改进对电煤价格的预测,但该方法仅将算法进行简单的加权运算,在滚动预测中没有自适应地动态调整参数.
所以综合上述研究现状,可以从两个方面进行优化,其一:通过多模型耦合的方法,解决单一模型灵敏度盲区问题,模型融合时灵敏性将优势互补;其二:通过确立动态权重解决滚动预测过程中的模型动态耦合关系.集成学习是机器学习的一个重要的分支,是一种利用统计学的交叉验证方法,以实现多个初级学习器融合的算法[17].文献[18]根据Adaboost集成学习方法,提高了软测量模型的预测精度;文献[19]根据集成学习实现了深度神经网络集成,在一定程度上实现了预测纳斯达克指数.然而电煤价格较股票指数而言,其价格机理和波动原因更具规律性和约束性,所以根据集成学习进行电煤价格预测更具现实意义.
因此,本文在分析国内外电煤价格预测与集成学习背景基础上,将多种效果良好的机器学习算法进行有效结合,基于Stacking构建了多智能集成学习的中短期电煤价格预测方法.首先,文中介绍了Stacking与电煤价格预测初级学习器的预测机理;然后,分析并设计Stacking集成模型的框架结构,建立了中短期电煤价格预测的集成学习模型,并通过差值点均差的方法,确定了中短期电煤价格预测的集成学习模型的最终参数结构;进而,通过结合实际的滚动预测分析,确定了各模型灵敏性盲区的存在,进一步说明集成学习预测的必要性;最后,采用中国煤炭资源网提供的电煤价格及其影响因素验证了文中集成算法的有效性.算例中表明,文中提出的集成学习模型具有动态化的权重参数并且在滚动预测过程中效果优于单一模型,表现了其在电煤价格预测中的适用性.
机器学习器中集成模型具有3类框架结构,分别是:Bagging,Boosting和Stacking.Stacking模型框架是基于不同模型的误差特性所构建的,其目的是为了削弱因单一模型灵敏性不同带来的预测误差影响.在Stacking模型中,第1层的个体学习模型称为初级学习器;第2层用于融合初级学习器的模型称为元学习器.集成模型涉及初级学习器选择问题,其选取方式分为两种,第1:选取不同类型算法的学习器;第2:选取相同算法但参数不同的学习器.本文采用第1种方法构建Stacking中短期电煤价格预测模型.
如图1为Stacking模型的结构.初级学习器模型的数量将影响集成模型的预测效果,通常Stacking的初级学习器数量为3-5个[20-21].
图1 Stacking模型流程Fig.1 Processing of Stacking
集成模型涉及一系列学习器,为简化模型说明,此处对各个算法模型的相关变量进行统一定义:假设电煤价格训练样本总数为n,煤价影响特征总数为p,给定煤价样本的向量为xi=[xi1,xi2,···,xip],任意样本的特征值都满足xij ∈[μj,τj],其中
表示特征j的最小值,τj=max([x1j,x2j,···,xnj])表示特征j的最大值.
XGBoost是一种Boosting集成学习算法,能够组合若干个精度较低树模型成为泛化能力较强的高精度模型.XGBoost电煤价格预测模型通过调用上一棵树的预测残差实现参数优化,预测结果的偏差在树模型的第1个树结构中传入;其采用二叉树策略和贪心策略,在模型构建过程中选择最优的电煤价格特征i,在考虑其最小值μj与最大值τj之间所有可能的取值的基础上进行二叉树分割.那么关于电煤价格的树模型表示为
其中:K表示树的总数;fk表示第k棵树;表示对特征向量xi的预测结果.
如式(2)所示,XGBoost的损失函数由两部分组成,第1部分为预测误差,第2部分为模型结构的复杂程度:
其中:n表示样本总数;r表示损失函数;yi,分别表示第i个电煤价格样本对应的实际值和预测值;K表模型树的总数;Ω(fk)表示第k棵树的复杂度;wj表示树结构中第j个叶子节点的预测值.
如果预测模型的第K棵树拥有T个叶节点(特征),则表示n个电煤价格样本将按照损失函数的要求最优化分布在T个叶子节点(特征)上.式(5)为叶子节点函数,L(xi)表示xi在归属于叶子节点l.
第K棵树的价格修正预测值表示为
其中:wl表示在该树结构中叶子节点l的预测结果.
根据式(2)-(4),预测模型损失函数可转化为如式(7)所示的第K棵树电煤价格修正量的形式,此时前K棵树的复杂度可看作是常数;进而,根据泰勒变换,式(7)转换为式(8)所示二次优化形式,式(8)的中括号第1项为第K-1棵树的误差,可视为常数.
将式(3)(5)-(6)代入式(8)得到式(9),进一步对式(9)求导得到第K棵树最优的预测值,损失函数最小值如式(10)所示:
此外,节点的分裂需要满足模型的增益,模型只进行有意义的分裂.根据式(10),模型分裂的增益函数如式(11)所示:
如果Gain<0,表示分裂后损失函数可以进一步减少,此时节点分裂是必要的;若Gain>0则节点不需要分裂.值得注意的是,当损失函数达到阈值或者树结构达到最大深度时,二分裂也将停止.
SVR,即支持向量回归模型,被广泛应用于时间序列的回归预测之中.在电煤价格预测中,SVR模型的的优化目标是寻求超平面,使得所有样本彼此的总体距离偏差最小.为了简化求解回归方程过程中参数复杂性,SVR设置内部间隔带,即当电煤价格学习样本xi在落于超平面间隔带中时,定义其误差r(f(xi)-yi)=0,进而得到SVR形式的损失函数为
其中:第1项表示回归函数参数的L2范数,用于表示结构风险;第2项表示测量误差函数,用于表示经验风险;C为正则化常数.
为了避免SVR回归模型对信息噪点的敏感程度,提升模型的泛化性能降低过拟合风险,还需要引入松弛变量ξ1,ξ2,分别扩展间隔带的上部与下部空间.引入松弛变量后,式(12)损失函数变为
与XGBoost模型利用二叉树不同,SVR模型利用核函数求解电煤价格及其特征之间的非线性关系.核函数方法将低维度的非线性特征空间α,映射到高纬度的线性特征空间β中,解决了特征空间映射过程中出现的维数灾难问题[22].在β高维空间中,电煤价格的非线性预测转化为线性预测.
长短期神经网络(long short-term memory,LSTM)通过门结构能够有选择性地处理长短不一的有效状态,在时间序列预测中拥有良好的表现.电煤价格预测本质上是一种时间序列预测.通过样本训练,LSTM模型将从历史特征信息中获得与电煤价格关联且有效的信息,以及他们相互间的映射关系.图2表示LSTM网络的第t个神经元,由输入门、遗忘门和输出门组成.LSTM通过激活函数如Sigmoid,双曲正切函数(Tanh)来求解非线性关系.
图2 LSTM神经元结构Fig.2 Structure of LSTM neurons
输入门、遗忘门和输出门中间变量如式(14)-(17),其中式(14)表示遗忘门中间变量;式(15)-(16)表示输入门中间变量;式(17)表示输出门中间变量,
其中:WH,WI,WJ和WK分别表示中间变量H,I,J和K的权重;cH,cI,cJ和cK表示中间变量H,I,J和K的偏置项;Ot-1表示神经网络上一个时刻的输出值;xt表示当前时刻的输入特征值.
通过输入门和遗忘门共同作用,输出该神经元的状态变量St,其如式(18).该神经元的输出量为Ot,其如式(19)所示.如果第t个神经元是网络中的最后一个神经元,则Ot就是相应特征的煤价预测值.
其中:⊗为定义的按位乘法符号;⊕表示按位相加符号.
由图2可知,遗忘门中间变量和上个时刻的状态变量,共同决定着上一个单元的学习状态;输入门中间变量决定如何更新当前单元的学习状态;输出门进一步处理当前单元状态变量,使其转化为输出量.所以,通过若干个LSTM神经元相互配合,可完成电煤特征有用信息序列区间的选择和刻画.
集成学习作为一种利用统计学理论构建的机器学习模型融合框架,其预测性能与泛化能力与初级学习器和元学习器的选择是相关的.
构建集成学习模型框架需要分两步走,第一,筛选初级学习器.确定初级学习器需要考虑两个方面,首先,要考虑初级学习器的电煤价格预测效果;其次要考虑各个学习器之间差异程度.一些学习器在煤价预测中拥有着不错的预测效果,其中:SVR作为传统的机器学习算法,在有限样本与复杂特征的回归中有一定优势;分类与回归树(classification and regression tree,CART)作为经典的树结构算法可以实现较为准确的连续回归预测;基于CART基础改进的梯度提升决策树(gradient boosted decision tree,GBDT)与XGBoost算法,具有更好的适应力和泛化能力;循环神经网络(recurrent neural network,RNN)对于处理时间序列对象拥有较好的效果;其变体算法LSTM,针对具有不同有效时间区间的时序对象时效果显著.Stacking融合各个模型面对不同特征变化的独特预测特性,能够在较大程度上发挥各个学习模型的预测能力,提高滚动预测的整体精度,文中提出利用差值点均方差的标准来衡量初级学习器之间的差异.差值点均差衡量方法是
1) 建立统一的训练集,根据各个训练模型分别得到初级学习器的预测值向量vi;
2) 寻找各模型预测值中差值大于阈值α的数据点数量,并统计这些数据点的均方差为r;
3) 若均方差大于阈值β,则表示模型之间具有差异性;否则认为模型对不同特征的变化灵敏性相近,不能构成集成模型的初级学习器.
综上所述,基于算法的实践应用效果,上述模型皆可作为初级学习器的候选模型;进而,需要通过差值点均差以及预测性能确定最终的模型.
第2步,确定元学习器.元学习器需要从各个初级学习器的预测结果中,找到合适的权重修正初级学习器预测带来的灵敏性差异,所以需要具有较强的泛化能力.XGBoost模型采用了正则化与列抽样的方法,一定程度上抑制了过拟合现象,泛化能力较强;同时损失函数中引入了二阶导数,拥有较高准确性,所以XGBoost适合作为元学习器.
Stacking模型框架中上下两层模型的耦合是通过K-fold交叉验证过程实现的.
首先,对模型具体参数进行假设:初级学习器由M个学习模型构成,原始训练集表示为
原始测试集表示为
其中:xi=[xi1,xi2,···,xip]表示特征向量的第i个样本,p表示特征维度,yi表示与特征xi对应的电煤价格,m和n-m分别表示训练集和测试集样本的总数.
其次,对于原始训练集,将原始数据集随机且平均分成k部分,那么第j部分表示为Dj,剩余部分表示为Dexcept(j).
进而,每个初级学习器都要进行一次K-fold交叉验证计算,交叉验证的结果是Stacking第2层集成模型数据来源.初级学习器ζi进行K-fold交叉验证具体方式是:ζi分别利用Dexcept(j)和Dj作为训练集和测试集构建k个交叉验证子模型,每个交叉验证子模型对子模型中的测试集Dj将得到预测结果Pi,j;对原始测试集T得到预测结果Ri,j.通过k个交叉验证子模型,初级学习器ζi从原始的训练集和测试集中,分别得到预测向量
其中:ri,n为k次交叉验证过程对第n个样本的预测平均值,表示为ri,n=
最后,在第1层模型预测训练中,M个初级学习器将得到预测矩阵
预测矩阵PT和RT分别构成Stacking框架第2层元学习器的训练集和预测集的特征,即元学习器的训练集和测试集分别为
对于一个集成算法而言,如果预测性能(准确性)可以优于各个初始学习器,则认为这种集成模型的构建是有意义的,为了检验Stacking集成模型与相关初级学习器的性能差异,文中采用滚动预测平均绝对百分比误差eMAPE--RP(mean absolute percentage error of rolling prediction,MAPE-RP)和滚动预测均方根误差eRMSE-RP(root mean square error of rolling prediction,RMSE-RP).
其中:f(xi)表示测试集第i个样本的预测值,yi表示测试第i个样本的实际值,n表示测试集数量.
本文数据来源于中国煤炭资源网,实验采用2015-2020年5月的CCI5500电煤价格及相关特征信息进行验证分析.文中模型于python3.7.4、CPU i7 7700K环境中完成编程计算.首先,文中电煤价格预测模型利用历史特征信息进行特征空间重构.特征空间重构具体过程是:假设特征i表示为xi,特征i在第k年的第j个时刻的值表示为;那么在历史信息中,如果特征xi在第k年的序列与不同年份、相同时间段自身序列存在趋势相似的情况时,例如第l年序列,那么假设第k年往后的一段时间内,第k年序列走势
将可能与第l年趋势保持一致.那么根据这个假设,利用特征的历史信息对原始的特征空间进行重构后,各个特征对电煤价格的影响将突破原始的空间维度,所以文中将第k年前至当前年的特征序列作为影响当下电煤价格的因素.然后,通过卡方试验与相关系数电煤价格特征,确定5大影响因素,分别是:价格类指标、煤炭库存量指标、煤炭消纳量指标、港口煤炭调度量指标以及港口船舶数量指标,具体的特征指标如表1所示.其中煤炭消纳量是指国内电煤使用量参数;重要区域与重要企业是指重型负荷中心的大型发电企业;重要港口是指如秦皇岛港口等我国用作煤炭转运的重要港口.上述重要区域、重要企业以及重要港口均在电煤业内具有导向性地位.
表1 特征信息描述Table 1 Description of features
不同的机器学习预测模型挖掘出不同层次的信息,如XGBoost是利用叠加模型优化CCI5500的预测准确性;SVR通过超平面拟合电煤价格和各种复杂特征;LSTM则是将特征序列的时序片段与电煤价格进行多维度映射,预测模型体现特征变化的动态特性.实验选取2019年第1季度(1,2,3月)时间段,比较XGBoost,SVR与LSTM模型之间的预测效果.3种模型的平均误差如表2所示;图3所示为3种模型的预测结果可视化对比.
表2 2019年第1季度月平均误差Table 2 Average monthly error for the first quarter of 2019
图3 2019年第1季度各模型预测结果分析Fig.3 Analysis of the prediction results of each model in the first quarter of 2019
由表2和图3可知,在滚动预测过程中,不同的模型的准确性变化差异明显.SVR模型在1,2月份的预测效果最好,但是3月份的预测效果不如其余两个模型;XGBoost模型第1季度的预测表现越来越好,其预测误差逐渐降低;LSTM和XGBoost模型相似,拥有越来越好的预测表现,但是该模型存在极端的表现,在1月份的预测效果最差,其3月份的预测效果最佳.滚动预测过程中出现该现象的主要原因,是不同模型的其特定的算法特性,对不同特征变化的感知的灵敏度存在差异.这种感知能力的差异导致学习器获取不同信息.学习器获取信息能力的偏差而无法感知特定的信息变化,将导致某个特定时间段的预测误差过大,影响电力市场或电煤市场的具体决策.如同本例中LSTM模型1月与SVR模型的3月的预测,都是由于信息感知盲区而导致的误差变大.这种算法特性所导致的准确性偏差,可以由算法的多样性所弥补.Stacking集成模型在多样化学习器的基础上求同存异,能够弥补学习器在滚动预测中存在的准确性偏差过大的现象.
使用深度学习模型进行预测时,不同的样本特征比例,会对预测效果产生较大的影响.由于在实验中电煤价格预测模型考虑利用特征空间重构的方法进行样本构建,如果在初级学习器中应用LSTM深度学习模型,为减少特征空间重构过程中带来的样本特征比过小的问题,初级学习器还应考虑主成分分析(principal component analysis,PCA)的LSTM 模型PCALSTM.所以,初步选择如表3所示的模型作为候选学习器,并利用ζ1-ζ7表示各学习器.
表3 候选初级学习器编号Table 3 Candidate primary learner’s number
实验中预设5个初级学习器,需要通过比较各模型的准确性以及相互的差异性最终筛选出5个学习器.首先,根据候选学习器按月份滚动预测2019年的电煤价格;然后,根据预测结果选择典型月份(在典型月份中各模型预测结果存在明显偏差)分析各模型之间的差异性,这是因为在典型月份中各项特征快速变化,各模型信息感知差异性最大,最能反映出各模型感知信息的差异,而非典型月中,则难以反映模型感知能力的差异.每年第3季度全国各地相继进入夏季,发电企业的电煤消耗骤增,电煤价格相关特征快速变化,同时发电企业也亟需制定电煤购买计划以满足夏季发电计划,所以实验采取2019年夏季7月作为典型月份.典型月份的均方差如表4所示.
表4 2019年7月份各模型均方差对比Table 4 Comparison of the RMSE of each model in July 2019
各模型的预测差异性由差值点均差表示,实验中设置的差值阈值α设置为5元,统计各模型之间的差异性数量以及均差.各模型差异值点和差异值均差对比如表5-6.
表5 候选模型间差异值点数量分析Table 5 Analysis of the number of difference points between candidate models
根据表4所示准确性分析可知,PCA-LSTM模型的准确性最高,其次LSTM和XGBoost模型准确性相近,CART和GBDT模型的准确性最低;根据差异性数量分析,除了SVR,CART和GBDT模型之间差异值点数量小于10个点之外,其与其余算法模型、以及其余算法模型之间的差异值点数量都大于10,其中PCALSTM,LSTM和的RNN差异值点最多;根据差异性均差分析,除了SVR和CART以及SVR和RNN之间的均差低于8元,其余模型对的均差都大于8元.
根据表5-6的差异值点数与差异值均差分析可知,SVR模型与CART和GBDT之间具有相似性.由于候选学习器中,CART,GBDT与XGBoost同属于树结构预测模型,并且因为集成学习初级学习器的数量有限,所以在SVR,CART和GBDT3者中仅保留SVR模型.
表6 候选模型间差异值点均差分析Table 6 Analysis of the average difference between candidate models
最终选择了PCA-LSTM,LSTM,SVR,RNN以及XGBoost模型作为集成学习模型的初级学习器.如图4所示,为本文建立的基于集成学习的电煤价格预测模型数据框架流程图.
图4 基于Stacking的中短期电煤价格预测模型Fig.4 Stacking-based mid-term and short-term electricity coal price forecasting model
为检验本文提出的Stacking集成学习模型(初级学习器为PCA-LSTM,LSTM,SVR,XGBoost,RNN;元学习器为XGBoost)在滚动预测中的预测性能,将初级学习器与文中的集成模型的预测效果进行对比分析.实验考虑到不同季节时间段的特征波动变化不一致,所以分别在2019年到2020上半年共6个季度中,各选择一个月份代表该季度的预测效果.同时,为了检验所选初级学习器组合性能以及元学习器的预测性能,文中设立多种模型组合作为对照组1;BP和LR模型作元学习器的对照组2.
图5分别为2019年第1,2,3,4季度和2020年1,2季度的预测结果对比可视化图样.
图5 Stacking模型与各初级学习器滚动预测对比分析Fig.5 Comparison and analysis of rolling prediction between Stacking model and primary learners
表7反映了各种模型间的滚动平均误差以及滚动平均均方差对比.
从表7可知,Stacking集成模型的滚动预测的效果明显优于单个学习器,这意味着文中提出的Stacking拥有着比单一学习器更好的性能,具有更强的适用性,能够适应不同季节,更好地反映不同特征值变化对电煤价格的影响.
表7 滚动预测结果误差对比分析Table 7 Comparison and analysis of error of rolling prediction results
图6表示动预测过程中Stacking集成模型中各个初级学习器的权重占比.在滚动预测过程中,各种模型的权重占比是动态变化的,这种动态的权重修正了各种模型在预测过程中获取信息的偏差,使得Stacking的预测结果更接近真实值.
图6 滚动预测模型参与度分析Fig.6 Participation analysis of rolling prediction model
根据电煤价格预测的现实需求,模型往往需要预测未来一段时间的价格趋势,然而预测时间尺度的长短会对预测的精度造成影响.文中分别对各个模型进行不同时间尺度的预测性能分析,实验设置时间尺度为3天,7天,14天,21天和30天,用以表示中短期电煤价格预测的时间尺度.
由图7可知,随着预测时间测尺度的增加,电煤价格的预测精度一般会随之下降,其中以LSTM模型最为显著.从预测时间尺度变化对模型精确度和平稳性而言,文中提出的集成学习模型表现较各个初级学习器更为优异,当预测时间尺度为3天时,其RMSE-RP 为9.3元;当预测时间尺度为30天时,其RMSE-RP仅为12.18元,仅增加2.88元误差,表明了该模型在中短期电煤价格预测中实用性.
图7 不同时间尺度下各模型预测性能对比Fig.7 Comparison of prediction performance of each model under different time scales
对照组1中随机选择4种初级学习器组合,并根据控制变量规则设置XGBoost模型作为元学习器,其预测结果如表8所示.综合表7-8分析可知,文中构建的集成学习模型相比对照组1的模型性能更为优异.事实上,该分析结果仅表明该模型在限定的初级学习器范围内取得了局部优异性能,无法证明所构建的模型实现最优解.
表8 不同初级学习器组合的滚动预测误差分析Table 8 Analysis of rolling prediction error of different primary learner combinations
对照组2选择BP神经网络与LR模型作为元选择器,初级学习器和本文提出的模型相同.表9为对照组2与本文模型各季度滚动预测对比.由表9可知,XGBoost-Stacking模型的准确性有个别季度稍低于BP-Stacking模型,如2019年第2季度,但两者的差距不大;从总体的滚动预测误差而言,XGBoost-Stacking模型的预测性能比BP-Stacking模型高出约40%,证明了XGBoost模型作为元学习器的可靠性.
表9 不同元学习器的滚动预测误差分析Table 9 Analysis of rolling prediction error of different meta-learners
本文分析并借鉴了国内外电煤价格预测与集成学习的技术方法,引入了多种效果良好的电煤价格预测算法.通过分析滚动预测性能波动的客观现象,确定了各类算法在滚动预测过程中存在的信息感知能力差异.为此,文中基于Stacking模型构建了一种集合了XGBoost,LSTM,SVR和RNN模型的集成学习算法,以充分融合不同模型对数据信息的灵敏性差异.
实验对比分析了Stacking集成学习模型与各初级学习器在滚动预测中的预测效果,其结果表明:在滚动预测动态过程中,集成学习模型滚动预测准确性高于任一初级学习器;集成学习各初级学习器权重占比不断变化,动态调整初级学习器在获取信息过程的偏差.
实验中通过设置对照组分析了初级学习器结构与元学习器对预测性能的影响,其结果表明文中构建的集成学习模型具有一定的预测性能,但是并无法证明文中构建的模型实现了最优的组合搭配.从总体而言,文中所构建的电煤价格集成学习预测模型具有较好的准确性,具有较高的实用价值.