基于主成分分析-BP神经网络的风电备件需求预测

2024-02-06 01:34李晓娟张芳媛喻玲
科学技术与工程 2024年1期
关键词:需求预测需求量备件

李晓娟, 张芳媛, 喻玲

(1.新疆大学机械工程学院, 乌鲁木齐 830000; 2.新疆大学商学院, 乌鲁木齐 830000)

风电行业因地制宜利用风力发电,故风电机组主要分布在风能丰富的地方,且受风速随机波动影响较大。此类地方分布离散且偏远,因此机组建造及维修方面耗时较多。风电机组所涉及的物料众多,运行工况复杂多变,技术升级换代快,长期受极端天气、温度等复杂因素影响使得零部件易受损。因此,为了保障风机的正常运行,降低运维成本,提高风力发电的经济效益,寻找高效精准的方法对风电备件进行需求预测具有重大实际意义。

关于需求预测,国内外学者做了很多研究,一共分为两大类:定性与定量。关于定性预测,研究人员通常结合理论和实践经验来得出他们对未来需求的判断[1]。时间序列分析[2-6]将获得的数据仅按时间顺序排列成序,避免了复杂线性和筛选影响因素等难点,因而被大量应用。定量需求预测是将仿真与运筹学等相结合,建立一个数学模型并加以解决,以产生一个结果,显示预期目标和其他因素之间的规律。基于机器学习的预测方法也受到了国内外学者的青睐,具体有支持向量机方法[7-8]、神经网络[9-12]等。吕靖等[13]提出了一种基于GM(1,1)和BP神经网络的组合预测模型,通过MATLAB对大连水产品冷链物流需求量进行仿真预测,表明与单一的预测模型相比,该组合模型具有更高的预测精度。徐庶博等[14]针对需求量大且消耗规律难以把握的部队车辆周转器材进行传统灰色模型的无偏优化,并对残差进行马尔科夫修正,达到了较精确的效果。宋铭星[15]针对动车组不常用备件提出了新的分类及GA-BP神经网络算法预测方法,提高了动车组维护运营效率。徐廷学等[16]提出了一种基于改进非等间距GM(1,1)-BP模型的导弹退化状态预测方法,提高了导弹退化状态预测的精度。徐仁博[17]构建了时间序列与灰色预测备件需求预测模型,降低备件库存,提升了公司的经济效益。Gutierrez[18]将神经网络预测的性能与单指数平滑法、克罗斯顿法和Syntetos-Boylan近似法进行了比较,发现神经网络预测模型的性能普遍优于传统方法。Fan等[19]提出了一种间歇时间序列域划分算法,通过挖掘序列中的需求发生时间和需求间隔信息,构建度量指标,预测的稳定性和准确性都有显著提高。Portabales等[20]总结了使用人工神经网络预测电力需求的方法。Song等[21]针对零售业预测问题,采用双重相关分析、LSTM与ARIMA联合模型对销售额进行预测。Babongo等[22]将外部干扰作为预测因素,可提高预测精度,为随机库存控制理论做出了贡献。李云长等[23]针对服装企业面料需求非确定性、预测难的痛点,提出基于关联规则及组合模型的面料需求预测方法,提高预测精度。以上学者发现相比于单一模型的预测,组合模型预测的效果较好。

上述方法只有在有足够的历史数据且备件需求波动较小的情况下才能使用,有一定的局限性。此外,只考虑时间序列作为备件需求的影响因素,而忽略了产生备件需求的其他重要因素。风电行业不同于一般制造业,风机呈现广域稀疏式网络分布特点,所处位置偏远且离散,建造维修及运输都较为困难,风机所处环境复杂、运行强度高、零部件量大类多且复杂、故障类型复杂,导致备件预测存在诸多不确定性因素。基于上述问题,现从外部环境、备件自身情况等方面结合风电行业特性归纳影响风电备件需求的影响因素,用主成分分析法(principal component analysis,PCA)对其进行因素融合,减少冗余信息的影响。利用MATLAB软件对作为神经网络输入值的主成分分析值进行分析预测,并以金风科技企业近五年齿轮需求数据为例进行分析,以实现风电备件需求的准确预测,降低成本,保障风机运行。

1 研究方法

1.1 主成分分析法

主成分分析(PCA)是一种降低数据维度的方法,它将几个相关的变量结合起来,消除重复的变量,最大限度地增加新的不相关变量的数量,并确保新变量保留原有变量的信息,具体操作步骤如下。

(1)

步骤2计算特征值和相应的特征向量。相关系数矩阵R的特征值为λ1≥λ2≥…≥λm≥0,相应的特征向量为u1,u2,…,um,m个新ym指标变量由特征向量组成,其中第一主成分是y1,第二主成分是y2,第m主成分是ym。

R=[rij]m×n

(2)

(3)

步骤3计算特征值λj(j=1,2,…,m)的信息贡献率和累积贡献率。

(4)

(5)

式中:bj为主成分yj的信息贡献率;αp为主成分的累积贡献率。

步骤4计算综合得分,根据综合得分值可进行评价。

(6)

1.2 BP神经网络模型

BP神经网络模拟人类思维,是在误差反向传播算法基础上训练的多层前馈神经网络。BP神经网络通常由一个前馈层、一个隐含层和一个输出层组成。如图1所示,输入和输出层是单层结构,神经元的数量由训练模式决定。隐蔽层可以设置为一个或多个层,神经元的数量,也称为隐蔽层的节点数,通常由经验公式确定,即

(7)

图1 神经网络结构图流程图Fig.1 Neural network structure flowchart

式(7)中:h为隐含层神经元数;m为输入层神经元数;n为输出层神经元数;s为常数,一般取1

2 数据采集与预处理

2.1 影响因素确立与分析

风机的安装多于风能丰富之处,所以分布离散,具有广域稀疏的特点,并且所处自然环境较为恶劣,如高温、雷电等易造成零部件故障,一旦故障就会导致停机,增加维护成本;风电机组所包含的物料零件繁多,因此要慎重考虑供应商的选择及采购周期;在双碳背景及政策支持下,风机应用广泛,为了具有竞争力,升级换代快,技术变更占比较多;这些风机特性决定着风机备件需求预测的因素众多,其中部分因素难以用定量分析,只能通过赋值将其从定性描述转化为定量的值。并且风机备件加工制造周期长,工艺复杂,具有较高的技术要求,该类供应商一般是大型企业,数量少。

综上,经过实际调研并结合风机特点,选取历史需求数据、相关备件历史需求数据、供应商信用程度打分、采购周期、故障处理时间、备件因素停机占比、产前技术准备周期、技术变更占比、风机销售、人为操作、气候、地域等12个因素作为风电备件需求预测的主要影响因素,以满足风机备件的需求预测。

(1)近期历史需求量:收集齿轮的近期历史需求量。

(2)相关备件需求量:收集与齿轮相关的备件的历史需求量。

(3)供应商信用程度打分:供应商的信用程度反映零部件的质量程度,当供应商信用程度良好时,意味着零部件的质量较高,从而减少备件的需求。

(4)采购周期:采购周期的长短也影响着备件的需求,当采购周期过长,备件的需求就会增大。

(5)故障处理时间:某个零部件故障后处理时间的长短影响着风机的运行时间,当故障处理时间过长时,就必须有足够的备件保障风机的运行,因此,备件需求就会增大。

(6)备件因素停机占比:涉及备件因素导致的停机,有备件缺失、备件故障等情况,它直接影响着备件的需求量。

(7)产前技术准备周期:因为风机机组的复杂性,所以提前进行技术准备是必要的,备件的需求量会结合技术准备周期的长短。

(8)技术变更占比:为了提高机组性能,提高发电量等会进行技术上的优化升级改造,这类变更会影响备件的需求量。

(9)风机销售:风机自身的销售情况可以反映出备件量,当风机销售趋势良好,备件需求量也会增大。

(10)人为操作:新入职的维修操作人员都需要花一定时间去上手业务,在此期间都会因操作不当或者不熟练而产生备件需求。因此对新手以及业务不熟练的赋值为3,熟练工人赋值为1,其余为2。

(11)气候:高温、潮湿等气候都会造成风机在运转过程中产生备件需求;比如金属备件会因腐蚀而导致导电性减弱等;电子备件也会因为高温而导致接触不良等;因此,气候是影响备件需求量的因素之一。根据风场所在地分布,根据气候恶劣程度分为3个等级,对应1~3的整数值,气候越恶劣,数值越大。

(12)地域:风机所处地方必须是蕴含风能的地方,故多选在海拔高或者海上以及一些平原宽广的地方,因此可以把地域分为2个等级,相应的量化为1~2的整数值,平原地带赋值为1,海上及高海拔地区赋值为2。

2.2 数据收集和归一化

以金风科技企业为例,选取关键部件齿轮作为研究对象,收集了2018—2022年近5年每月的齿轮历史需求量,以及相关备件轴承2018—2022年5年每月的历史需求量如表1和表2所示。

表1 2018—2022年齿轮历史需求量Table 1 Historical demand for gears from 2018 to 2022

表2 2018—2022年轴承历史需求量Table 2 Historical demand for bearings from 2018 to 2022

并对齿轮的供应商进行打分,如表3所示;技术变更占比如图2所示;结合其余10个影响因素确定神经网络的输入量如表4所示。

表3 供应商打分情况Table 3 Scoring of suppliers

表4 BP神经网络输入量 Table 4 BP Neural Network Inputs

图2 技术变更占比Fig.2 Percentage of technical changes

在实际生活中,不同的变量导致数值之间产生不同,就会引起神经网络预测的结果出现“过拟合”情况,根据相关文献[24],将对数据进行归一化处理,将输入BP神经网络的数据转为0~1的数,归一化公式为

(8)

式(8)中:y为归一化后的数据;xi为归一化前的数据;xmin为数据的最小值;xmax为数据的最大值。应用MATLAB(2022版)软件对数据进行归一化处理,处理结果如表5所示(部分)。处理后的数据样本取值区间为0~1。

表5 各指标归一化的结果Table 5 Normalized results for each indicator

3 实例验证与分析

3.1 PCA-BP模型

将备件需求量作为输出,将12个因素变量进行输入,如表6所示,该BP神经网络模型存在12个输入节点和1个输出节点。在MATLAB中多次实验后发现隐含层节点数范围为4~12,当隐含层数为6时,BP神经网络的性能最好,训练次数设置为1 000,最终构建的神经网络拓扑结构为12-6-1。

表6 参数对应表Table 6 Normalized results for each indicator

基于上述PCA-BP神经网络模型,对输入变量进行PCA分析,图3和表7分别为主成分的特征值和方差贡献率以及主成分的因子载荷矩阵。从图3可以看出,前8个主成分的累计方差贡献率已达80%以上,即前8个主成分体现了12个原始指标信息量的84.59%,因此原始指标可由这8个主成分代替即可,同时与碎石图显示信息相一致,如图4所示。

表7 主成分的因子载荷矩阵表Table 7 Table of factor loading matrix for principal components

图3 主成分的特征值和方差贡献率Fig.3 Eigenvalues and variance contribution of principal components

图4 主成分分析碎石图Fig.4 Principal components analysis lithotripsy

主成分载荷矩阵主要反映原始变量指标对主成分的贡献大小,从表7可以得到前8个主成分的因子载荷,第一主成分中相关备件、风机销售的载荷系数很高,主要反映了风机销售和相关备件的需求因素的重要性;第四主成分中产前技术准备具有最高载荷,而其他因素的载荷在第四主成分是负值或者趋近于零,因此第四主成分可称为“产前技术准备周期成分”;第七个主成分中故障处理时间的载荷最高;第五个主成分中供应商信用程度打分的载荷最高;第八个主成分的表达式可以看出,所有因素对第八主成分的影响值相当,因此第八主成分可称为“平均影响成分”。由此可以根据公式计算获得前8个主成分得分。基于上述方法的特征筛选,PCA法优化的神经网络拓扑结构为8-6-1。

3.2 模型对比分析

通过将PCA-BP神经网络模型与未降维的BP神经网络模型、ARIMA时间序列模型预测模型的预测结果进行对比,结果如图5、图6和表8所示。验证PCA-BP神经网络模型预测风电备件的预测误差最小,效果最好。

表8 3种模型预测误差对比结果Table 8 Results of comparison of prediction errors of the three models

图5 3种模型实际值与预测值对比Fig.5 Comparison of actual and predicted values of three mode

图6 3种模型预测值与实际值对比Fig.6 Comparison of predicted and actual values from three models

为了评估预测模型的预测效果,用相关指标对其进行了比较,以评估预测误差。选取的评价指标有平均绝对误差(mean absolute error,MAE)、均方根误(root mean squared error,RMSE)、平均绝对百分比误差(mean absolute percentage error,MAPE);MAE和RMSE反映了预测和实际情况之间的差异,指标越低,预测越准确;MAPE是所有误差归一化后的平均绝对误差百分比;如果MAPE为0,说明模型是理想的;如果MAPE大于100%,说明模型的拟合效果不好,不应采用。

若不利用主成分法先进行降维,BP神经网络模型的输入层节点数为12个,输出节点数仍为1个,经多次调试隐藏层节点数为6。两种神经网络其余参数设置调试方法均相同。在对备件的需求预测研究中,有较多研究使用了自回归积分滑动平均(autoregressive integrated moving average,ARIMA)模型,所以使用2018—2022年齿轮历史需求量的数据构建ARIMA模型,根据相关数据运行SPSS软件,建立ARIMA(0,2,0)模型,模型残差序列的白噪声和异方差检验通过了显著性检验,故认为ARIMA(0,2,0)是较为科学合理的预测模型。

3种模型预测对比如图5所示,可以看出PCA-BP的拟合效果好,而ARIMA单纯根据时间序列分析,没有考虑非线性因素,导致拟合效果不如PCA-BP;BP神经网络模型的拟合效果也不如PCA-BP好,因为没有考虑各种因素之间的相关性。

用3个模型得到的预测值和实际值的比较如图6所示,PCA-BP的误差最小。从预测误差评价指标的角度将PCA-BP神经网络模型、未降维的BP神经网络模型、ARIMA模型的预测效果进行比较分析,预测误差对比结果如表8所示。可以看出,经过主成分分析取主成分后,PCA-BP神经网络模型的预测误差大幅度减小,MAE、MAPE、RMSE 值分别为2.662 3、6.064 9、3.251 7,均明显优于其他两种模型。

风机备件由于风能的大量开发使用呈现逐年增长趋势,并且会有政策等因素的影响存在。在构建 ARIMA 模型前最初的数据需要被进行几次差分处理,差分能够减少甚至消除不稳定性,但是每一次差分都会导致信息的丢失,从而影响最终的预测结果,故ARIMA模型的参数并不能优于其他模型,并不能很好的适用风机备件的预测。经主成分分析的BP神经网络考虑风电备件的诸多影响因素间的相关性,排除冗杂因素,而不是简单地将因素输入,降低神经网络结构复杂性,有效地提高神经网络的预测精度。综上所述,使用PCA-BP神经网络模型预测风电备件更科学合理。

4 结论

以风电行业零部件作为研究对象,结合风电行业实际情况,运用PCA-BP神经网络模型对风电备件进行预测,PCA方法消除了影响因素之间的关联性,如风电备件的故障率和周转时间,将12个影响因素减少到8个,从而减少了BP神经网络的数据输入量,提高了预测精度,与未经PCA处理的BP神经网络和传统的ARIMA模型对比,发现PCA-BP神经网络模型的预测误差最小, MAPE、RMSE、MAE值都比其他模型低,所以运用PCA-BP神经网络模型预测风电备件是可行的。

影响风电备件需求的研究还有待进一步的完善,研究的不足之处在于未考虑零部件寿命长度以及风机建设受政策规划等影响因素,并且可以先对指标进行分类,这也是今后研究的重要方向之一。

猜你喜欢
需求预测需求量备件
中材机电备件有限公司
基于贝叶斯最大熵的电动汽车充电需求预测
中材机电备件有限公司
从数学角度看“弹性”
价格战是一定的! 2020年虾苗需求量预计减少10%~20%,苗价下调是趋势
基于层次分析法的汽车备件供应商选择
基于HANA的工单备件采购联合报表的研究与实现
基于计算实验的公共交通需求预测方法
2017年我国汽车软管需求量将达6.4亿m
中国中长期煤炭需求预测