张钰妍 张馨予
摘要:随着全球能源结构的转变和环保意识的提升,新能源汽车行业迅速发展,销量预测对于市场布局、生产及供应链管理至关重要。然而,销量预测受多种因素影响,具有复杂性和非线性特征,传统的时间序列预测方法如ARIMA模型在处理这些特征时存在局限性。为克服这些问题,提出了一种创新的组合模型算法,该算法融合了ARIMA模型在捕捉线性趋势方面的优势以及LSTM模型在捕捉非线性特征和时间依赖性方面的强大能力。利用选取的2021年1月—2023年9月每月新能源汽车销售数据,验证了该组合模型在预测未来一年内两个品牌新能源汽车销量方面的准确性和可靠性。研究结果表明,该组合模型相较于单一模型在预测精度上有所提升,RMSE下降约20%,为新能源汽车市场的战略规划提供了有价值的决策支持。
关键词:ARIMA;LSTM;预测;新能源汽车
中图分类号:U469.7 收稿日期:2024-02-23
DOI:1019999/jcnki1004-0226202406007
1 前言
随着全球能源结构的转变和环境保护意识的提高,新能源汽车行业迅速崛起,成为汽车市场的重要发展方向[1]。准确的销量预测对于新能源汽车企业的市场布局、生产计划以及供应链管理具有至关重要的意义。然而,新能源汽车销量受到多种复杂因素的影响,如政策导向、技术进步、消费者偏好以及市场竞争态势等,从而使销量预测成为一项极具挑战性的任务。
在销量预测领域,研究者已经提出了多种方法。桂思思等[2]在2021年使用传统的时间序列预测即ARIMA(自回归积分滑动平均模型),有效地捕捉数据的线性趋势,陈科秀等[3]在2022年使用同样的方法对黑猫新能源汽车的销量进行研究,有效地捕捉了销量的线性变化特征,并得出了有价值的预测结果。但随着市场环境的不断变化和消费者需求的多样化,新能源汽车销量的变化可能逐渐变得复杂,这使得单一的ARIMA模型无法处理这种非线性特征[4-5]。2023年陈尚林[6]利用长短期记忆网络(LSTM)神经网络对比亚迪销量进行预测,在短期预测中取得了很好的效果,但处理长时间序列数据时可能存在梯度消失或梯度爆炸等问题。
本文在综合分析现有研究的基础上,提出了一种ARIMA和LSTM组合模型的算法。该算法旨在结合ARIMA模型在捕捉线性趋势方面的优势和LSTM模型在处理非线性特征和时间依赖性方面的优势,以更准确地预测新能源汽车未来一年的销量。通过这种方法,本文期望能够克服单一模型的局限性,提高销量预测的准确性。
2 模型与方法
针对时间序列预测以及传统神经网络预测模型的不足之处,本文提出了一种基于ARIMA和LSTM组合模型的算法,如图1所示。该算法结合了ARIMA模型在时间序列线性趋势预测方面的优势和LSTM模型在非线性特征捕捉方面的强大能力,使用ARIMA进行趋势项主体预测,使用LSTM对ARIMA回归残差进行预测,充分利用了二者的优势,其模型如下:
[Yt=Yt,ARIMA+Yt,LSTM-residual] (1)
式中,[Yt]为组合模型在时间[t]的预测值,[Yt,ARIMA]为ARIMA模型在时间t的预测值,[Yt,LSTM-residual]为LSTM模型对时间[t]的残差的预测值。
21 ARIMA部分
ARIMA(自回归积分滑动平均模型)是一种强大的统计工具,专门用于分析非平稳时间序列数据。该模型的核心在于,它首先通过差分技术将原始非平稳序列转换为平稳序列,然后在这个平稳序列上建立自回归和移动平均的组合模型[7]。
ARIMA模型的结构包括自回归部分、移动平均部分,以及差分整合部分,该模型满足以下结构:
[yt'=c+?1yt?1'+…+?pyt?p'+θ1?t?1+…+θq?t?q+?t] (2)
式中,[yt']为差分d次后的序列;[?]和[θ]为待估计的参数;[?t]为白噪声项。
22 LSTM部分
本文采用LSTM进行非线性预测。LSTM模型的原理如图2所示,它能够捕捉到时间序列数据中的长期依赖关系,这一特性在销量预测问题中至关重要。由于销量数据常常受到过去事件的影响,LSTM模型能够有效学习并应用这种历史信息来预测未来的销售趋势[8]。LSTM的核心是如何更新和计算细胞状态[Ct]和隐状态[?t],下面给出具体公式。
[e1][ht][et-1][ht-1][xt]
a.遗忘门,公示如下:
[ft=σWf?t?1,xt+bf] (3)
b.输入门。
更新值:
[it=σWi?t?1,xt+bi] (4)
候选值:
[Ct=tanhWCht?1,xt+bC] (5)
细胞状态更新:
[Ct=tanhWC?t?1,xt+bC] (6)
c.输出门。
输出值:
[ot=σWo?t?1,xt+bo] (7)
隐状态更新:
[?t=ottanhCt] (8)
3 实验设计
31 数据获取
华东地区作为中国经济的重要引擎,其新能源汽车市场发展迅速,消费者接受度高,且竞争态势激烈。因此,选择华东地区作为研究范围具有代表性和实际意义。
在众多新能源汽车品牌中,特斯拉与比亚迪凭借其卓越的技术实力、市场布局和品牌影响力,成为市场的领导者。特斯拉以其创新的电池技术、智能驾驶功能和独特的营销策略赢得了消费者的青睐;比亚迪则以其丰富的产品线、稳定的性能和良好的性价比在市场上占据了一席之地。选择这两个品牌进行研究,不仅有助于了解新能源汽车市场的发展趋势,还能为其他品牌提供有益的参考和借鉴,因此本文选择了华东地区特斯拉以及比亚迪电车的销量数据进行分析。
32 实验步骤
本文将采用分别使用ARIMA、LSTM,以及两者组合模型根据现有数据划分训练集和测试集,比较组合模型和单一使用两种模型时预测的RMSE。接着将对数据进行处理,将原始数据随机选取数据进行调整,作为缺失值或异常值,再次进行训练,模拟现实中可能存在的统计错误的情况。最后比较三个模型的灵敏度和鲁棒性。
4 实验结果分析
41 数据分析
首先对已有的数据进行平稳性检验,以便后续使用ARIMA。
在本次研究中,采用了单位根检验来对华东地区特斯拉与比亚迪两个品牌的新能源汽车销售数据进行平稳性检验,结果如表1所示。
由结果显示,原始的新能源汽车销售数据并不平稳。因此采用一阶差分进行分析。一阶差分是一种常用的时间序列数据平稳化方法,它通过计算相邻时间点的数据差值来消除数据中的趋势和季节性波动。一阶差分后,再次对数据进行单位根检验,验证其具有平稳性。图3所示为特斯拉华东地区销量一阶差分数据。
a.比亚迪销量一阶差分后的数据
b.特斯拉销量一阶差分后的数据
由于差分阶数越高会造成越多的数据特征损失,这里不在考虑更高阶的差分。
42 预测性能
在ARIMA模型中,[p]和[q]分别代表自回归项(AR)和移动平均项(MA)的阶数。具体来说,[p]代表自回归的阶数,即要用到过去多少个时间点的数据来预测当前时间点的值;[q]代表移动平均的阶数,即要用到过去多少个白噪声误差项来预测当前时间点的值。本文首先通过绘制一阶差分数据ACP图和PACP图来确定ARIMA模型中的[p、q]参数的值(图4)。
对一阶差分后的序列进行自相关和偏相关判断如图4所示,从自相关图和偏自相关图可以看出,ACF和PACF均为一阶截尾,因此可以确定模型中[p、q]的值均为1。因此,本文建立[ARIMA(1,1,1)]模型。
将已有的数据按照10∶1的比例划分训练集和测试集,使用训练集训练模型并用测试集检验模型准确性,最大迭代500次,模型在200次左右收敛,误差达到稳定。根据上述模型本文预测了未来一年两种新能源汽车的销量。
计算组合模型的RMSE与两个单一模型分别预测时的RMSE,对比单一模型与组合模型预测性能,对比结果见表2。
可以看出,组合模型的预测效果明显优于单一模型的预测效果,预测的精度有明显提升,能够对新能源汽车销量的趋势进行准确的预测和跟踪。相较于ARIMA和LSTM单一模型,组合模型具有更好的预测性能。
43 灵敏度检验
为了全面评估本文所采用的算法在处理实际数据中的缺失值和异常值时的稳定性和鲁棒性,本文进行了灵敏度检验。本文随机选择了不同城市的数据,并针对每个城市随机抽取了两个月的数据进行特殊处理:将其中一个月的数据设置为缺失值,以模拟实际数据中可能出现的缺失情况;而将另一个月的数据设置为异常值,以检验算法在面对极端或偏离常态的数据时的表现。
在数据预处理阶段,本文采用了插值方法来补全缺失值。然后本文用三个模型分别进行预测,并比较三种方法的RMSE,结果如表3所示。
通过表3可以看出,ARIMA-LSTM组合模型的RMSE明显小于单独使用两个模型,因此可以看出组合模型有良好的稳定性和鲁棒性,可以很好地适应实际情况。
5 结语
本文从新能源汽车的销量出发,建立了ARIMA-LSTM组合模型,组合模型展现出了更优异的预测性能。这一研究不仅提升了销量预测的精度,也为企业的战略决策提供了有力支持。
对于企业而言,通过精确的销量预测能够合理制定生产计划、优化库存管理、降低运营成本,进而提升市场竞争力。通过深入分析销量背后的因素,企业可以更有针对性地调整产品策略和市场布局。本文的研究成果能够为新能源汽车行业的发展提供有益的参考和启示,并期待在未来的研究中继续拓展和深化相关领域的探索。
参考文献:
[1]廖荣洋,计春雷,任菊慧,等一种基于小波分析和ARIMA-LSTM的汽车销量预测方法[P]中国专利:CN115564474A,2023-01-03.
[2]桂思思,孙伟,徐晓锋基于ARIMA与线性回归组合模型的汽车销量预测分析[J]计算机与数字工程,2021,49(8):1719-1723.
[3]陈科秀,刘娟基于ARIMA模型的欧拉黑猫新能源汽车销量预测[J]现代工业经济和信息化,2022,12(3):169-171.
[4]Agbessi A P,Salami A A,Agbosse K,et al.Peak Electrical Energy Consumption Prediction by ARIMA,LSTM,GRU,ARIMA-LSTM and ARIMA-GRU Approaches[J]Energies,2023,16(12):4739.
[5]张怡基于ARIMA-LSTM混合模型的时间序列分析研究与应用[D]荆州:长江大学,2023.
[6]陈尚林基于LSTM神经网络和百度指数的新能源汽车销量预测——以比亚迪为例[D]武汉:湖北大学,2023.
[7]呼雄伟基于ARIMA-LSTM组合模型在钢瓶销量预测中的研究与应用[D]上海:上海第二工业大学,2022.
[8]刘丽佳,李晓雪,王海滨,等考虑节假日的ARIMA模型在酸奶销量预测中的应用[J]计算机科学与应用,2023(12):2172-2179.
作者简介:
张钰妍,女,2003年生,本科在读,研究方向为管理科学与工程。