张明昊 卓翔芝
摘要:
随着原油市场环境的日益复杂,模型很难准确预测未来某段时间的原油价格。在保证预测精度的前提下为获得尽可能久的预测时长,采用模糊信息粒化方法简化计算复杂度,通过压缩样本点信息得到Up、Low和R三个模糊参数。针对原油价格时间序列周期性、非线性和长时记忆性的特点,基于支持向量机算法对模糊参数进行回归预测。研究表明,此法能够较为准确地预测未来两周的Brent原油期货价格走势和波动区间。
关键词:
时间序列;模糊信息粒化;支持向量机;原油价格预测
中图分类号:F224,F764.1
文献标志码:A
收稿日期:2021-03-03
基金项目:
国家社会科学基金(批准号:15BTQ048)资助。
通信作者:
卓翔芝,男,博士,教授,主要研究方向为供应链管理。E-mail:zhuoxz@chnu.edu.cn
原油作为最基础的能源化工原材料、战略储备资源和世界能源结构的中流砥柱,承担保障国家与社会安全、维持经济平稳运行的重要作用。原油价格是反映能源市场经济活动状况的显性指标,是原油供求关系变化的快速指示剂,也是国家采取相应能源政策进行宏观调控的重要依据。因原油用途广泛、所涉产业链长,其价格变化产生的连锁反应将会对行业上下游的生产经营活动产生直接冲击,通过金融市场等渠道的传递影响国内物价水平、利率水平等宏观经济指标[1-2]。预测国际原油价格的未来趋势有利于降低国家能源价格波动风险,促进经济和社会稳定,有助于原油产业链中的制造企业形成价格预警和计划缓冲,并对相关能源产业的可持续发展提供前瞻性的政策建议。原油价格的预测类型可分为样本内预测和样本外预测。样本内预测是指将原始数据事先划分好训练集和验证集,通过对比预测值和观测值的拟合优度来判别模型的优劣。如Elaziz等[3]利用遗传算法(GA)改进Salp群算法(SSA)来提高自适应神经模糊推理系统(ANFIS)的性能,按照7∶3的比例分割数据集,验证了组合预测模型能够取得更优的预测效果。对于样本外预测,美国能源情报署(EIA)定期向公众发布未来两年关于原油价格的月度和季度预测信息,常被业内人士用于分析解读原油市场一定时期内的市场行情状况[4]。Stifanic等[5]通过集成平稳小波变换(SWT)和双向长短期记忆网络(BDLSTM)提出的商品-股票价格预测系统(BDLSTM+WT-ADA)对未来5天的原油价格预测效果显著。Elshendy等[6]利用语义分析在网络社交媒体上寻找经济意识的信号,采用动态回归模型(ARIMAX)进行建模,分析WTI原油价格与多维预测因子之间的关系,证明了不同媒体平台所承载的样本外预测能力差异化。当前原油价格预测研究虽取得了一定成果,但由于市场环境复杂,多数情况下不能对原油价格做精确的点值预测,故对原油价格进行区间预测尤为必要。模糊信息粒化(FIG)具有独特的数据压缩区间化能力,常与支持向量机算法(SVM)构成组合预测模型,广泛应用于风速预测、负荷预测、股票价格预测以及城市交通流量预测等领域,但鲜有学者利用该模型研究原油价格预测。针对原油价格时间序列周期性、非线性和长时记忆性的特点[7-9],支持向量机极佳的泛化性能和在小样本、非线性预测方面的出色表现,使得其能够满足原油价格预测的需要[10]。考虑到受原油价格受美元汇率、地缘政治博弈、重大突发事件以及国家政策导向等不确定因素的影响[2,11-13],模型的预测精度会随着预测时长的增加而不断被削弱,因而短期预测的结果比长期预测更为准确,更具有实际意义[14-15]。为保证预测精度且尽可能延长模型的预测期限,将对时间序列数据做模糊信息粒化处理,配合SVM实现对数据变化趋势和波动区间的拓展预测。本文拟构建FIG-SVM原油价格预测模型,以Brent原油期货日结算价格为例,探究原油价格预测的新途径。
1 基礎理论与方法
1.1 模糊信息粒化
信息粒化就是根据所关注的信息,将数据集中或相似、或接近、或难以区别的元素,人为的组合并划分成一定数量的子数据集进行研究的方法,其中构成整体的每个子部分被称为信息粒[16-17]。粒化方式可分为非模糊粒化(c-粒化)和模糊粒化(f-粒化)。c-粒化在诸多技法中发挥着重要作用,但在实际情况中非模糊粒子不能充分反映事物的特性,故对于大部分缺少先验信息的研究而言,f-粒化相比c-粒化更加贴近现实意义[16,18]。
f-粒化的核心是完成窗口创设后的模糊化过程。以Pedrycz提出的模糊信息粒化方法为例,模糊化的目标是要在时间序列数据X上找到模糊粒子p,即一个能够对X做出合理刻画的模糊概念G(以X为论域的模糊集合),通过确定G来获得p。因此,模糊化的本质是一个确定函数A的过程,A为G的隶属函数[19-20]
2.3 数据分析
上述模糊信息粒化过程,将原始时间序列数据窗口化且映射到图3中带状价格区域内,削弱了原始时间序列的局部震荡,对原油期货价格曲线具有明显的平滑效果,为后续配合SVM算法的回归预测分析起铺垫作用。由图4~图6可知,模糊参数Low、R和Up的样本内预测结果与原始数据在总体趋势上能够较好地吻合,且未来两个交易周的参数Low、R和Up与尾部图像走势一致。图7对应三个模糊参数第156~159个粒子窗口的预测结果,其中第158和第159个粒子窗口表示2021年前两个交易周Brent原油期货预测价格的下界、均值和上界,如表1所示。对比表1、表2可知,除个别时间点外实际价格波动区间及走势与模型的预测结果基本相同。由于原油价格的不确定影响因素众多,而本文的研究仅考虑Brent原油期货价格自身的变化(单一变量)对预测的影响,故存在一定误差。
3 结论
针对国际原油价格的特征,以Brent原油为例,运用模糊信息粒化和支持向量机构建预测模型。研究结果表明,FIG-SVM原油价格预测模型能够对Brent原油期货在未来两个交易周内的结算价格走势和波动范围做出较为准确的预测,有助于降低国家的能源价格波动风险,维护经济和社会稳定,促进相关能源产业健康发展。本研究所构建模型的性能优劣与参数选取密切相关,未来可利用优化算法对模型进行参数寻优。还可通过增加数据维度构建影响原油价格变化的多因素FIG-SVM模型,以获得更为准确的预测结果。
参考文献
[1]赵丹婷,刘园.国际原油价格波动对中国物价水平影响的传导机制研究—基于全球向量自回归模型[J].宏观经济研究,2016(10):155-166.
[2]马郑玮,张家玮,曹高航.国际原油期货价格波动及其影响因素研究[J].价格理论与实践,2019(4):87-91.
[3]ELAZIZ M A, EWEES A A, ALAMEER Z. Improving adaptive neuro-fuzzy inference system based on a modified salp swarm algorithm using genetic algorithm to forecast crude oil price[J]. Natural Resources Research, 2020, 29(4): 2671-2686.
[4]BAUMEISTER C, KILIAN L. Forecasting the real price of oil in a changing world: A forecast combination approach[J]. Social Science Electronic Publishing, 2015, 33(3): 338-351.
[5]TIFANICˊ D, MUSULIN J, MIOCˇEVICˊ A, et al. Impact of COVID-19 on forecasting stock prices: An integration of stationary wavelet transform and bidirectional long short-term memory[J]. Complexity, 2020, 2020(1): 1-12.
[6]ELSHENDY M, COLLADON A F, BATTISTONI E, et al. Using four different online media sources to forecast the crude oil price[J]. Journal of Information Science, 2018, 44(3): 408-421.
[7]李建立,萬勇韬,张志刚.基于多因素SVM的油价预测模型研究[J].数学的实践与认识,2014,44(6):61-67.
[8]KIRAN B. Nonlinearity and fractional integration in the world crude oil prices[J]. Energy Sources, Part B-Economics, Planning, and Policy, 2016, 11(2): 103-110.
[9]张金良,李德智,谭忠富.基于混合模型的国际原油价格预测研究[J].北京理工大学学报(社会科学版),2019,21(1):59-64.
[10] 王绵斌,齐霞,安磊,等.小样本条件下基于VMD-SVM的电网技改项目科技投资预测[J].科技管理研究,2020,40(16):231-235.
[11] 徐蕾.国际油价后续走势分析—是触底反弹还是继续走低[J].价格月刊,2020(12):24-28.
[12] 柴建,卢全莹,周友洪,等.国际原油价格拐点分析及统计推断[J].中国管理科学,2017,25(5):33-41.
[13] 黄维和,梅应丹,吴丽丽,等.能源革命与中国能源经济安全保障探析[J].中国工程科学,2021,23(1):124-132.
[14] 何凌云,张愉,郑丰.基于相空间重构技术的原油价格的时序混沌判据和混沌特征量[J].数学的实践与认识,2008(17):13-23.
[15] 姚青松,赵国庆.国际能源价格的持续性结构突变研究[J].河北经贸大学学报,2020,41(4):16-21.
[16] 熊景华,茹璟.基于随机森林算法和模糊信息粒化的汇率预测组合模型研究[J].数量经济技术经济研究,2021,38(1):135-156.
[17] 廖玲珑,李培强,唐捷,等.信息粒化和相似数据结合的短期风速预测[J].电力系统及其自动化学报,2016,28(4):12-17.
[18] 黄文聪,张宇,杨远程,等.模糊信息粒化和GWO-SVM算法结合的短期风速范围预测[J].华侨大学学报(自然科学版),2020,41(5):674-682.
[19] 李洋.时序数据的信息粒化方法及应用研究[D].北京:北京师范大学,2012.
[20] 肖白,赵晓宁,姜卓,等.利用模糊信息粒化与支持向量机的空间负荷预测方法[J].电网技术,2021,45(1):251-260.
[21] 赵明利,袁一鸣,李博涵,等.基于模糊信息粒化和优化支持向量机的氧化铝陶瓷超声磨削力趋势预测[J].宇航材料工艺,2020,50(4):24-29.
[22] 李素,袁志高,王聪,等.群智能算法优化支持向量机参数综述[J].智能系统学报,2018,13(1):70-84.
[23] 李宁,王李管,贾明涛.基于粗糙集理论和支持向量机的岩爆预测[J].中南大学学报(自然科学版),2017,48(5):1268-1275.
[24] 吴庆洪,高晓东.稀疏表示和支持向量机相融合的非理想环境人脸识别[J].计算机科学,2020,47(6):121-125.
[25] 张晶华,甘宇健.基于深度学习支持向量机的上证指数预测[J].统计与决策,2019,35(2):176-178.
[26] 付松,钟诗胜,林琳,等.基于迁移学习的民航发动机小样本故障诊断[J/OL].计算机集成制造系统:1-19[2021-02-22].http://kns.cnki.net/kcms/detail/11.5946.tp.20200420.1333.004.html.
[27] 周志华.機器学习[M].北京:清华大学出版社,2016.
[28] 滕吉文,乔勇虎,宋鹏汉.我国煤炭需求、探查潜力与高效利用分析[J].地球物理学报,2016,59(12):4633-4653.
[29] 卜林,李晓艳,朱明皓.上海原油期货的价格发现功能及其国际比较研究[J].国际贸易问题,2020(9):160-174.
[30] 陈蕊.石油价格对国民经济的影响及石油安全体系研究[D].哈尔滨:哈尔滨工程大学,2005.
[31] 张梦.基于模糊信息粒化和ARIMA-SVR组合模型的空气质量指数预测[D].济南:山东大学, 2020.
Abstract:
With the increasing complexity of the crude oil market environment, it is difficult for the model to accurately predict the crude oil price in a certain period of time in the future. In order to obtain as long prediction time as possible under the premise of ensuring the prediction accuracy, the fuzzy information granulation method is used to simplify the calculation complexity, and the up, low and R fuzzy parameters are obtained by compressing the sample information. According to the characteristics of periodicity, nonlinearity and long-term memory of crude oil price time series, the fuzzy parameters are regressed and predicted based on support vector machine algorithm. The results show that this method can accurately predict Brent crude oil futures price trend and fluctuation range in the next two weeks.
Keywords:
time series; fuzzy information granulation; support vector machine; crude oil price forecasting