刘培培 张肖肖
【摘要】原油和化工产品在国民经济和生活中的作用越来越大,把握其价格运行规律对于企业生产经营意义重大。本文提出了一种改进的模糊时间序列预测方法,将其应用到了上海原油期货和郑州盯A期货的价格预测当中。通过样本数据的检验,不仅证明了算法的有效性,同时证明了对企业业务经营也具有指导意义。
【关键词】原油期货;PTA期货;模糊时间序列;价格预测
随着中国经济的发展和产业的升级,能源和化工行业在国民经济生活中的影响越来越大。上述两行业作为上下游既紧密联系,同时又各具特点。传统能源例如原油、煤炭和天然气等产品,对国民经济的正常运行起到至关重要的作用。而下游石化行业部门庞大,牵涉到工业和民用的方方面面。原油和化工市场参与者众多、价格波动率高,而且通常具有波动性集簇效应。如果能够把握能源化工产品的价格走势规律,那么对于降低市场风险,提高企业运行效率,乃至保障国计民生都将起到重要作用。
从影响力上看,原油是我国最重要的能源之一,2018年我国对外依存度已经达到70%。原油价格主要受到供给面、地缘政治、天气和市场投机因素的影响。PTA作为原油产业链的终端标准化产品之一,价格受到上游原料、行业产能和下游需求等因素影响。同时,由于期货市场具有价格发现和套期保值的功能,本文选取上海原油和郑州PTA期货作为研究对象,讨论对这两种产品的价格预测。
一、模糊时间序列方法
国内学界和业界对能源化工产品的研究很多,如文献[6,7]等。但是多数研究非常重视数学和算法的作用,较容易出现过度拟合和为了预测而预测的问题。此外,如果过度依靠优化算法,就容易忽视人的主观能动性作用。
模糊时间序列最早由文献[8]提出,最初主要应用到大学录取人数预测、股票指数预测等。文献[11]将模糊时间序列应用到了国际油价的预测当中,但文献的研究具有以下局限性:
1)缺乏对模糊区间的有效性说明。
2)针对样本,仅仅将每年前10个月数据用作训练数据,后2个月的数据作为验证数据,进行价格预测未能充分利用市场信息。
3)仅将数据运用到了WT原油的研究中,缺乏对中国市场运行特点的研究。
针对文献[11]的不足之处,本文相应进行了改进。第一,模糊时间序列法相对于纯算法预测来说,最大的优点在于能够将人的主观判断融合到预测过程当中。我们对模糊区间选取方法进行改进。我们邀请油气以及化工行业中的11位行业专家,采用专家咨询的方法考察模糊区间的划定原则。专家们一致认为,把模糊区间划分为5个,更符合人类的认知过程,更有利于调动决策者的积极性。第二,计算方法上,不再把每年的数据单独分割为训练数据和验证数据,采取自启动分步油价预测方法,能够及时和充分利用市场中新的交易信息,提高市场预测的准确度。第三,将模糊时间序列应用到了中国市场中,分别就上海原油和郑州PTA期货价格进行分析,得出了上述两市场的特点。
模糊时间序列的基本概念定义如下:
1)对于模糊时间序列F(t),如果存在模糊集上的关系R(t+1,t),使得F(t+1)=F(t)。R(t+1,t),那我们就关系R(t+1,t)称为F(t)→F(t+1)。
2)如果有两个连续的模糊序列值F(t)=4和F(t+1)=Aj,那么我们就称上述两个模糊值存在关系Ai→Aj。
3)在给定的模糊时间序列中,模糊域定义为u=[Umin-D1,Umax+D2],其中Umax和Umin代表了样本区间内的原油期货最高价和最低价。
本文提出一种改进的模糊时间序列算法,其基本计算步骤如下。第一步,从当前油价时间序列中,选定前n个交易日的价格序列P(t1),P(t2),…,P(tn),形成自启动样本St;第二步,对自启动样本St,定义模糊域Ut;第三步,将模糊时间序列价格转化为模糊语言数字:第四步,建立模糊时间序列关系,计算自启动样本的权重矩阵,并对自启动样本的下一期油价进行预测:第五步,将价格p(tn+1)加入到原始启动样本St中,形成新的样本St+1,并重新计算模糊定義域Ut+1;第六步,继续按照模糊时间序列方法,利用样本St+1预测价格P(tn+2);第七步,继续对剩余样本重复第四步和第五步,直至完成对价格的预测。
二、期货价格数据
本文所采用的期货价格为上海能源交易所的原油期货主力合约和郑州商品交易所PTA期货主力合约的收盘价。其中上海原油期货上市时间较短,样本数量相对少。上海原油期货价格区间为2018年3月26日至2019年3月6日,共计230个交易日,合约均价为471元/桶。郑商所PTA价格数据起止日期为2006年12月18日至2019年3月6日,共计2970个交易日,合约均价为7012元/吨。
期货价格样本对应的统计样本特性见下表。总体来看,上海原油和郑州PTA期价总体上服从正态分布。虽然上述两种期货价格的极端分布频次较少,但原油和PTA期价呈现较大波动性,标准差分别为233.54元和1692.7元。由此可见,能源化工产品面临极端价格的影响,如果能够对期货价格进行有效预测,将有助于行业企业进行套期保值业务和现货交易业务。
三、模型预测结果
同时,我们对所有样本的价格、预测价格、标准差和均方根误差进行作图。从价格走势上看,本文所采用的模糊时间序列算法,在对应无论是对仅有230个数据的上海原油小样本,还是对有2970个大样本的郑州PTA期价预测均起到了较好的结果,预测出来的价格总体上能较紧密地贴近实际价格走势。其次,在方向性预测的方面,在价格出现较大波动的时候,模糊时间序列能及时反映出价格变化的方向。
四、结论和意义
从现实指导意义上看,采用本文提出的模糊时间序列预测方法,能够协助原油和PTA产业链企业做好价格预测,降低价格波动所带来的风险。当市场波动加剧时,预示着市场可能进一步出现波动,必须做好套期保值业务。同时,在市场价格形成趋势的时候,往往会沿着目前方向继续运行,必须提前做好市场预测和分析。最后,也应当看到,虽然模糊时间序列方法辅助了价格预测,但是在预测的精确度上仍有误差。下一步研究工作的重点在于提高模型的准确度方面。