乔曼,王敏,董传波,余乐安,刘倩
1.中国石油天然气股份有限公司规划总院;2.中国石油天然气集团有限公司油气业务链优化重点实验室;3.中国航油华南蓝天湖北分公司;4.北京化工大学
成品油作为日常生产和生活的必要能源,其价格波动对国民经济运行有着深刻的影响[1]。与欧美等国家成品油市场大多采取完全市场化定价机制不同[2],中国现行成品油定价机制为半市场化定价模式。国家发展和改革委员会(简称国家发展改革委)2016年1月13日发布的《石油价格管理办法》规定:“汽、柴油零售价格和批发价格,向社会批发企业和铁路、交通等专项用户供应汽、柴油供应价格,实行政府指导价。汽、柴油最高零售价格以国际市场原油价格为基础,考虑国内平均加工成本、税金、合理流通环节费用和适当利润确定。汽、柴油价格根据国际市场原油价格变化每10 个工作日调整一次。成品油批发企业对零售企业的汽、柴油最高批发价格,合同约定由供方配送到零售企业的,按最高零售价格每吨扣减300 元确定。”
2016年以前,国内成品油市场施行严格的准入经营许可制,关于成品油市场化价格的研究也相对较少,价格调节不灵活,市场在资源优化方面发挥的作用不突出。2016年,国家开始推进油气体制市场化改革,原油“双权”(进口权和使用权)向地方炼厂放开,成品油批发资质审批权也由商务部下放至地方政府,市场准入门槛的降低带来国内成品油市场供应规模的大幅增涨,而成品油消费端步入中低速增长,导致以往主营企业独享的政策红利逐步弱化[3],成品油销售压力显著增加。2021年,成品油市场化进程进一步提速,国家对调油原料征收进口环节消费税、强化原油资质使用审核、环保督查等一系列政策出台,成品油市场运行愈加规范化[4]。此外,在“双碳”战略和目标的大背景下,国家适当收紧出口配额以降低国内成品油产量,产需差又经历了一定程度的主动收窄[5]。总的来说,目前国内成品油市场批发价格更为灵活,周期性波动频繁,特别是在山东省和东部沿海等省份的成品油市场批发价格已经衍化为受多种因素影响的完全市场化价格,进一步推动国内成品油市场格局重构。因此,深入开展成品油市场批发价格影响因素分析和应用研究,是成品油生产和销售企业应对市场化改革的必然要求,对企业制定生产计划、优化价格和市场营销策略都具有重要意义。
从现有研究看,成品油不仅是重要的能源消费品,更是一种特殊的商品。影响成品油商品价格的因素众多,除去成品油与国际原油价格紧密相关的定价逻辑外,产业链供需基本面变化、宏观经济波动、国际汇率变动,以及投资者风险规避意识的提升,都会对成品油市场化价格产生不同程度的影响。卫永刚等[6]分析国际石油市场的基本走势认为能源转型和“欧佩克+”限产政策的实施是油价上升的主导因素。李治国等[7]通过使用市场供给、市场需求、消费状况和成品油进出口贸易这四方面指标,利用古诺模型对现行成品油定价机制与成品油市场平衡之间的关联进行分析。张峥等[8]认为影响原油价格波动的因素大致可以归类于商品属性和金融属性,供给主导商品属性,需求主要受金融属性影响,并通过引入波动率指标,证明了油价波动是原油的商品属性和金融属性共同作用的结果。钱兴坤等[9]指出,石油具有多重属性,而商品属性和金融属性是其最为突出的两大属性,其中最重要的就是商品属性中的供需关系,并表明21世纪以来的油价上涨一部分是由需求驱动的,特别是由发展中国家快速增长的石油需求所支撑的。Oladunjoye[10]的研究也证明,造成成品油价格变化的因素不是单一的,而是多种因素共同作用的结果,原油价格变化只是其中一种重要因素,此外还应包括原油及成品油的储备、加工成本等因素。Frankel[11]通过研究还发现了原油库存对成品油价格有负面影响。Kiliana 等[12]的研究表明,油价近10年的走势都可以用原油及油品的需求预期加以解释。
对于成品油价格的宏观经济维度,学者们主要是从宏观经济影响成品油的供需,进而影响成品油价格的角度进行分析。经济增长速度是决定石油消费增长的主要因素。Aastveit 等[13]通过构建FAVAR(因子增广型向量自回归模型)也证实了新兴经济体的原油需求快速增长是油价波动的主要原因。Li 等[14]对中国和印度的原油进口总量与国际原油价格的协整关系进行了分析,指出国际市场上原油价格持续上涨的重要原因,是由于中国和印度经济的迅速发展导致的原油需求量的持续增长。
此外,考虑到能源金融化之后,能源市场在金融属性下表现出新的价格形态和微观行为规律,进一步加大了成品油市场与传统金融市场间的信息联系[15]。基于国际原油以美元标价,同时各国汇率之间存在强关联性,所以美元货币发行量和汇率变动必然对成品油价格产生影响[16]。谭小芬等[17]基于FAVAR 对油价进行研究指出,发达国家大规模宽松货币政策导致的全球流动性增加对油价的冲击显著增强,而美元汇率走高是造成2014年下半年以来油价加速下跌的主要原因之一。
可以看出,国内外学者关于成品油价格影响因素的研究已经取得了丰富的成果。但是,现有研究未能综合考虑成品油价格基本属性和需求、供给、宏观经济及金融等多维度属性对成品油价格产生的影响。由于影响成品油市场的因素众多,价格波动复杂,因此有必要构建成品油市场分析的特征参量体系与基础数据库,从而辅助成品油价格分析,指导生产经营决策。
综合考虑中国成品油定价机制现状及2016年以来中国成品油市场环境变化,本文将结合现有文献的分析结果,系统分析界定成品油市场批发价格影响因素,基于构建的备选特征参量体系,结合数据预处理方法和特征工程模型,筛选出成品油市场批发价格的关键影响因素,根据汽油和柴油的差异,分别构建汽油市场批发价格特征参量体系和柴油市场批发价格特征参量体系,用以分析成品油市场批发价格。
本文从成品油市场批发价格基本属性和产业链特征出发,结合价格、需求、供给、宏观经济及金融5 个维度构建初始特征参量。使用数据预处理与特征工程模型,考虑到成品油市场批发价格不仅受定价机制的影响,还受到经济增长、供需变动、金融市场等多类指标因素的影响,通过维度划分,将相关影响因素的信息输入该模型进行特征选择,构建出成品油市场批发价格特征参量体系,具体研究框架见图1。
图1 基于特征工程的成品油市场批发价格影响因素研究框架
考虑到初步筛选的特征变量较多,不同变量之间可能存在信息冗余,因此需要结合相关模型,筛选确定成品油市场批发价格特征参量体系。本文从特征工程模型中的特征选择入手,从特征集合中挑选一组具有明显统计意义的特征子集,剔除不相关或者冗余的特征,从而减少模型训练的时间,提高模型的精确度。在特征选择方面,分别选取过滤式、封装式和嵌入式方法,包括皮尔森相关系数(Pearson)、线性回归(Linear regression,简称LR)、递归特征消除(RFE)、交叉验证的递归特征消除法(Cross-Validation Recursive Feature Elimination,简称RFECV)、Lasso 回归(Least Absolute Shrinkage and Selection Operator regression,简称Lasso)、岭回归(Ridge)、随机森林(Random forest,简称RF)在内的机器学习模型。从现有研究来看,这3 类特征选择方法各有优劣。其中,封装式和嵌入式方法对于基模型的依赖性较强,需要结合基模型确定的特征重要性进行选择。当基模型对于数据的适应性较强时,封装式和嵌入式方法选出的特征效果优于过滤式,反之效果则较差。对于过滤式方法,其通用性强,计算复杂性低,适合于大规模数据集的筛选。同时,此3 类特征选择方法均属于数据驱动型,即需要结合数据确定最适合当前数据集的特征选择方法。因此,本文选择过滤式、封装式和嵌入式3类特征选择方法、7 种特征选择模型,结合训练集数据进行实验,并基于实验结果确定成品油市场批发价格特征参量体系。此外,在参数设置方面,皮尔森相关系数法的筛选阈值设置为0.6,即筛选相关系数大于0.6 的变量进入特征参量体系;RFECV 方法选择三折交叉验证的方法;其余模型的参数则使用Python工具箱“sklearn”中的默认参数进行实验分析。
基于数据的可获得性,本文选择全国和山东地区成品油市场批发价格作为研究对象进行指标体系构建,从5 个维度构建成品油市场批发价格的特征参量体系,每个维度的详细特征参量详见3.2 节。特征参量数据收集于国家统计局及Wind 数据库等行业公开的第三方数据库,目标序列成品油市场批发价格以商务部内贸统计监测平台的实货贸易成交价格以及第三方监测机构提供的地方炼厂成品油市场报价为主。
研究时间区间是2009年1月至2021年12月,共计156 条月度观测序列,按照8∶2 的比例划分训练集和测试集。训练集包含了125 条观测序列,用于特征选择和参数训练;测试集包含31 条观测序列,用于模型预测性能测试和对比分析。对于目标序列全国成品油市场批发价格,考虑到国家税费政策的改革调整,根据不同时期税费制度进行了剔税处理,换算为不含税价格作为模型目标序列。
为了评价不同特征变量筛选结果,本文选择均方根误差(RMSE)和平均绝对百分比误差(MAPE)进行衡量,RMSE 衡量真实值与预测值偏离的绝对大小,而MAPE 衡量的是偏离的相对大小。两者的指标值越低,说明筛选出的变量对于成品油市场批发价格的拟合度越高,筛选效果越好。
本文分析构建成品油市场批发价格的5 个维度中,价格维度是从中国现行成品油的定价机制出发,挑选国际市场基准原油价格序列作为备选特征参量。由于汽、柴油拥有一般商品的属性,因此选择基于需求维度和供应维度进行特征参量构建。随着经济体的高速增长,成品油的供需变化会引发油价持续上涨,这影响到成品油价格的宏观经济维度特征参量的分析与选择。成品油价格的金融维度则涉及成品油市场与传统金融市场间的信息联系。
价格维度主要涉及作为成品油生产主要成本的国际基准原油价格、国家发展改革委成品油定价机制参考价格,以及其他相关产品的价格。原油价格直接反映成品油生产成本,且原油价格是零售环节不含税成品油价格的最主要构成部分,原油价格的波动对国内成品油价格的影响通常呈现同向移动趋势。国际市场原油是完全市场化的,主要原油现货市场包括西北欧地区、地中海地区和美国、新加坡等国,以及纽约商业交易所(NYMEX)、伦敦国际石油交易所(IPE)及迪拜商品交易所(DME)等三大原油期货交易所。因此可选取具体指标包括:WTI原油期货价格、布伦特原油期货价格、DME 阿曼原油期货价格、阿曼原油现货价格、WTI 轻质原油现货价格、布伦特原油现货价格、迪拜原油现货价格,其他相关产品价格可选取新加坡优质汽油价格、新加坡普通汽油价格、新加坡柴油价格等特征参量。
需求维度方面,除了汽、柴油表观消费量直接能够反映需求程度外,交通、工业、农业、运输、新能源等行业发展也会影响成品油需求变化,在以市场需求为主导的成品油市场格局中,这些产业发展的指标与成品油批发价格必然有一定的相关性,甚至有可能是一些先行指标。因此需利用运输部门、工业企业、商务部门等相关行业部门的特征参量开展研究。其中,汽油市场批发价格需求维度的特征参量可包括:载货汽车保有量、民用轿车保有量、新能源汽车保有量、公路货运量、公路客运量、工业增加值、汽油出口数量、汽油表观消费量、单位汽油销量、地方炼厂汽油销量等。柴油市场批发价格需求维度的特征参量可包括:公路货运量、航运货运量、航运景气指数、公路客运量、工业增加值、柴油表观消费量、农业柴油消费量、采掘业柴油消费量、生活类柴油消费量、工业柴油消费量、其他行业柴油消费量、主营单位柴油销量、地方炼厂柴油销量等。
供应维度方面,主要从成品油产业链中的原油加工量、开工率以及汽、柴油库存等方面来反映成品油的供给情况,供需差一定程度反映了市场竞争态势。其中,汽油市场批发价格供应维度的特征参量可包括:国内原油产量、原油加工量、原油进口量、原油库存、主营单位原油加工量、地方炼厂原油加工量、主营单位炼厂开工率、地方炼厂开工率、国内汽油产量、主营单位汽油库存、地方炼厂汽油库存、新加坡轻质油库存等。柴油市场批发价格供应维度的特征参量可包括:国内原油产量、原油加工量、原油进口量、原油库存、主营单位原油加工量、地方炼厂原油加工量、主营单位炼厂开工率、地方炼厂开工率、主营单位柴油产量、地方炼厂柴油产量、主营单位柴油库存、地方炼厂柴油库存、新加坡中质油库存等。
宏观经济维度主要反映国家经济质量、经济增长、税收收入、固定资产投资、货币汇率波动以及天然气与电力等替代产品对我国成品油价格造成的影响,可选取GDP(国内生产总值)、固定资产投资、克强指数、交通工具使用和维修CPI(居民消费价格指数)、增值税税收收入、液化天然气市场价格等为备选特征参量。成品油需求与宏观经济关联密切,投资、消费、经济的增长,一定程度上会转化为成品油消费增长的内生动力。
金融维度主要包括可能影响成品油价格的金融市场相关参量指标,如中证指数、能源类大宗商品价格指数、美元指数、汇率、M1 同比值、国内信贷、债券增速等。此外,还包括部分投资指标,虽然目前国内成品油的金融属性还不强,但因其与原油挂钩,还可加入与原油相关的金融指标如主要期货市场相关品种期货成交量和持仓量,在一定程度上反映投机者情绪。
在实证分析中,使用7 种特征选择模型对各维度的影响因素进行特征选择,以探究不同因素对于成品油批发价格的影响大小,并使用选出的特征参量对成品油市场批发价格进行研究,并通过在测试集上的表现确定各特征选择方法的优劣以及选出的特征参量质量。同时,在数据预处理阶段,考虑到汽、柴油特征参量体系中部分特征参量存在数据缺失,若直接使用均值或零值填充,则会丢失变量的局部信息。因此,使用KNN 插补方法,通过识别空间相似或相近的k个样本,并使用这些近邻样本来填补缺失数据。通过缺失值填充处理后,保证了数据的完整性与可分析性。
对汽油和柴油的特征参量体系各5 个维度分别进行特征选择,用MAPE 与RMSE 指标衡量性能评价结果,见表1和表2。
表1 成品油价格影响因素选择性能评价
表2 成品油价格影响因素
3.3.1 价格维度
对于汽油的价格维度而言,基于LR 共筛选出5 个影响因素,所选出的特征参量整体性能较优,分别为迪拜原油现货价格、阿曼原油现货价格、阿曼原油期货价格、布伦特原油现货价格和布伦特原油期货价格。具体地,从指标性能上来看,其在训练集上的MAPE为7.246 4%,RMSE 为334.674 4,能够用于后续的汽油价格走势分析。
对于柴油而言,基于LR 所筛选出的价格维度特征参量整体性能较优,共选取5 个影响因素,分别为迪拜原油现货价格、阿曼原油现货价格、阿曼原油期货价格、布伦特原油现货价格和布伦特原油期货价格。具体地,从指标性能上来看,其在训练集上的MAPE 为10.344 3%,RMSE 为550.313 9,能够用于后续的柴油价格走势分析。
3.3.2 需求维度
对于汽油而言,基于RF 所筛选出的特征参量整体性能较优,共选取3 个影响因素,分别为民用轿车保有量、新能源汽车保有量和公路客运量。具体地,从指标性能上来看,其在训练集上的MAPE 为24.084 8%,RMSE 为938.625 9。虽然Pearson 选出的影响因素在MAPE 上较RF 选择的影响因素下降了1.597 5%,但是其RMSE 较RF 选择的影响因素增加了35.295 3%。因此,基于RF 筛选出的变量性能更优,能够从需求维度出发分析汽油价格走势。
对于柴油而言,基于Ridge 所筛选出的特征参量整体性能较优,共选取3 个影响因素,即公路客运量、采掘业柴油消费量和生活类柴油消费量。具体地,从指标性能上来看,其在训练集上的MAPE为10.588 0%,RMSE 为564.403 5,优于其他所有的特征选择方法。因此,Ridge 所筛选出的影响因素,能够从需求维度角度对柴油价格走势进行分析。
3.3.3 供应维度
对于汽油而言,基于LR 所筛选出的特征参量整体性能较优,共选取3 个影响因素,分别为汽油产量、新加坡轻质油库存和主营炼厂开工率。其在训练集上的MAPE 为22.857 7%,RMSE 为850.853 9,优于其他所有的特征选择方法。因此,LR 所筛选出供给维度的影响因素能够用于后续的成品油价格走势分析。
对于柴油而言,基于Lasso 回归所筛选出的特征参量整体性能较优,共选取4 个影响因素,分别为主营柴油产量、地方炼厂柴油产量、主营炼厂开工率和地方炼厂开工率。其在训练集上的MAPE 为17.073 9%,RMSE 为773.701 6,优于其他所有的特征选择方法。因此,Lasso 回归所筛选出的供给维度因素能够用于后续的成品油价格走势分析。
3.3.4 宏观经济维度
对于汽油而言,基于Lasso 回归所筛选出的特征参量整体性能较优,共选取5 个影响因素,分别为当月同比CPI、交通工具使用和维修CPI、美元实际有效汇率指数、出口货物退税收入和平均销售电价。其在训练集上MAPE 为14.308 8%,RMSE 为758.608 0,优于其他所有的特征选择方法。因此,Lasso 回归所筛选出的宏观经济维度因素能够用于后续的成品油价格走势分析。
对于柴油而言,基于Ridge 所筛选出的特征参量整体性能较优,共选取5 个影响因素,分别为当月同比CPI、交通工具使用和维修CPI、短期贷款利率、美元实际有效汇率指数和平均销售电价。具体地,从指标预测性能上来看,其在训练集上的MAPE为16.567 7%,RMSE 为855.564 6,虽然RMSE 可能略高于RFE 和RFECV,但MAPE 优于其他所有的特征选择方法。因此,Ridge 所筛选出的宏观经济维度因素能够用于后续的成品油价格走势分析。
3.3.5 金融维度
对于汽油而言,基于RFE 所筛选出的特征参量整体性能较优,共选取3 个影响因素,分别为布伦特原油期货成交量、中国大宗商品价格指数(能源类)和美元指数。其在训练集上的MAPE 为12.375 5%,RMSE 为499.633 2,优于其他所有的特征选择方法。因此,RFE 所筛选出的金融维度因素能够用于后续的成品油价格走势分析。
对于柴油而言,基于RFE 所筛选出的特征参量整体性能较优,共选取3 个影响因素,分别为布伦特原油期货成交量、中国大宗商品价格指数(能源类)和美元指数。其在训练集上的MAPE 为11.390 2%,RMSE 为510.279 4,优于其他所有的特征选择方法。因此,RF 所筛选出的金融维度因素能够用于后续的成品油价格走势分析。
本文在分析筛选国内成品油市场价格影响因素基础上,基于特征工程方法,从价格、需求、供给、宏观经济以及金融5 个维度出发,通过对历史数据的插补分析处理,分别构建汽油和柴油市场批发价格特征参量体系。在实证分析中,通过对比不同特征工程模型在测试集上的性能,筛选出成品油市场批发价格目标序列关键影响因素。从特征参量体系的构建结果来看,汽油和柴油在价格维度、宏观经济维度和金融维度的特征选择结果整体相同,说明汽油和柴油作为重要的能源品种,其价格变化均会受到包括宏观经济波动、国际汇率变动,以及投资者风险规避意识提升等因素的影响。但是,在需求维度和供应维度,汽油价格主要受到包括汽车保有量、轻质油库存以及汽油产量等因素的影响,柴油价格主要受到柴油消费量和柴油产量的影响,特征差异性更为明显。因此,在生产经营过程中,相关政策制定者在制定成品油批发市场指导价时,除对国际市场油价变化情况、宏观经济环境形式和金融市场氛围进行深入分析外,还需要有针对性地考虑汽柴油的供需环境因素,从而引导成品油生产和消费市场的有序发展。
试验数据测试说明,本文基于特征工程方法从价格、需求、供给、宏观经济以及金融5 个维度的影响因素出发,使用多种特征选择模型筛选分析,构建了汽油、柴油市场批发价格特征参量体系,取得了较好的性能。但是,该方法仍存在一定不足,需要在未来进一步探索和改进。例如,基于各类影响因素如何设计考虑多影响因素的成品油市场价格预测模型,以便预判成品油市场批发价格的变化趋势,是值得进一步研究的方向。