基于机器学习方法的我国天然气进口预测

2022-08-31 09:08邢文婷
工业技术经济 2022年9期
关键词:进口量投影卷积

邢文婷 袁 琳 张 巧

1(重庆工商大学管理科学与工程学院,重庆 400067) 2(四川大学商学院,成都 610065)

引 言

“十四五”规划(2021~2025年)中一项重要任务是在2030年实现非化石能源占一次能源消费的比例达到20%,“双碳”政策要求在2030年实现二氧化碳排放量达到峰值并稳中有降。在当前能源政策导向下,我国正大力发展清洁能源,但在实际发展中,出现传统能源退出步伐过快以及新能源的安全可靠替代性不足等问题。天然气作为一种清洁能源,在传统能源退出和新能源发展中起着重要的过渡作用,是实现 “双碳”目标的桥梁[1]。受限于资源禀赋、储存条件、技术水平和产业环境等因素,尽管国内天然气产能建设在国家加大勘探开发力度政策的引导下得到快速发展,但产量增速与需求增速相比仍显动力不足,因此我国天然气供应主要依赖进口[2]。2018年我国天然气进口量超过日本,成为世界最大的天然气进口国,2020年受新冠肺炎疫情影响,各行业经济形势受到不同程度冲击,但天然气进口增速仍与2019年进口增速持平,显示出我国对天然气的刚性需求以及天然气在应对危机中的独特韧性,天然气进口的重要性不言而喻。因此,准确预测天然气进口趋势对不影响国民经济稳定发展的前提下实现 “双碳”目标具有重大意义。同时,掌握科学的预测数据有利于政府实行动态的进口策略,为相关部门制定能源政策提供科学的理论依据。

1 文献综述

构建科学的天然气进口预测评价指标体系和高精度的预测模型是本文预测工作的重点。在早期天然气预测指标的选取中,更多考虑与需求直接相关的影响因素,认为GDP和人口是影响天然气消费的最主要因素,另外,行业不同天然气消费量的影响因素也不同,如Melikoglu将国内生产总值、人均购买力、人口统计和人口变化等指标纳入了预测体系[3],Li等认为第二产业和第三产业中天然气使用量与固定资产投入有关[4]。近年来,大多学者会针对自身的研究需要,纳入其他对天然气预测可能产生影响的指标,Zhang和Yang认为能源效率、城镇化率等会对天然气消费量产生影响[5],Omer等使用季节指数、温度、天然气价格、石油价格、人口和GDP为预测变量用以预测伊斯坦布尔省的天然气需求[6]。由此可见,学者研究视角的不同导致难以形成统一的预测指标体系,且大多研究在构建预测指标体系时仍采用传统定性方法,存在一定的局限性和非客观性。因此,本文利用曲线投影寻踪动态聚类模型构建天然气进口预测评价指标体系,剔除人为任意性的影响,使预测指标体系更具客观科学性,提升预测精度。

在能源预测方法中,时间序列[7]、灰色系统模型[8]和多元线性回归[9]等传统预测方法因具备简单、运行速度快等优点受到研究者们的青睐,但这些方法在单独使用时存在精确度较低、难以刻画复杂的非线性演变趋势等缺陷。为了提升预测精度,有学者对预测模型进行优化改进,Song设计了一种能自动适应天然气消费特征的非线性优化且自适应初始值的灰色预测模型[10]。Zhou等对传统灰色模型进行了优化,设计了一种非线性的新型离散灰色模型,提升了模型的性能,减少预测误差[11]。Liu等建立了一个具有时间幂项的离散分数灰色模型并预测了2019~2025年中国天然气消费量[12],虽然优化后模型的精度有所提升,但其所求解的权系数固定不变,对于受多种复杂因素影响的天然气进口预测并不是最合适的。机器学习模型与传统算法相比,不仅弥补了上述缺陷且具有高精度、自适应和动态学习的优势[6,13]。

综上,为了降低预测风险,提升预测精度,准确地对我国天然气进口量进行预测,本文利用曲线投影寻踪动态聚类模型深入挖掘影响天然气进口量的主要因素,剔除数据中显示与天然气进口量无关的因素,实现最终预测指标体系的客观性。并构建多变量灰色预测、支持向量机和卷积神经网络3种机器学习模型来拟合2006~2020年我国天然气进口量数据,并将拟合结果进行对比分析,以期选出拟合精度最高的预测模型对我国2021~2026年天然气进口量进行预测,旨在为我国天然气供应安全和制定能源政策提供一定的科学依据。

2 天然气进口预测评价指标体系构建

通过梳理相关文献[3-6,10-15],从天然气需求预测指标出发并结合天然气进口的特殊性以及当下能源背景,本文从经济发展指标、人口指标、天然气行业指标和能源消费指标4个方面综合考虑,初选13个影响天然气进口的二级指标。如表1所示。

表1 影响天然气进口的初始评价指标集

然后,采用曲线投影寻踪动态聚类模型[16]对各指标进行排序,假设xij(i= 1,2,3,…,n;j= 1,2,3,…,m)表示影响天然气进口的评价指标,其中n表示样本数量,m表示指标个数),最终指标体系X由m×n维数值矩阵构成。

(1)指标无量纲化

由于天然气进口评价指标的量纲不尽相同,首先对指标数据进行无量纲化处理。如果xij为正向指标,其标准化公式为:

如果xij为负向指标,其标准化公式为:

(2) 曲线投影

双曲正切曲线的特点是增长缓慢,然后加速,最后逐渐稳定。用它来描述天然气进口各评价指标的变化过程是合理的。有双曲正切函数:

(3)投影寻踪动态聚类指标的构建

采用动态聚类投影法构造新的投影指标。双曲正切函数曲线的投影特征值序列表示为:z1,z2,z3,…,zn,评价等级为p(p≤n)。Θt(t=1,2,3,…,p)表示样本投影特征值的第t类集合:

Θt={Zi|d(At-Zi)≤d(An-Zi)}

h=1,2,3,…,pt≠h

d()越小表示类间样本的聚合越高,s()越大表示样本间离散程度越高。投影寻踪动态聚类的思想要求样本点在整体上尽可能分散,并形成多个类,类与类之间尽可能分散,而类内样本点尽可能聚集。根据该思想,定义了曲线投影寻踪动态聚类指标:

最佳投影方向和投影值可以反映各评价指标与天然气进口量的内在机理,当Q()最大时可以得到最能反映数据特征的最佳聚类结果和投影方向向量,因此,天然气进口评价指标可以描述为以下非线性优化问题:

表2 天然气进口预测指标特征重要性排序

结果显示,能源消费总量中天然气占比、天然气使用人数和城镇人口数量对天然气进口量影响较大,均在10%以上,其中能源消费总量中天然气占比的影响程度最大,为32.06%,说明天然气消费占比是影响我国天然气进口量的最主要驱动因素,与当前我国大力发展天然气改善能源消费结构、天然气进口需求不断增大的现实情况一致。另外,能源工业固定资产投资、天然气进口价格和居民消费水平对天然气进口量的影响程度微乎其微,均在1%以下。从预测数据的有效性和预测精度考虑,将影响程度不足1%的指标剔除,得到最终天然气进口预测评价指标体系,如表3所示。

表3 天然气进口预测评价指标体系

续 表

3 机器学习模型概述

3.1 多变量灰色 GM(1,N)模型

GM(1,1)是最常用的灰色模型,其原理是用少量数据预测变量未来一段时间的发展趋势。由于整个样本仅由一组时间序列数据构成,并未深入挖掘外界因素对变量产生的影响,因此模型精度不高。GM(1,N)模型原理与GM(1,1)相似,但弥补了GM(1,1)的缺陷,将对因变量有影响的N个因素纳入模型,构造N个n元一阶常微分方程结合求解,提升预测精度。GM(1,N)模型构建如下。

3.1.1 数据准备

3.1.2 计算累加序列,生成邻值序列

3.1.3 引入矩阵向量记号

参数列u=[a,b2,…,bN]T的最小二乘估计满足:

最后将其做累减解得还原值,得到最终天然气进口预测值:

3.2 支持向量机回归(SVR)

支持向量机是一种稳健而精确的数据挖掘技术,可以用于样本的分类与预测,用于回归解决预测问题时,称为支持向量机回归。SVR的目的是使函数最大限度偏离实际输出的不敏感损耗函数。在减小误差时,通过同时增加函数的平坦度,可降低过度检测风险。对天然气进口预测评价指标体系组成的N维数据样本进行训练,找到拟合效果最佳的函数模型和参数,并利用拟合所得函数输出某一时间段的预测值。SVR从函数角度表示为:

其中φ(x)表示核变换函数,将输入数据映射为高维数据,w和b是参数。通过最小化正则化风险函数来计算系数,如下所示:

其中参数ε为容差值:

上述方程中L(y,f(x))表示不敏感损耗功能。当估计值在介电常数内,则损耗为0。同时引入两个松弛变量ξ1和ξ2,分别表示介电常数区的正偏差和负偏差。式 (10)以新的约束形式重新表述为:

通过下式的拉格朗日乘子法解决上述约束优化问题:

对偶拉格朗日形式如下:

最后得到回归函数:

其中K(xi,xj)是一个核函数,其值等于特征空间φxi和φxj中两个向量xi和xj的内积。比较常用的核函数有径向基核、线性核和多项式核,在本文研究中采用多项式核进行天然气进口预测,多项式核计算简单且提高算法速度,用以下等式表示:

在等式中,d表示阶数,a1和a2为常数。SVR的性能取决于超参数(c,ε)和核参数(d)的设置,参数的设置会影响估算精度。详细来说,c提供了训练误差和模型鲁棒性之间的折衷,c取值过大,则目标函数的经验风险将最小化。参数ε与支持向量的数量一致,并决定SVR中耗损函数的宽度。

3.3 卷积神经网络(CNN)

人工神经网络是一种反向传播算法,由于神经网络中存在大量参数,容易产生过拟合或训练时间长的情况。卷积神经网络(Convolution Neural Network,CNN)是一种深度学习模型,典型的卷积神经网络结构包含卷积层、池化层和全连接层3个环节,每层卷积层由一组卷积核组成,CNN依靠卷积层中的卷积核识别输入数据的特征,通过池化层提取有效特征,并通过局部连接对输入数据的相关性进行分析、权值共享和子采样,提取出全局特征一般需要多次卷积才能完成。与传统神经网络相比,卷积神经网络降低了相同网络规模下的训练参数量和计算量,适应性更强,同时降低了模型的复杂度以及过拟合的风险。CNN本质上是一种输入到输出的映射,训练过程一般包括两个阶段:第一阶段:向前传播阶段。输入卷积网络,计算出与之对应的实际输出值。在此阶段,信息从输入层经过逐级变换传送到输出层;第二阶段:向后传播阶段。计算实际输出值与理想输出值间的差距,按照极小化误差的方法调整权值矩阵。判断指标是否满足精度要求,不满足则返回第一阶段继续迭代。当训练结束则认为各个权值达到稳定,分类器已形成。一维卷积公式如下:

其中,yt为输出的特征数据;wt为卷积核;xt-k+1为输入数据;b为偏置;K为数据长度。

4 我国天然气进口量预测

4.1 数据说明

本文使用到的数据为2006~2020年天然气进口预测评价指标以及我国天然气实际进口量的历史数据,数据来源于历年 《中国统计年鉴》和 《BP世界能源统计年鉴》(其中2020年进口数据受新冠肺炎疫情影响较小,未造成整体进口趋势变化),预测评价指标数据如表4所示。

表4 2006~2020年预测指标的历史数据

在天然气进口量预测之前,需要获取各个指标的预测值,由于指标较多,因此选用具有简单时间序列预测优势的ARIMA模型进行预测。将各指标分别带入遍历不同参数的ARIMA(p,d,q)模型[17]。各模型拟合结果中均方根误差(RMSE)取值最小的组合视为该指标拟合最好的模型[17,18],并获取各指标2021~2026年的预测值,预测结果见表5。

表5 2021~2026年各指标预测值

4.2 预测结果及分析

将2006~2020年各评价指标的历史数据作为输入变量,2006~2020年天然气实际进口量作为输出变量,比较3种模型的预测拟合精度。将2006~2013年数据划分为训练组,用以训练预测模型,2014~2020年数据作为验证组,验证模型精度。验证组中拟合值与真实值的相对误差百分比如表6所示。

表6 3种模型天然气进口量拟合结果对比

3种模型中SVR模型预测误差最大且波动最剧烈,7组拟合数据中相对误差百分比最小到0.44%,最大至30.19%,此外有4组数据的相对误差百分比均大于20%。GM(1,N)模型和CNN模型的相对误差波动较小。选取均方误差(MSE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)3种误差评价指标进一步对比3种模型精度。

一般来说,MAPE小于10%,模型被认为预测精度较高[19],且MSE和RMSE的数值越小,模型误差越小、精度越高。从表7结果分析,CNN模型3个误差评价指标的数值均最小,其次是GM(1,N)模型,数值最大的是SVR模型,同时CNN模型的MAPE值小于10%,GM(1,N)和SVR模型的MAPE值均大于10%。由此可见,CNN模型的预测精度较高,用此模型预测的未来天然气进口值最富参考价值。下面将表5中各评价指标预测值带入训练好的CNN模型中,得到2021~2026年天然气进口量预测结果,如表8所示。

表7 3种模型预测误差对比

表8 2021~2026年天然气进口量预测结果

预测结果表明,2021~2026年我国天然气进口趋势与历史数据保持一致,进口量持续增加;进口增速缓慢下降,整体增速波动较小,均在10%以内;2026年,天然气进口量首次突破2000亿立方米。从我国能源政策来看,与供应可靠性不稳定的新能源相比,天然气仍是未来调整能源消费结构、实现 “碳达峰”目标的 “主力军”,天然气进口需求仍会持续增加。结合国际能源背景分析,各天然气出口国积极响应 “碳达峰”号召,天然气出口量上升,我国作为最大的油气资源消费国,是能源出口国争先合作的对象。在我国主要的天然气进口来源国中,俄罗斯表示将增加向中国出口天然气的总量,并加强绿色低碳领域的合作,发展更为紧密的能源联盟,哈萨克斯坦、土库曼斯坦、卡塔尔、乌兹别克斯坦等国也明确表示将加强与中国在天然气、可再生能源领域的合作,因此未来中国的天然气进口体量上升是大势所趋。

同时,风电、光伏发电等在政策扶持下具备了一定的市场竞争性,绿色低碳能源政策的导向使风电、光能等清洁能源所占比重有所上升,国内能源政策将推动可再生能源替代计划,完善绿色低碳转型体制机制,氢能等可再生能源或许会成为未来能源政策的另一重点,除此之外,我国对页岩气开发的重视和开采技术的进步促使国内天然气产量增加,这些在一定程度上缓解了天然气进口端的供应压力,因此天然气进口增速呈下降趋势。

5 结论与政策建议

天然气进口预测受到多种因素影响,本文从天然气自身特殊性和当下能源背景考虑,并结合曲线投影寻踪动态聚类的方法,确定了具有客观性的天然气进口预测评价指标体系。构建3种机器学习模型并对比天然气进口量的拟合精度,选取最优模型进行最终预测。综合结论有以下几点:

(1)利用曲线投影寻踪动态聚类模型构建天然气进口预测评价指标体系,并深入挖掘了各因素对天然气进口量的影响程度。其中能源消费结构中天然气消费占比是影响天然气进口量的最主要驱动因素。其次是城镇人口数量和天然气使用人数,从居民用气需求角度解释其对天然气进口需求的影响。最后天然气对外依存度、煤炭消费占比以及国内生产总值也对天然气进口产生了一定影响。

(2)CNN模型具有极强的数据处理能力,且避免了训练时间长和出现过拟合的情况,是性能较高的机器学习模型,通过与GM(1,N)模型和SVR模型对天然气进口预测拟合结果的对比,也显示出其精度更优、拟合误差更小的优势。因此用CNN模型预测出的天然气进口结果具有参考价值。

(3)预测结果显示,2021~2026年天然气进口增速在逐步减缓,但天然气进口量仍不断攀升,预计2026年天然气进口量突破2000亿立方米。在未来发展中应重视我国天然气进口能力的提升,避免出现天然气短缺等能源供应问题,同时采取措施降低天然气对外依存度。

以上结论对国家制定相关能源政策、规划天然气进口策略、实现 “碳达峰”、“碳中和”目标等方面提供了一定的参考价值,基于研究结论,本文提出以下建议:(1)未来发展中要健全以天然气为导向的能源政策,继续发挥天然气在我国能源转型中的支撑作用,发挥天然气在氢气等新能源发展中的 “孵化器”作用,助力实现 “双碳”目标;(2)合理调配天然气资源。优先保障居民用气,严格控制产能过剩工业的天然气用量,提高天然气利用的社会价值,在生产、运输、使用过程中严格控制天然气的排放和使用泄漏量,确保天然气的利用效率;(3)加快天然气管道建设,加强天然气进口能力。截至2020年,我国管道天然气进口量占天然气进口总量的32%,远低于液化天然气进口量,通过管道运输的天然气量还远不及充分利用管线所能达到的产能。因此,加快管道建设,增加管道运输量有助于增强我国天然气进口能力;(4)推进天然气基础设施建设,在天然气的长期规划中,要加快建立储气设施,增强调峰能力以应对出现天然气实际进口量低于预测进口量以及季节性的供需不平衡等情况; (5)增强资源勘探力度,加大科技成本投入,升级我国天然气开采技术,做到常非并重、海路并举。“双碳”目标下既要增加天然气在能源消费结构的比重,实现能源结构转型,又要求降低天然气对外依存度,破解难题的关键举措在于增加我国天然气产量。

猜你喜欢
进口量投影卷积
2021年我国聚酰胺66切片的进口概况
7月我国化肥进口量增加
基于3D-Winograd的快速卷积算法设计及FPGA实现
解变分不等式的一种二次投影算法
2020年我国己内酰胺的进口概况
2020年我国聚酰胺66切片的进口概况
基于最大相关熵的簇稀疏仿射投影算法
卷积神经网络的分析与设计
从滤波器理解卷积
找投影