文 | 韩宇 特日根 胡坤 李想
1.长光卫星技术有限公司
2.吉林省卫星遥感应用技术重点实验室
我国自2018年超越美国成为全球最大原油进口国,且能源进口量逐年增加,目前年石油和天然气进口总量已超过6亿吨。能源价格直接关系国民经济安全,能源价格波动会影响我国众多实体企业和金融机构的营收。因此,通过多种信息预测未来一段时间原油期货价格,对制定策略、辅助投资决策、保障投资安全有重要意义。卫星遥感具有大面积同步观测能力,遥感数据周期短、时效性强、受政策约束小,通过机器学习算法可从遥感数据中快速提取能源产品生产、存储相关指标,结合经济变量与计量分析方法可构建能源期货产品高效分析与预测的模型。随着航天事业的进展,地球在轨的遥感卫星数量大幅增加,全球拥有400余颗在轨遥感卫星,遥感卫星的数量和地物识别能力都在快速增长[1]。遥感影像数据从传统服务进一步扩展到保险、银行、投资公司等金融单位,在大宗商品期货交易领域的价值正被逐渐挖掘。
本文通过公开资料及研究成果,总结了利用遥感分析原油库存储量的方法,通过回归分析阐述原油库存对原油期货价格的影响,进而探讨遥感解译数据为原油期货交易策略提供支持的方法和意义。
近年来国际能源价格大幅波动,为对冲原油价格暴涨暴跌带来的风险,国内很多能源单位和金融实体参与到国际能源期货交易中。由于信息不对称或经验不足,在能源期货领域,我国经济实体和金融机构常陷于被动地位,如:1)2004年中国航空燃油集团公司在石油期货交易中损失5.5亿美元;2)2018年中石化旗下从事原油贸易的子公司联合石化,在原油期货交易中因为判断失误造成超7亿美元的资产损失[2];3)2020年WTI原油5月期货合约结算价-37.63美元/桶,中国银行旗下原油宝投资平台对原油期货价格巨幅下跌的风险预估不足,未及时止损,造成中行及其投资者近100亿人民币的巨额损失[3]。
能源期货交易中,及时的产量、库存、经济形势相关信息,对判断形势、制定策略和预防风险十分关键,在这方面卫星遥感数据可以发挥独特的作用。
当前遥感数据在大宗商品的主要应用场景还停留在农业和畜牧业领域[4],如佳格大数据通过不同农作物的光谱特性,分析我国东北某地区大豆、玉米等作为农业期货作物的种植变化情况,进而预测部分大宗农产品产量[5];黄健熙等通过遥感信息与农作物模型集合卡尔曼滤波通化来预测冬小麦的产量[6]。在能源期货领域遥感数据的应用研究还较为匮乏,仅有部分学者利用传统数据研究能源期货变动原因,如陈大恩等通过协整分析和因果检验明确了原油储量对原油期货价格的影响[7]。
总体而言,国内直接通过遥感信息来分析原油期货趋势的研究较少,而原油期货对存储量、销量等数据极为敏感,及时的信息会对投资决策产生重大影响,遥感技术的发展已经可以做到对重点区域每天数次重访,如果能够利用遥感数据提取能源期货产业中相关定量信息,会使相关交易者获取信息优势,研究遥感数据应用于能源期货领域具有可行性和现实意义。
对原油等大宗商品库存情况统计时,传统调研方式主要为:与能源库存公司或管道公司合作、使用大量地面调查人员现场调研、广泛问卷调研、等待能源机构公开数据。这些方法都存在成本高或时效性低的问题。如仅美国库欣区的原油储罐就有14家仓储运营商分别运营,与这些运营商都建立合作关系不但执行上有困难,且成本高昂;采用地面调查和广泛问卷的方式则存在效率低和客观性无法保障的问题;能源机构公开的数据,所有机构和个人皆可见,无法使分析者获取时效性优势。
遥感卫星因平台高、视野广、受地方政策限制小的特点在解决以上问题方面具有突出优势[8]:
1)获取数据效率高,不受地域或公司限制。我国商业遥感卫星已实现在优于1m分辨率的情况下,仅通过一次拍摄形成135km×135km幅面的遥感影像,其获取地面数据的效率是传统方法难以比拟的。通过卫星遥感影像获取原油库存数量数据时,只需在核心储油区经过一次卫星拍摄,即可分析获得各个储油罐的储量情况,亦可汇总出区域内整体储油量或各个仓储企业的储油情况。
2)遥感数据时效性强。空间遥感探测可以在短时间内对同一地区进行重复探测,发现目标区域多种事物的动态变化,部分太阳同步轨道卫星可以每天2次对同一地区进行观测。遥感星座的建设更增加了数据的时间分辨率,如长光卫星建设的吉林一号星座,已实现在轨卫星25颗,星座具备指定区域一天内8~10次的重访能力,相比于美国能源信息署(EIA)或美国石油学会(API)官方每周公布的库存数据,通过遥感影像分析获取的库存数据具有明显时效性。
3)经济性强。遥感影像中获得的地物电磁特征蕴含大量自然、经济活动等信息,新的解译技术可以高效挖掘其中的量化数据,随着技术进步和商业遥感事业发展,数据成本不断降低,越来越具有经济性优势。如国内商业卫星拍摄的遥感影像数据价格已低至每平方千米数十元,相比雇佣大量地面调查人员统计调研,经济优势明显。
影响能源期货价格的因素很多,包括供需关系、宏观经济形势、地缘政治和货币政策。地缘政治和货币政策属于突发事件或政府决策,目前各种模型都难以预估和量化,因而不做考虑。在市场经济中,影响价格的根本因素依然是供需关系,宏观经济形势也可以通过传导反映在供需关系中,所以遥感应用于能源期货领域的数据也主要反映在供给量和需求量两个维度上。
可通过原油库存和全球经济形势来定量反映原油供给和需求的即时情况。对于原油库存,可通过卫星影像对重点港口的油轮停泊情况、重要储油区的油罐存储情况进行分析,如中科星睿公司通过对主要港口和储油区的浮顶油罐进行提取和储量分析,其提取效果如图1。
图1 储油区油罐提取影像
原油是社会经济的重要能源,其消耗与社会经济活跃度正相关,也可使用经济数据或通过夜光遥感影像解译的重点区域内灯光数据来分析原油消耗情况,如李德仁发现夜光总量能够较好地在省级单元上模拟GDP和能源消耗数据[9],其通过珞珈一号夜光遥感卫星进行了夜光影像数据与区域经济关系的研究,夜光影像如图2。
图2 珞珈一号卫星夜光影像
遥感影像解译的经济数据,可用于原油期货价格模型的构建,同时由于遥感数据的时效性,可先于市场获取重要机遇或规避风险,有潜在巨大价值,其应用模型如图3。
图3 遥感数据在原油期货中的应用模型
本文重点介绍通过主要原油库存区遥感影像来分析原油储量变化。在选择监测区域和影像数据时主要围绕能反映供需关系的关键地理区域,如美国库欣区是全美原油交易的心脏地带,包含大量的浮顶储油罐。储油罐的分类比较清晰,根据材质分为金属和非金属油罐,根据位置分为地下、地上和半地下油罐。其中地上油罐,又可进一步分为浮顶油罐和固定顶油罐,遥感影像善于分析的是浮顶油罐,这对储油量变化的预估已经足够,因为绝大部分原油是以性价比较高的浮顶油罐存储,且只要获取足够多期数的样本数据,即可通过相应模型估算出总储量绝对值的变化情况。图像预处理方式主要包括图像增强和特征提取,图像增强技术有:滤波、大气校正、几何校正等;特征提取包括从图像中抽取光谱特征、形状、空间特征,区域分割等。通过这些预处理技术,可以提高遥感影像质量,缩小检索范围,为接下来的机器学习提供良好输入,提高效率和准确率。
通过遥感影像研究原油储量,首先要从影像中准确识别和切割出各个储油罐。遥感图像中提取油罐的方法国内外学者已进行了一定的研究,传统方法包括滑动窗口搜索法和感兴趣区域提取法:主要利用油罐的颜色、形状、阴影,设定匹配模板,进行显著性检测来对目标进行判断。针对需要精确查找浮顶油罐的场景,传统方法存在检测速度慢和精度不足的问题,由于浮顶油罐与固定顶油罐在形状、大小和颜色上高度相似,通过传统方法难以区分,因而传统的遥感监测方法不适用于浮顶油罐的提取。
随着机器学习,特别是深度学习技术的发展,产生了很多高效且较准确的目标识别方法:如神经网络(NN)、支持向量机(SVM)、随机森林(RF)等算法。深度卷积神经网络模拟人脑的分析过程,通过组合影像的低级特征形成抽象的高级特征,为遥感目标识别技术开辟了新的路径,是机器学习应用到遥感影像识别和分类的重大成果。深度学习中神经网络模型具有高效性、可塑性强和普适性强的特点,通过多维的低级特征逐渐向上拟合出待识别目标高级特征,适合于浮顶油罐的提取场景。
深度学习神经网络模型的典型代表为基于区域的卷积神经网络Faster R-CNN,其将目标检测的多个步骤集中于一个网络结构中,使用一个深度卷积网络,可以在候选框生成和类别判断中共享特征参数,减少重复计算,同时完全兼容GPU硬件计算[10]。计算原油储量既需准确识别出浮顶油罐,还需将其从所在位置中提取,且有较高效率要求。
深度神经网络的训练过程主要就是卷积核的优化过程,使各个层级的卷积核都能良好过滤出符合浮顶储油罐特征的影像。首先需要足够数量的浮顶油罐样例数据作为训练模型的输入,如图4,通过对含有浮顶油罐标签的样例图片数万次训练迭代,使模型逐步做到对浮顶油罐的高度拟合识别。
图4 浮顶油罐样例数据集
基于Faster R-CNN的VGG16网络,使用卷积神经网络(CNN)对图片特征进行提取,生成特征图,判别图像中目标是否为浮顶油罐;在特征图的基础上用区域推荐网络(RPN)解决目标在哪的问题;最后综合目标特征和目标相对位置输出给全连接层完成目标分类和位置框选。以美国库欣区遥感影像为例,通过选取数百张浮顶油罐样例图对神经网络模型进行多达数万次的迭代训练,然后使用训练后的VGG16网络进行未分类影像的识别,可以达到满意效果,如图5。
图5 VGG16网络提取出区域内的全部浮顶油罐
通过机器学习提取出待检测区域的浮顶油罐位置后,需要依次对单个油罐的储量进行估算。由于原油储藏罐多是形状规整的圆柱体,所以求取其储量的关键转化为计算油罐浮顶的面积和浮顶相对罐底的高度[11]。
油罐中浮顶面积的计算过程较为简单,以于圣涛在基于高分辨率遥感影像的油罐体积求取为例,其对包含油罐的遥感影像直接采用Opencv中的相关函数可准确识别出油罐的上顶半径,计算出的半径与实际半径的绝对误差小于0.35m,相对误差小于0.9%。
相比于浮顶油罐的上顶面积,浮顶的相对高度求取过程较为复杂。需要通过高分辨率遥感影像中浮顶油罐的内壁和外壁阴影长度、太阳高度角、太阳方位角、卫星高度角和卫星方位角等多个参数计算油罐高度[12]。根据前文求得的油罐面积即可求出油罐的储油量。
使用遥感影像求取单个浮顶油罐的储油量后,通过逐个累加后可得到储油区中全部浮顶油罐的总体储量,结合相关统计模型后可估算出储油区全部储油量。
目前已有国内企业基于遥感卫星影像和回归模型提供日度频次的原油库存数据,如中科星睿发布的基于美国库欣区遥感影像的原油库存数据,其发布频率领先于EIA发布的周度库存报告,且数据准拟合度达到了90%以上。
遥感数据在能源期货领域的典型应用场景为对能源期货品种的库存情况进行分析,建立库存与能源期货价格相关的模型,辅助交易者和政策制定者决策。要想通过遥感影像了解原油库存情况,需对重要原油港口和原油库存区的影像提取分析,这些港口或库存区应具有以下几个特点:1)具有庞大的存储能力,能够反映区域原油库存状况;2)处于原油交易的核心地带,每周都有较高的流入与流出量;3)该区域原油库存与相关能源期货贸易挂钩。
美国库欣原油储存区为满足以上要求的典型区域。库欣位于俄克拉荷马州俄克拉荷马城和塔尔萨之间,曾经是萨克斯和福克斯保护区的一部分,这里拥有星罗棋布的原油储罐。石油资源帮助俄克拉荷马州建立起石油工业体系,并将库欣地区变成了一个新兴城市和重要的石油供应中心—储存了来自美国各地的各类型原油和来自加拿大、墨西哥的进口原油,以及其他地方原油。目前,库欣地区原油储罐的容量高达9000万桶以上。
更为重要的是WTI原油期货合约的交割地就位于俄克拉荷马州的库欣地区,合约到期以后通过管道、储罐网络系统进行交割。统计数据显示,库欣地区原油库存减少300万桶至500万桶,就可导致WTI原油价格上涨5至10美元。换言之,库欣地区原油库存增加几百万桶,就可能令油价出现大幅度下跌[11-16]。
每周三美EIA都会公布库欣区上周五的原油库存情况,每当数据公布都会引起WTI期货合约的大幅度波动。因库欣区大部分原油储罐为浮顶油罐,可使用卫星拍摄;且EIA公布数据为5天的滞后数据,这就为遥感影像利用高时空分辨率分析库欣区原油库存量且先于官方获取数据提供了基础。
基于WTI原油价格与库欣区原油库存量和宏观经济数据的关系,建立了如图6所示的应用模型。
图6 遥感数据应用模型图
应用模型中以卫星观测的库欣区库存数据和区域经济活动数据为超前数据集,结合EIA官方公布的全美各州原油产量数据与宏观经济指标PMI构建整合模型,利用回归算法与机器学习技术,可对WTI原油价格的波动做良好解释[17],对决策分析和价格预测均有一定辅助作用。利用该模型对2019年6月至2020年6月WTI原油价格进行回归验证,取得了良好拟合度。
其中增加库欣区解译数据的回归模型拟合度达到了62.4%,较无此项数据的模型大幅提高31.7%,极大增强了模型解释能力。及时获取原油库存储量信息对预估原油期货价格,构建分析模型有重要意义,利用卫星遥感数据可获取先于官方公布的原油库存数据,增加模型的时效性和解释能力。
原油价格波动对国民经济和金融安全影响重大,人工智能算法可精确识别并提取遥感影像中浮顶油罐的位置;通过卫星高度角和方位角、太阳高度角和方位角,以及油罐内外壁阴影长度可获取浮顶油罐中原油储量;进一步通过回归分析,明确了原油库存储量对分析预估原油期货价格的重要性。通过遥感能力与数据意义的分析,间接证明遥感数据在能源期货领域应用的巨大价值:
1)当前解译算法已具备从卫星遥感数据中获取原油储罐位置和总体储量的能力;
2)卫星遥感数据具有较高时效性,可先于官方数据发布;
3)原油库存储量与原油价格有较强相关性,结合其他经济学变量对分析及预估原油期货价格、提供策略依据有重要价值。
使用遥感影像数据预估原油储量变化,可更早做出合理投资决策,为交易者和策略制定者提供信息优势。
遥感数据不仅可获取原油储量数据,还可通过夜光遥感监测区域经济活力、物流区车流量计算区域贸易指数等与原油期货价格相关的其他维度数据。随着商业遥感星座不断发展和技术进步,遥感数据的时空分辨率将不断提高,数据解译能力也会进一步提升。将遥感数据应用在能源期货领域是可行的,且相较传统渠道数据具有时间优势和客观性优势,未来遥感影像在能源期货领域的应用前景广阔,数据价值将更加凸显。