金淑萍*,刘冰,王建,邵强,曹宇天
(1.中海石油气电集团有限责任公司;2.上海中旖能源科技有限公司;3.国家石油天然气管网集团有限公司;4.北京公共交通控股(集团)有限公司)
从长赐号阻塞苏伊士运河的恢复时间及损失估算,到通过一辆LNG 槽车冬季保供的行驶轨迹进行用户用气特征分析,卫星定位系统为能源行业提供了大量基础数据,帮助能源企业与用能企业更好地进行资源调度与供给优化,也可以更好地对黑天鹅事件进行风险防控。率先拥有数据与资讯的企业,将在下一轮竞争中取得先发优势。2020 年中国北斗三号系统完成全球组网,给各行业深入应用北斗数据提供了契机。本文通过对北斗大数据在能源及交通领域的应用场景进行初步探究,对其在天然气下游业务领域的应用进行深入思考。
天然气按资源形态可以分为压缩天然气(CNG)和液化天然气(LNG)。压缩天然气通过管道来运输,如西气东输长输管网和从门站接至千家万户的城市管网。液化天然气主要通过LNG 槽车来运输。液化天然气行业由于市场开放程度较高,参与主体多元,数据采集一直是行业难题。从上中下游来分析液化天然气行业,上游相对集中,但中游和下游非常分散,整体呈现以下状态:
上游:共有270 多家LNG 企业(包含液化工厂、接收站)。资源供应主体以国有能源公司为主,也包括民营企业与外资,构成呈现多样化。
中游:行业内数百家LNG 槽车运输车队,合计2.2×104辆槽车,分布在全国各地。参与主体极为分散,集中度较低,相互间为竞争关系。
下游:主要分为加气站、工业用户、城市燃气、燃气电厂四种类型,数万个终端用户分布在全国各地,多依托于区域运营商,供应特点及价格承受力有较大差异。
液化天然气行业分散且差异化的业态决定了在数据采集方面存在很多困难,想了解行业全景宏观和微观信息,需要对接多个主体,所耗费人力和物力将会是巨大的,同时很难保证数据实时性。
当前能源企业的市场战略已经从“资源为主导”变为“数据为主导”,销售模式正在从传统的广撒网模式向高效的精准营销模式转变[1]。对于用户的服务正在从“千人一面”向“千人千面”个性化订制转变。市场决策与用户生命周期管理,都需要以市场动态数据为基础,提升决策的科学性和服务的用户体验。
因此,数据质量决定了市场决策的质量,如果获取的信息都是历史和片面信息,无法了解用户真实在哪里、用气体量如何、偏爱哪种气质类型气源、价格承受度如何等信息,就无法做出正确的市场决策[2-3],反而会让市场陷入无休止的恶性竞争与价格波动,无法保证用户的稳定供应和良好体验。以人工智能、大数据、区块链等新一代信息技术为支撑的智慧能源,有望为这一问题提供解决方案。
卫星数据(北斗、GPS)的主要应用内容为定位数据和遥感图像数据,在这两方面国内外均有实践案例:定位数据可形成轨迹数据,通过数据挖掘获取更加丰富的信息,而遥感图像数据可以用于目标检测图像识别等应用。
1.3.1 高德地图对新增道路和道路封闭的识别
高德地图作为中国国内排名第一的地图软件,用户月均日活跃量超过1×108人次,通过实时采集的大量定位数据,高德地图进行了数据挖掘:对于没有道路但是出现轨迹信息的情况,挖掘出新增道路,并进行实地/卫星图核实,补充至路网数据;对于存在道路数据但是长时间没有轨迹数据的情况,挖掘提取封路等特征进行事件标记。
1.3.2 百度地图根据轨迹数据挖掘时段性交规
百度地图基于对轨迹特点的研究,可判断出是否存在时段性交规。如在某一时段中,路段的轨迹数量骤然下降,之后又骤然提升,但当地整体出行需求并未出现这样的情况,那么轨迹下降很可能是人为限制造成的。又由于发生突变的时间点非常的整齐,从而可以推测,此处很可能有一个仅在期间禁止通行的分时段交规。
1.3.3 阿里巴巴达摩院研发的卫星遥感影像人工智能(AI)分析系统
2018 年12 月,在首届联合国世界地理信息大会上,土地资源保护与AI(Artificial Intelligence,人工智能)技术的结合,成为与会者的关注热点。北京市规划与自然资源委员会联合达摩院与阿里云,率先利用这项技术实现大棚房90%的监测准确率。传统卫星影像分析主要依赖真人肉眼比对,不仅效率低,错检、漏检也时有发生,遥感分析师要每天伏案比对北京近1 000 km2的耕地卫星遥感照片,从中找出违章大棚及破坏农田等违法行为,每次分析都要花费数月时间。由于分析耗时长,执法人员赶到时已有大片农田被破坏,损失难以挽回。通过达摩院机器智能实验室深度学习团队开发的卫星遥感影像AI 分析系统,遥感卫星影像分析被缩短至几分钟,大大提升了效率。该技术还被应用于水利河道监管、生态环境保护、农业估产及农情监测、地质灾害防治等领域。
1.3.4 长光卫星技术公司实现卫星图船舶识别
传统卫星使用方式是卫星在太空中拍下图像后将其传回地面,由地面工作人员来对目标进行识别,再发送到相对应的部门,这时对应部门才能做出反应。长光卫星技术公司的卫星通过研发在轨智能识别系统,工作模式变成由卫星将拍摄到的图片信息进行智能识别,图片中的目标被识别之后,直接发送到相关部门采取行动,节省了人工识别时间,提高反应速度,可实现对海上船只进行动态精确识别。
1.3.5 斯坦福大学通过卫星图智能识别贫困地区
来自斯坦福大学计算机研究中心的科学家们找到一种精准识别贫穷区域的新方法,利用机器学习卫星图片的方式,成功标识了非洲5 个国家的经济状况。该方法采用了机器学习中“迁移学习”的技术,分两步标识贫困情况。首先,通过机器深度学习高分辨率的白天卫星图像中大约4 096 个与经济相关图像信息,包括道路、市区和水道等,建立模型,对这些区域晚间的照明情况进行预测。然后,结合世界卫生组织以及世界银行已有研究,对模型进行修正,完成对贫困情况的标识。
以上案例通过卫星数据中定位/轨迹数据与遥感图像数据,利用AI 算法进行数据挖掘,获得了很好的社会效益和经济效益,分别在城市拥堵治理、农业、搜救、扶贫等领域起到示范作用。能源行业普遍需要进行基础设施建设,使能源设备在卫星图上有比较清晰的呈现,但是目前国内尚未有成体系的基于卫星数据的能源行业人工智能应用场景的成功案例,少有人探索这一交叉领域,该领域存在巨大的开拓空间。能源行业一旦与卫星数据以及人工智能算法相结合,将会产生颠覆性创新,生成创造性的现实应用场景。
现阶段LNG 物流主要以LNG 槽车作为中间环节,连接了上游出货液厂/接收站与下游LNG 消费终端,车辆接液、堵车、休息、卸液等行为都有明显的行为特征。以LNG 槽车轨迹数据为基础,结合周围地图数据、卫星遥感数据、企业工商信息、行业信息等数据,以人工智能、大数据等新一代信息技术为支撑,可还原车辆的接液、卸液行为、追溯某个上游行政区域的常用运输路线,以及相应的用气终端信息,从而推导出整体行业的供应和消费全景信息(见图1)。
图1 方案架构图
(1)危化品车辆数据:主要来源于国家级危化品监控平台即交通部“两客一危北斗联网联控平台”。按照国发〔2010〕23 号《国务院关于进一步加强企业安全生产工作的通知》文件要求,运输企业必须为“两客一危”(指从事旅游的包车、三类以上班线客车和运输危险化学品、烟花爆竹、民用爆炸物品的道路专用车辆)车辆安装符合JT/T 794—2011《道路运输车辆卫星定位系统车载终端技术要求》的卫星定位装置,并接入全国重点营运车辆联网联控系统,保证车辆监控数据准确、实时、完整地传输,确保车载卫星定位装置工作正常、数据准确、监控有效。截至2020 年底,交通部“两客一危北斗联网联控平台”共接入了全国31 个省、自治区、直辖市的数据,有超过80×104辆“两客一危”车辆数据,这其中就包含LNG 槽车。LNG 槽车的实时定位、车速、时间等数据,都被平台实时记录下来,每天处理量在500 G 以上。
(2)行业数据:上游液厂/接收站精准位置数据来自于上海中旖能源科技有限公司的行业知识图谱积累,通过图像识别与人工核验,标注高频行为数据。市场价格数据来自于对主流液源及物流运力实时报价摘取,以及资讯公司的数据采集,可实现离岸价(FOB)与到岸价(DES)日级别更新。
(3)地理信息数据:主要借助于高德、百度、腾讯等第三方开放平台,保证数据更新的及时性,同时也可以采用离线数据部署方式。
(4)企业数据:企业工商信息数据来自天眼查、企信宝、企查查等第三方工商信息查询与信用平台。
(5)其他数据:通过气候数据、海事卫星/遥感数据、可替代能源数据、海关数据、资讯公司及相关新闻报道等多维度数据进行分析评估,提升结果的准确性。
(1)北斗车辆数据(易燃气体)未能区分LNG槽车类型,而LNG 在实际运输中会出现更换运输介质的情况,如何区分哪些是运输LNG 的车辆是个难题。特别是在罐箱多式联运和甩挂运输等普及后,这一问题会更加突出。
(2)轨迹数据中存在各种各样的噪声:北斗轨迹存在传感器采集精度导致的噪声;车辆的局部运动行为也会导致记录噪声。噪声使数据的准确率距离商用有一定差距,需要后期算法的调试使其达到高质量要求。
(3)轨迹数据隐藏有较强的语义信息:轨迹数据天然具有较强语意信息,如何挖掘语意信息强化模型稳定性,并提升对槽车运动特征的刻画也是挖掘难点。
(4)轨迹聚类出POI(Point of Interest,兴趣点)的卫星图像信息存在噪声:轨迹聚类出的POI卫星图像对识别LNG 储罐和非标准站有一定机器判定,但由于图像拍摄日期久远、图像不清晰以及其他相似罐体的干扰,机器判定存在误差,需要实时生成疑似点并提高转化准确率。
由于传感器采集误差的缘导致真实轨迹数据中存在异常轨迹点,这不仅反映在轨迹坐标记录中,也反映在传感器读数的记录中。因此需要事先采取合适的方法进行数据清洗以有效识别关键信息,包括识别全局异常与局部异常的轨迹坐标的读数,识别异常的槽车速度记录,同时,需要根据情况修复异常的坐标与异常的速度值。在整体数据清洗过程中可采用较多方法,例如基于 S-G 滤波器(Savitzky-Golay 滤波器)[4]的平滑法、基于Kalman Filter(卡尔曼滤波)[5]的平滑法,对连续异常轨迹点的清洗问题[6-7]等。
(1)车辆筛选
非LNG 运输车辆在接卸液行为等方面和LNG运输车辆存在一定特征差别,如基于槽车常停靠的液化工厂/接收站装车撬的位置、槽车常停靠的企业类型、过磅/装卸时长和危化品道路限行等方面,通过强化学习建立算法模型,可以从危化品车辆中筛选出LNG 车辆。
(2)POI 信息挖掘
为了更细致地刻画轨迹的运动模式,也为了后续槽车用户画像的构建,需要对POI 信息进行数据挖掘。即将车辆轨迹投射到一个网格坐标系下,基于槽车访问次数,停留的平均时长和网格总被访问次数等指标,筛选出一系列POI 网格,获取潜在的POI 网格编号与坐标。再使用基于密度的聚类算法(DBSCAN)对这些网格坐标进行聚类,合并具有相近地理位置的网格,滤除不满足密度条件的网格,也可以尝试使用聚类方法[8]获取POI 信息。利用KD-Tree(分割k 维数据空间的树形数据结构)对每条轨迹的轨迹点进行标注,使其对应POI 区域标签,从而获取周边的地图信息,推测车辆可能的行动轨迹。如周边如果是停车场、道路、餐馆等数据点,则车辆休息的概率较高,如果周边企业是玻璃、造纸、加气站、城燃储罐区等用气的企业,则车辆卸货的概率较高(见图2)。
图2 槽车停留点与车辆行为判断示例
(3)LNG 储罐图像识别
LNG 需要通过储罐进行存储,并通过气化器将其由液态转化为气态供用户使用。储罐按体积分为30 m3、60 m3和150 m3不等,在卫星图上具有明显的特征,通过卫星遥感图和图像识别技术可以有效识别LNG 存储点,实现和车辆数据互补校验,
(4)基于word2vec(用来产生词向量的相关模型)的轨迹时序信息挖掘
槽车的每条轨迹可被转换为网格坐标的序列,并通过word2vec 与信息检索的方法来捕获轨迹的时序特性与一些静态的统计特性[9-10]。基于基础统计特征、地图信息特征、轨迹embedding(嵌入)特征与图像特征模型,采用以决策树为基学习器的梯度提升框架(XGBoost 和LightGBM)作为基模型,用带有标签的数据训练模型,再用模型预测无标签数据,将高置信度的无标签数据与标签数据合并以扩大数据集重新训练模型,增加模型泛化能力,识别槽车接、卸液行为、数据挖掘新的LNG 用气点POI信息,从而计算出行业的供应和消费量全景信息。
基于行业供应和消费的全量全景信息为基础,针对LNG 历史数据消费量进行统计和可视化研究(见图3),可以做地区性的供需预测,预测结果与经验性判断基本相一致。
图3 历年各类型LNG 消费量曲线
通过图3 可以看出,综合消费量各年度呈现周期性递增趋势,其中工业气化站占比最高,其次是加气站、城燃调峰站、燃气电厂。其中燃气电厂的用量最为稳定,几乎不受时间节点的影响,其他3种类型的用量会有周期性的变化,并受到事件性影响。比如2020 年疫情期间,工业气化站和加气站的用量下降明显,说明疫情对工厂的开工影响比较大,但交通部门波动更大,却先于工业部门复苏。
从2020 年LNG 全年消费曲线(见图4)可以看出,第一季度到第四季度消费量整体呈现递增态势,细分到月上也基本是递增态势。从曲线的变化情况看出,一年中二月是LNG 消费量最低的月份,这是由于二月比其他月份天数要少,同时,节假日对消费量也有较大的影响。
图4 2020 年全年LNG 消费量
通过数据可视化分析技术[11]可以直观地发掘一些事件,如季节周期性、气温、节假日等对消费量的影响,同时结合可替代能源和价格因素的特征可以推测出未来一段时间内的供需趋势。在具体商业应用中,供需预测分析既可以宏观到整个行业,又可以细化到省市县乃至用户级别,为能源企业与用能企业提供精准画像与资源储备提供参考。
通过将北斗大数据、人工智能技术与天然气产业知识图谱结合,交通与能源融合的应用场景已逐步成熟,聚焦在天然气下游业务领域,主要体现在以下5 类应用场景:供需预警保供;储运调度优化;供应链成本优化;用户评级与增值服务;平台经济与产业生态。经过前期研究,现已建立数据库包含400 多条管道,22 座接收站,250 多座液化工厂,2.2×104多辆槽车,近2 000 家维修站点、3×104多个活跃用气终端的信息。大数据技术使能源网与交通网深度融合,为用户降本增效,应急保供;为上游以需定产,削峰填谷提供技术支持。
通过汇集产业链数据,动态生成全量、全网供需数据,可实现天然气行业的数字孪生与价值挖掘。从微观应用上,可帮助下游企业了解区域市场的稳定气源及历史供气价格,帮助上游企业提前预测需求,建立用户画像实现精准营销,从历史用量(日均/峰谷/周期)、到岸成本、供应占比(流失预警)、竞争液源等维度分析终端采购情况,辅助制定客户开发计划。辅助市场决策支持,让企业了解现有及潜在用户分布、用户结构、用户消费状态变化、以及触达用户的方式,从而提升市场决策和服务质量,进行市场沙盘策略模拟并及时复盘。
从宏观应用上,结合基础设施(例如管网、储气库)数据,可以为相关生产及建设部门决策提供参考,错峰生产储备,提前部署管容、罐容、库容及运力,有效平抑气荒;对于保供工作提出科学化建议,预测各地区的LNG 用量,提出重点关注区域可能出现的问题、气液并举优化调度方式等等。
2016 年8 月,暴雨使河北地区管道气整体瘫痪半个月,邢台地区66 条年产值300×108元的浮法玻璃加工线面临停工风险,单一客户面临2 000×104元窑炉停工的损失。沙河市长城玻璃有限公司通过北斗大数据对车辆流向监控,预测到西部拥堵和部分大客户面临停供,提前做好保供准备,从山东、天津等地进行反向调配LNG,以槽车配送实现了客户日均30×104m3的保供目标。通过运用北斗大数据分析技术精准判断了区域运力紧张及后续价格上升的趋势,采用预付款方式直接锁定气源价格,在气价上涨的情况下,用能成本不但没有上升,反而成为当地66 条浮法玻璃线中唯一未停产的玻璃厂商,并一跃成为行业龙头,掌握了当地玻璃定价权。
北京公共交通控股(集团)有限公司(简称北京公交)是以经营地面公共交通客运主业为依托,多元化投资,多种经济类型并存的大型公交企业集团。截至2021 年5 月,北京公交拥有LNG 公交车8 570辆,LNG 加气站66 座,年用量约合15×104t。北京公交长期以来执行LNG 行政定价,但近些年市场能源供给价格波动频繁,行政定价不再合理,亟需在保障供应的前提下,找到合理科学的定价模式。通过运用北斗大数据进行成本核算,建立不同液源真实到岸价格追溯系统,并且构建了价格调整模型,使得定价机制从行政定价转向跟随市场信息变化的浮动定价模式。在保证燃料供应商的合理利润空间的前提下,自2017 年至今,北京公交每年节约1.2×108元燃料成本。与此同时,2017—2020 年冬季,北京公交保持了供应量价双稳格局,首都公民出行没有受到气源紧张影响。
根据国内沿海及中部13 省调研数据,小微客户整体LNG 用量约占所在区域LNG 总用量的15%~20%。2018 年整体LNG 消费市场为2 413×104t,按照15%的占比计算,小微客户天然气用量约362×104t。“海友宝”是由上海中旖能源科技有限公司与中海油气电集团合作打造,在浙江省试点,集电子地图、海气通、银行支付等功能,通过将北斗槽车分析的用户基础历史用量与交易支付进行接口互通、模型联调,面向小微企业提供购气白条供应链普惠金融服务,单笔授信30×104~50×104元不等,放款基于北斗数据分析的用户真实用量而非银行流水,银行以数据服务费方式支付利率差值,建立了供应链金融服务模式,为用户解决“买气贵,融资难”的问题,实现了数据的高价值使用。
为更好地拓宽天然气终端市场销售渠道,实现从资源为王转变为终端为王的高质量发展战略,结合重卡物流大数据分析,中海油气电集团制定“三线五港一环”发展规划,依托海气通平台进行数字化营销,建设集加注交易、客户管理、资金沉淀、后服务于一体的综合性交易平台,统筹实现天然气加注板块线上+线下+物流的新零售。自2019 年7月线上业务试运营以来,截至2020 年10 月,线上物流公司覆盖了全国15%的加气站。线上营销活动实现同期销量提升56%,累计会员13×104,服务LNG 重卡加注39×104辆次,累计销售量突破51×104t,与前一年同期相比,LNG 线上加注销量提升幅度超过8 000%。在2020 年冬季保供中,实现对联盟站点稳价稳量,严控窜货,形成了品牌美誉度与用户忠诚度。围绕着大车司机、车队物流、整车商、加气站、维修点、资源方、互联网车货匹配平台建立的交通能源生态正逐步引领市场,有效影响相关参与方油改气预期。
利用数字化手段,打通天然气行业上中下游各个环节,通过北斗车辆数据挖掘获取天然气行业实时全量全景数据,可进行多维度的分析与挖掘,衍生出关于产业的多维度视角,从而自上而下与自下而上相结合,提升对于产业决策的科学性和产业链效能。关于北斗大数据在能源领域应用场景建设,有以下三项建议:
一是推进天地一体、气液互补的天然气供需再平衡。北斗卫星的规模化运用要充分重视不断推出新的应用场景。中国作为世界第一大能源生产国和消费国,履行着“碳达峰”和“碳中和”的国际承诺,将能源领域作为北斗三号的应用场景具有重要战略意义,既推动能源行业降本增效,又反哺北斗深空探索。在北斗卫星数据的基础上,通过对算法、算力与行业知识图谱的积累,推动“数据+平台+应用”模式,建设数字化“产供储销”统一平台,实现全产业链无边界,形成中国特色的能源供需预警与调度平台。
改革开放四十年来,我国各部委沉淀了大量数据资产,但彼此间并未打通,直到近期中央首次明确将数据作为生产要素,为数据资产的盘活与治理提供了指引。大数据分析的关键在于数据基数与数据质量。如果现有卫星天基互联网(简称天网)能够与地面/地下管网储气库等基础设施数据(简称地网)融合,从横向打通到纵向垂直,延展至制造业乃至整个国民经济领域,会走出一条中国特色数据治理之路。可以以LNG 车辆数据分析为基础,逐渐拓展至其它危化品运输领域,如LPG(液化石油气)、CNG、成品油、氢能等。未来,在能源开发利用的物理基础设施之上,应有一张数字基础设施网,兼顾“大动脉”与“毛细血管”,大电厂与小微用户,结合用户用能习惯,实现精准滴灌,避免大水漫灌,提升综合能效水平,降低能耗与碳排放。
二是通过以需定产、从厂到端的思维模式来优化供应链。打造从厂到端(Factory to Customer,简称F2C)的模式,使各个环节的信息透明化,并引入市场参考价格浮动机制,可降低上游基础设施的产能闲置率,提升供应链的稳定性和供应保障。在价格追溯上进行延展,整个LNG 产业链都可以实现物联整合。从上游的气井到终端用户,通过互联网精准感知,溯源控本,可以管理优化用能成本,实现上中下游业务链打通,通过大数据分析和物联感知技术,匹配供需,智能化调度,提升能效。
未来能源消费并不仅限于油气,只要有运输载体就会有数据留痕,并可以闭环监测碳足迹。以公交为例,随着时间推移,每位乘客、每辆车的C02排量均可进行精准汁量。交通与能源数据融合后,可进一步进行跨平台数据资源整合,如电力、供暖,依靠车联网、物联网、能源互联网进行整合,会产生新型的碳计量和碳交易平台,这对于我国履行“碳达峰”与“碳中和”的承诺有直接帮助,能够建立指标分解与可视化量化评价体系,实现可核查,可追溯,可问责。
三是重视数据治理与数据安全,探索数据业务的体制机制性创新。数据不能孤立地存在于企业内部,应建立能源数据应用联盟,推动用能数据对决策的支持,同时不断完善数据作为要素的治理、运用、交易机制。在各央企组建的数据经济运营主体中,应推动数据成为生产要素,在保障数据安全的前提下加强融合,形成平台经济与产业生态,降低社会使用物理基础设施的成本,提高数字化基础设施建设水平。
产业互联网业态具有灵活、快速、合作共赢的特点,而具备行业认知的数字化人才相对匮乏。要充分发挥产业与互联网的乘数效应,在实践中,既要发挥国有企业在新一轮科技革命和产业变革浪潮中的引领作用,也要具备数据驱动、继承创新、合作共赢等数字化转型理念,调动起行业从业者和相关利益方的积极性,发挥人才兴企的支撑作用,为公司发展提供体制机制、组织和人才保证。
在数字经济领域可探索进一步深化混合所有制改革,在增量创新业务领域调整并开放股权,设计符合数字化转型业态的合作模式与人才激励机制,通过市场化方式选聘既懂产业又具备互联网思维的复合型人才,探索建立基于数字化治理的价值评价体系。