交通能源融合大数据平台架构与应用

2022-07-04 07:20张润涛杨子安向悦萍何正友
电力系统自动化 2022年12期
关键词:交通能源融合

廖 凯,张润涛,杨子安,向悦萍,何正友

(西南交通大学电气工程学院,四川省成都市 611756)

0 引言

实现“碳达峰、碳中和”,是中国的重大战略决策[1]。根据全球碳计划组织发布的《2020 年全球碳预算》显示,中国近12 年碳排放连续位居世界第一,并以年均2.55%的增速继续增长[2-3]。其中,交通领域的碳排放占比为13.89%,远高于世界平均水平7.01%[4],为全面落实“双碳”目标,交通减碳势在必行。

交通电气化是减少交通领域碳排放的有效方式。当前,电气化交通正飞速发展。据国际能源署报道,从2020年到2030年,全球电动汽车将增长18倍,预计2030 年电动汽车年销量将达到5 500 万辆[5]。2020 年中国电动汽车销量高达136.6 万辆,占全球份额的51%[6-7]。另外,中国电气化铁路里程从2001年到2020 年,累计增长6.1 万km,增幅达23.8%[8-9]。

电气化交通大规模运行并与电网交互,势必会加剧电网稳定运行的风险,造成一系列影响。例如,电气化交通的运行时间与居民用户用电行为规律重合,导致负荷峰谷差加大[10]、电能质量下降[11]、网损增大[12]等各方面问题,从而影响电力系统的稳定安全运行,带来安全隐患[13]。此外,当电力系统发生故障时,也会影响电气化交通的正常运行,造成城市与城际交通拥堵甚至瘫痪[14]。

另一方面,电动汽车兼具移动储能特性,可用做需求侧灵活性资源,参与电网调峰调频等辅助服务,实现交通能源友好互动。分析交通与能源间的紧密耦合关系,提出了交通能源融合的框架与技术,是交通能源友好互动的基础。文献[15]提出了能源互联网较为明确的概念、架构及组成,预测了未来交通系统与电力系统在规划与运行将演变为高度耦合的系统。文献[16]基于能量流与信息流实现了多元能量发电系统、柔性新型供电网络、主动交通负荷和能源储存设施。文献[17]分析了能源-交通-信息三网融合的必要性与可行性,以电动汽车在充电服务领域为例,提出了三网融合的系统架构及关键技术。文献[18]分析了区域、城镇/地区、终端的三层能源交通一体化系统的发展模式,考虑了交通系统各类能源布局、生产、传输的影响。文献[19]以港口综合能源系统为研究场景,从能源侧和交通侧两方面详细分析了港口能源-交通融合下的各类柔性资源,并给出了示范性的建模方法。

上述研究探索并总结了交通能源融合的框架,可为后续交通与能源协同发展提供良好的建议。然而,现有交通与能源融合系统框架的实施都将严重依赖于两者间的数据交互,交通能源融合涉及交通和电力行业的供应商、运营商、监管等众多政府、企业部门,在信息交互与运行控制等方面均独立运行且具有较高的行业壁垒[20]。这些系统成烟囱式发展,数据信息分布分散、缺乏统筹规划,并且各系统间的数据难以兼容,从而极大地限制了交通与能源系统的融合协调发展。因此,加快研发交通能源大数据融合技术、构建交通能源融合大数据平台是解决上述问题的必然路径。

本文以城市交通网和能源网为背景,研究交通能源融合大数据平台。首先,提出交通能源融合大数据平台架构,从功能和技术两方面进行解析。其次,从数据交互融合、质量把控、协同分析及安全保护4 个角度,归纳并总结构建该平台所面临的关键挑战,并提出解决对应挑战的关键技术。最后,列举该平台部分典型应用场景,为后续大数据技术在交通能源融合方向的研究与发展提供参考。

1 交通能源融合大数据平台架构

交通能源融合大数据平台架构分为功能架构与技术架构。功能架构主要用于规范和定义大数据平台在运行时的整体功能流程。技术架构主要用于保障大数据平台能够顺利实现各种功能。

1.1 功能架构

根据交通能源融合运行的实际需求,以大数据准确分析与有效应用为建设目标,构建交通能源融合大数据平台功能架构如图1 所示。

图1 交通能源融合大数据平台功能架构Fig.1 Functional architecture of traffic-energy integrated big data platform

交通能源融合大数据平台主要包括5 个功能模块:

1)数据融合。首先,对不同来源的数据进行格式转化,形成统一的数据规范。然后,将异名同义的数据进行合并。最后,根据语义关联性,通过实体识别与信息关联,将描述同类信息的数据建立字典检索,以减少数据冗余、提高数据检索效率,为后续大数据存储与分析奠定数据基础。

2)数据存储。首先,建立数据中心,包括数据仓库、关系数据库和技术数据库。然后,通过筛查错误数据、补充缺失数据、纠正偏差数据,实现数据清洗。最后,构建信息目录树、提供信息发布功能、信息检索服务和数据接口,实现数据共享。

3)数据分析。数据分析是交通能源融合大数据平台的关键环节,针对数据展示与数据应用所需要的信息,提供内置数据分析工具,包括但不限于数理统计、人工智能和数据挖掘等模型与算法,实现海量多源多样化数据分析,以满足不同用户或功能的使用需求。为满足平台功能的不断拓展,数据分析还需要具备横向扩展能力,以满足用户自定义的数据分析方式。

4)运维与安全。通过大数据平台服务集群进行集中式监视和管理,对大数据平台功能采用配置式扩展等技术,解决大规模服务集群软、硬件的管理难题,并能动态配置调整大数据平台的系统功能。采用隐私保护、访问控制、身份验证等技术手段保障数据全生命周期安全。

5)可视化。为更好地解释数据分析的结果,方便管理人员或用户直观地获取信息,大数据平台可通过桌面终端、移动终端、大屏终端等呈现系统的历史数据、当前运行参数以及未来趋势预测。管理人员或用户可通过便捷的操作界面与数据交互,实现对数据的高级分析与利用。

1.2 技术架构

依托成熟的数据平台和通用设计,结合交通能源融合大数据平台的功能需求,本文提出适应交通能源融合大数据平台的技术架构,如图2 所示。

图2 交通能源融合大数据平台技术架构Fig.2 Technical architecture of traffic-energy integrated big data platform

交通能源融合大数据平台技术架构主要包括以下4 个层级:

1)融合层。本层级的主要目的是对多源结构化数据进行融合。首先,大数据平台与交通能源相关的调控平台或数据采集系统进行数据交互,采用网络本体语言(ontology web language,OWL)进行语义描述,将语义异构的数据相融合形成局部本体。其次,利用语义网规则语言(semantic web rule language,SWRL)规则结合的方式将局部本体融合成全局本体,最后建立全局本体库,为后续数据处理与分析提供支撑。

2)储存层。基于统一资源调度管理器与分布式储存,实现数据的快速储存与查找。首先,采用数据高速缓存Redis 的集群部署模式,提高业务数据的整体读写效率。其次,利用MySQL 作为关系型数据库,当表数据体量过大时,可采用分库分表的策略提高数据库的水平扩展能力。最后,针对海量多源异构数据的处理、分析应用,还需要基于分布式文件系统(HDFS)、Hbase(面向列、可伸缩的分布式存储系统)、Hive(基于Hadoop 的大型数据仓库)、Presto(交互式数据查询引擎)、Elasticsearch(分布式数据搜索引擎)等大数据组件,通过ZooKeeper 分布式应用程序协调器实现各分布式存储的同步服务、配置维护和命名服务等。

3)分析层。根据分析数据的时效性、高速性、海量性和多样性,可以将数据的处理方式分为数据流处理、内存高速处理、批处理以及数据挖掘。流处理通常是指对实时数据源进行快速分析,迅速触发下一步动作的场景;实时流处理业务,对分析处理速度要求极高,数据处理规模巨大,对CPU 和内存要求很高,但是通常数据不落地,对存储量要求不高,如Flink 专门用来承载实时流处理业务;内存计算技术通常提供了一个基于内存的快速计算、写入以及交互式查询的框架,如Spark 使用in-memory 的计算方式,通过这种方式来避免一个MR(MapReduce)工作流中的多个任务对同一个数据集进行计算时的输入输出(IO)瓶颈;批处理技术是针对实时性不高的业务,可对海量数据进分析和处理,形成结果数据,供下一步数据应用使用。若对处理时间要求不高,但处理数据量较大通常通过MR 或者Hive 的SQL作业实现;数据挖掘主要采用数理统计分析软件RStudio、可伸缩的人工智能算法Mahout 和开源大数据挖掘平台TensorFlow 进行数据分析与挖掘,能够提供不同应用多样化的结果。

4)展示层。采用Web 浏览器,通过并行使用多种计算机编程语言,实现泛屏多终端的可视化呈现,包括桌面终端、移动终端、大屏终端等。

2 交通能源融合大数据平台关键挑战

目前,针对独立的交通或能源系统,其大数据挖掘分析与相关系统平台已有相应研究成果[21-24]。随着交通网与能源网逐渐融合发展为复杂的综合系统,交通能源大数据平台建设在数据交互体系、数据质量把控、多主体协同分析和数据安全4 个方面面临挑战。

2.1 挑战1:海量多源异构数据交互方式难统一

相较于传统的大数据平台[25],交通能源融合大数据平台具有以下3 个主要特点。

1)数据来源广泛。交通能源融合的数据来源涉及不同的行业主体,包括交通路网、城市电网、个体交通工具、充换电设施和其他系统。这些多主体与多系统数据库之间存在着显著的规模大小、通信协议、行业规范标准差异等一系列兼容性问题,若不能统一采集信息和互联,将造成数据冗余。

2)数据类型不一。不同系统采集的数据可能是文本、图片、音频、视频等多样化数据类型,交通能源融合数据组成情况如表1 所示,主要分为结构化、半结构化和非结构化数据。

表1 交通能源融合数据组成Table 1 Composition of traffic-energy integration data

3)时间尺度多样。交通能源融合数据的时间跨度非常大,采样信息涵盖了城市配电网和轨道交通牵引网的电压电流以及交通工具实时定位的分秒级别数据,交通流扩散分布、拥堵疏导的小时级别数据,电力系统日前调度与交通流长期分布规律的日级别数据,气象系统与线下大型活动发布的月度数据以及公共部门总结的各区域国内生产总值(GDP)、人口活动情况等月度或年度数据。

综上所述,传统单业务大数据的交互方式不适用于海量多源异构的交通能源融合数据交互,各系统之间的大数据存取交互难以统一,交互成本高、信息壁垒仍然存在。各主体数据管理系统横向拼接的建设思路不能从根本上实现交通能源融合大数据价值链条的贯通[26-30]。因此,需构建一种统一的交通能源融合数据交互方式解决上述问题。

2.2 挑战2:多维异质数据质量难把控

为充分发挥海量多维数据的优势,需要提供真实、完整、及时的高质量数据。只有从海量高质量数据中进行分析处理与信息挖掘得到有用的信息,交通能源大数据平台所得到的结果才能帮助决策者进行更好的调控与规划[31]。

影响多维数据质量的因素主要来自环境或者人为干扰、故障状况以及不同标准多源数据提取转换过程中的误差。本文根据大数据5V 特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),概括了交通能源大数据平台的数据质量与信息挖掘中主要面临的5 个方面的挑战[32-33]。

1)数据完整性:保证数据不存在缺失。由于检测设备老化、检测环境恶劣、传输系统故障、系统运行缺陷等原因,从实际感知对象中采集到的动态实时数据经生成、上传、中间环节存储、处理和传输至目的地,数据的完整性难以得到保障。按照缺失的数据量,可以分为部分数据或全部数据缺失;按照缺失的数据类型可以分为属性值的缺失、采集时间的缺失等方面。

2)数据时效性:保证数据收集与分析实时进行。主要体现在原始数据收集和产生分析结果两方面,交通能源融合大数据平台通过与不同感知对象的数据管理系统进行交互,可能存在原始数据收集时已经与实际发生偏差的情况。产生分析结果需要通过大数据平台进行高效的分析,但随着数据量的日益增长,数据处理的速度可能会赶不上数据的“保质期”。

3)数据一致性:保证数据不存在相互矛盾。交通能源融合大数据平台的数据来源于各感知对象的数据管理系统,由于获取数据的途径较多,可能存在不同数据管理系统之间发生数据交叉的现象,例如数据采集、视频传输等。此外,还存在多语义性差异、多坐标系差异等,这些问题都导致了数据的不一致。

4)数据准确性:保证数据能够准确采集、处理、传输等。由于不同系统采集方式、采集精度、采集环境的不同等,可能导致数据由于精度不够降低准确性;数据采集选区的采样、计算、分析方法不一致,也有可能对数据的准确产生影响。

5)数据真实性:保证数据来源真实可靠。大数据平台的数据都来自各个系统、网站、设备采集或融合生成,一些测量误差或者外界扰动所引起的“数据污染”会影响平台正常分析运行。大量噪声数据杂糅在真实数据中容易掩藏数据的真实性,从而干扰平台分析、导致错误的决策。

2.3 挑战3:多主体协同的运行数据难分析

交通能源融合的建设基础是物理层面的实物连接和信息交互。实物连接是两网产生联系的实体支撑,主要体现在充换电设施、燃料补充站、牵引变电所、储能设备、光伏发电及风力发电等。而信息交互是依托实体连接,以维持和优化两网频繁交互的重要手段。这些耦合信息通常是以激励用户的方式来运作的,例如:交通与能源系统各自运行的模型有较大的差异,交通能源融合大数据平台如何分析已经整合的数据,并将有效调控措施作用到两网的信息耦合点上,是实现不同系统间协同运行的难点所在。为准确构建主体的协同运行模型,需要对各主体运行特征和影响因素进行分析。

1)电动汽车。由于用户出行与用能决策易受交通流量、气象、社会活动等多种客观因素影响,因此电动汽车充电行为具有较高的不确定性,并且考虑不同因素影响下的行为模式差异性较大[34]。目前影响电动汽车用户行为的因素可以概况为客观条件、用户的理性判断与感性决策,如表2 所示。

表2 影响电动汽车用户行为的因素与特点Table 2 Factors and characteristics affecting behaviors of electric vehicle users

为了更加全面地分析电动汽车出行与充电行为对充电设施、交通路网与城市电网运行状态的影响,需考虑客观条件,研究理性判断对用户选择的影响,刻画感性决策影响下的用户行为不确定性。

2)充电设施。充电桩的运营模式在很大程度上影响了用户的充电体验,目前主要有3 种运营模式[35]:政府主导、企业主导和用户主导。考虑到现有充电设施行业处在发展的成本效益阶段,各企业建设充电设施过分追求建设补贴并抢占资源,忽略充电桩的科学布局[36]。同时,目前现有的充电平台难以互通互联,用户很难选择最优的充电设施进行充电,增加用户行驶成本,造成交通网与能源网难以协同优化[37]。

3)交通路网。随着各种新技术不断涌现并与交通工程有机融合,网络约车、路径搜索与规划、路线导航、目的地停车引导等服务均已形成成熟体系,这也造成了交通路网的复杂性。此外,城市路网受到外界突发情况、系统技术失效、工作人员操作失误等多方影响,这些都会导致路网的局部瘫痪,从而增加其他道路的负担,可能会导致路网超载并损害交通功能,增加分析交通路网的困难性。这些突发情况具有事前检测难度高、事中控制难度高、事后回溯难度高的特点,虽发生概率小,但潜在危害大,对现有秩序可能带来巨大的冲击[38-39]。

4)城市电网。随着电动汽车的增多,电动汽车的充电负荷对电网造成的影响日益明显,研究表明,制定分时电价或实时电价会缓解负荷曲线的峰谷差[40-41]。然而,传统的分时电价与实时电价需求响应机制均会在峰谷产生新的负荷高峰[42],并且电动汽车充电负荷分布具有不确定性与随机性。同时,充电桩还提供预约充电、随时充电的充放电模式[43],未来还会有电动汽车与电网互动(V2G)的充放电模式。因此,准确刻画电动汽车充电负荷对电网的影响具有一定难度。

5)轨道交通。不同于随机分布的电动汽车充电负荷,电网为负荷体量庞大的轨道交通专门引出了牵引供电系统,因此,轨道交通在耦合系统协同优化运行层更多考虑的是能量管理策略。对铁道沿线的分布式能源出力和储能、空间地势变化、站台分布与班次协调等相关数据的提取和管理,向牵引供电系统和列车提供在线能量管理策略,能有效减少冲击性负荷对电网的影响,在节能的同时提高轨道交通运行的经济性。

6)多主体协同。在用户方面,由于不同主体涉及的用户有重叠,用户群体在不同主体上的选择或行为会使得各主体的运行相互影响。例如电动汽车的出行选择影响交通流分配、电动汽车的充电选择影响电网潮流分布。在运维方面,多主体的运行数据十分庞大,但针对各个不同的运维需求所需要的数据不一样,如何从庞大的数据库中有针对性地找到适用于各个不同运维需求的数据集合需要研究。在利益方面,各主体所对应的利益主体不同,不同的利益主体对交通与能源系统运行有不同的需求,且各自可提供的公用数据有限,如何利用有限的公用数据,兼顾多主体的利益,尽可能实现交通能源融合系统的高效稳定运行需要研究。

2.4 挑战4:复杂融合系统的数据安全难保障

未来交通能源互联网应用的稳定运行依赖于物理与信息两个层面的可靠性和完备性[44],而信息的交互实现过程频繁且复杂、跨越时空范围广,同时大数据的分布和需求不同使得大数据信息在采集、传输、存储和应用过程中面临更多更大的安全风险[45-46],具体体现在以下4 个阶段:

1)采集阶段。交通能源大数据平台所获取的相关数据来自安装在系统中的各类传感检测设备,这些数据自身存在一些失真和误差。同时,最为常见、影响最为显著的威胁是人为网络攻击[47],攻击者对状态感知设备进行破坏或篡改,例如篡改电网输电线路或节点电气量从而误导调控平台对网络拓扑的判断[48]、侵入交通网车载终端并对车辆定位信息和车载设备信息进行伪造和修改[49]等等,这些攻击均有导致信息错误整合或者整合失败的潜在风险。此外,攻击者也可能趁机盗取融合层中系统的运行信息和用户的个人信息,造成关键或隐私数据的非法泄露[50]。

2)传输阶段。大数据的传输安全即通信安全,应特别注意对通信协议的配合和通信信道的保护。攻击者发动分布式拒绝服务攻击、重放攻击、伪造基站来截取通信信号,甚至通过物理接口更改和控制车载电子控制单元(ECU)[51]等手段,都有可能干扰控制平台对数据的正常获取,危害车辆行驶安全,甚至引发故障的全方位扩散。

3)存储阶段。云计算为大数据的基本存储架构,其数据加密、身份认证和安全服务信任问题存在待解决难点[45,52]。当前多家公司在推广与更新数据库方案,其产品和标准各有差异。而在交通能源互联网的逐步推进中,如何将交通系统的数据库和能源系统的数据库进行一致性整合,以及制定统一的信任接口和安全保护策略,是构建和保护交通能源融合大数据平台的研究难点。

4)应用阶段。访问控制是实现数据受控共享的有效手段[53],随着接入用户多样性的提高,常规的访问控制策略即自主访问控制、强制访问控制和基于角色的访问控制,无法满足相应的权限要求[54]。因此在大数据架构还需要对新型的访问控制机制进行探索和研究[45]。同时,采用新型的访问控制模型可以避免攻击者利用历史经验对信息重要性的猜测和总结,是一种解决共享数据隐私保护的较好手段[54]。

3 交通能源融合大数据平台关键技术

交通能源融合大数据平台的核心目标是提高交通网与能源网的协同运行能力和能源利用效率。通过对交通能源多源数据的语义统一与标准化集成,实现数据规范化管理,有利于后续数据的统一处理和存储;通过质量优化管控技术,从数据源头上和处理阶段过程中来降低数据不良率,并对各类数据进行合适的分类;应用先进的数据挖掘与分析技术,充分利用潜藏信息,为制定系统协同运行策略、优化调度方案提供预测性、关联性方面的指导;通过全方位信息安全保护措施的部署,保证大数据平台的安全、可靠、高效运行。

3.1 交通能源融合数据标准化集成技术

由于构建的交通能源融合大数据平台所需数据分散在各个应用系统中,每个数据信息都有自己的数据库管理系统。目前实现空间数据集成的传统方式都忽略了语义异构的问题,数据中的语义异构需要一种能够明确表达数据语义的方式来进行语义描述。目前,本体技术具有良好的概念层次结构和对逻辑推理的支持,可通过综合各个数据库管理系统所建立的不同应用本体来搭建一个良好的领域本体,由此产生全局概念模式,建立起异构系统中元数据和目标数据的语义映射,从而实现异构系统的语义互操作,满足约束条件下的信息共享。根据空间数据的特点,通过自底向上的设计方法,在局部本体的基础上,经过融合生成一个综合本体,从而产生全局概念模式以实现异构系统的语义共享,因此,这是一种松散耦合联邦数据库方式,如图3 所示。

1)数据层。由不同数据库组成,涵盖交通、电网、充电桩企业、气象部门等数据库,提供海量分布式多源异构数据源作为基础。

2)融合层。从各个数据源中抽取存放数据的模式,在此基础上采用OWL 进行语义描述,形成不同本体的局部本体。由于局部本体来源广泛,不同渠道在获取数据的准确性、加工精度、重点描述维度等存在差异,因此需要将多源局部本体融合成一个统一完整的全局本体,主要包括数据转换、信息整合和语义关联3 个层面。

3)表示层。将融合后的局部本体通过SWRL规则结合的方式建立全局本体库,本体维护器与本体推理器通过分析全局本体库之间的共享词汇,将相似的数据通过类别、属性和角色进行合并优化。

4)访问层。主要负责各主体的查询与编辑功能,通过Web 或应用程序接口(API)进行数据的访问,将所访问的本体数据转化为查询系统的本体语言,有效检索管理平台中各数据库的结构化以及非结构化数据,从而有效支撑完成各行业应用。同时对于不需要的局部本体数据可以进行编辑,减小所需数据传输的带宽。

以电动汽车为例,其全局本体数据集成如图4所示。全局本体为电动汽车,局部本体为不同类型的电动汽车,例如公交车、私家车、网约车、环卫车等,一般实体是与本体连接的实物,例如正在充电的电动汽车的一般实体为充电桩,局部本体和一般实体都有其对应的属性值。

图4 电动汽车全局本体数据集成Fig.4 Global ontology data integration of electric vehicle

3.2 多维数据质量优化控制管理技术

多维异质数据的完整性、极值、尖峰、等值、梯度和一致性检查是提高数据质量的关键步骤[32,55-56],为交通能源融合大数据平台应用提供高质量的数据支撑。多维数据质量优化控制管理流程如图5所示。

图5 数据质量优化流程Fig.5 Optimization process of data quality

1)完整性检查。对于缺失的数据主要的处理方法分为3 类:删除法、数据填充与不处理[57]。删除法是将缺失的某一条数据或某一个属性的对象删除,从而得到完整的数据集。数据填充是采用一定的方法,对缺失值进行合理的估计并替代缺失值,从而得到完整的数据,保障了数据的完整性。不处理缺失值可以保障数据的原始性,避免数据删除或填充不当造成数据失真等,从而得到错误的结果。以上3 种方法的优缺点与适用范围如表3 所示。

表3 缺失数据处理方法对比Table 3 Comparison of missing data processing methods

2)极值检查。根据人们对各感知对象最基本的认识,检查所测量的参数及相应的元数据(年份、月份、日份、时间、时区、经纬度)是否在合理值区间内。如果某一观测值不在合理的区间内,则该观测值将被标记为可疑值。

3)尖峰检查。在数据的融合与传输的过程中,可能会因为机器故障或传输损失等原因,某一个数据存在明显不合理的较大突变。参照文献[58]的方法,比较当前时刻采样值与上一时刻采样值,再通过包含交通-电力网络的结构拓扑约束和流量约束的相关量测量间约束关系关联矩阵进行核验,有效解决残差淹没问题,提高不良数据辨识的准确性。

4)等值检查。部分检测设备可能由于老化,导致检测的数据具有一定的偏差性。因此,对于电力负荷与交通流量等周期规律强的数据,可以观测其周期性轮廓线在不同时段与区域内是否相似。如果在一定时间段或一块区域内出现了明显的偏差,排除自然因素后,则将该时段或区域的数据标记为可疑值。

5)梯度检查。对于定点、长时间序列的数据通常前后时刻的变化是连续、有规律的,因此可以通过确定相邻两时刻间的差值对数据进行校验,超过某一阈值并排除故障、堵塞等特殊情况后,判定为异常值。

6)一致性检查。由于交通与能源的数据在时间与空间上具有相关性,不同感知对象之间同样存在一定的联系[59]。例如交通流量与充电负荷的关系、天气情况与交通流量的关系、当前电价与充电功率的关系等。因此,可以根据在同一时刻、同一地点观测得到的数据间的相互关系进行检验。如果某一要素的数据与其他同时刻要素的数据在一定的范围内不符合两者之间的关系,则标记为可疑值。

3.3 交通能源网络信息挖掘与分析技术

交通能源融合大数据平台的数据分析核心在于电动汽车移动模式分析、负荷时空分布预测以及交通能源关联性分析,整体流程如图6 所示。

图6 交通能源网络信息挖掘与分析流程Fig.6 Process of information mining and analysis in traffic-energy network

1)移动模式分析。分析交通系统中各主体的出行规律,主要包括活动特性分析、出行类别划分和异常状况分析。活动特性分析考虑不同类型交通方式下的行程规律、平均行驶速度、早晚高峰流量分布、交叉口排队时间等进行统计分析,宏观把握各种交通方式的出行特性分布;出行类别划分根据不同类型用户的出行起讫时刻、停驻位置和时长、出行目的等,提取用户出行OD(origin-destination)矩阵,绘制居民区、工作区、商业区等空间热点分布模型,为交通精细化管理及不同类型用户提供分类定制化的服务;异常状况分析考虑突发自然灾害或交通事故,这些异常状况具有较强的不确定性、突发性与随机性,主要通过模板匹配进行异常状况检测。

2)负荷时空分布预测。精准预测电动汽车的负荷分布是电网负荷管控的关键,也是风险预警与防控的先决条件。主要分为基于数理统计的分析与基于数据驱动的建模[34]。基于数理统计的方法是在掌握电动汽车移动模式整体分布特性的基础上,结合不确定性模糊理论并将其拟合为数学模型,再代入设置的基本参数对充电负荷进行时空分布预测分析。然而对于高维、非线性、海量分布式数据,数理统计方法难以获取精细的预测分析结果,因此有学者提出基于数据驱动的方法,包括基于移动社交网络平台的电动汽车充放电行为预测模型[60]、城市交通状态估计[61]、基于卷积神经网络和小生境免疫算法的电动汽车充电负荷预测[62]等,通过自适应学习历史数据中的隐藏演变模式,对未来负荷时空分布规律进行建模。

3)交通能源关联耦合特性分析。关联耦合分析的核心是量化两个变量之间的数理关系,现实场景中,交通与能源的关联十分紧密。例如,电动汽车用户发起充电需求的时刻与电网提供充电服务的时刻具有时间滞后性,并且充电位置与用户行驶轨迹具有空间相关性。此外,当交通发生区域范围堵塞或瘫痪时,该区域充电负荷的滞后性将更加明显,并且区域周围充电负荷也将升高;当电网发生区域停电或故障时,可能会引发用户的电量焦虑,从而导致附近充电负荷会急剧增加。可以利用关联规则聚类系统[63]、基于关联规则的分类[64]、关联决策树[65]等数据关联规则挖掘方法,加以不同类型气象数据及周边区域不同充电站的关联特性进行分析。

3.4 多层级全生命周期信息加密技术

将数据安全与隐私保护落实到交通能源融合大数据平台架构的各个层级中,以及从整理数据到应用数据的平台全生命周期中,是全方位保障大数据平台常态化安全稳定运行的技术基础。事实上,各行各业的大数据平台在安全保护所应用的技术有许多的通用之处,并且这些技术都侧重应对人为网络攻击。完整的多层级全生命周期数据安全技术参考关系如图7 所示。

图7 多层级全生命周期数据安全技术Fig.7 Technology of multi-level lifecycle data security

平台的融合层负责在整理融合阶段保障各运营商各部门所收集数据的安全。在保证融合算法高效性的条件下,除了采取先进的数据质量优化技术、数据清洗技术来辨识和剔除信息采集中因不可抗力因素引发的异常、冗余数据混杂,还有必要在源头上预防人为恶意注入虚假数据对信息收集过程的干扰。聪明的攻击者会事先掌握交通网稳态状况、电网信息及其保护算法,能有效避开不良数据辨识检测。文献[66]利用历史数据的轨迹规律对比分析,提出了基于广义似然的序贯检测和传感器轨迹预测方法,能够识别出伪装的虚假数据。借助机器学习、深度学习、模糊聚类等人工智能技术,提取大数据的海量特征来对虚假数据进行判断是一种效果较好的方案[67-68]。在规划方面,文献[69]提出了双层混合整数线性规划模型以识别电力系统的关键区域与组件,从而更优地向系统传感设备分配防御虚假数据的资源,预测攻击者的潜在攻击目标,形成攻防双方博弈的最优策略。

传输层是数据流入流出的通道,数据的提供者和消费者将在此处进行双向交互。一般地,数据在被传输之前都会有加密处理。现有应用广泛的代理重加密算法、完全同态加密算法已能解决大部分数据安全保护的问题,但存在着密钥管理和计算效率低的问题[70],同时加密手段用于敏感数据防护方面仍有所欠缺[71]。而脱敏处理可以实现在不改变数据原始特征的条件下变换信息中的敏感内容,有利于避免隐私数据的泄露。随着量子信息技术的发展,量子保密通信技术将会是未来重点研发和突破的信息传输技术[72-73]。

分析层是实现交通能源融合的核心,两网的数据上传并存储到平台分析层,将能源网数据和交通网数据进行本体驱动的标准化集成处理、深度挖掘以及数据存储。数据挖掘和数据操作的过程中应重点降低泄露和访问风险,现有最基本的手段是匿名化技术、属性控制和差分隐私算法,但在交通侧与能源侧的数据集庞大且关联性强,单独应用上述方案会存在计算效率低、被动防御等问题[74]。交通能源融合大数据平台除了建立技术面所需数据库外,还应设有在一定法律允许范围内存储数据消费用户的基本信息的数据库,如用户目标、偏好、信用等。访问权限管理技术则可以基于该用户数据库对数据消费者进行严格的角色鉴定、身份认证,对其数据挖掘或者访问请求进行风险评估[75],从而保证数据流通的安全性以及提升平台对威胁的拦截概率。当前,区块链技术因其灵活和独具特色的加密机制而在V2G 去中心化交易[76]、数据访问控制与共享[77]等领域受到青睐,未来区块链技术在交通-电力市场方向的运用可能成为潜在的发展趋势。

数据消费者在应用层获取经授权后的流出数据。该过程对应于数据生命周期的应用阶段,需要实施风险评估与访问控制策略以确保数据不被泄露和滥用。同时,在数据流出的过程中需做好流转记录,便于出现异常后的及时查找与追溯[78]。

4 交通能源融合大数据平台典型应用

交通能源互联网作为跨学科、跨领域的前沿研究,具有很强的衍生性和包容性。基于交通能源互联网的理念,构建交通能源融合大数据平台的典型应用场景,并且支持横向扩展更广阔的业务功能,加强与更多的网络组织的联系,促进更庞大更复杂耦合网络的形成。目前,智慧城市、港口交通、城市群区域、智慧航空,分别与交通系统存在工程场景,并具备交通能源融合的应用潜力。

4.1 智慧城市TOD 园区建设

TOD 的概念早在1992 年就被提出,具体是指以交通为导向的城市发展模式(transit-oriented development,TOD)。TOD 园区围绕中心的交通枢纽站点通过路网向外辐射,建设有综合办公、商业、公交站、住宅、能源供给站点等多功能多用途的基础设施及配套建筑。TOD 园区由于其土地面积适中、城市功能高效完善、区域能源集中、人车出行规律性强等特征,是交通与能源融合交互的典型场景。中国在TOD 的引进和发展上采取了积极措施,例如早期探索TOD 模式的云南昆明呈贡核心区,园区内设有云南大学、高铁枢纽以及绿色生态系统[79];2019 年成都市带头首批规划建设了16 个TOD 示范项目[80]。

TOD 园区人口繁多,考察每个用户的行为和应激心理,为每个用户提供合理的应用方案,是打造具有TOD 特色的交通能源大数据平台的目标,主要包括以下工作:

1)灵活性资源调度潜力评估。大数据平台可以对用户进行智能聚类,利用数据挖掘技术获取用户出行行为、用能行为规律,并进行多维可调度潜力评估,实行合理的调度安排和出力分配。

2)实时滚动优化运行。大数据平台分析发电侧和负荷侧的供需差异数据,建立合理的电价激励的用户需求响应模型。模型接入在线传输的实时数据,从而制定电动汽车最优的充放电策略,引导交通负荷消纳可再生能源、削峰填谷,最终推动实现能量的高效利用和园区运营成本的经济性最优。

3)可视化展示与分析。为了将平台处理得到的数据以更为简洁明了的方式呈现给各类用户,平台数据会经前端技术包装,形成可视化界面和客户终端。作为园区用户,或者从外界驶入园区网络覆盖范围的用户,经过身份认证和使用授权后能够通过个人便携移动设备或者车载电脑实时查看平台客户端显示的路网交通状况、停车位置信息、充电站排队信息、电价分布以及平台提供的出行路径,用户既可以参考系统提供的方案出行,也可以按照用户意愿制定个性化出行方案。

4.2 港口交通能源综合系统建设

港口是实现国际集装箱贸易的重要基建设施,港口机械、运转车辆或拖船、货运铁路等港口物流交通系统的电气化与含新能源发电场(海上风能、太阳能、潮汐能)的港口微电网、燃料输送网络、冷热负荷供应网络等能源系统的综合集成共同推动港口交通能源的融合发展。近年来,世界范围内多个重要海岸港口、河流港口开始逐步发展和建设港口综合能源系统[81]。

港口综合能源系统管道能流较为复杂,包括电网潮流、化石燃料流、热水流和生产型化工原料流,交通运输设备众多且繁忙。同时,港口、码头的大气污染物排放量较大[82]。利用大数据技术能够完成以下与建设港口交通能源综合系统相关的工作:

1)能源供需预测。港口交通能源互联网大数据平台必须要配置更强大的算力,以同时求解平台内嵌的数据驱动型管道多能流融合的统一潮流模型。平台应用层基于深度学习算法、大数据挖掘和多维数据融合功能,并考虑到船舶停港时间、能源使用的时效性等多时间尺度特性,对港口各能流需求和港口新能源发电出力的随机性进行预测。

2)故障识别与应急方案。平台在实时监测各能源传输设备运行情况的同时,还需基于历史和实时的大数据统计特征评估多层级耦合网络脆弱性,辨识系统薄弱环节。即使物理系统发生故障,平台也能调用智能搜索模块快速锁定故障位置并调整相应设备动作,同时制定应急协同调度策略,重新规划能流,避免故障在各能流网间的相互传播引发连锁故障,最大限度减轻故障引发的损失。

3)港口-内陆协同优化。对于占地面积较大的港口,平台需要接入到港口机械、运输车辆或船舶的负载容量、耗电情况采集数据库,结合港口内的陆地路网拓扑与实时车流量,制定最优物流任务配置和路径规划等相关的优化方案,减少港口、码头及内陆的污染排放。

4.3 城市群区域交通能源一体化建设

随着中国城市化进程的加速,以特大城市为中心、联系周围城市向外辐射扩展形成的城市群区域已迅速在中国规划建设,例如长江三角洲地区、珠江三角洲地区、成渝经济区和长株潭城市群等。城市群的发展加快了资源和信息的流动,促进了市场和产业的扩大,对区域经济发展起到引领作用[83]。

与城市中小型区域内交通能源协同规划不同,城市群交通能源融合大数据平台应有更强的数据传输能力、保持响应速度、存储空间充足等功能,以适应空间跨度更大、设备分布更分散的城市群交通能源互联网系统,其中主要包括高速路网与城际轨道交通。

1)高速路网是连接城市的基本交通系统。城市之间距离远、电动汽车高速行驶耗电量大,如何规划高速路网沿线公共充电站的位置与容量是当前研究的重点。依托大数据平台,挖掘长期车流信息与车辆充电数据,构建以建设成本、用户成本最低为目标函数的数据驱动模型,实现充电站、换电站或服务区的最优选址和容量确定。同时,针对含光伏储能设备的充电站,平台通过对光伏出力的预测,以光储充电站的寿命周期成本最小为目标规划光储设备容量,并智能调控充电负荷和储能出力。

2)城际轨道交通是城市群交通能源互联网的另一重要应用场景。铁路沿线布置的分布式新能源和储能设备也将接入轨道交通牵引网,形成“源-荷-储”系统[16]。大数据平台能够快速整合异构计算资源,采用多级协调式能量管理技术,以优化列车和配电网运行成本最低为目标,设计合理的电源侧供应和用电侧需求的平衡方案。此外,在建立牵引供电系统和电动汽车充换电站联合运行系统的模型基础上,平台应用层可以制定价格激励策略,反馈并引导用户消纳轨道交通系统再生制动能量,从而提高能源利用率,实现“源-荷-储”系统的协同运行。

4.4 智慧航空交通运输系统建设

面对中国民航运输量、空中交通规模和复杂程度持续高速增长的发展趋势[84],2019 年民航局提出智慧民用航空运输系统发展方向,即大数据、云计算和互联网等新一代信息技术在民航的应用和融合[85],推动民航运行全面数字化,促进民航业高效、绿色和可持续发展。

交通能源互联网发展趋势下的智慧民航工程分为硬件和软件系统两个协同发展的方向。在硬件方面,飞机电气化推进系统和混合电推进技术是目前各国研发聚焦的热点。电推进技术能显著降低碳排放与噪声,促进新型航空运输业的发展。但现有电动飞机受限于电池能量密度,远不能满足大承重长距离的运输要求,电推进和电动飞机领域在世界范围内均处于起步阶段[86]。软件系统方面,具有航空航天特色的交通能源大数据平台有望实现以下功能:

1)机坪“车-机-路”自主协同运行。在机场内广泛部署车辆、航空器和廊桥传感设备,使机场运控中心能深度感知场面资源和地面交通运行情况,实现对机场资源的优化配置和交通的宏观优化调度。同时,地面交通工具还具备障碍检测、协同避让和自主路径规划等功能,提高机坪无人化水平。

2)航空器健康状况分析。民航客机的一次正常航班后,会产生海量机组状态数据和机载日志信息,为严格保证下次航行的安全性,大数据平台必须借助智能模型对这些数据进行收集、价值挖掘和处理,分析航空器各组件的性能或寿命情况,完成快速故障诊断,以安排航后维护和检修。

3)智能空中交通流管理。航空器的正常稳定飞行需要与地面塔台频繁多链路交互通信,以感知各航路信息和气象条件,平台需要承载多链路的空地宽带高速数据传输技术,保证超远距离的信号覆盖。在规划方面,管理人员通过大数据平台提前获取航迹需求后,能及时请求相应空域管理中心、气象部门的数据,为航班制定最优的航路并预测空中交通态势,辅助地面中心管制与航班波优化。

5 总结与展望

在“碳达峰、碳中和”的国家战略背景下,交通能源融合发展是未来城市建设与发展的必然趋势,交通能源融合大数据平台是实现交通网与能源网数据深度融合、协同运行控制、全方位优化调度极为有力的技术支撑。本文提出了交通能源融合大数据平台的基本架构,初步阐释了交通能源融合大数据平台在多源数据融合、复杂数据分析处理、交通能源协同优化调控与安全保护4 个方面所面临的难点与挑战,论述了应对方法与关键技术,并针对交通能源融合的典型场景,给出了相关应用方案。

然而,完善交通能源互联网理念中的全局信息交互、积极推动交通能源融合大数据平台落地应用仍存在许多问题和挑战,例如:

1)交通能源融合大数据平台的研究和工程应用目前处于起步阶段,作用的空间范围小、作用的系统结构简单,未来将进一步研究如何提高数据融合程度和融合范围,以兼容更多的系统;

2)交通行业与能源行业的信息深度交互和协同发展需要众多政府企业部门的沟通合作,牵涉多方利益,有必要形成统一规范的监管体系;

3)交通能源融合大数据技术需要面向用户并服务社会,因此,如何激励与引导用户接受统一化和智能化技术在生产生活中的渗透、积极选择系统提供的更优策略,是保证交通能源融合大数据平台发挥正向作用的必要条件。

猜你喜欢
交通能源融合
国际能源署:今年清洁能源投资将再创新高
村企党建联建融合共赢
融合菜
从创新出发,与高考数列相遇、融合
繁忙的交通
《融合》
第六章意外的收获
小小交通劝导员
阅读理解三则
好大的方块糖