信息交换技术、信息处理技术及信息存储技术的快速发展,使得海量数据得以汇聚。超大规模数据隐含更真实的事物本质和规律,其呈现出来的巨大价值正推动着各行各业的深刻变革。
顺应大数据技术的发展趋势,铁路行业在信息化建设取得长足发展的基础上,积极开展大数据技术的应用研究。近几年,在高速铁路牵引供电领域,已开始逐步整合各类信息平台数据,研制基于大数据技术的跨平台多源信息整合与分析系统,构建多维信息共享、多元信息一体化的管理系统,在大数据的应用上做出了诸多有效尝试,力求将高速铁路牵引供电系统打造成高效、节能、环保、智能化的系统。本文主要介绍大数据技术在高速铁路牵引供电系统中的应用。
高速铁路牵引供电系统的数据具有来源广、类别多的特征。
按照数据来源划分,数据源可以分为牵引供电系统内部数据、铁路内部其他系统数据及铁路外部数据。数据来源构成和分类如图1所示。牵引供电系统内部数据主要来自供电SCADA系统、供电6C系统、供电调度运行管理系统及供电运维管理系统等;铁路内部其他系统数据主要来自高速铁路自然灾害监测系统、铁路运输调度管理系统、高速铁路综合视频监控系统等;铁路外部数据主要来自地方气象预报公共服务系统。
按照数据类别划分,数据源一般可分为结构化数据、半结构化数据以及非结构化数据。结构化数据包括预定义的数据类型、数据格式和数据结构,如关系数据库数据、电子表格文件等;半结构化数据主要有识别模式和自描述定义,支持语法分析的文本数据文件;非结构化数据没有固定的结构,如文本文件、图纸、图像和视频等。
图1 高铁牵引供电大数据来源及分类
通过建立统一的具备高扩展性的高铁牵引供电大数据管理平台,可实现数据的采集、存储和处理,并提供面向高铁供电领域多场景应用的客户端服务接口。高铁牵引供电大数据管理平台总体技术架构如图2所示。
图2 高铁牵引供电大数据管理平台架构
高铁牵引供电大数据管理平台提供流式数据采集、数据库数据采集和文件数据采集3种数据采集方式。
流式数据采集用于采集高铁牵引供电各类接口系统提供的流式数据,包括设备状态监控数据、各类实时检测监测数据等,提供数据来源配置、传输通道配置、传输目的配置等功能。
数据库数据采集用于从各类牵引供电接口系统关系型历史数据库中抽取数据到大数据管理平台,提供抽取源、路径、目标、抽取规则、转换规则等配置功能。
文件数据采集用于采集图片、视频、文本以及电子表格等文件中数据信息,提供文件校验规则、预处理规则等配置功能。
高铁牵引供电大数据管理平台采用分布式文件系统、分布式数据库、关系型数据库及内存式数据库等多种存储引擎,构建易于扩展的分布式大数据存储系统,可随数据规模的扩大动态增加存储节点,具有较强适应性。
高铁牵引供电大数据管理平台可根据不同业务场景需求,处理不同规模、复杂多样的数据,提供批处理、流处理、交互式处理等多种数据处理方式,并提供基于大规模数据的聚类、关联、回归、分类等多种大数据分析算法。
批处理方式用于复杂的批量数据处理,其时间跨度在几分钟到数小时之间。
流处理方式用于实时数据流的处理,其时间跨度在数百毫秒到数秒之间。
交互式处理用于基于历史数据的交互式查询处理,其时间跨度在数十秒到数分钟之间。
大数据应用的目的在于发现知识、洞察规律并实现预测。高铁牵引供电大数据的应用能够为高铁牵引供电系统的运行、维护带来高效、便捷和精准的服务。目前,高铁牵引供电大数据的应用形式大致可分为数据可视化、多维数据融合、业备深度挖掘3种。
数据关联可视化是大数据最基础的应用形式。简单的数据展示已无法满足高铁牵引供电系统的业务需求。数据可视化技术能够充分利用统计学、计算机图形学和图像处理技术,将海量数据信息直观、生动、高效地展示给相关人员,使其及时准确地了解各种信息。同时,通过可视化展示可将错综复杂、看起来无法解释及关联的数据建立联系和关联,发现规律和特征。
例如,高铁牵引供电大数据管理平台可抽取供电6C系统数据,采用区域着色图、折线图(图3)、饼图(图4)、数值与曲线综合展示图(图5)等多种方式进行可视化展示。
图3 接触网导高、拉出值、硬点等对比折线图
图4 接触网缺陷分布饼图及指示盘
图5 接触网缺陷分布与整改综合展示图
通过高铁牵引供电大数据管理平台,将供电系统内部数据与外部数据进行融合,通过关联分析,可明晰牵引供电系统与其他外部因素之间的联系,以更加全面地了解牵引供电系统生产运营状况和发展规律。当前阶段,面向高铁牵引供电大数据应用的典型多维数据融合主要表现在以下几方面:
(1)与综合视频数据融合。获取综合视频图形数据,并采用图像识别技术,识别所亭内开关状态、复核安防报警、监视操作及识别烟火等,通过与SCADA系统及安监系统数据的关联,可实现对现场情况的多维感知及相互验证。
(2)与列车调度数据融合。获取高铁集中调度系统(CTC)中的行车数据,并与牵引供电相关系统运行数据相融合,实时掌握牵引供电与动车负荷的联系,同时加入行车实时数据,更有利于故障跳闸原因分析及行车组织方案的优化。
(3)与地理信息系统(GIS)融合。通过牵引供电系统数据与GIS数据的融合,以地理位置为基础对各种牵引供电数据进行管理,使其具备空间属性。同时,GIS的空间查询及分析能力可为牵引供电系统的应急抢修提供路线规划。如图6所示。
图6 供电6C系统数据与GIS的融合
(4)与地方气象预报公共服务数据融合。通过获取长期的气象数据及气象预报数据,可对牵引供电设备的健康状态与外部气象环境进行关联分析,并可提早针对恶劣气象情况制定预案。如图7所示。
图7 供电系统与气象数据融合
通过聚类分析、预测分析及关联分析等大数据分析方法,从大量的、复杂的、不规则的、离散的数据中获取隐含的、具备潜在规律的信息,对大数据的价值进行深度挖掘,以此指导高铁牵引供电系统的安全生产和运营。
(1)故障预测与健康管理(PHM)。通过收集并管理设备的各种实时状态数据、环境数据以及非实时记录数据,依据大量数据实现牵引供电系统关键设备的故障预测、健康评估(图8)、可靠性及风险评估和维修决策等(图9),为牵引供电系统安全可靠运行及高效经济运维提供决策依据。
(2)广域保护。高铁牵引供电大数据管理平台通过抽取供电SCADA系统数据,以供电臂为单元,实现区域内各负荷数据的拟合,通过数学模型自动分析电流分布异常情况,可精确定位故障位置及判断故障性质,快速切除故障区段。
图8 牵引供电系统关键设备健康评估
图9 牵引供电系统关键设备可靠性及风险评估和维修策略
目前,大数据技术在高铁牵引供电系统数据可视化、多维数据融合及业务深度挖掘方面已经展现初步成效。随着大数据技术在牵引供电领域的广泛应用和发展,其应用价值也将不断扩展和提升;伴随铁路供电系统修程修制的改革,其必将成为推动铁路供电系统发展和创新的有力工具。
参考文献:
[1]李康.浅论大数据技术在电力系统中的应用[J].中国战略新兴产业,2017(44):87-89.
[2]沈国辉,佘东香,孙湃,等.电力系统可视化技术研究及应用[J].电网技术,2009(17):31-36.
[3]刘巍,黄曌,李鹏,等.面向智能配电网的大数据统一支撑平台体系与构架[J].电工技术学报,2014(S1):486-491.
[4]王玘,何正友,林圣,等.高铁牵引供电系统PHM与主动维护研究[J].西南交通大学学报,2015,50(5):942-952.