李世野
【摘 要】大数据是一个国家的重要的战略资源。城市轨道交通凭借其大容量运输和高效率运输水平,在缓解交通拥堵方面有重要作用。如何在轨道交通中挖掘和发挥大数据的创新价值,如何利用大数据挖掘、预测、可视化等技术服务轨道交通行业有着重要的意义。本文系统地阐述了大数据技术在轨道交通领域的研究现状,总结了大数据在轨道交通应用中的研究难点和挑战,为轨道交通信息化和大数据应用拓展提供支持。
【关键词】轨道交通;大数据;数据挖掘;机器学习
随着互联网的高速发展,大数据已成为一个国家的重要的战略资源。由于国家战略层面的重视,近年来大数据技术越发成熟,大数据应用得到了快速增长。大数据是指无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。大数据具有4个特征:数据体量巨大、数据类型繁多、价值密度低、处理速度快。大数据是需求驱动的,目前国家是大数据应用的主要推动者。
快速发展的城市轨道交通在城市交通中发挥着巨大的作用,积累了海量的数据规模。这些原始数据有多源异构、周期变化大,传播速度快,动态的数据体系等特点,具有明显的大数据特征。如何在轨道交通管理中挖掘和发挥大数据的创新价值,如何利用大数据挖掘、大数据预测、大数据可视化等技术分析轨道交通大数据,有助于发现轨道交通中潜在的数据规律,分析决策需求,优化数据采集和处理。轨道交通大数据技术能更好的服务于轨道交通行业的管理,提升效率,促进发展,已成为轨道交通业内研究和拓展的新领域。
一、轨道交通大数据研究现状
目前,大数据技术在轨道交通领域中的研究主要可分为5方面:基于大数据的轨道交通客流预测,基于大数据的轨道交通规划优化,轨道交通大数据分析,轨道交通调度和节能优化和轨道交通状态监测与可视化研究。
(一)基于大数据的轨道交通规划优化研究
在城市轨道交通中,大规模事件往往会引发大量的客流,给附近的交通运输和管理带来极大的压力。因此,针对城市轨道交通网络中客流,进行有效的评估和传播研究变得很有意义。通过捕捉复杂地铁线网中客流的时空特征,文献中提出了一种有效动态交通规划方法。通过设计随便效应函数和多项分对数模型,该方法能较好的进行客流规划,优化交通运输成本。
(二)轨道交通大数据分析研究
大数据分析(BDA)广泛应用于铁路运输和工程领域。通过一个新的分类框架,全面综述大数据在铁路工程和运输领域的最新应用。从铁路运输的三个领域(运营、维护和安全)的大数据分析应用进行了系统研究。对大数据分析的层次、大数据模型的类型以及各种大数据技术进行了分析。
(三)轨道交通调度和节能优化研究
由于环境和社会问题的不断增加,在轨道交通系统中,如何节能是一项具有挑战性的问题。现有文献在设计时间表和能耗过程中,往往忽略了每个车站乘客需求的时变特征。基于时间相关的智能卡自动收费数据,提出一种基于时间依赖客流量的城市轨道交通双目标时间表优化模型,最大限度地减少了旅客等待时间和纯能源消耗。在模型公式中,旅客等待时间受限于满载情形下的列车容量,纯能量消耗由牵引能量消耗与给定时期内再生能量的差值表示。数值实例表明: 相对于现行的时间表方案,该模型能显著改进客运服务,有效地减少能量消耗。
(四)轨道交通状态监测与可视化研究
自然灾难、恶意攻击和误操作事故是轨道交通网络的重要威胁。轨道交通网络的脆弱性受到了越来越多的行业专家和管理者的重视。针对该问题,在轨道交通网络脆弱性分析过程当中综合考虑了乘客流量和使用特征,提出了一种基于站点的网络脆弱性测量方法。从轨道交通网络数据、客流数据和车站周围的土地利用数据入手进行系统数据分析。结果表明,轨道交通网络的脆弱性受其网络拓扑结构、客流、土地利用变量等因素的共同影响。有助于轨道交通管理者及时了解网络脆弱性,关键站和链路的实际状态。
二、轨道交通大数据研究所面临的挑战
目前,轨道交通大数据分析和处理有着丰富的应用,但仍有一些潜在的问题需要解决,下面从数据收集、数据隐私、数据存储、数据处理和数据共享这5个方面进行分析。
(一)数据收集
由于车辆和行人的频繁移动,在特定地点或在某些时间,在轨道交通中收集的数据可能不准确,不完整或不可靠,如车辆没有嵌入提供实时定位数据的设备、道路传感器收集的道路交通数据可能丢失。解决这一难题的一个可能途径是投入新的数据采集技术,提高数据采集能力。随着物联网技术的发展,新的传感器技术应运而生,有助于提高数据采集和数据质量。此外,采用数据捕获自动化来最小化手动數据输入也是提高数据质量所必需的。
(二)数据隐私
在大数据时代,最具挑战性和最关心的问题是隐私问题。个人隐私可能在数据传输、存储和使用过程中泄露。以往的轨道交通系统收集的数据是非个人数据,如车辆数据、交通流数据。而现有的数据收集涉及到个人隐私数据,如个人和车辆的位置信息。如果不严格保护这些数据,窃取这些数据的人将损害数据所有者。因此,隐私问题一直备受关注,隐私保护是其大数据应用的重要内容。为防止未经授权的个人隐私信息泄露,各国政府和交通部门应采取相应的措施提高数据的安全级别。
(三)数据存储
目前,大数据的数据量已经从TB级跃升到PB级,数据存储容量的增长速度远远落后于数据增长速度。特别是在轨道交通运维中,将每天从各种传感器产生各种数据。传统数据存储基础设施和数据库工具已经无法应对日益庞大和复杂的海量数据。因此,设计最合理的数据存储体系结构已经成为一个关键的挑战。主要的公共云存储提供商,如谷歌和微软,通过提升大数据集成能力来改进其服务,多云存储和混合存储正在成为大数据存储的关键领域。它们的计算能力在处理计算密集型分析工作负载中极具优势。
(四)数据处理
轨道交通中的大数据应用有很强的时效性,需要及时、快速地处理数据。这些大数据应用包括交通数据预处理、交通状态识别、实时交通控制、动态路径引导和实时交通调度。轨道交通数据包含大量的来自不同数据源的异构数据,同时必须与历史数据进行比较,并在短时间内进行处理。数据处理系统必须能够处理更复杂和日益扩大的数据。
三、结束语
城市轨道交通的快速发展,能有效的缓解交通拥堵,是现代交通运输发展的重要方式。具有运输容量大、运输水平高效等特点。应用大数据技术,通过数据采集、数据预处理和存储、数据计算和分析等关键环节,深入探索轨道交通系统的运维和数据规律,指导运营实践和规划,是一个重要的研究领域。针对该研究热点,本文系统阐述了大数据技术在轨道交通领域中的研究现状,分别从基于大数据的轨道交通规划优化,轨道交通大数据分析,轨道交通调度和节能优化和轨道交通状态监测与可视化研究4个方面进行展开研究。分析了轨道交通大数据应用中数据收集、数据隐私、数据存储、数据处理这4方面的研究难点和挑战。研究成果对提升轨道交通的运营管理水平和乘客服务水平具有重要的理论和现实意义。
【参考文献】
[1]宋杰,孙宗哲,毛克明,等.MapReduce 大数据处理平台与算法研究进展[J].软件学报,2017,28(3):514-543.
[2]毛国君胡殿军,谢松燕.基于分布式数据流的大数据分类模型和算法[J].计算机学报,2017,40(1): 161-175.
[3]李得伟,张天宇,周玮腾,等. 轨道交通大数据运用现状及发展趋势研究[J].都市快轨交通,2016,29(6):1-7.