翁湦元
(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
智能交通系统将信息技术、通信技术、计算网络技术有效集成,有助于综合交通信息的融合与综合运用。2001年美国智能交通运输协会明确了智能交通建设主题,以缓解日益恶化的交通拥挤与基础设施建设扩张乏力之间的矛盾[1]。美国ADVANCE系统采集车辆信息与地面传感器信息经过系统处理分析后,将交通引导信息下发至车载设备,引导司机选择最优路线[2]。日本建立VICS[3]系统,能提供实时路况、停车场实时车位等信息,功能较为完善。我国智能交通信息系统始于90年代,经过20多年探索已进入实用阶段[4],北京市交通运行协调指挥中心、杭州智能交通信息系统平台等均实现了跨区域、跨行业交通信息资源的集成、共享与交换[5],为综合交通科学管理提供技术保障。目前,城市交通、铁路、民航、公路、水路等交通行业均在建设与发展本行业智能交通信息系统,由于各领域业务相对独立[6],交通数据分散在大型交通企业与相关业务部门中,缺乏跨行业交通信息资源的整合和综合运用。
高速铁路综合枢纽车站同时连接铁路运输、城市交通、公路、民航等多种交通工具。随着客流不断增加,为方便旅客在车站内快速进出,对综合交通信息与换乘引导服务的需求极为迫切。本文研究高速铁路综合枢纽车站旅客换乘引导信息服务平台(简称:平台)方案,实现车站周边地面公交、轨道交通、出租车、网约车、停车场、共享单车等多源交通信息融合,建立高效的综合交通数据发布渠道,为旅客提供换乘引导信息服务;并通过对高速铁路与城市交通接驳服务需求的预测及运力资源的优化配置,提升高速铁路综合枢纽车站内旅客疏解效率,提升旅客出行体验。
高速铁路综合枢纽车站旅客换乘引导信息服务平台主要由3部分构成:底层基础软件、平台基础运行环境、大数据分析与应用服务。
底层基础软件主要包括操作系统、数据存储、文件存储组件,提供高性能的分布式结构化与非结构化数据存储服务以及高性能的分布式文档存储服务;为提高系统稳定性和运行效率,基础软件主要以物理裸机结合虚拟化部署为主。
平台基础运行环境主要结合当前主流的容器与容器编排技术,部署Docker运行环境,搭建Kubernetes应用集群,为大数据分析与应用服务提供基础运行环境,具备自动化部署、弹性伸缩的能力。
大数据分析与应用服务运行于Kubernetes环境内,大数据分析基于主流开源数据分析工具进行二次研发,应用服务基于Spring Cloud微服务架构进行定制化开发。
逻辑上,平台技术架构可划分为资源层、中间层、应用层、接口层4个层次,如图1所示。
图1 平台技术架构示意
(1)资源层:包括基础运行环境和资源服务,提供平台运行所需的环境与数据文件资源,支撑平台的运行。其中,基础运行环境主要包含操作系统与虚拟化环境;资源服务主要包含数据库、文件存储、数据缓存等与平台业务无关的资源服务。
(2)中间层:由数据库连接服务、消息队列服务、分布式任务调度服务、集群管理服务等组成,是连接应用层与资源层的桥梁;应用层的大数据分析与应用服务统一通过中间层提供的服务访问资源层的数据资源,保证资源的使用稳定与合理负载。
(3)应用层:由大数据分析与应用服务组成;大数据分析包括非实时分析的离线计算服务与实时分析的流式计算服务;应用服务包含数据接收与采集、数据处理、平台管理以及数据查询服务。
(4)接口层:由负载均衡、MQ服务以及Restful接口组成;负载均衡用于将外部请求流量分配给后端Restful接口服务实例;Restful接口用于接收外部请求,并将需要应用层处理的请求传递给下层的应用服务;MQ服务负责接口层与应用层间数据通信的缓冲与流量调度。
如图2所示,平台离线计算采用Apache Spark[7]作为离线计算引擎,由Apache YARN完成Apache Spark集群的调度管理。数据分析人员通过离线数据分析管理应用提交数据分析需求,生成数据分析任务;任务调度管理根据分析任务,驱动离线分析引擎执行数据分析任务;离线分析引擎利用基于Spark Core的Spark SQL(用于数据处理)、GraphX(用于图计算)和MLlib(用于机器学习)完成数据分析。
图2 离线计算框架示意
如图3所示,平台流式计算[8]采用Apache Flink[9]作为计算引擎,数据源包括外部数据源及有限数据源2类:外部数据源主要是随时间推移不断变化的实时事件数据流,由消息队列将数据传输至数据处理引擎;有限数据源将有限长度的数据集转换为流的形式,并传输至数据处理引擎进行分析处理。数据分析管理应用负责维护数据分析规则,数据处理引擎按照数据分析规则对数据流进行相应处理后,传递给后续的数据存储及数据服务。
图3 流式计算框架示意
平台采用集中化部署,从功能构成上划分为数据接口、数据处理、数据存储、平台控制4个区域,从网络结构上划分为客服外网、客服内网和客票网3个网络安全域,不同网络安全域之间通过安全平台实现安全防护隔离,如图4所示。
图4 平台结构
2.1.1 数据接口区
数据接口区是平台的入口,提供数据接收、采集以及数据展示与报表生成功能。数据接收功能完成外部数据的统一接入,主要包括数据路由、队列服务、流量调度与负载均衡服务;负载均衡服务根据指定策略,将外部数据分配给不同的数据接入应用实例,并由路由服务传递到相应的数据处理器进行处理;流量调度与队列服务将处理后的数据传输给数据处理服务,其中,队列服务完成流量的削峰填谷,避免后端数据处理服务面临瞬时大数据量处理压力,并将需要实时处理的数据转发给实时数据处理服务。
2.1.2 数据处理区
数据处理区提供数据分析、交通预测及数据查询功能。数据分析功能对所采集的多源交通数据进行统计与综合分析,生成分析结果,并建立知识库;交通预测功能通过对历史数据的综合分析,利用预测模型提供未来交通状况指标的预测服务。数据查询功能提供平台内数据的综合查询服务,可查询的数据包括:平台内原始数据、数据分析结果数据及平台基础数据。
2.1.3 数据存储区
数据存储区跨越客服外网、客服内网、客票网3个网络安全域。平台采集的第三方交通运输数据作为外部数据存储在客服外网;铁路内部数据如时刻表、调度数据、旅服数据等存储在客服内网;余票数据、席位数据、售票数据等铁路运输生产数据存储在客票网。这些数据是平台数据分析功能的基础。
2.1.4 平台管理区
平台管理区主要提供权限控制与服务管理功能。权限控制功能主要负责管理平台用户(包括调用平台数据查询服务的外部应用、访问平台数据的管理、运营及数据分析人员)对平台数据查询服务的使用权限,以及平台管理人员、数据分析人员对平台数据采集、数据分析任务的操作权限。服务管理功能主要是监控平台内部应用服务的运行状态,采集平台内部应用服务的运行日志,提供日志检索服务,对平台应用服务的运行实施控制,如控制应用的版本、副本数量等。
平台主要数据处理流程,如图5所示,外部数据采集由第三方推送,或由平台主动拉取。消息队列服务将采集的外部数据复制成2份,1份数据经预处理转换为标准格式后,存储在外部数据存储集群中,另1份数据发送给数据流式实时计算模块,由该模块对需要实时分析的数据进行处理,分析结果作为离线分析结果的补充与修正,存储在外部数据存储集群中。
根据用户需求,数据处理模块从外部、内部数据存储集群中读取数据,完成数据分析和预测计算,并将处理结果存储在数据存储集群中,供用户和其它内部系统读取。日常的数据分析和预测任务均由任务调度模块完成统一调度和管理。
平台的内部、外部存储集群中所存储的数据与文件,以接口、可视化图形及报表等形式,统一由数据查询模块提供访问;将数据查询接口纳入平台权限管理,并设置查询缓存,以优化查询性能。
图5 主要数据处理流程
考虑到平台接入的外部数据格式多样、数据接口方式各异以及平台自身的可扩展性,建立标准化的多源综合交通数据采集流程,提供静态、动态数据的高效存储与查询,实现高性能的数据离线与在线分析。所采集的综合交通数据主要包括:
(1)地铁数据:地铁车站基本信息、线路基本信息、时刻表信息、地铁车站进出站旅客人数、火车站周边地铁及前后站的进出站人数、地铁线路区间满载率等;
(2)公交数据:公交站点基本信息、公交线路基本信息、站点公交首末班时间、线路预计下班车到站时间、公交车辆满载率、火车站周边公交站点分时上下车旅客数量等;
(3)网约出租数据:高速铁路综合枢纽车站网约出租车打车便利指数、网约车进出站数量等;
(4)道路交通数据:火车站周边道路和路口交通指数、车速、流量等;
(5)共享单车数据:火车站周边共享单车数量等。
综合交通数据的发布包括对外和对内2类渠道。对外发布渠道以开放数据查询服务的方式,为授权用户提供数据查询;对内发布渠道以服务接口的方式,将综合交通数据提供给铁路12306网站、12306 App、旅客服务平台等业务系统,借助铁路12306网站、12306 App等官方服务平台将数据呈现给用户。
铁路12 306网站目前可提供火车票预定、机票预定、汽车票预定、约车服务等业务,涉及各种主要交通出行方式[10]。利用平台提供的综合交通数据,可帮助旅客在行程中提前规划好到站后的换乘方式与出行路线,实现延伸服务资源的增值,增强铁路客运服务的市场竞争力。
在高速铁路综合枢纽车站等人流密集场所,5G通信高速率、低延时、高可靠、低功率、海量连接的优势[5]更加突出,基于5G技术的高速铁路枢纽车站旅客引导信息服务可为旅客带来更优质的出行体验。
5G高频毫米波通信技术具有非常好的方向性,可以实现更高精度的测距和测角。5G大规模天线技术具有更高分辨率的波束,定位精度更高,填补了UWB与蓝牙等现有窄带定位技术在1~3 m范围内精确定位的空白[11],可实现从室外到室内定位导航的无缝切换,为旅客提供更顺畅的定位服务。对于换乘通道较为复杂的大型高速铁路枢纽车站,利用站内导航与交通接驳换乘地图数据,可引导旅客快速到达正确的地铁、出租车、网约车接驳换乘地点,提高站内换乘效率。
在高速铁路综合枢纽车站内设置5G基站,利用5G高精度定位技术,根据枢纽站不同进站口的网络连接数量,估算出不同出站/进站口客流量;旅客可根据站内客流分布,选择相对不拥挤的进站检票口、出站口或换乘通道,方便旅客在车站内快速进出,提高站内旅客换乘体验。
在车站使用设置问路机、智能机器人等设备,通过人脸识别,借助5G网络和边缘计算技术,智能识别出重点旅客的身份信息和出行信息,提供咨询、引导、送餐等服务,协助旅客安全、顺利进站。旅客也可以在出站时查询与枢纽车站接驳的地铁、公交、网约车等其它交通工具的实时运行情况,选择出站后的换乘方式;可在出租车候乘点安装摄像头,利用 5G网络传输实时采集各候乘点的高清视频,据此分析出租车排队人数,引导旅客前往排队人数较少的候乘点。
面向高速铁路综合枢纽车站旅客出行需求,针对当前综合交通数据相对独立、缺乏统一管理、未充分发挥价值的问题,研究高速铁路综合枢纽车站周边交通数据融合技术,提出高速铁路综合枢纽车站换乘引导信息服务平台设计方案,对平台技术架构、平台结构及功能进行设计,为下一步开发工作奠定基础。