于 晋,张学怀
(威海市交通运输事务服务中心,山东 威海 264200)
目前信息技术已经在各领域得到非常广泛的应用,交通行业也在大数据、云计算、区块链以及北斗定位等新技术的支撑下,实现了智能化的发展[1-3]。各类交通业务信息系统经过多年的运行,积累了大量的交通基础数据资源,为大数据的应用发展奠定了坚实的基础。目前交通部门为了应对不同的业务需要,建立了不同的业务信息系统大多独立运行,系统关联度低,也缺少相应的数据分析模型,很难从交通行业全角度对数据进行分析和挖掘,致使目前的行业管理效能不高。因此,运用先进的大数据技术对交通运输领域海量基础数据进行分析,深挖数据的内在价值,解决交通运输行业运行管理中存在的各种问题,为提高交通公共服务能力和管理决策提供有效的支撑,使交通运输行业管理更加智能化、科学化、信息化[4-5]。
数据库(DataBase,DB)是存储在计算机辅助存储器中的,有组织的,可共享的相关数据集合。数据库技术研究和解决了计算机信息处理过程中大量数据有效地组织和存储的问题,在数据库系统中减少数据存储冗余、实现数据共享、保障数据安全以及高效地检索数据和处理数据。
随着数据库管理系统(Database Management System,DBMS)特别是关系型数据库管理系统(Relational DataBase Management System,RDBMS)的发展,数据的安全稳定运行在系统运行中起到关键作用,通常采取数据保密、加密算法、身份认证、磁盘阵列、数据备份、异地灾备等信息化手段进行主动防御,以防止出现不合法地使用造成的数据库数据泄露、更改或破坏。
北斗卫星定位系统是由我国自主研发的,致力于向全球用户提供高质量定位、导航及授时服务的定位系统,主要服务包括开放服务和授权服务两种方式。开放服务是向全球免费提供定位、测速和授时服务;授权服务是为有高精度、高可靠卫星导航需求的用户,提供定位、测速、授时和通信服务以及系统完好性信息。
大数据可以概括为5 个V:数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。由于大数据超过传统数据库系统的处理能力,常规软件工具无法在一定时间范围内对数据进行获取和管理,需要通过大数据技术对海量数据进行处理分析,为行业决策提供强有力的数据支撑。
大数据无法用单台的计算机进行处理,必须采用Hadoop、Spark、云存储、云计算等分布式处理方式实时分析海量的交通数据,同时采用MapReduce模型技术用于大规模数据的并行运算,实现智能化、高效率的计算和分析。
Hadoop 是一个分布式计算平台,其最底部是Hadoop Distributed File System(HDFS),它储存Hadoop集群中所有存储节点上的文件。HDFS 的上一层是MapReduce 引擎,该引擎由JobTrackers 和TaskTrackers 组成。通过对Hadoop 分布式计算平台最核心的分布式文件系统HDFS、MapReduce 处理过程,以及数据仓库工具Hive 和分布式数据库Hbase的介绍,基本涵盖了Hadoop 分布式平台的所有技术核心。
图1 大数据分析系统架构
为有效利用交通基础数据资源,开发不同的大数据的应用系统,通过综合交通数据信息一体化的系统平台,对不同的业务信息系统进行数据资源整合共享,以及吸取清洗互联网数据,来适应当前交通行业信息化的发展的需要。通过大数据分析等先进技术进一步将不同数据基础资源进行挖掘与分析,为交通管理部门提供预警分析和决策分析,且为不同的从业者、公众提供不同的的数据需要。功能总体架构主要包括交通拥堵指数、出租车网格化预警、重点营运车辆主动预防及疫情管理预警等部分。
图2 系统总体架构
通过建立区域交通检测及预测模型,共享交通运行数据,建立交通运行数据共享试验体系,分析营运车辆综合情况,做到提前预警和规范管理,为政府精准规划管理提供基于数据证据的综合决策依据。交通数据中心在底层提供各业务系统操作接口,充分理解底层接口的调用机制、制定合理的调度策略,深入分析现有业务系统,了解其性能、机理,建立相应的数据交换标准与规范。以巡游出租车、重点营运车辆、公交车辆等数据作为大数据分析试点,分析道路运行安全管理的内在规律,为交通管理决策、规划、运营、服务以及主动安全防范带来更加有效的支持,提高交通安全的水平。
在分析城市道路交通拥堵指数总体变化规律的基础上,综合考虑天气、节假日、重大活动、突发情况等因素对交通的影响,以未来1 h、2 h、6 h、12 h、24 h 为时间间隔,每3 min 的交通拥堵指数明细为预测目标函数,建立基于城市道路交通拥堵指数预测模型,确定了模型的状态向量,距离计算方法,预测值计算方法等,并根据实时采集到的出租车、重点营运车辆、公交车北斗定位信息数据对模型各参数进行标定,实现对威海市市区宏观交通拥堵指数的短期、中期预测。见图3。
图3 交通拥堵指数模块
拥堵指数范围0~10,数值越大,反映出该区拥堵情况越严重,反之则道路越通畅,可根据日/周/月/年为周期进行交通指数的展示与对比,包括拥堵时长、道路运行速度、全年拥堵天数的分布等,分析区域城市道路通行情况,以早高峰、晚高峰、日高峰做对比,分析市区的交通压力,并向公众推送合理化出行建议。
基于市区巡游出租车北斗定位信息数据、交通执法车辆摄像头数据、交通视频采集系统视频数据等,将本市地图进行网格化处理,以0.5 km 为一个网格,实时监控全市出租车在每个网格的数量、所属公司、驾驶员信息等,从而协助管理部门掌握全市出租车的运营分布和运行轨迹。在此基础上,后台积累数据量达到分析要求后,可实现对出租车的异常集聚现象进行预警,一旦网格区域的出租车数量出现异常增加,即出租车数量明显高于此网格历史数据,系统将实时显示出租车异常区域的具体位置、出租车所属企业、驾驶员等信息,并以将该区域标红,采用弹窗的形式来提醒工作人员。工作人员可以通过车载视频查看现场情况,一旦确定是异常聚集,及时与公安部门共享信息,对现场的出租车进行监管、引导和疏散。见图4。
对车辆运行期间产生的各类预警信息,碰撞预警、车道偏离、抽烟、打电话、疲劳驾驶等进行实时提醒。对预警信息根据严重等级分为“严重”、“中等”、“一般”三类进行分级展示,可对每一预警信息查看详情如图片或短视频,并可查询预警历史,实现对车辆预警信息的全面掌握。通过车载前视摄像头识别行驶轨迹前方的车辆,实时探测本车与前车的距离、识别前方道路上的车道线,实时探测本车在当前车道中的横向位置;当检测到本车在与正前方车辆有碰撞危险时车速>30 km/h 时、当检测到本车由在车道中心正常行驶偏离到车轮压线过程时车速在>50 km/h 且未打转向灯时,向驾驶员发出声音警示,提醒其注意驾驶。
通过车载后视摄像头识别车辆驾驶员精神状态,并实时探测驾驶员的面部活动,当检测到驾驶员有闭眼、打哈欠行为、抽烟、低头、左顾右盼、精神不集中等行为时向驾驶员发出语音预警,并将报警图片与视频传回后台中心。对车辆预警信息可进行预警处置,可直接下发至企业或车辆,提醒企业和车辆进行整改,企业整改后可进行线上提交,管理部门可查看整改情况,实现对主动预防预警的科学管理。
基于重点营运车辆北斗定位数据,通过GIS 地图的形式可以查看当前在疫区及14 d 内驶离疫区的车辆当前的实时状态。通过算法,甄别可疑车辆,为疫情防控提供数据支撑。对于去过疫区以及当前在疫区的本市车辆进行统计展示,可清晰掌握车辆当前所在的省、地市、区县到实时位置。当前疫区车辆分为当前在高风险区域的车辆以及中高风险区域的车辆,车辆类型分为危货、两客、普货等,清晰直观;14 d 内驶离疫区车辆分为当前在辖区内的车辆以及当前在辖区外的车辆,车辆类型也分为危货、两客、普货等,强化疫情期间的车辆管控工作。
通过建立市-县区-企业三级联动抽查、处置闭环管控,市级管理部门日常可通过平台自动抽查功能实现对车辆的自动抽查,问题车辆所在企业需要对抽查问题进行整改,区县督促,企业整改后通过线上反馈和自动跟踪检验,印证企业监管责任落实情况,实现市级通过大数据分析锁定抽查对象→区县级落实抽查推送→企业接收整改→反馈整改情况→区县及市级自动跟踪检验闭环管理。
通过与交通运输部平台结合,将部平台的联网联控数据以月度考核的形式展现,直观了解每项考核项在每月成绩,可查看本市在全省范围内联网联控的成绩走势及当前成绩排名,并可清晰地查看各指标数据,入网率、上线率、轨迹完整率、数据合格率、平台连通率、平台查岗响应率等指标都有指标值及对应分值。通过对每天企业抽查→整改→跟踪的落实,提升全省联网联控考核工作排名,通过“省内排名”和“市内排名”及时掌握每月排名情况,对较差区县进行督查,加强抽查,形成良性循环,从而全面推进联网联控考核成绩的稳步提升。见图5。
交通运输领域与大数据技术的交互融合,可以促进交通行业的发展进程,加快交通相关领域间的数据交流和资源共享。随着大数据技术的发展,会提供更多的应用场景,也应加强相关人才的培养,正视与其他国家的技术差异,进一步扩展大数据技术的应用领域,对提升我国交通行业管理水平、服务水平有重要意义。