丘建栋,庄立坚*,梁嘉贤,宋家骅,段仲渊
深圳市城市交通规划设计研究中心有限公司
城市交通综合治理是大中城市改善交通的重要抓手。在深圳市交通拥堵治理工作方案,“强结构、优服务、调需求、重科技”的背景下,急需建立一种快速响应、高效处理、主动预防的综合治理新模式,实现城市开发与交通承载相适应,有效改善交通出行环境,提升市民幸福感。随着“互联网+”和大数据出现,推动大数据与交通领域融合创新,依托交通大数据,实现城市交通数据的全覆盖、全关联、全开放和全分析,探索交通大数据在城市综合治理的应用,是实现被动改善到主动治理、设施扩容到管理提升、感性认知到量化监测转变的关键点。
大数据(Big Data, Mega Data)指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产[1]。2008年8月,大数据概念由牛津大学教授Viktor Mayer最早提出。在他编写的《大数据时代》中,大数据指不用随机分析法(抽样调查)这样的捷径而采用所有数据进行分析处理的研究方法[2]。大数据有4V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)[3]。
大数据的基本概念包括:①并非有大量数据就可以被称为大数据;②大数据更加关注相关性而非因果;③大数据关联与挖掘后,把孤立的数据联系起来能相对完整描述一个对象;④大数据主要用于预测,可以预演未来的结果。因此,业界的共识是,大数据等于海量数据加分析方法加预测结果。
除居民出行调查、道路交通量调查等传统调查方法以外,多渠道的交通数据来源将为交通模型提供海量多元的非关系型数据。这些数据最初用于其它目的,而后被引入交通分析评估。交通大数据可分为六大类:
①人的移动。包括手机信令、个体位移、导航软件等;
②车的移动。包括出租车、公共汽(电)车、客货车GPS数据;
③定点检测。包括地感线圈、地磁数据、视频识别、车牌识别等;
④交通收费。包括停车收费数据、IC卡数据、出租客运、公路与铁路车站收费数据等;
⑤交通安全。包括交通事故处理及位置等数据;
⑥传统基础。包括用地规划、交通网络、社会经济和交通需求等。
交通大数据具有5大特征。
①客观性。大部分数据不需要访问被调查者,而是由传感器主动获取,可保证数据的客观性,发现静默者,包括老人、小孩或者较不活跃者。
②多元性。不同渠道的数据从不同方面反映交通特征,数据之间可以相互校核。
③稳定性。可以在多个时段对调查目标反复验证,降低极端数据的干扰。
④准确性。缩减抽样、访问、填写、录入等人工操作环节,提高数据准确性。
⑤廉价性。数据获取成本较传统调查低廉,检测设备一次投入可反复使用,而大量数据原本用于其它目的,经数据转换后可成为交通分析数据源。
尽管大数据在交通领域的应用刚刚兴起,中国大城市的交通研究机构、高德百度等地图公司、京东阿里等电子商务企业均已开展实际应用。尤其是中国主要的交通研究机构逐步开始利用交通大数据,变革传统的调查方法,使交通分析开始由抽样数据分析向全样数据分析转变。
2006年,深圳市城市交通规划设计研究中心建立“深圳市城市交通仿真系统”,成为中国较早运用动态数据,实时评估交通运行状态的城市[4]。2010年,北京交通发展研究中心推出“北京市道路交通指数”,把复杂的道路评估用简单的指数形式呈现给政府和市民,交通数据由政府走向民间[5]。2014年,百度推出春运迁徙地图,依托强大的地图和移动终端用户数据为用户提供及时、全面的春运出行信息,帮助用户更好的规划行程。2014年,高德交通季度分析报告基于海量历史路况数据分析出不同区域在不同时间段内的拥堵延时指数,首次推出主要城市拥堵延时指数排名[6]。2017年,阿里巴巴发布城市大脑1.0智能治理城市系统,采用实时路况监测、智能配时优化等措施破解交通拥堵问题[7]。2018年,高德连同阿里一同打造城市大脑智慧交通体系,结合已有的拥堵延时指数,量身定制“堵城”的“高德方案”。
运用城市运行产生的多源大数据,包括浮动车GPS、公交IC卡、固定检测线圈(视频)、车辆识别系统、手机移动数据等,在一定程度上代替原有大规模的交通调查方式,有效节省城市交通分析的成本并提升工作效率。同时,传统方式无法实现的调查,如长时间不间断调查、公交IC卡和移动终端追踪等,通过大数据挖掘得以实现。
总体上看,大数据在交通分析领域的应用取得了一定突破,但大部分城市尚未实现交通大数据在城市交通综合治理的应用。因此,本文系统梳理了交通大数据集成关键技术,以深圳市为聚焦点,总结了交通大数据在深圳综合治理中的应用实践。
深圳城市交通大数据集成的关键技术,将实现从“数据采集—数据融合—决策支撑—共享服务”的全流程处理,具体体现在以下几点:
数据采集关键技术以“出行环境+出行感受”多目标为驱动,实现对数据整合和集成化采集,实现对人、车、路等核心要素和交通、环境、安全等多维细分领域的全面感知。主要关键技术包括:
(1)基于海量数据的多元多维度数据体系构建
建立多维度的交通大数据公共平台,通过集成交通、土地、环境、安全、气象、政策等多元数据,采用数据集市与数据立方体,搭建面向分析的交通大数据多维度特征指标体系。
(2)高可靠、高扩展的交通大数据标准化架构搭建
交通大数据标准化架构搭建基于Hive数据仓库封装,分布建立原始数据库、元数据库、基础信息库、指标库等多层级数据库架构,实现ETL数据抽取,形成高可靠、高扩展的基础数据库。
(3)考虑未来自动驾驶场景的智慧道路集成化数据采集
图1 数据采集维度
图2 交通大数据标准化架构
智慧道路集成化数据采集技术基于路口级中枢与路段级管廊,结合路面传感器,采集包括车道流量、排队长度、进口道流量、行人流量和信号灯配时等实时数据,实现对道路的全息感知。其中,路段以智慧交通杆为核心,结合高精度图像识别、多模态信号控制等算法,实现“人—车—路—环境”的数据全面采集与交互;路口以智慧信号机为载体,采集车辆轨迹、车辆状态、交通安全等信息,实现基于LTE-V/DSRC短程通讯与信号控制策略的自适应耦合联动,全面感知动静态交通运行,支持车路协同应用。
数据融合体系以分布式计算技术为基础,构建一系列快速应用、组合的通用关键技术群,为数据应用提供标准化支持,关键技术包含:
(1)时空关联分割的分时、分区、分布式计算技术,集成Hadoop分布式存储、Spark Streaming实时数据处理和Hive大数据交换等技术手段,考虑交通大数据的时空属性,实现对结构化与非结构化增量数据的快速存储、大规模实时运算与便捷共享。
(2)基于人工智能的城市道路险情快速检测技术,建立多类别路面险情图像数据集,搭建分层级联判别静态险情的框架,实现边缘计算与云计算的深度学习融合;针对道路视频监控的时间点局部性,对动态险情识别引入NoScope引擎优化视频检索。
图3 智慧道路集成化数据采集技术
(3)基于多层贝叶斯网络的交通异常事件精准识别技术,建立以历史数据推导先验概率,以实时天气、道路运行速度和道路流量为判断条件,以交通异常事件(道路积水、交通事故等)是否发生为判断结论的多层贝叶斯精准识别模型,实现对交通异常事件的精准识别。
(4)本地化、多层次的交通碳排放核算技术,建立本地化的交通排放模型参数,包括交通特征的本地化、行驶工况的本地化、排放因子的本地化和车队模型的本地化,确定了不同车型、不同行驶工况下的4 500个排放因子;建立“自下而上”的核算流程,以单个路段单个车型的排放为基础,实现从路段片区到市域的交通排放核算[9]。
(5)基于动态自适应加权的多源交通流数据融合技术,结合出租车GPS、公交车GPS、手机信令、两客一危GPS等交通流数据,分别建立数据级、特征级与决策级的耦合融合模型,以数据质量、时空覆盖范围等多因素为依据,构建时空差异的多数据源动态自适应加权模型,实现可靠数据为主、其余数据为辅的融合框架,实现城市道路多源交通流的有效融合。
(6)多方法耦合的交通流预测技术,基于改进神经网络、改进KNN近邻、LGBM等方法的融合,解决不同时空下速度、车流量等参数预测的精确性、效率性和多维性难题。
(7)基于锚点理论的惯常性出行模式辨识技术,针对手机信令数据,提出了基于锚点理论的惯常性出行模式辨识方法,构建用户全出行OD,挖掘用户的个人出行特征信息。
决策支持关键技术结合多元化综合交通数据库,分别建立多层次一体化模型体系、在线仿真技术体系和智慧交通管控技术体系,实现从一体化模型、仿真推演到宏—中—微观交通流管控的决策支撑。
(1)多层次、一体化交通模型技术
多空间层次。分为区域、宏观、中观、微观共四个模型层次,分别用于支持区域、市域(组团)、分区(片区)、关键路段和节点等不同空间层次的交通规划技术分析和决策支持需要。
多层一体化。在遵循预定交换标准、接口、技术的情况下,通过网络切割或融合、矩阵切割或合并等技术,达到不同层次模型间的输入输出数据的顺畅交换,实现不同层次交通模型的一体化。
(2)大规模路网车道级实时在线交通仿真技术
图4 基于图像识别的道路险情异常识别
图5 多空间层次交通模型体系
建立了从动态车辆OD估计、动态路径决策、动态流量加载到短时交通流预测的实时在线交通仿真技术流程,实现了从“源”到“流”的交通状态的再现和推演。有别于传统最短路径搜索或者动态路径搜索,根据现实中驾驶员路径选择的自学习特征,提出基于(浮动车、网约车或者导航车辆等的)真实路径集的动态更新,进行路径集的合理延展和分配,从而有效的提升路径选择的准确性。
(3)智慧交通管控技术
建立“宏观—中观—微观”三层次耦合的交通管控技术,主要表现在:
宏观层面,通过分析市域、区域间交通出行需求总量和时空分布,制定调控策略和配套手段管控跨区交通出行,在时间上削峰填谷,空间上控密补稀,实现区域时空平衡。
中观层面,通过分析片区道路间交通运行状况,利用单向交通、车速限制、交叉口转向限制、车辆分类通行等措施及平行道路信号灯控协同调节,以均衡流量、提高效率,实现片区时空平衡。
微观层面,利用交通仿真手段,针对节点控制交通时空分布,在时间、空间分离交通冲突,车道渠化上寸土必争、信号配时上分秒必争,实现单点时空平衡。
以共享和服务为原则,面向政府、行业和公众共享信息与服务,制订共享开放规则,研发车路协同、定向诱导、全出行链(MaaS)的关键技术。
(1)数据共享开放规则
构建面向不同类型(政务、运营、社会、自有)、不同对象(政府、企业、创客、公众)、不同权限(高、中、低、公开)的分级开放共享体系,形成标准化的数据存储、共享与算法规范,避免大数据乱象,促进行业健康发展;研发公众开放平台API,构建安全、可靠、规范的动态鉴权机制,在保护数据的基础上推动万众创新。
(2)特种车辆车路协同技术
图6 实时在线交通仿真数据流
基于LTE-V/DSRC车路协同技术采集数据,通过车载单元同信号系统联动,实现公交车/救护车等主动信号优先控制,保证在经过交叉口时优先通行。
(3)基于多目标体系的全出行链服务技术
构建“出行环境+出行感受”的多目标体系,为用户提供基于全出行链(MaaS:Mobility as a Service)的综合交通信息服务。基于多源数据整合及多方式诱导策略,面向个体出行前、出行中和出行后的全过程动态跟踪,结合交通指数、交通预测、交通排放、天气、停车位、公交指数等综合信息,制定面向全方式、全过程的交通诱导策略,提供“数据-策略-服务”的整体智慧出行方案。
依托交通大数据集成关键技术,深圳市为道路拥堵治理、规划决策、精准管控服务、安全环保、共享服务等城市综合治理问题提供决策评估服务,有力支撑了近年深圳城市交通综合治理发展。
(1)深圳市交通综合拥堵治理行动计划。利用道路交通运行指数平台、公交服务指数平台监测常发拥堵路段,做到针对性地、有重点地进行深圳市道路交通拥堵治理,同时利用交通一体化模型支撑公交专用道设置及优化。以新彩隧道公交专用道为例,前期采用一体化模型技术的仿真模型初定的实施时段是全天24小时,在实施的过程中跟道路交通运行指数平台的反馈信息优化实施时段。自2014年实施治堵以来,公交客运量较去年同期增加9.7%,达653万人/日,创历史新高;伴随着公共交通客运量提升,路面车速稳中微增,中心城区高峰路网平均车速与去年同期相比逐步回升,达27公里/小时。
(2)深南大道交通改善。利用一体化交通模型技术对深南大道仿真,发现其拥堵主因,并提出采用中航路做内部微循环,通过两次左转弯实现右转功能的方式实现改善,同时配合调整路口渠化、优化信号配时等措施。相比传统道路改造方案,采用微循环改造费用低、改善效果显著,改善后东西向通行能力提高12.5%,排队长度减少15%。
(3)交通枢纽站点的布局优化。利用一体化模型技术对华强北地铁站高峰时间的客流进行提前校核。经仿真后发现,华强北的3站2区间原铁三院的施工图存在两个瓶颈点。若执意保留该设计,未来实际运行后将会造成节点拥堵,严重会发生踩踏等安全隐患。结合仿真结果,重新修改设计方案,站点建成后,结合对线路运营时间、发车班次等优化,站点人潮拥堵现象较少发生,与仿真改善方案的结果一致。
图7 华强北交通改善测试分析
依托综合交通大数据的决策支持技术服务,支撑了深圳市20余项重大公共政策研究,具体包括对停车收费政策、网约车管理、高速公路回购等多项重大交通战略的准确评估和快速落地,切实做到政策落地的有据可依。
(1)深圳市停车收费政策调整。利用交通大数据集成技术构建整体评估模型,利用道路交通运行指数平台和碳排放检测平台等对停车收费政策实施前后对比分析。项目实施后,路边停车规模下降,停车秩序上升,道路交通运行速度显著提升,主要路段晚高峰车速平均上升12%~15%,机动车碳排放有所下降,工作日晚高峰碳排放平均减少约4.6%。
(2)深圳市网约车政策研究。通过利用大数据处理技术对车牌识别数据进行分析,挖掘网约车的日均规模、出行特征等信息,同时利用道路交通运行指数平台对网约车出现前和出现后的运行交通规律进行分析,得出网约车的控制规模、车型等管理细则。利用大数据决策支撑技术,一是能快速评估网约车的整体规模和特征,实现政策的快速落地;二是分析得到的结果能保证大部分出租车和网约车司机的利益均不受损害。
(3)梅观高速等高速公路回购分析研究。梅观高速是深圳的重要纵向通道,承担城市通勤、区域出行、过境出行等复合功能,因此市政府决定回购梅观高速,并全线进行市政化改造。利用一体化交通模型技术对梅关高速等高速公路的流量进行预测。依托交通量预测结果,估算每年梅观高速公路收费收益,评估现状年折现收益,为市政府确定回购梅观高速的成本。
(4)交通需求管理政策。利用道路交通运行指数数据,对实施前后的效果进行评估;利用大数据计算技术对车牌识别数据进行挖掘分析,监测不同区域、路段车辆归属地构成,为制定限外范围提供了定量支撑,评估政策实施后的外地车比例变化,限外效果,构建“规划—实施—评估—调校”的动态循环工作模式。
利用交通大数据平台,支撑重大基建项目,准确把握基建方案问题症结,对比评估方案实施前后情况,先后运用在城市道路交通基建建设、轨道交通建设、路网改造等。
(1)利用碳排放监测平台辅助进行绿色交通设计系统,评估丽山路南延等重大交通基建、留仙大道-10号路交叉口等精细化改善的环境影响,量化“绿色”等级,校准规划方案;成功落实了大学城站、塘朗站两处接驳首末站的土地开发项目的绿色交通控制要点,支撑约2.5公里市政道路的规划审批工作,指导建设5公里的自行车道。
图8 网约车、出租车客运量变化
(2)通过搭建在线仿真系统和大数据公共服务平台,降低管理成本,全市高峰期平均车速维持在25km/h以上,通勤时间平均可节约2分钟以上;实现突发事件,快速评估分析交通紧急预案优劣,制定有效的交通诱导方案。
(3)实时运行状况和变化趋势信息发布,定量化的精确道路交通运行和公共交通评估服务,有效提高政府决策效率,积极应用到包括:深圳市城市交通白皮书、深圳市停车发展政策及实施方案、深圳市交通拥堵综合治理近期规划等项目,有效提高政府的规划决策能力。
在安全环保方面,有以下几个方面的应用:
(1)利用大数据平台对“两客一危”车辆的运行轨迹监测;
(2)建立碳排放实时监测平台,监测城市交通的碳排放情况,在国内尚属首创;
(3)城市道路积水点监测与影响分析评估系统,实现对积水点的有效监测,特别是针对台风天气,能及时预报台风过境后的道路积水信息和道路交通指数;
(4)利用腾讯的实时数据,建立热点区域的人流密度安全监测系统,同时对节假日期间的人流密集情况提出预警制定解决方案,并提前告知公众。
(1)智慧停车泊位共享。利用数据共享开放规则、大数据处理技术和智慧停车系统,依托“互联网+政府开放”数据模式,在全市开放空停车位信息,并将车位信息共享给百度、高德等互联网导航软件,实现高效的资源整合和利用。
(2)道路路况实时发布。依托深圳市道路运行交通指数系统,实现道路路况实时发布,支持对实时和历史的热点片区和道路关口的道路运行指数、拥堵等级、平均车速等信息的查询[8]。
图9 突发事件应急发布与诱导
图10 深圳道路积水监测(左),碳排放监测(右)
图11 深圳道路交通运行指数系统
(3)全出行链智慧服务。以出行者体验为导向,提供基于MaaS的个性化、全过程智慧出行服务,以轻量化微信小程序、互联网导航APP合作等多种渠道发布出行服务。
集成综合交通大数据关键技术,实现了交通大数据“采集-融合-决策支持-共享服务”的一体化处理流程,通过深挖交通潜力、支持重大政策出台、精细化诊断交通问题等,为深圳市提供拥堵治理、规划决策、精准管控、安全环保、共享服务等方面的城市综合治理应用,有力支撑了近年深圳城市交通综合治理发展。