汪瑞琪 陈建均
(1. 广东省交通运输规划研究中心,广东 广州 510101;2. 广州市交通规划研究院,广东 广州 510375)
大数据 (big data) 是指在一个可承受的时间范围内,常规传统软件工具无法捕获、管理和处理的数据集合。
“大数据”的内涵正在不断扩大,它是包括数字、文本、声音、图像和视频等所有有价值信息的总称[1]。其特点为Volume (海量性) 、Variety (多样性) 、Veracity (真实性) 、Velocity (高速性) 、Value (重要性),可以概括为5V。
大规模数据为交通信息和交通数据的处理和分析带来了许多挑战。国务院于2015年印发《促进大数据发展行动纲要》,首次明确提出建设数据强国,至此大数据发展正式上升为国家战略。
“大数据”成为城市规划热点的主要原因有两个。第一,大数据在电子商务、移动互联、社交网络等领域的成功应用,对人们的生活方式产生了影响,激励着规划者们将大数据系统应用在交通领域。其次,城市规划传统上并不依赖数据,常常被诟病为太软、不真实和不科学,而大数据无疑可以弥补这个缺点。大数据背景下的分析框架如图1所示。
图1 大数据背景下的分析框架
1.2.1 “大数据”背景下交通数据的采集技术
利用大数据的交通信息数据采集方法让交通运输行业发展更具前瞻性和科学性。主要表现为:一是能够快速、及时地反映交通基础设施的状况,为应急救援提供最有效、最直接的信息技术和决策支持;二是能够获得交通运行的连续观测数据,为道路管理措施的制定和公共交通政策的研究提供了动态依据。第三,通过对居民出行信息的动态采集,很好地解决了抽样调查只能获取单时段数据的问题。第四,动态,实时地观测交通拥堵状况,持续评估缓解拥堵政策的实施效果。
1.2.2 “大数据”背景下交通数据的管理技术
当前海量的数据源、多样的数据类型给交通数据管理带来了新的挑战。第一,大数据的归档存储及数据更新成为交通数据管理中亟须解决的重要问题;其次,多样化多类型数据的统一化和精确化管理是交通数据管理的关键研究方向;第三,缺乏及时有效的数据提取与处理手段,建设智能交通的前提是构建交通数据处理模型。第四,面向管理部门、科研机构及运输企业等多用户的数据实时共享与交换系统,需要满足不同用户对流量数据的多样化需求。
大数据技术的发展使管理者和研究者能够更深入地观察规划对象。大样本的优势使人们能够更准确地细化不同类型活动的居民的空间分布结构。连续追踪观测的优点使得观测城市交通行为的连续变化过程成为可能。多角度综合观测的优点使规划对象能够通过多源数据从不同角度更全面的研究。多尺度的优点可以使人们在不同的时间和空间测量条件下,研究交通宏观与微观的关系成为可能。
基于数据的建模方法可以从多维数据中学习复杂模式从而有效的弥补未被记录的活动。从大型社交网站的数据中可以推断出个体的活动特征,实现基于数据主题的建模。
移动通信网的信号覆盖逻辑上设计为由若干的六边形基站组成的蜂窝网络业务区,移动终端总是与其中一个基站保持联系。移动通信网络控制中心定期主动或被动记录各移动终端时间序列的基站手机号信息[2]。具体示意图如图2所示。
图2 移动通信网络中手机用户出行轨迹示意图
将手机移动用户时间序列的信令数据映射到真实的地理空间位置,从而完整客观地还原手机用户的出行活动轨迹,分析得到常住人口的地理空间分布特征和城市居民出行活动特征的动态信息。
主要研究思路包括:首先,利用手机定位数据分析居民在移动通信网络中的活动;其次,建立移动通信网络信号与所覆盖的空间地理数据的对应映射关系,分析移动用户在城市空间中的活动路径。第三,运用移动用户活动模型、出行配流模型、时空聚类算法和移动模式识别算法等对移动用户群体的活动特征进行分析和挖掘。第四,将手机用户样本扩展到一般人群 (包括手机用户和非手机用户) 进行特征指标分析,如人口居住和工作场所的分布、流动人口活动特征、区域间客流的交换、城市发展轴线的延伸分布、核查线或关键通道客流与周边城市客流联系等。
2.3.1 地理位置特征
随着卫星定位技术和信息通信技术的进步,实现对手机用户的自动识别、定位、跟踪、控制和信息的互换。手机用户每天出行时都会在无线通信服务提供商的信息数据库中留下电子足迹,利用GSM、WIFI、RFID等定位技术和通信技术相结合,基于无线局域网实现对物体的智能化、实时化的识别、跟踪和管理。也就是说,随着移动电话使用频率和定位精度的不断提高,移动通信服务提供商连续积累了大量的手机用户轨迹数据,为研究获取城市居民出行规律提供了丰富的数据资源。用户的地理位置反映了相邻区域间的紧密联系,挖掘这些数据的轨迹特征,实现实时交通状况监控日益引起各领域广泛的关注[3]。
2.3.2 城市用地特征
城市用地特征是科学开展城市规划的基础和前提,是影响基础设施建设、公共资源分配、社会经济发展、生态环境持续的最根本因素。
利用社交网络数据可预测城市土地利用(见图3)。通过手机用户在一段时间范围内在一定区域范围出现的天数频率,判别为常住性的手机用户群体,从而分别识别出夜间和白天活动最为频繁的区域近似为居住和工作地点,以收集每个区域相应规模的居民和工作人口。
图3 基于手机定位数据的实际及预测用地信息
2.3.3 居民出行分布
出行指的是人从始点到终点的一次移动,出行数量的多少为出行量。区域客流的产生量,指的是人以某个区域为出行始点产生的出行总数(见图4),区域客流的吸引量,指的是人以某个区域为出行终点产生的出行总数(见图5)。对不同类型土地利用对客流的产生吸引量进行分析,得到不同类型土地利用产生吸引率,以此作为预测基础,可以有效地提高交通需求预测的可行性及可靠性。
具体的分析法可以按照基于家、工作地等不同出行目的统一不同日期 (工作日、周末) 、不同时间区域 (高峰、平峰) 间的人的出行量的变化情况,来作为分析不同区域间交通联系紧密程度的依据。同时,可结合区域周边交通基础设施的布局情况,分析城市内部人们的空间出行轴向,为城市总规的编制与区域发展规划提供定量支撑。
图4 区域出行产生点
图5 区域出行吸引点
基于手机移动数据的城市交通规划决策支持系统,是整合交通信息采集与融合、交通信息传输与管理、交通信息服务发布等形成的一个新环境系统[4]。该系统有效地利用了基于移动计算的全区域广覆盖、无线传输快捷等特点,充分利用了移动手机数据占据城市交通出行比例大、城市交通影响范围广等,是通信移动技术与交通运输领域的有效结合与完美统一的具体实践。
目前,随着移动手机的普及,手机流量与覆盖城市的居民活动总量密切相关,而居民活动总量与该地区的活跃人口数直接相关。大量实验证明,手机流量与相应城市居民活动总量成正比,通过对手机流量时空分布的分析,定性地得到了该地区居民活动总量的时空分布特征。然后,根据区分每个区域的交通特征,将具有类似交通特征的区域合并为交通土地单元。此外,在一定的城市地区,可量化的手机流量与活跃人口数量之间存在着统计意义上的正比关系,因此可以得到该地区活跃人口数量的时间分布特征,为交通网络建模和分析提供了良好的依据。
手机信息映射的交通小区与基站的物理覆盖范围密切相关,基于手机数据的交通小区映射将基站小区与移动通信网络基站相结合,将基站小区映射到交通用地上,提出了一种更精确的基于手机信息的交通小区映射方法。该方法在基站覆盖的物理范围基础上采用更精确的交通小区和OD矩阵。所谓“修边”是将基站的覆盖范围映射到交通小区,并将基站覆盖范围与交通小区的物理覆盖范围进行逻辑整合。
另一种方法是利用手机基站数据,提取其中具有交通特性及与交通产生吸引有关的趋势数据,再利用聚类分析方法将交通属性相近且基站距离近的数据集划分为一个交通小区。基于手机数据的活动人群分布如图6所示。
图6 基于手机数据的活动人群分布
前面已经提到了一个试验结论:在相应的城市地区,手机流量与城市居民出行总量之间存在正相关关系。换言之,移动电话信号在基站之间移动的方向可以看作是个体出行的方向,通过建立的基站覆盖范围与交通小区的映射关系,将基站覆盖区域内手机用户的出行方向和位置映射到划分的交通小区,得到相应的客流OD数据。
传统的交通数据调查每年都需要花费大量人力、物力和财力,而基于手机定位的交通数据采集与处理技术是对传统方式的重要补充,是一种广域动态的客流探测技术,为交通调查和交通规划提供了实时依据。一方面,手机数据能够通过定位信息分析动态客流状态,充分把握当前的交通状况,从出行链、职住特征、人口动态、出行方式距离、活动轨迹等进行个体活动规律的研究,从而进行区域活动特征、走廊活动特征、节点活动特征的分析应用。另一方面,移动数据可以应用于交通规划的需求预测,同时通过交通诱导、交通信息服务为交通拥堵治理、智能交通应用等提供了一定的条件;也可用于交通规划的后评估和模型参数的修正,从而真正实现交通规划的建模、定量化和科学化[5],使人们重新认识交通需求以及交通运行的内在规律。