管娜娜 田 苗
(成都市规划设计研究院,四川 成都 610041)
近年来,成都市致力于探索数据和模型驱动的交通规划理念,依靠构建交通数据库和多层次综合交通模型技术,能够极大地提高交通规划决策的科学化水平。2016~2017年,成都市开展了新一轮综合交通调查和交通模型体系构建工作,并将手机信令数据、车载GPS数据、视频监测数据、交通运营数据等多源交通大数据纳入规划决策支持体系。本次以双流区为例,阐述大数据对交通规划技术创新、交通需求分析的支撑作用。
交通与城市的土地利用、人口构成、经济收入、车辆保有、交通条件等有着密切的关系。交通规划的理论基础是基于综合交通调查建立“四阶段”交通需求模型,调查的门类包括居民出行调查、公共交通调查、道路流量调查、专项调查等,传统交通调查采用人工方法,每一项调查都涉及极大的工作范畴和工作量,比如居民出行调查需要通过入户询问进行信息采集,数据获取成本高、时耗长、时效性短。在大数据蓬勃发展的背景下,大数据为研究者提供了针对城市交通的一种多角度、多层次、多测度的大样本连续观察能力[1],借助交通大数据的“大样本”“连续追踪”优势,使得整体把握交通态势与趋势成为可能。
基于交通大数据的空间的联系与活力、居民的出行特征、交通与居民活动空间的关系等研究成果逐渐涌现。北京、上海、天津等城市在最近的城市综合交通调查中均充分挖掘交通大数据资源,主要包括遥感影像数据、移动通信信令数据、车载GPS数据、公交IC卡数据、RFID监测数据等。交通大数据为交通模式提供了更加全面的原始数据[2],上海、广州、重庆等城市不断探索通过挖掘大数据改进交通模型技术,比如遥感影像数据用以挖掘城市用地特征,移动通信信令数据用以分析人口分布、通勤特征,公交IC卡数据用以分析轨道和常规公交出行特征,RFID监测数据用以分析小汽车总量和运行分布[3]。大数据技术将会越来越广泛地应用于城市交通规划和决策,特别是模型的构建和维护中[4]。
(1) 元数据。
手机信令数据为依托运营商建立的信令监测平台,采集手机与基站之间信令数据交换。触发数据交换有两种方式,一是通话、短信、上网、区间切换等主动行为;二是基站定期扫描其覆盖范围内手机的在线情况,形成一条被动信息记录。基站分布情况如图1所示。手机信令数据记录内容如表1所示。
图1 基站分布情况
表1 手机信令数据记录内容
本次研究采用中国移动通信运营商提供的2016年3月14日~3月20日为期一周的双流区境内所有基站采集到的全量数据,总记录条数8249万条,有效日均信令数据1 178万条。
(2) 数据处理。
对手机信令数据的处理分为两部分,第一部分为静态分析,通常以停留时长作为判定原则识别手机用户类型;第二部分为动态分析,根据经纬度信息生成居民出行链,进一步分析出行OD。
①静态分析处理过程:
数据清理:以用户ID为唯一标识,统计每个ID一周总记录条数,剔除一周记录条数不足7条的用户ID对应的所有记录。
数据排序:以用户ID为唯一标识,按时间排序,提取其记录时间在每天22:00~次日6:00时间段内的所有手机信令记录,用于判定常住人口;提取其记录时间在9:00~18:00时间段内的所有手机信令记录,用于判定通勤人士。
用户类型识别:将一周7天内至少有4天从22:00~次日6:00在同一位置停留6小时作为常住人口判定原则;将一周7天内至少有4天从9:00~18:00在同一位置停留4小时作为工作人口判定原则。
②动态分析处理过程:
数据清理:一次出行至少应有3条记录,为此预先剔除一天记录条数不足3条的手机记录。
出行记录识别:首先,以手机号为索引,按照时间先后顺序,生成某人全天行动轨迹,并计算上下两条记录的间隔时间和平面距离;然后,以20 min为阈值,将全天出行轨迹截断为多条出行记录;然后根据每条出行记录,汇总出行距离、单次出行OD等信息。
(1) 元数据。
本次研究采用成都网阔信息有限公司平台提供的货运车载GPS数据,车载GPS每条记录涵盖信息包括:序号,车牌号码,GPS时间,经度,纬度,隶属公司,车辆速度,车辆方向等信息。车载GPS数据记录内容如图2所示。
图2 车载GPS数据记录内容
(2) 数据处理。
首先采用网络爬虫技术,从网阔信息GPS企业平台页面上爬取了双流区境内482辆货车的GPS定位信息;然后在eclipse开发平台上,对货运GPS原始数据进行处理,生成每辆车每次出行轨迹。
传统获取居民出行特征的方法为居民出行调查,采用调查问卷的方式进行抽样调查,抽样率通常为1%-5%。在分析居民出行特征时,需要对调查数据进行扩样和校核,在扩样的过程中数据难免存在一定程度的“失真”,因此,校核工作对准确反映全体居民出行特征是至关重要的。手机信令数据具备“大样本”“连续追踪”的优势,能够更为精准地反映城市居民出行特征,起到对居民出行调查的补充和校核作用,本次研究通过手机信令数据识别出双流区现状居民的出行总量与出行率、出行距离等特征,有效地对居民出行调查的数据进行了校核。
(1) 出行总量与出行率。
通过手机信令数据分析居民出行OD,得到双流区现状居民日均出行总量为80.6 万人次/日,人均出行次数为2.37 次/日。通过居民出行调查测算的人居出行次数是2.16 次/日,可以看出手机信令数据测得的人均出行次数略高于居民出行调查的结果。因此,本次研究采用了两者的平均值2.27 次/日。双流区出行量与出行次数分布图如图3所示。
(2) 出行距离。
居民总体平均出行距离为5.4 km。其中,约66 %的居民出行距离在5 km以内,说明双流目前平均出行距离较短,中长距离的跨区出行量较低。还有约34%的居民出行距离超过5 km。双流区居民出行距离分布图如图4所示。
图4 双流区居民出行距离分布图
(3) 对外交通分布。
对外机动车OD调查通常需要采集高快速路、国省干道、主次干路的全天双向的交通量,通常采用传统的人工调查法结合固定检测器采集法进行调查,固定检测器需要埋放在道路下方,且容易损坏,数据获取成本高。
通过手机信令数据对双流区的客流OD进行分析(见图5),能够更为准确客观得出双流区与成都市中心城区、天府新区成都直管区、温江区、新津等周边城市片区之间的现状交通联系客流量。其中,双流和中心城区的客流交换量最大,达到51 065 人次/日;其次是高新区,达到29 450 人次/日;与直管区的客流交换量为25 574 人次/日。上述对外交通分布为分析现状区域交通运行状态提供了支撑,结合现状区域联系通道的建设情况,联系成都主城区的双楠大道、成双大道、大件路高峰期较为拥堵;而联系高新区的通道数量不足、通道等级低,因此,为确定区域交通通道方案奠定了基础。
图5 双流区现状OD分布图
大城市的居民出行调查往往5年才开展一次,中小城市的调查数据更是极为匮乏。而手机信令能够获得“当前的”“连续的”数据,从而对交通需求模型中的参数确定起到校核和验证的作用。本次研究采用面积原单位法来测算交通生成量,即通过不同用途的土地和开发强度下的交通吸引率和发生率来计算交通区的生成量。首先,通过手机信令数据可以快速统计出各个交通区的生成量,然后通过回归分析,可以得到各类用地的交通吸引率和发生率。结合规划年的用地布局和开发强度,进而可以测算出规划年的各个交通区交通生成量。规划年各交通中区交通发生量与吸引量如图6所示。
图6 规划年各交通中区交通发生量与吸引量
传统的调查方法很难区分特定人群的出行行为,而手机信令数据在分析特定人群的出行特征方面具有较好的适用性,特别是通勤出行的研究,通过定位到用户的居住地和工作地,能够有效地对通勤特征展开研究,从而较好地把握整个区域的职住分布和主要的通勤方向等特征,这对通道的规划布局和城市空间结构都有很强的指导意义。
本次研究通过手机信令数据对双流区居住人口和就业人口进行识别,按照一周内有4天于夜间22:00~6:00出现在同一个坐标的为常住人口,分析表明,双流区有44万常住人口(使用移动通信的人口),主要集中于东升老城区6.6 万人(东升街办12.1 万人)、蛟龙港片区和西航港北片区9.5 万人(含6万在校学生)。按照一周内有4天于白天9:00~18:00出现在同一个坐标的为就业人口,分析表明,分析得到区内就业(就学)人口约20万,主要集中于东升老城区、蛟龙港片区和西航港北片区。双流区常住人口分布图如图7所示,双流区就业岗位分布图如图8所示。
图7 双流区常住人口分布图
图8 双流区就业岗位分布图
交通规划需要掌握区域内重要的客流吸发点,手机信令数据在分析特定区域(交通枢纽、大型公共设施、商圈等)的客流来源及目的地方面具有优势。
本次研究对双流国际机场、东升核心区的客流分布进行分析挖掘,可以看出,双流国际机场的客流主要来自区外的成都主城区和高新区;东升核心区的客流主要集中于内部出行,占60%左右。从而对重要集散点的集散通道规划、进出交通组织等提供了依据。双流机场客流分布图如图9所示,东升核心区客流分布图如图10所示。
图9 双流机场客流分布图
图10 东升核心区客流分布图
在传统的交通调查中,货运车辆出行特征调查通常与对外交通调查同时进行,在对外的主要通道设置观测点,进行停车问询,数据采集成本高、工作量大。大数据为货运车辆出行特征提供了更加高效精准的采集方法,通过车载GPS定位信息获取货运车辆停靠点、货运OD数据、货运热门通道,能够识别各个方向的货运联系强度,及现状货运通道存在的问题。
(1) 货运联系强度分布。
通过车载GPS定位信息获取货运车辆停靠点、货运OD数据,得到双流对外货运比例约占总货运量的82%,双流与天府新区、龙泉、主城方向联系较强,温郫方向所占比例较低。基于现状货运OD分布,结合市域“4+N”产业联系将加强,与主城区货运联系将在现状基础上减弱,与龙泉、直管区、简阳等方向联系将不断加强,从而主要增加向东、东南方向的货运通道。双流区对外货运分布比例图如图11所示。
图11 双流区对外货运分布比例图
(2) 货运通道识别。
基于货车出行轨迹识别出货运热门通道主要包括,大件路、双楠大道、成新蒲大道、长城路、剑南大道、珠江路、S108等。从而识别出货运交通组织的问题,主要的货运通道穿越西航港城区,货车对该片区交通组织影响较大,容易带来安全隐患。因此,建议对长城路、珠江路等采取分时段禁行措施,并规划引导客货分离。现状货运热门通道分布图如图12所示。
图12 现状货运热门通道分布图
本文通过将手机信令数据、车载GPS数据等多源数据应用于统一的交通规划体系,实现了传统交通规划理论下的交通大数据的应用实践。大数据充分体现出大样本、连续性、获取方便的优势,使得研究者能够更准确地把握居民出行特性、各区域的人口分布等,并能够与居民出行调查形成良好的校核关系,成为构建交通模型重要的组成部分。同时,大数据也有其局限性,比如数据本身的处理挖掘技术、基于大数据的交通规划理论等方面都存在极大的提升空间。
大数据技术已经广泛地应用于交通规划和交通管理中,随着交通大数据更加多元、集成、智能,交通大数据在交通规划、交通管理、交通决策中的应用是必然趋势。在交通大数据技术的推动下,交通规划理念和管理体系正在经历一场变革,城市交通规划将转向一个适时响应的过程管控平台。