刘 萌, 邬群勇
(福州大学地理空间信息技术国家地方联合工程研究中心, 空间数据挖掘与信息共享教育部重点实验室, 福建省空间信息工程研究中心, 福建 福州 350116)
城市居民活动深受城市功能结构和空间格局的影响, 随着时间变化会体现出明显的特征与规律. 探索居民活动背后蕴含的规律特征可以为交通部门的实施管理提供理论支持. 随着我国城市化进展的加快, 城市空间结构相比过去数十年有了显著的变化, 城市居民活动的空间特征在一定程度上反映出当前城市空间格局. 因此, 研究面向地理空间的居民活动规律[1]可为进一步探索城区间联系、 城市扩张趋势提供参考和借鉴.
研究城市居民活动背后蕴含的特征规律, 主要包含以下手段: 基于问卷调查数据[2-3]、 基于公交车刷卡数据(SCD)[4]和基于出租车GPS轨迹数据[5-6]. 出租车出行随机性很强, 不受线路约束, 乘客涵盖各个年龄段、 各个阶层的群体. 对于没有轨道交通的城市空间, 出租车换乘几率相对较小[7], 上下车点往往是居民真实的出发地和目的地. 因此, 大规模的出租车GPS上下车点(origin-destination, OD点)是研究居民活动情况的理想数据源. 现有基于出租车GPS轨迹数据研究中, 主要有基于密度的聚类方法如DBSCAN[8-9], 以及区划法, 包括网格划分法[7, 10-11]和多边形划分法. 网格法的结果依赖于网格的划分策略, 往往需要基于网格再次聚类[10]; 多边形划分法以交通小区为代表, 基于道路或行政区边界对研究区进行划分[12-13], 或借助划分聚类法如K-means[14]、 SNN[15]来实现, 得到的地块往往具有一定的地理意义, 计算量较小, 适合大规模轨迹数据.
本文基于福州市2015年连续一个月的出租车轨迹数据, 首先从OD点的空间分布和时间分布上把握主城区出租车活动的总体特征, 接着采用基于道路中心点的多边形区划方法来确定活动强度研究单元, 从活动强度的空间分布及不同时段变化特征两个角度探索主城区内出租车活动强度的时空变化总体特征, 在此基础上结合出租车乘客出入情况的时空变化特征进一步把握活动强度背后所蕴含的居民活动时空规律. 最后对主城区居民活动时空特征进行总结.
选择福州市主城区作为研究区, 其范围覆盖福州市三环路及内部区域. 以福州市区2015年5月共500辆出租车的GPS轨迹数据为数据源, 其运行轨迹在空间上覆盖主城区全部范围, 且时间上前后连续, 不存在空白时段, 能够较好地表达出租出行背后所呈现的居民活动时空规律. 原始轨迹点的采样间隔为10 s, 包含字段有记录编号、 出租车编号、 经纬度、 采集时间、 提交时间、 车速以及载客状态信息(0为异常, 3为空载, 4为载客). 在剔除异常记录后, 根据载客状态获取所有O点和D点构成出租车载客的起止点数据. 最后得到有效的OD车点总数共775 890个, 如图1所示.
对出租车OD点按1 h间隔统计, 得到图2所示的一天内出租车活动强度的分布曲线. 定义6时到18时之间(包含时段18时)为白天时段, 其余为夜间时段. 由图2可知: 1)白天的出租活动占总体的51.7%. 除两个通勤时段外活动量的基数都较大, 尤其在10:00~15:00之间, 几乎持平在6%; 相比之下, 夜间的活动变化特征较为显著, 从18时开始逐步增长, 总体活动强度于时段23时内达到一日的顶峰, 占总量的约8%, 之后便急速下降, 一直持续到早高峰时段. 2)早上和傍晚都存在一个活动低谷. 早上的活动低谷位于6时左右, 活动强度不到总数的0.7%; 傍晚的活动强度总体上都大于早上, 16时左右开始下降, 在17时达到该部分的低谷, 但仍超过总量的4%.
图1 出租车OD数据空间分布图Fig.1 Spatial distribution of taxi ODs
图2 出租车活动强度按时间分布图Fig.2 Temporal distribution of taxi activity intensities
研究活动强度的空间分布首先需要对研究区进行划分来确定活动强度研究单元. 出租车行驶轨迹几乎沿道路网分布, 且上下车点的聚集中心与附近道路交叉口之间的距离很近[13], 考虑到以上特征以及泰森多边形具有侧向邻近性和局部动态性的优点[16], 本文采用基于道路中心点的泰森多边形区划方法进行研究单元划分. 步骤如下: 1)道路网自动求交, 得到道路中心点集C; 2)以C中每个成员为站点建立泰森多边形TC; 3)记所有OD点集合为S, 将S与TC叠置, 落入TC中每个多边形内的所有OD点归为一类, 得到簇集{Si}; 4)对{Si}中任一类簇, 以全部成员OD点为站点再次生成泰森多边形然后将多边形全部合并, 从而形成属于该类簇的连续完整的活动单元边界; 5)对{Si}中每一类簇按照4)生成单元边界. 由于OD点分布的不均匀性, 以上划分并没有保证每个单元内都有足够数量的OD点. 过少的OD点在区域出入特征表达上不具有较强的说服力. 因此我们对区域进行了合并. 合并的总体思路是根据给出的OD数量阈值ε, 对每个OD数量小于ε的单元合并到与之邻接且OD数量最少的对象中. 如此反复迭代, 直到所有单元内的OD数量都大于ε即可. 在提取道路网交叉点后, 研究区被初步划分成984个单元, 经过再次合并后最终得到623个研究单元. 对比现有多边形区划法, 本文方法具有如下优点: 1)简单高效, 泰森多边形的建立过程简单且效率很高, 不需要复杂的聚类运算, 即可实现对OD的快速划分; 2)仅依赖于路网要素; 3)能实现对研究区的无缝覆盖. 由于泰森多边形的空间连续性和侧向邻近性, 可以保证每个OD点都能落在对应的研究单元中.
图3 出租车活动强度总体空间分布图Fig.3 Spatial distribution of taxi activity intensities
将所有研究单元内的OD点数量采用Jenks自然断裂点法分成五大类, 由此得到如图 3所示的主城区一月内出租车活动强度的空间分布.
从图3可知, 闽江北岸出租车活动占了总体的绝大部分, 闽江南岸尤其是二环路以南出租车活动量十分稀少, 绝大多数位于总量的0.2%以下. 拥有较高活动强度的区块集中在二环以内中部及偏东的大部分区域, 可将该区域定义为居民活动的核心区. 典型代表有福州火车站、 世欧王庄、 塔头、 阿波罗空港快线等. 除外, 宝龙城市广场、 屏西住宅区、 福州总院、 福建师范大学学生街等二环路边缘区域的活动强度也较为突出; 二环路以外以仓山区万达广场、 五凤兰亭住宅区为主要代表. 其中福州火车站拥有主城区最高的出租车活动强度, 到达了总体的3.2%; 进一步来看, 核心区东部活动强度较高的区域连续成片出现, 其他活动强度较高的区域在空间上都显得相对孤立; 主要交通站点(如图3中标注)的出租车活动强度相比周围地区显得更为突出, 反映了出租车作为应急出行交通工具的特点.
借鉴Guo[15]对深圳市出租车活动情况的研究方法, 将一日按照如下规则分为6个时段: 1:00-5:00记为时段1, 5:00-9:00记为时段2, 9:00-13:00记为时段3, 13:00-17:00记为时段4, 17:00-21:00记为时段5, 21:00-次日1:00记为时段6. 本文所采用出租车数据在时间上已处于夏季, 研究对象为城区的居民活动, 可将时段2、 时段3和时段4归为白天时段, 其余归为夜间时段, 其中时段2和时段5涵盖了居民通勤活动的早晚高峰时期. 采用这种分段方式可以较好地研究主城区居民在白天、 夜间以及通勤高峰这三个典型时段的规律特征. 各时段的出租车活动强度的空间分布如图4所示.
图4 不同时段出租车活动强度分布图Fig.4 Spatial distribution of taxi activity intensities in various periods
白天部分: 时段2的OD最突出的特征表现为空间分布较为分散, 核心区内出租活动不明显. 除火车站和阿波罗空港快线, 该时段大部分单元的活动强度水平都较低; 时段3和时段4, 核心区内外的多数区域活动强度都有了明显的上升, 核心区内外活动差距不明显. 三环附近的区域如软件园、 海峡会展中心、 橘园洲、 鼓山镇的活动强度达到一天中最大值. 与时段3相比, 时段4内各区内的活动强度有所下降, 造成该现象的一个可能原因是福州市出租车于16:00-18:00左右进行交接班, 使得运营中的出租车数量开始下降, 但是活动强度的空间分布却变化不大. 在白天的各个时段内, 福州火车站一直是最活跃的区域.
夜间部分: 由于受交接班的影响, 时段5总体活动相比前两个时段略有下降, 但核心区内的出租车活动优势开始显现并且活动集中性明显, 形成以宝龙城市广场、 阿波罗空港快线以及世欧王庄等独立的活动中心, 核心区外仅五凤兰亭住宅小区、 仓山万达以及福建师范大学学生街维持较高活动强度; 时段6中, 核心区内出租车总体活动强度进一步增强, 以泰禾广场、 塔头等为中心共6~8个连续单元的活动强度与福州站持平, 形成了范围较大的活动中心区. 二环路之外的大型居民区如五凤兰亭、 金牛山公园的活动也比较明显; 时段1处于下半夜, 核心区东侧的活动强度开始下降, 核心区内的出租车活动已有明显北偏的特征. 这一时段核心区的活动优势也是全天内最明显的, 核心区以外的活动情况甚微.
从出租车活动强度角度对福州主城区内居民的活动特征总结如下: 1)活动强度的总体空间分布反映出二环路和闽江作为居民活动空间分布的主要界限, 二环路以内、 闽江北岸所围成的区域成为主城区居民活动的核心区. 居民活动大多集中在住宅小区和商业街, 反映福州市出租车乘客群体的选择偏好. 2)在一日内的不同时段上, 核心区的居民活动优势主要集中于夜间时段, 尤其是晚21时至次日凌晨. 在白天的各个时段, 核心区以外的地块活动较强; 此外, 早晚两个通勤高峰时段活动强度虽然处于低谷, 但都是主城区形态变化的转折处, 也是核心区活动优势变化的转折处.
出租车活动强度体现出了某段时间内该单元人口活动数量的大小特征, 却无法展现居民在该区域内具体的流动变化情况. 为进一步把握这一规律, 本节在活动强度时空规律的基础上, 仍以活动强度研究单元为研究对象, 采用网络流率的手段从出租车乘客出入特征的角度来进行进一步的分析和讨论.
网络流率(net flow ratio, NFR), 是用来表达某一时段某个区域内人流出入情况的量值, 范围为[-1, 1]. 其中第i个聚类区的NFR表达式为:
(1)
式中: ini表示该区域在该时段内的流入人口数量, 可以用D点数量表达; outi表示该区域在该时段内的流出的人口数量, 可以用O点数量表达; NFR越高, 表明当前时段内该地区越倾向于出租出行的目的地, 越低则更倾向于出发地, 接近于0则表示地区出租车的流入流出情况接近平衡.
6个时段内对每个研究单元计算NFR值, 按照如下规则分成5大类. 1) 高流出区: NFR≤-0.3; 2) 次级流出区: -0.3 图5 不同时段出租车NFR分布图Fig.5 Spatial distribution of taxi net flow ratio in various periods 1) 白天部分. 时段2内出租车流出区的比例全天最大. 核心区以外的大多数区域为出租车主要上车点, 集中在海峡会展中心、 软件园、 橘园洲附近. 考虑到该时段包含通勤早高峰, 由此可推测以上地区有可能属于工作区; 与活动强度的分布类似, 时段3~4内出租车NFR分布同样拥有较高的相似度, 总体上都接近出入平衡. 核心区内以平衡区占多数, 体现出出租车在白天以商务出行和应急出行为主的特征. 2) 夜间部分. 时段5的出入特征总体上类似于时段4. 图5(e)中作为出租车主要活动中心的宝龙生活广场、 世欧王庄等都表现为平衡区. 由此可知, 在通勤晚高峰阶段, 主要商业区的人口交互比较频繁, 活动情况较复杂; 在时段6, NFR的整体空间分布呈现明显的同心圆状, 以核心区为中心. 二环路内部的平衡区比例较大并且连续成片, 尤其是东侧的塔头、 东二环泰禾广场等区域, 与图5(f)中的出租车活动热区相对应. 相比时段5, 二环以外的大部分地区出租车乘客流入比例开始上升, 以五凤兰庭、 金牛山公园等为代表的典型住宅区的流入比例较为突出, 表明该时段内处于夜生活的居民已经开始有返家的趋势. 时段1的NFR同心圆分布特征最为明显, 流入区所占的比例达到全天最大. 核心区内部的出租车活动整体上以流出为主, 核心区以外的绝大多数地区几乎都属于高流入区. 由此可知, 主城区绝大部分居民的夜生活在该时段已经结束. 从出租车乘客出入特征角度, 福州市主城区内居民出入情况及其变化特征可概括如下. 1)除时段5, 居民夜间出入规律比白天相对明显. 在夜间, 核心区内尤其是东侧区域人口交互频繁、 活动复杂, 形成主城区夜生活的主要集中地, 核心区以外地区成为主要出行目的地, 整体上的出入情况空间分布呈现着明显的同心圆状, 与活动强度的空间分布相对应; 白天居民出入情况分布散乱, 无法获取明显的空间特征. 结合对应时段的活动强度的空间分布进一步说明白天居民出行情况的复杂性以及夜间出行的集中性. 2)早晚两个通勤高峰的居出入情况相似性不大. 通勤早高峰规律更明显, 与前后两个时段形成较大差距, 说明居民出行目的性较强; 通勤晚高峰时期, 可能由于白日商务出行的延续, 存在大片出入平衡区域. 1) 从出租车活动强度发现, 以二环路以内、 闽江北岸所围成的区域为主城区居民活动核心区; 居民活动大多集中在住宅小区、 商业街和商业广场, 体现了福州市出租车乘客群体的选择偏好. 2) 白天居民活动基数大, 核心区以外的区域活动有所加强且较分散, 核心区以内的活动优势不显著; 核心区内的活动在夜间一直保持优势, 以商业区和住宅区为典型活动代表. 核心区内的居民活动在21时之后至午夜间达到了一天内最高水平; 早晚两个通勤高峰时段对应了核心区活动优势的两个转折, 且这两个时期出租活动强度均达到了曲线的低谷. 综合交接班等出租车运营特征的原因, 说明在这两个时期内可能存在“打车难”的问题, 从另一方面也可推断出这一时期由于通勤活动频繁造成主干道过于拥堵, 出租出行的高效性不明显, 出行成本偏高. 3) 出租车乘客出入情况与出租车活动强度在时空变化规律上存在一定的相似性. 总体上说, 二者在白天的规律都比较复杂, 在夜间都比较清晰、 明显, 共同体现出白天居民出行情况的复杂性以及夜间出行的集中性; 出入特征在某些程度上体现出区域内人口交互的复杂程度, 尤其夜间时段的商业区, 在活动强度的基础上更深一层揭示该类区域内居民活动特征及变化. 此外, 在夜间时段出入情况所呈现的同心圆状的空间分布进一步体现出核心区外居民活动的差异. 参考文献: [1] 陆锋, 刘康, 陈洁. 大数据时代的人类移动性研究[J]. 地球信息科学学报, 2014, 16(5): 665-672. [2] 周素红, 邓丽芳. 基于T-GIS的广州市居民日常活动时空关系[J]. 地理学报, 2010, 65(12): 1454-1463. [3] 孟斌, 于慧丽, 郑丽敏. 北京大型居住区居民通勤行为对比研究: 以望京居住区和天通苑居住区为例[J]. 地理研究, 2012, 31(11): 2069-2079. [4] 龙瀛, 张宇, 崔承印. 利用公交刷卡数据分析北京职住关系和通勤出行[J]. 地理学报, 2012, 67(10): 1339-1352. [5] 李艳红, 袁振洲, 谢海红,等. 基于出租车OD数据的出租车出行特征分析[J]. 交通运输系统工程与信息, 2007, 7(5): 85-89. [6] 程静, 刘家骏, 高勇. 基于时间序列聚类方法分析北京出租车出行量的时空特征[J]. 地球信息科学学报, 2016, 18(9): 1227-1239. [7] LIU Y, WANG F, XIAO Y,etal. Urban land uses and traffic ‘source-sink areas’: evidence from GPS-enabled taxi data in Shanghai[J]. Landscape & Urban Planning, 2012, 106(1): 73-87. [8] MAZIMPAKA J D, TIMPF S. Exploring the potential of combining taxi GPS andflickr data for discovering functional regions[C]// Lecture Notes in Geoinformation and Cartography. Lisboa: Springer, 2015: 3-18. [9] PAN G, QI G, WU Z,etal. Land-use classification using taxi GPS traces[J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(1): 113-123. [10] 张俊涛, 武芳, 张浩. 利用出租车轨迹数据挖掘城市居民出行特征[J]. 地理与地理信息科学, 2015, 31(6): 104-108. [11] 周素红, 郝新华, 柳林. 多中心化下的城市商业中心空间吸引衰减率验证: 深圳市浮动车GPS时空数据挖掘[J]. 地理学报, 2014, 69(12): 1810-1820. [12] 郭莉, 谢明隆, 邹海翔. 基于出租车大数据的活动空间功能识别研究: 以深圳为例[C] //中国城市交通规划年会论文集. 深圳: 中国城市规划学会交通规划学术委员会, 2016. [13] 毛峰. 基于多源轨迹数据挖掘的居民通勤行为与城市职住空间特征研究[D]. 上海: 华东师范大学, 2015. [14] 吕玉强, 秦勇, 贾利民,等. 基于出租车GPS数据聚类分析的交通小区动态划分方法研究[J]. 物流技术, 2010, 29(9): 86-88. [15] GUO D, ZHU X, JIN H,etal. Discovering spatial patterns in origin‐destination mobility data[J]. Transactions in GIS, 2012, 16(3): 411-429. [16] 陈军, 赵仁亮, 乔朝飞. 基于Voronoi图的GIS空间分析研究[J]. 武汉大学学报(信息科学版), 2003(增刊1): 37-42.4 结语