基于出租车轨迹的城市居民移动模型相关研究

2017-04-26 11:29鲁丽
电脑知识与技术 2017年6期
关键词:数据挖掘

鲁丽

摘要:轨迹數据在一定程度上反映了轨迹产生主体的行为特征,对轨迹数据的研究及相关挖掘工作受到了越来越多人的重视;出租车GPS轨迹数据,在一定程度上包含了部分居民出行行为的丰富信息。针对出租车GPS轨迹数据的相关研究近几年呈上升趋势,本文对这类研究进行了分析和整理,探讨了基于此类数据的基本处理流程、模型构建与数据挖掘、以及可应用的相关领域。

关键词: 轨迹数据;数据挖掘;移动模型;GPS;轨迹重建

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)06-0252-03

Abstract:To some certain extent, the trajectory data reflects the behavior of trajectory subject. The research on trajectory data mining and related work has attracted more and more attention; Taxi GPS trajectory data contains abundant information about travel behavior of residents. The related research on taxi GPS trajectory data has risen in recent years. This paper analyzed and collated for this type of research, discussed the basic processing and constructing model and data mining based on those data.

Key words:Trajectory data; data mining; mobile model; GPS; trajectory reconstruction

1 概述

在过去相当长一段时间里,研究人类移动轨迹几乎是一件不可能的事情。近些年来随着传感器技术及GPS技术的发展,大规模的记录个体运动位置在经济上和技术上都变得比较可行,人们可以采集到大量的车辆、动物和人的移动轨迹数据,对人类移动数据集的研究引起了研究者们越来越多的兴趣。尽管这些数据集的用途和处理方法不尽相同,但是研究结果表明,人类移动符合一系列的特征,对于这些数据进行分析,可以帮助人们更好地了解城市的交通状况、动物的活动习性和人的移动规律。

通过对轨迹数据进行分析,可以理解世界日益增长的需求,是理解全球化中一些复杂现象的关键,例如全球快递业务、城市交通管理、鸟类迁移监控等,传统的针对这些数据的应用局限于存储和查询对象的时空位置,勾勒对象的运动轨迹。现在人们越来越多地关注如何从大量的轨迹数据中,进行建模,将建构好的模型提供给相关的应用,通过建模一方面可以归纳轨迹运动的轨迹,另一方面可以基于模型进行一些预测。[1]

人类移动轨迹的研究是一项非常有挑战的研究,尤其是当其与机会网络的应用研究相关时,本文回顾了人类移动分析研究成果的现状,针对一些移动模型进行了调查研究,着重考虑了比较容易获取到的城市出租车移动数据,探讨了通过出租车数据构建居民移动模型的一些研究、在此基础上展开的相关应用及相关应用系统的基本处理流程。

2 研究现状及动态

研究人类移动轨迹的模式和特征是一项非常有挑战性的任务,对于公共健康、城市规划、交通工程、和经济预测都有重要的意义。[2]

移动轨迹可被定义为由移动实体在空间移动时产生的路径。典型的移动物体包括汽车、个人、和安装有GPS装备的飞机,加了RFIDs标签的包裹,穿戴了特殊传感器设施的动物,这些传感器发送的信号可以被卫星采集到。[3]

时空现象分析引起了一些研究团体浓厚的兴趣。轨迹数据已经被用于诸如社会科学、生物学、医学、地理信息科学、数据挖掘等方面。例如:在社会科学中,研究人群在时间和空间上的活动一直以来都是一个非常重要的研究领域,可以用来解决诸如:居民迁移、购物、旅游、通勤行为等。[4,5]

轨迹数据代表了人类移动,能建立一个更好的真实的社会网络。目前轨迹数据可分为以下几个类别。[6]

1)人的移动轨迹

以空间轨迹的方式记录人在真实世界的活动,主要包括主动记录和被动记录。

主动记录包括:旅行者为了记录旅行经历、与朋友分享旅行经验,通过GPS轨迹记录旅行路线;自动车运动员,徒步行走者记录他们的轨迹进行运动分析。在有些应用中,用户上传的一系列的地理图片能生成空间轨迹,每个图片有地理标志时间标志,记录图片产生的时间和地点。

被动的记录包括:人们在使用移动电话时,产生了很多空间轨迹数据,这些空间轨迹数据以一系列的蜂窝塔ID号表示,包括相应的接入时间等;信用卡的交易记录也隐含了携卡人的空间轨迹信息,每个交易都包含时间戳和供应商ID号,能表明具体位置。

2)交通工具移动轨迹

我们日常生活中有大量装备了GPS的交通工具(出租车,公交,飞机,地铁),例如,很多大城市的出租车都配备了GPS,使得出租车能够以一定的频率报告基于时间的位置信息,形成了大规模的空间轨迹数据,这些数据可以用于资源发布,交通分析,提升交通网。

3)动物移动轨迹

生物学家收集了动物的移动轨迹,例如老虎的,鸟的,可以研究动物迁徙的轨迹。

4)自然现象的移动轨迹

人类学家、环境学家、气候学家及海洋学家收集自然现象的移动轨迹,可以为全球性的环境气候等问题研究提供参考。

目前GPS成为国内大多数城市出租车的标准配置,它能够实时记录出租车速度、位置、载客信息、方向信息。出租车作为城市常用的交通工具,在城市内广泛分布,出租车GPS数据全面,连续性强,作为公共交通工具不存在隐私问题,因此出租车GPS数据是研究城市居民移动模式很好的数据源。

安装了GPS的出租车可实现大范围、全天候的车辆行驶数据采集,这些量大、时刻变化的GPS数据记录了城市交通、人群移动的动态变化信息,对研究城市交通、城市居民出行模式有重要的意义。[7]

Castro P S 等[8]基于大量的出租车GPS轨迹数据,提出了一种构建出租车密度模型的方法,通过这个模型可以预测未来交通情况,估算机动车排放对城市空气质量的影响。由于仅仅考虑出租车数据不能完全反映道路机动车的密度,因此文中对此进行了建模,通过出租车密度来预估道路实际机动车密度情况及通行情况。

Chen C等[9]提出了利用出租车夜晚的GPS轨迹数据来规划夜间公交车路线。针对双向bus,他们提出了2个阶段的路径选择;第一个阶段,通过探测乘客上下车位置,找到区域中的热点,然后通过一些方法将大的热点区域划分为几个小区域,每个小区域中指定一个位置作为候选的公交车站;第二个阶段,给定公交车的起始点,方向,和候选站点,以及公交站间隔限制,从而得到公交运行路线图。

综上所述,研究出租车轨迹数据可以为居民出行,城市规划,交通预测,污染预测等方面提供分析基础。

3 相关应用系统

基于轨迹处理的相关应用主要包含以下几个模块:

3.1 预处理

出租车轨迹数据的采集来源于安装在出租车上的GPS设备,由于GPS卫星定位、操作失误等因素,所获取的GPS原始数据可能存在较大的误差,直接利用这些原始数据进行移动行为分析势必会严重影响分析质量,因此需要对原始的GPS数据进行预处理。

3.1.1 轨迹重建

搜索GPS嵌入式移动设备产生的数据,处理该原始数据,获取移动物体的轨迹,保存轨迹到相应的库(轨迹数据库或数据仓库)的过程被称为轨迹重建。[10]

轨迹重建的准确度依赖于原始数据的质量,相邻的轨迹位置的距离可以从几米到几百米;通过插值,找到一条合适的曲线来连接采样点。线性插值是最快和最简单的方法之一,通常采用直线连接不同的采样点。轨迹重建往往采用线性假定,即不同实体在相同的采样点之间移动时,相等的时间将导致在空间移动相同的距离。

3.1.2 数据校准

在路线建议、交通监控、流浪预测等应用中需要一个高采样率的轨迹数据集,以减少不确定性。通过地图辅助轨迹重建的方法称为地图重建法。可有效地提高轨迹应用相关系统性能。

3.2 构建移动模型

基于修正后的移动数据可在此基础上构建移动模型,进而实现数据挖掘等应用。

马武彬等根据对出租车历史运动轨迹数据的分析发现:出租车在长期的运动过程中,在某些特定时段,位于某些特定的空间状态存在一定的规律,他通过隐马尔科夫模型来对出租车移动轨迹进行建模,构建出租车移动概率模型,通过对模型计算预测节点位置分布概率,为用户推荐最佳搭乘路线。[11]

Karamshuk等,通过研究人们日常接触时移动的习惯和模式,构建人类移动模型,预测未来相遇的节点,从而为机会网络数据包的准确投递提供支撑。[2]

Zheng等利用出租车历史运行数据,建立移动模型,通过移动模型挖掘居民出行基本模式,进而将其运用到交通规划中,挖掘城市公共交通中需要改进的地方,从而指导城市交通规划建设。[12]

Peng等利用出租车历史轨迹,建立居民移动规律模型,发现上海市民在周末只要进行三类移动:从工作地到家里、不同商圈之间、其他移动。

4 结论

出租车GPS轨迹数据是城市深层动态特性的映射,不仅能够体现城市交通信息状态分布,同时也反映了城市的市民生活方式、经济文华分布、城市地理结构等深层次的城市特征。在数据科学崛起的大背景之下,综合利用大数据及云计算的快速实时性和预测性,对GPS轨迹数据实时分析处理、统计学习、深层挖掘,可发现城市内在模式和运行规律,大大提高智能交通信息化管理水平。

从轨迹数据的相关应用、出租车GPS数据系统的基本构成、GPS轨迹数据挖掘方法三个方面,本文综述了基于出租车GPS轨迹大数据驱动的城市居民移动模型研究发展现状,阐述了目前国内外研究成果和研究进展基于现有研究。

参考文献:

[1] Song C. Modelling the scaling properties of human mobility[J]. Nature Physics, 2010, 6(10):818-823.

[2] Karamshuk D, Boldrini C, Conti M, et al. Human mobility models for opportunistic networks[J]. IEEE Communications Magazine, 2011, 49(12):157-165.

[3] Spaccapietra S, Parent C, Damiani M L, et al. A conceptual view on trajectories[J]. Data & Knowledge Engineering, 2008, 65(1):126-146.

[4] Mei-Po K, Lee J. Geo visualization of Human Activity Patterns Using 3D GIS: A Time-Geographic Approach[J]. Spatially Integrated Social Science, 2003:48-66.

[5] Thériault M, Claramunt C, Séguin A M, et al. Temporal GIS and Statistical Modelling of Personal Lifelines[M]. Advances in Spatial Data Handling. Springer Berlin Heidelberg, 2002:84-92.

[6] Zheng Y. Trajectory Data Mining: An Overview[J]. Acm Transactions on Intelligent Systems & Technology, 2015, 6(3):1-41.

[7] 張红, 王晓明, 过秀成,等. 出租车GPS轨迹大数据在智能交通中的应用[J]. 兰州理工大学学报, 2016, 42(1):109-114.

[8] Castro P S, Zhang D, Li S. Urban Traffic Modelling and Prediction Using Large Scale Taxi GPS Traces[M]. Pervasive Computing. Springer Berlin Heidelberg, 2012:57-72.

[9] Chen C, Zhang D, Li N, et al. B-Planner: Planning Bidirectional Night Bus Routes Using Large-Scale Taxi GPS Traces[J]. Intelligent Transportation Systems IEEE Transactions on, 2014, 15(4):1451-1465.

[10] 蒲剑苏,屈华民,倪明选.移动轨迹数据的可视化[J].计算机辅助设计与图形学学报,2012, 24(10):1273-1282.

[11] 马武彬, 刘明星, 黄宏斌,等. 依据历史轨迹构建城市出租车移动概率模型[J].国防科技大学学报, 2014(3):129-134.

[12] Zheng Y, Liu Y, Yuan J, et al. Urban computing with taxicabs[C]. International Conference on Ubiquitous Computing. ACM, 2011:89-98.

猜你喜欢
数据挖掘
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究