基于GPS轨迹数据进行分析改善城市交通拥挤

2017-01-06 12:10沈丽娜程介虹冯丹
中国新通信 2016年21期
关键词:R语言数据分析

沈丽娜+程介虹+冯丹

【摘要】 城市化促进了社会经济的发展,同时为人们提供了方便,但也带来了交通拥堵、出行耗时长等问题。为了了解出行情况,缓解交通问题,交通管理部门将越来越多的传感设备安装在出租车上,如GPS等。利用GPS设备采集得到了大量出租车载客数据。由于得到的出租车载客数行建模,建模的目的是为了利用数据处理软件将复杂且量大的数据用图形表示,可以更直观的看到居民的出行,利用这种方法改善交通拥挤的问题从而优化交通,为人们的出行提供方便。

【关键词】 出租车轨迹 R语言 数据分析 数据建模

一、设计内容

在本设计中我们将利用GPS设备得到出租车的在载客数据,在得到的数据非常的复杂,而且数量非常的大,在对数据进行分析之前,要对数据进行预处理,把不合适的数据进行数据,之后找到数据之间的关系,对数据分析和建模。

二、本设计的组织结构

(1)出租车轨迹数据分析和处理。在得到出租车的数据时,通过对轨迹数据的分析,在对数据的采集的情况下,由于可能因为外界的因素,造成数据的采集出现问题,因此在数据处理之前要对数据进行预处理,将不合适的数据进行删除或者修改。

(2)搜索和可视化。在数据导入时,完成了对数据的分析和处理,之后通过R语言软件对数据进行汇总统计和绘图,数据更好的理解是为之后正确的建模做准备。

(3)分析和建模。在使用汇总统计和图形能更好的帮助我们理解数据,但他们有一定的局限性。统计数据不能告诉你数据的形状,而图形不能扩展到多个变量,他们在数量上也不能扩展,而且统计数据和图形都不能从数据中预测什么,所以通过建模,对相关数据进行定量判断而做出预测,构建可视化圆形系统,实现出租车轨迹数据的可视化分析。

三、数据来源及基本特征

数据的来源很多,R内置有很多数据集而在其他的附件包中能找到更多的数据,在本设计中的数据时利用GPS设备,将GPS设备安装在各个出租车上,将采集得到城市出租车的载客的数据,其中可以采集得到一个固定地点的出租车的载客数据,也可以得到在流动的地点的出租车的载客数据,以及在同一个时间的不同出租车的载客数据,一个出租车的在不同时间的相同地点的运行状态。

四、数据处理结果

4.1 k-means算法

k-means算法有k个输入量;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用聚类中各个对象的均值来获得一个中心的对象,以及来计算中心对象的坐标。

k-means算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。

4.2模型的建立

假设给定数据集X={,i=1,2,,4…n}其中还有m个样本描述。

K个聚类中心分别为

两样本之间的欧氏距离为d( )=

再有评价准则函数T=

最后得到k个聚类中心

4.3模型求解

根据出租车载客的数据,对数据进行分析,筛选出拥挤的路段和时段,而拥挤的标准可以自己设定,根据整个兰州城市的交通考虑,给出拥挤的标准和时间段,根据所有数据通过excel筛选出需要的时间段,并对数据进行分析,根据excel筛选出的数据应用matalb仿真软件对在确定的时间段画出速度图,根据速度的大小标准来确定交通的拥挤状况。

五、结论

在周末节假日的出租车的全天的任务量,载客的距离(任务量),运营时间,明显的高于平常,因此城市的相关部门应该对数据分析,找到合适的出租车的调度,和运行措施来减少出租车的空驶,提高出租车的运行比率,以及减少出租车的空驶浪费。来解决群众上下班时段一车难求、高峰时段还常遇拒载、等问题,同时群众可以根据分析得到的数据进行分析,自己选择相应的出行方式与时间。

总结:本设计采用数据分析及处理,在将得到的GPS轨迹数据进行分析,处理,借助可视化的方法,利用地图匹配,matalb软件,R语言软件对数据进行分析,在不同的时间段内,人们的出行状况,以及在不同地方交通的状况,交通潜在的规律及其特征进行分析,在所得到数据很难看到这个,所以利用这些软件对数据可视化分析,分析得到的结果可以直观的看到出租车的变规律,为人们的出行提供更方便的条件。

参 考 文 献

[1]李钊,彭勇,谢丰等.信息物理系统安全威胁与措施.清华大学校报,2012.

[2]黎作鹏,张天驰,张菁.信息物理融合系统研究综述.哈尔滨工程大学计算机科学与技术学院.2011.

猜你喜欢
R语言数据分析
基于R语言的Moodle平台数据挖掘技术的研究
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
基于读者到馆行为数据分析的高校图书馆服务优化建议
基于R语言的湖南产业结构对其经济增长贡献分析
注重统计思维培养与应用为主导的生物统计学课程建设
人民币汇率的均值回复检验及Hurst指数计算
R语言及ggplot2在环境空气监测数据可视化中的应用