基于出租车轨迹活跃度的北京市商业空间选址推荐

2023-11-28 05:23:50王文康王玉亮付瑞阳郭宏婷
滁州学院学报 2023年5期
关键词:出租车热点轨迹

王文康,王玉亮,付瑞阳,郭宏婷

1 引言

商业选址问题始终是商业活动中考虑的首要问题,合适的选址关系到从事商业人员流动及发展机遇。商业选址关键因素在于空间地理位置是否在商业活动的热度区,主要依赖于人、车流和交通可达性等驱动力[1]。商业选址时,出租车的行驶频率是常用决策依据。在对活跃度高的热点区域调查时,使用出租车轨迹数据统计车流量具有一定的可比性和真实性[2]。传统的商业选址依据实地环境勘测,综合评定经济发展状况等估计选址位置,这种做法不仅费时费力,在针对一些特殊边界区域划分时易出现偏差。而对不同时空大数据进行分析可以获取较为精确的选址,如:人们的出行方式、城市人口的空间密度、POI(Point of Interest)数据、手机定位等[3]。但这些方法存在一定的不足:对于不同区域实际选取位置的地形特征和实地情况缺乏全面考虑。出租车轨迹数据时空分析使商业选址的方法更加全面、科学[4]。

通过统计出租车车频数,判断不同区域的活跃度是目前选址方向研究的热点[5]。出租车轨迹活跃度可以反映一个地区人流密度,群众在这个区域聚集,能够反映区域的活跃度,从而为精确商业选址提供重要参考。利用出租车GPS轨迹和POI数据结合对商业选址进行一个推荐,主要是将人员流动数据与车辆数据以及区域内的POI数据进行整合,根据活跃度判断商业选址[6]。宋美娜等人提出了用户签到行为兴趣点推荐方法,通过一种概率模型模拟用户签到,运用轨迹数据作为底层铺垫,从而达到对兴趣点的推荐[7]。而在城市交通研究,出租车作为代表性交通工具,其轨迹数据的动态变化也可以作为城市交通情况和人员流动变化的重要依据。刘轶伦等人提出出租车轨迹数据的动态可达性分析,利用出租车GPS轨迹数据,对不同路口、小区的人员上下车情况进行分析,得出不同路口的拥挤程度,体现不同区域的活跃强度及相关城市特征,其主要还是基于大数据进行的处理[8]。综合运用GIS与GPS数据结合制作商业选址系统,以出租车轨迹数据为主要数据源,如LSBN(Location-based Social Network)热点区域选址的方法,利用出租车车辆空间坐标、行驶日期和各种属性,实现商业选择推荐[9,10]。本文通过出租车轨迹活跃度对不同区域的热点部分进行分析,提出一种兼顾周边环境的改进OD矩阵(IOD)优化算法,实现对该研究区商业选址的合理建议。

2 研究方法

2.1 活跃度模型的构建

本文根据出租车轨迹数据推测不同区域的活跃强度,而活跃强度可以在某种程度上反映一个区域的热点程度[11]。通过对热点区域的逐步缩小范围,将原先的一个市区车频数的统计,转化为同路口之间的车频数统计,其模型依据的公式为:

(1)

其中,H是指活跃强度,U是指停留在坐标为i,j位置的车频数,L是指在该i,j路口通过的总车频数,X则是热点密度值。为了求出H的大小,将采用OD矩阵进行热点密度的估计。

2.2 OD矩阵算法

OD( Origin-Destination) 矩阵是一种可对不同区域之间的交通量进行预测的矩阵,不仅可运用在小区之间统计人员流动,还可以放在不同路口统计出行量。假设一天中车辆从i路口为起始点,经过下一个路口j路口结束,或只停留在i路口的次数大于1次,则O和D均加1,除此之外,将D记为0,依次从i访问到j来统计不同路口的车频数(如表1所示)。设出租车轨迹中每个路口开始和终点位置构成一个有序点对,每一个点对表示出租车经过一次路口。如开始点位置路口i处,终止点位置在j内,然后经过一个点就加一,遍历一下点对。如下是O和D符合条件情况:

表1 OD矩阵

(2)

2.3 IOD矩阵算法

IOD矩阵是在OD矩阵的基础上,针对已划分区域之间的出行量,计算不同区域节点之间的统计值,并且在不同区域之间(至少1个起始点与至少1个目的点)选取路径最短的,包含了对时间成本的考虑。这里采用OD成本矩阵的合并,利用ArcGIS软件实现该操作,该算法主要创新之处在于它将其与OD成本矩阵中所考虑的时间成本所结合,去除掉时间成本较大的路径的目标点与起始点,加入时间成本小、聚集点密集的区域,能够避免推荐区域因时间成本较大而导致的选址结果不准确的问题,最后输出推荐结果。

2.4 IOD矩阵构建

Fi=Qi*ti(i∈n)

(3)

其中,F表示各个路径上的平均出行量,最终得到相应的IOD矩阵。

通过对IOD矩阵的整合,结合相应出租车轨迹数据所反映的车频数密度,来统计两个区域之间的热点密度,其基本步骤如下:

1) 筛选范围,缩小区域,并利用格网进行划分,使用出租车轨迹数据来计算IOD矩阵。

2) 统计该区域不同路口的车频数及其坐标(范围在1km以内)。

3)将其密度结果与OD成本矩阵进行合并,剔除时间成本较大区域。

4) 利用公式:

(4)

其中,Ai=[Dj]-1,指在i到j上的车辆数,Bj=[Oi]-1指在起点的车辆数,X(ij)热点密度值。

3 研究数据的收集与处理

3.1 研究区域的概况

针对一个城市进行合理的商业选址,首先要了解其城市的基本的地理特征,北京位于东经115.7°~117.4°,北纬39.4°~41.6°,中心位于北纬39°54′20″,东经116°25′29″,总面积16412 km2。北京位于中国华北平原北部,背靠燕山,毗邻天津市和河北省(如图1所示)。北京的气候为典型的北温带半湿润大陆性季风气候,夏季高温多雨,冬季寒冷干燥,春、秋短促。北京作为中国一线城市,不同区域的发达程度也是不同,为此要初步从地形上对北京市进行区域划分[14]。

图1 研究区行政区域图

北京市区域划分为东城、西城、海淀、朝阳、丰台、门头沟、石景山、房山、通州、顺义、昌平、大兴、怀柔、平谷、延庆、密云16个市辖区(合计16个直辖区),147个街道、144个镇、33个乡、5个民族乡(合计329个乡级行政单位),且北京地势西北高、东南低。西部、北部和东北部三面环山,东南部是一片缓缓向渤海倾斜的平原。所以,北京人员的居住与商业发达部分主要集中在中部与东南部分区域。

3.2 出租车轨迹及POI数据的收集与预处理

3.2.1 数据的收集与整理

本文利用北京市出租车轨迹数据,将出租车基础数据进行筛选,如:车牌号、车辆日期、车辆经纬度坐标、权值等,如表2所示。设定轨迹踩点时间的间隔时间为10s,利用北京市2018年2月1日至2月7日总计8天的车辆经过区域的车频数为例,首先对北京市的不同区县进行车辆轨迹点的统计,获得出租车轨迹的基本信息。再提取相应北京市的POI数据,如学校、餐厅、超市等数据,在对热点区域分析时作为抉择选址区域类型的依据。

表2 出租车轨迹数据字和POI分类

3.2.2 数据的分析与处理

以出租车轨迹和POI数据为数据源,构建北京市路网图层分为:城市主干路,次干路以及市级道路。将其构建完成的路网导入图层中如图3a所示。再将轨迹数据导入已经投影完成的北京市路网。为了防止从网络上爬取的出租车轨迹数据信息字段丢失,轨迹的经纬度坐标与地图信息不匹配、越界等问题。本文采取使用高德API开发功能对所爬取整理的轨迹数据进行可视化展示,图3b为轨迹数据的匹配与试错。

通过轨迹数据与路网数据比较,发现不同区域的出租车轨迹点分布密度有所不同。为了减少数据冗余和工作量,按照北京市的不同区域进行划分,引用panda库,利用Python按照市区的经纬度从东经115.7°~117.4°,北纬39.4°~41.6°进行统计(如图4所示)。

图4 北京各市区车频数统计

3.3 热点区域的初步筛选

通过北京市各市区车频数统计,发现北京市的东城区、朝阳区、海淀区这三个区域的车频数相较于其他区域比较高,反映这三个区域的出租车活跃系数高。为了避免出租车数据冗余,选取这三个区域进行着重筛选,利用车流量密度的大小筛选数据,并通过API平台展示车流量密度高的区域,红色部分属于热点区域,黄色部分属于一般区域(如图5所示)。

图5 热点区域筛选

3.4 热点区域的可达性分析

可达性在城市交通系统与居民地之间中起到了重要作用,不同商业区域的空间布局影响着出行生成与分布,商业区域空间布局不同,各个区域的可达性水平也有所不同,该区域的出行需求也有不同程度的差异,侧面反映出租车乘客所到区域的需求性,这对选址有着重要的影响;而另一方面,不同居民小区之间出行轨迹影响着该区域可达性水平的高低,可达性高的区域通常具有更强的吸引力,能够吸引更多的人流和物流,刺激该区域商业的开发,促进城市经济的发展。因此,将可达性看作交通系统与商业发展共同作用的结果(如图6所示)。图6展现北京市海淀区、朝阳区和东城区不同小区路口之间路口的连通性,利用ArcGIS中的OD矩阵成本来计算城市主干路之间出租车的时间成本,采用反权重插值法得到关于该区域的可达性分析图(如图7所示)。

图6 所选区域的连通性

图7 海淀区、朝阳区和东城区可达性分析图

由图7可知,使用出租车出行时间范围在十分钟之内的区域主要集中在朝阳区和东城区,而可达性水平在30范围以内的区域主要集中在海淀区的北部和西部。可根据居民出行的空间布局以及交通便利性,将商业选址区域着重放在海淀区的东部,东城区的北部以及朝阳区的西部,能够吸引更多的人流和物流。

3.5 IOD矩阵分析

在原OD矩阵划分的热力区域基础上(如图8所示),利用优化过的IOD矩阵统计所选区域不同路口之间车频数,结合路口信息赋值给出租车中的车频属性和OD成本矩阵的数值,利用网格将筛选后北京市区域进行划分,得到北京市热点区域的空间布局情况,划分结果如图8所示,不同路口之间的区域密度可由矩阵算法公式计算得出结果。本文IOD矩阵所用的单元矩阵宽度是1km,由公式(3)和(4)可知Ai值与区域密度成反比,即Ai值越小说明该区域密度越大,则该区域密度计算结果如表3所示。

表3 IOD矩阵计算部分结果

由上可以看出,使用IOD矩阵算法后,保留原有OD矩阵中主要的热力区域记录,同时删除了部分时间成本较大的起始点,使得矩阵计算更加的便捷。

4 研究结果及其讨论

通过利用IOD矩阵对活跃强度的分析与处理以及对北京市的交通可达性分析,基本上已经选定了符合商业选址的大致区域,对于这部分区域所建议的具体的选址类型,需要结合区域的原始POI数据进行判别,这里主要分为服务业、休闲业、餐饮业,其所选区域的POI数据如图9、图10以及图11所示。

图9 休闲业POI数据

图10 餐饮业POI数据

图11 服务业POI数据

对于商业选址的关注点不能只考虑这片区域车频密度和相应活跃度高来确定,还要考虑选址区域内的地理空间位置。为考虑所选取商业街的位置合理,采用Google Earth 地图对上方确定位置进行目视观测,并结合对所选区域特征地物(如:学校、商业楼、停车场等)的识别,达到对推荐选址区域的验证。

通过对图9~图11中热点区域部分加入高德API底图,查看区域路况并通过放大来分析热点区域的实际位置,选取东城区部分热点区域为例。根据图12(a)中区域的颜色程度来区别活跃度,颜色越深表示该区域的活跃度越高。本区域按照活跃度可为4个热点区域中心(1km范围),分别是:东直门街道、琨莎中心、三里屯、中国贸易中心。将1号区域放大所得图像为图12(b),观察其街道走向,选取以东四十条这段道路进行对比,依次使用Google Earth 地图观测附近街道影像进行验证(如图12(c)所示)。

图12 Google Earth实景验证

利用Google Earth Map进行实景图观测验证,发现这段区域有四个符合商业街的条件,在图12(a)中1号区域有停车场,3号区域是加油站,能够提供车辆的停放与续航,这也是车流量大的原因之一。2号和4号区域分别为居民楼与学校,为商业街提供了人员来源,符合商业街选址标准。对图12(a)中的2号热点区域进行验证,以琨莎中心为热带中心,半径为1km的区域进行筛选,如图13所示,图13(a)为放大后的2号区域,13(b)为 Google Earth实景,发现其Y型路口以居民楼占多数,位于琨莎中心东北侧有一所幼儿园,根据实际具体商业选址要求,可在此设立相应的商业街,与IOD算法推进结果一致。

图13(b)左侧2号区域是居民区,提供客流来源,4号区域是大型商场区域,如:三里屯SOHO商场,大润发等。而在街道右侧,由地图观测可知1号区域存在三座大厦公司,分别为中宇、凯富大厦以及盈科中心。而在街道由北至南可以发现3号区域是北京联合大学,其人流量多以师生出行为主,可选该区域作为商业选址推荐,与IOD算法推进结果一致。

为验证数据所展示的真实性与准确性,选取12(a)中4号区域,其出租车热点活跃度较低(如图14所示),14(a)为商业推荐地图,14(b)Google Earth为实景地图。根据实景对比分析,该区域车流量少,活跃度小,推荐地图颜色淡绿,与活跃度高区域颜色深红形成对比。根据朝阳公园实景图(14(b)),图中红色实线区域部分大部分以湖水为主,附近区域居民房和商业建筑较少,同时湖边圆圈区域所示建筑物较为稀疏,所以这片区域出租车轨迹活跃度较小,不推荐商业选址。

图14 4号区域实景图验证

结果:针对东直门街、琨莎中心、三里屯以及朝阳公园四个区域,发现东直门街道沿着街道从北至南,附近遍布停车场和居民楼,商业区域较多,可在这附近建设商业街。而在小亮马桥附近,从小亮马桥到琨莎中心,该区域不仅有居民楼,还有学校提供客源,可以推荐建筑商业街。至于三里屯和朝阳公园,前者靠近世贸天街,周边附近带有学校,可以考虑建立小吃街,而后者范围内湖面积占大多数,并且商业街道稀疏,不适宜建筑商业街。将实景验证的结果与图9比较,发现POI分布密度与分析结果相类似。

为了验证IOD算法精度比原先OD算法精度高,这里采用原始朝阳区、海淀区、东城区POI数据热力分布图作为验证图(如图15所示),用来对OD矩阵算法结果(如图16(a))与IOD矩阵算法结果(如图16(b))进行对比。发现其在朝阳区、东城区、西城区的热点区域与原图像热点区域一致,而在海淀区中,两种算法的热点区域都比原POI热点区域覆盖更多,说明在这段区域产生较大的误差。

图15 POI热点区域

图16 (a) 原OD矩阵划分的热点区域;(b)IOD矩阵划分的热点区域

为反映精准度的优化程度,其精度主要结果由表4可得 :

表4 算法精度结果对比

由此可以看出,在划分热点区域时所额外划分的数目减少,对应挑选精准的热力区域精度也提高了,但提高的效果并不是特别明显,这与开始选择的OD矩阵算法适用性有一定关联。

通过对海淀区、朝阳区和东城区商业空间选址推荐的对比验证,确保了IOD算法的有效性。将该方法应用到北京市全区域,建立POI热点筛选、空间可达性计算和IOD运算,可得到北京市商业空间选址推荐图(如图17所示),图中的蓝色区域以居民区为主,其周围分布着餐饮区域和购物区域。图17中北京市商业选址主要密集在海淀区、朝阳区、西城区、丰台区、石景山区、大兴区和顺义区。

5 结语

本文利用出租车轨迹数据判断区域活跃强度,采用改进后的OD矩阵(IOD)算法和空间可达性计算,建立了区域密度分析和干扰数据清除,实现了北京市商业空间选址推荐地图,通过Google Earth实景地图建立空间格局对比分析,验证了IOD算法商业选址的精度。该方法为其他城市商业空间选址推荐提供了一种方案。

猜你喜欢
出租车热点轨迹
热点
乘坐出租车
轨迹
轨迹
热点
车迷(2019年10期)2019-06-24 05:43:28
轨迹
现代装饰(2018年5期)2018-05-26 09:09:39
结合热点做演讲
快乐语文(2018年7期)2018-05-25 02:32:00
凭什么
进化的轨迹(一)——进化,无尽的适应
中国三峡(2017年2期)2017-06-09 08:15:29
开往春天的深夜出租车
山东青年(2016年1期)2016-02-28 14:25:29