邢 雪,翟娅奇
(吉林化工学院信息与控制工程学院,吉林 吉林 132022)
针对车辆停车需求问题,目前已经有很多学者对此进行研究。 杨圣文等学者[7]对现有停车场进行调查,对不满足停车需求现状的停车场利用建立的路网通行能力模型进行泊车路段的优化。 Ren 等学者[8]考虑到学生步行的可达性,利用k-means 的迭代聚类方法来分配学生和为校车停车站点进行选址,以获取最短的学生上学的通勤时间。Vdovychenko[9]通过分析车辆的行驶数据来对车辆的停靠点进行分类,随后对停靠点的分类与车辆运行路线流量之间的相关性进行建模,并进行实例分析。 王国娟等学者[10]根据设定的商业区停车管理水平评价指标建立基于模糊综合评价法的停车管理水平评价模型,研究表明构建的模型能够对商业区路内停车管理水平进行准确评价。 王震邦等学者[11]均衡考虑多个停车需求,设计基于交替方向乘子法(ADMM)分布式优化的停车匹配模型,实验证明模型优于其他常用模型,并有较优的收敛效果。郑慧敏[12]对停车需求的影响因素进行分析,并提出基于滴滴出行OD数据的停车需求预测方法,利用模型进行公共停车场的选址分析证明了模型的实际意义。 除此之外,双层目标模型[13-14]、粒子群算法[15]、DBSCAN[16]等多种方法也被应用在停车选址的研究上。
以上研究已对车辆临时停车选址的可行性进行了论证,但是以网约车OD数据为出发点,并结合城市热门POI 数据点对乘客上下车需求的分析,挖掘网约车停靠的交通特性,从而作为网约车临时停靠点的选址依据的相关研究较少。 针对上述问题,通过对网约车OD数据和爬取到的城市热门POI 数据进行相关性分析,研究网约车停靠需求的交通特性,在此基础上提出基于POI 聚类的网约车临时停靠点的选址策略,并基于成都市滴滴出行数据集进行实例验证。
POI(Point of Interest)被称作兴趣点,通常指互联网电子地图中的点类数据。 应用python 编写程序在高德地图上爬取成都局部区域的所有餐饮相关POI 数据,提取时间范围为2022-10-09 ~2022-10-10。 爬取数据时选取的POI 大类是餐饮服务,中类包括:餐饮相关场所、中餐厅、快餐厅、休闲餐饮场所、咖啡厅、茶艺馆、冷饮店、糕饼店、甜品店,字段信息包括POI 的具体名称、类别、城市、地址、经纬度。
网约车OD需求数据是指乘客在乘坐网约车过程中的上下客数据,包括当前订单信息、上下客时刻时间戳以及上下客时刻位置经纬度。 采用成都市局部区域网约车轨迹数据进行网约车OD数据提取,字段信息包括订单ID、时间戳、当前位置经度、当前位置纬度。 根据轨迹数据进行OD需求的提取过程如图1 所示。
基于高德地图,爬取得到餐饮相关POI 位置分布,以及对应区域的网约车上下客需求点的分布,如图2 所示。
图2 成都市OD 需求数据及餐饮相关POI 分布情况Fig. 2 Distribution of OD demand data and catering related POI data in Chengdu
近年来,网约车数量在城市的快速扩张极大地加强了城市交通站点不可达区域之间的通达性,改善了城市区域之间的联系。 以成都市为例,对OD需求数据与餐饮相关POI 数据(数据量分别为104 148条和61 101条)进行分析,研究网约车OD数据和城市餐饮POI 分布之间的关系,乘客的网约车乘车需求顺应城市POI 分布的空间特征,OD需求密度分布以城市中心为起点向城市四周辐射开,网约车OD分布受城市POI 点的影响,POI 分布与网约车OD点分布密度大的区域构成了城市繁华地带,并且POI 与OD数据分布呈现明显的组团集聚分布形式,区域繁华程度随着远离城市中心逐渐递减。 基于上述结合网约车需求量与POI 的空间分布关系的分析,可以得出网约车OD点与POI 分布具有耦合关系,考虑网约车上下车点与餐饮相关POI 进行网约车临时停靠点的选取具有一定的现实意义。
(1)依托互联网工具:企业必须依托互联网来建立网络品牌,因此网络品牌也具有互联网的全球性、服务的连续性、动态性等特点。
采用K-means 聚类算法对OD数据进行聚类,使空间上距离很近的POI 尽可能被归为一类,形成广义上的POI。 在此基础上,研究广义上的OD需求点与周围一定半径范围内的POI 数据之间的关系,为网约车的临时停靠点的选址提供依据。
K-means 算法是一种非监督的聚类算法,其主要思想是对于给定的OD需求点数据集,按照各个OD点之间的距离大小进行区分,将总的OD需求数据划分成K簇。 划分后的OD数据的空间分布特点为簇内的OD点尽可能紧密相邻,而簇与簇之间的距离尽可能地大。 设数据集为D ={x1,x2,x3,…,xn},表示n个数据点构成的集合,K-means 算法的实现过程详见如下:
Step 1确定K个初始OD数据聚类中心C1(0),C2(0),C3(0),…,CK(0)。
Step 2对所有OD数据,求其到K个聚类中心的距离,并将数据点xn归类到与聚类中心点距离最小的簇内Dm(m =1,2,3,…,K),迭代Q次,判定公式如下:
其中,i,j =1,2,3,…,Q。
Step 3每次迭代,更新聚类中心。 推得的公式为:
当Jj取得最小值时:
其中,Nj是Dj(Q) 的样本个数。
Step 4利用Step 2 和Step 3 对聚类中心进行迭代更新,如果点的位置变化很小,可以判定达到稳定状态,迭代结束。
使用K-means 聚类算法对网约车OD需求数据进行聚类,以各个类簇的质心作为广义的OD需求点,并以广义的网约车OD点为中心,半径为R画圆作为广义OD点的吸引范围,对于半径选取,一般认为是400~800 m[17],目前应用较为广泛的是800 m,以800 m作为覆盖半径,统计区域内所有POI 数据的个数,对成都市局部区域进行网约车OD点和餐饮相关POI 的统计见表1。 使用线性回归来拟合通过K-means 算法聚类得到的各个类簇中的网约车OD数据与广义OD点吸引范围内的POI 数据之间的数量关系。 以广义OD需求点吸引范围内的POI数量为x,类簇中的OD需求点数量为y,可得:
表1 成都市局部区域OD 数据与POI 统计情况表Tab. 1 OD data and POI statistics of local regions in Chengdu
代入成都市数据可得x和y之间的函数关系如图3 所示,x和y满足y =1.705 014 42x +152.182 346 1,对应的拟合度R2为0.964 786 13。 结果表明,OD需求数据与POI 数据的数量关系上存在线性正相关关系。
图3 成都市OD 需求与POI 数量的关系曲线Fig. 3 Relation curve between OD demand and POI quantity in Chengdu
上述分析表明OD需求数据与餐饮相关POI 数量之间存在线性正相关性,基于OD需求点和餐饮相关POI 数据进行聚类,以得到的聚类结果作为网约车临时停靠点的选址是具有合理性的,网约车的临时停靠点的选址策略如下:
Step 1获取相应城市区域的餐饮相关POI 数据和网约车轨迹数据。
Step 2对网约车轨迹数据进行OD提取,并基于K-means 聚类算法对OD数据进行聚类,得到广义上的OD需求点。
Step 3计算广义上的OD需求点吸引半径内的POI 的数量,筛选出吸引范围内POI 数量大于等于某个特定值的OD需求点,将其作为初始候选的网约车临时停靠点。
Step 4对候选的网约车临时停靠点吸引范围内的POI 进行聚类,得到各个初选网约车临时停靠点吸引范围内的POI 的聚类中心,即是最终的网约车临时停靠点的选址。
以成都市为例,验证分析选址策略的有效性。
根据选址策略可得:
(1)获取相关数据:爬取获得成都市局部区域餐饮相关POI 数据、共61 101个数据点;使用滴滴全样本轨迹数据作为实验数据,数据主要来自于2016年11月的成都市二环局部区域轨迹数据,共计706万条,对11月1日08:00 ~17:00 时间内的轨迹数据进行OD数据提取操作后,获取到共计104 147条OD数据。
(2)基于K-means 聚类算法进行聚类得到500个聚类中心,即广义上的OD需求点。
(3)以聚类得到的OD需求点为圆心,统计800 m范围内POI 数量大于100 的OD需求点,将其作为初选的网约车临时停靠点,总共筛选获得318个初候选点。
(4)对初始候选点吸引范围内的POI 进行聚类,得到的聚类中心即是网约车临时停靠点的最终选址。
当前网约车上车点分布如图4 所示,得到的拟选的网约车临时停靠点如图5 所示。 由图4 和图5可以看出,餐饮商家和OD点呈现边缘分散、中间密集的分布规律,分布密集的区域主要位于城市中心区域和南部区域,由K-means 聚类得到的广义的网约车上下车点的分布与城市网约车上下车的餐饮相关POI 的热门区域相重合,表明广义上的网约车上下车点位于人流量密集区域;通过对广义的网约车上下车点根据范围内的POI 数量进行筛选,完成对临时网约车停靠点选址的优化。 优化后的网约车临时停靠点同时具备网约车需求量大、人流量密集等特点,该选址策略对于缓解城市交通拥堵、规范网约车运行具有重要实际意义。
图4 当前网约车上车点分布图Fig. 4 Distribution of boarding points for current online car hailing
图5 拟选网约车临时停靠点Fig. 5 Proposed temporary parking point for online car hailing
针对网约车临时停靠点的选址策略问题进行初步研究,考虑到以往的网约车运行特点和城市热门POI 分布特点,建立了考虑OD点与POI 数据状态下的基于K-means 聚类算法的网约车临时停靠点的选址策略。 以城市中餐饮相关POI 数据和网约车OD数据作为研究对象,研究发现网约车OD数据与周边POI 数据密度之间存在正相关关系,利用模型进行网约车临时停靠点的选址。 最后以成都局部区域的网约车OD数据和POI 数据进行实例验证,对K-means 聚类算法得到的候选点进行筛选得到最终的网约车临时停靠点,并论证该选址策略的合理性和可行性。 未来将在以下方面进行深入研究:
(1)除餐饮相关POI 外,可以研究其他类型的POI 数据的聚类分析对于网约车临时停靠点选址的影响,进一步建立考虑OD数据和POI 的城市区域划分方式的优化模型。
(2)对城市进行功能上的交通小区的划分,并进行交通小区分类,对于不同分类的交通小区提供不同的网约车临时停靠点的选址。