杨 燕,胥 川
出租车和网约车载客空间特征分析
杨 燕1,胥 川2,3
(1.四川省公路规划勘察设计研究院有限公司,综合交通规划分院,成都 610041;2. 西南交通大学,交通运输与物流学院,成都 611756;3. 综合交通大数据应用技术国家工程实验室,成都 611756)
本研究的目的在于通过挖掘出租车和滴滴的上下客数据, 描述出租车和网约车载客行程的统计特征和空间特征并比较两者的异同。首先通过对出租车和滴滴的GPS数据进行处理获取了上下客数据, 然后以OD对为单元分析了出租车和网约车行程的距离、时间和平均速度; 接着分别以出租车、滴滴的上下客点为对象, 通过热力图、全局Moran’s检验和局部Moran’s检验分析了两种方式的热点和空间特征。结果表明: 网约车的平均行程距离和平均行程时间都更长, 而出租车的平均速度更快; 滴滴和出租车的大部分热点位置比较类似, 但滴滴的服务范围比出租车更广; 两类车辆的上下客点都分别存在空间相关性, 但在城市外围有滴滴活跃而出租车不活跃的交通分析小区存在。
出租车;网约车;载客行程;GPS数据;热点图;空间相关性
网约车服务是用户通过手机应用远程叫车的新型服务模式,和传统巡游出租车不同,网约车公司通过接入互联网的智能手机搜集供需双方的位置信息,并通过优化匹配算法来寻找最优配对关系,以减少打车用户的等待时间、缩短服务车辆的空驶时间和寻客距离。开展网约车业务的公司也被称为交通网络公司,比如国内的滴滴、神州专车,以及国外的Uber、Lyft等公司。全球多个大城市在经历了网约车的迅速发展阶段后,原属于出租车占主导的个人出行市场大量被网约车占有[1],比如美国的大城市旧金山[2;3]、纽约[3-5],中国的大城市上海[6]、深圳[7]、成都[8]。
很显然,交通网络公司和传统的出租车公司处于激烈的竞争状态。网约车的反对者认为网约车的成功是因为它违反了限制出租车的管理法律,包括总量管控、规定价格和安全标准(如出租车公司必须购买商业运输保险)[2]。但网约车的支持者将其视为提供高质量出行服务(可提供车辆预计到达时间)[9]的低社会负担(利用已有私家车)的创新;他们认为,基于私家车的广泛普及和通信技术进步的网约车服务释放了巨大的交通供给,同时覆盖了低收入低密度的地区,增加了社会公平性。这样的争论还在继续,且一直困扰着政策制定者。
当上述争论仍在继续时,出租车的份额在一些中国的大城市并未持续下降,而是开始趋于稳定[7]。研究两种车辆相互作用后达到平衡状态时的行程空间特征,可以理解两种形式车辆的空间运行范围和偏好,为政策制定者提供参考依据。
成都是一座超大城市,2017年的人口数为1600万,2017年7月的机动车拥有量为432万辆。根据深圳的经验[7],有理由相信截止2016年11月,网约车对成都出租车市场的冲击已经过去,网约车和出租车的平衡已经形成。
2012年,滴滴出行在北京成立。2016年第一季度的数据显示,滴滴有中国最高的网约车市场占有率(88.4%的用户比例)[10],第二名是Uber China(7.8%)。2016年8月,滴滴合并了Uber China,此后成为了中国网约车市场占支配地位的企业。2016年全年,滴滴平台注册用户达到了4亿,同时日均行程量峰值超过2000万[8]。近期,滴滴出行公开了2016年11月成都部分区域的全样本OD(origin and destination)数据,这为分析、比较出租车和网约车的行程特征提供了机会。与此同时,我们也收集了成都市的出租车GPS数据(抽样车辆占比:47.36%)。
本研究通过挖掘出租车和网约车的OD数据来分析两者载客的空间特征。首先通过对两者行程参数的统计来对比其行程差异,然后通过热力图来分析出租车、网约车的OD点分布规律,最后通过Global Moran’s和Local Moran’s检验分析两者OD点的全局和局部空间相关性。
滴滴公开的数据为快车和私家车数据,不包括顺风车和滴滴专车,且公开区域为图 1四边形所示。即任意行程轨迹中,如果至少有1个GPS点在这个四边形内,这个行程记录则包含在公开数据集中。数据包括订单编号、OD点的经纬坐标、行程开始和结束的时间。
为了比较传统出租车和网约车,我们也收集了成都市的出租车数据。2016年,成都市共有11 374辆出租车,其中获取了5 387辆(47.36%)出租车2016年11月的GPS数据。出租车GPS数据集中包含了车辆识别号、时间、日期、经纬度、载客标记(0-空车,1-载客)等。根据载客标记,每个行程的OD点可以根据如下步骤来确定:首先按照车牌和时间(升序)来排序,然后对于同一辆车,识别出载客标记有变化的相邻GPS点。如果载客标记从0变为1,则识别为上客点,如果载客标记从1变为0,则识别为下客点。同时再剔除掉不完全的行程数据,于是,对于一次载客行程,最终获取了上客点、下客点、出行时间、出行距离。
处理数据的过程中也发现了异常的OD数据,如异常的OD距离、出行时间和平均速度。这些异常可能是由GPS故障造成的。例如,由于故障,GPS设备在行程结束时不将载客标记从1变为0,那么提取的OD距离和出行时间将会非常大。同时,日常生活经验告诉我们,在目的地非常近的情况下,乘客通常不会使用出租车或网约车,而是采用步行。同时,在研究区域内,大部分道路的限速都低于60 km/h。因此,本研究通过设定出行距离、出行时间、平均速度的范围来过滤异常的OD数据。但判定正常数据和异常数据的准确范围很难确定,本研究范围的最终选取参考了指标的分布。最后,异常的行程界定为OD距离不在0.8~25 km之间,或行程时间不在2~90 min,或平均速度不在1~80 km/h之间的OD数据。出租车和网约车中的异常数据(小于3%)都被剔除。
本研究的目的是分析、比较出租车和网约车载客行程的空间差异,为了避免偏差,出租车和网约车的抽样方式和抽样比例都应保持一致。首先,出租车数据也采用了和滴滴数据相同的抽样方式,即OD点中至少有一个点位于研究区域内。然后,出租车的抽样率为47.36%,滴滴在网约车市场的占有率为84.1%[10]。因此要抽取网约车市场中47.36%的样本,则需要抽取滴滴56.31%(47.36%/84.1%)的样本。为了避免时间上的影响,我们在每个小时的数据中等比例抽取56.31%的滴滴数据。同时为了避免交通限行政策(2013年7月,成都开始实行车牌尾号限行政策,每天两个尾号被限行,普通限行时间为7:30~20:00,重污染限行的时间为6:00~22:00)造成的样本差异,剔除了周末和假期的数据。最终两个数据集分别包含了1 732 613次的出租车行程和2 926 549次的滴滴行程。
同时,成都相关地理信息数据也用于本研究,包括路网数据(shape file)和交通分析小区数据(Traffic Analysis Zone,简称TAZ)。TAZ数据仅采用了全部或部分在研究区域内的交通分析小区,如图1所示。
图1 研究范围和交通分析小区
滴滴的行程中,平均出行距离为5.887 km,平均出行时间为20.90 min,OD平均速度为17.26 km/h。对于出租车,平均出行距离为4.389 km,平均出行时间为15.64 min,OD平均速度为18.40 km/h。
从结果中可以看出,滴滴行程的平均出行距离和平均出行时间都更长,这可能是由于滴滴的补贴政策导致价格比出租车低,进而远距离出行者更多的选择价格更低的滴滴造成的。而在OD平均速度上,出租车更高,这可能是由于出租车驾驶员的丰富经验使得其在路径选择上更优,且驾驶速度更快。图2为出租车和滴滴的行程特征统计直方图。
图2 出租车和滴滴的行程特征统计直方图
热力图、全局Moran’s和局部Moran’s检验[11-13]都被用于分析出租车和滴滴行程的空间相关性[14]。热力图采用了核密度函数来描绘出滴滴和出租车的OD点空间分布。
传统的单变量Moran检验也可以扩展到双变量,即度量1个变量在某个位置和另一个变量在邻近区域的空间滞后[15]。双变量的Moran’s[16]可以按照如下公式计算:
全局Moran’s值如果为正且接近1,则意味着聚集效应,即相近的观测值比起随机分布更加趋向于集中,相反的,如果全局Moran’s值接近-1.0,则意味着相近的观测值比起随机分布更加趋向于离散[17]。Moran’s[18]的值为正说明了观测值的分布是空间聚类的[19],同时,值如果小于0.05则说明了Moran’s值在95%置信区间内显著[20]。
从热力图(见图3)结果可以看出,滴滴和出租车的大部分热点都比较类似,比如中央商务区(春熙路-盐市口商圈)、火车北站、宽窄巷子,以及电子科技大学沙河校区周边,这从某种程度上说明了两者的竞争关系。但如果仔细比较热点图的细节,仍然能观测到两者的差异。例如,出租车在市中心的上客点比滴滴更密集;滴滴的服务范围比出租车更广,特别是城外区域。两者的空间特征进一步采用Moran’s检验进行了分析。
图3 出租车和滴滴上、下客点的热点图
本研究使用软件GeoDa[18]进行了单变量全局Moran’s检验来分别度量出租车上客、下客和滴滴上客、下客之间的空间相关性。同时,双变量全局Moran’s检验也用于两组变量:① 滴滴的上客点和出租车的上客点,② 滴滴的下客点和出租车的下客点。交通分析小区是此方法的分析单元,8个最邻近的方法为权重计算方法。9999随机组合(Permutations)被用于计算伪值。表2汇总了全局Moran’s检验的结果。结果表明滴滴的上客、下客,出租车的上客、下客都分别存在空间相关性。所有的伪值均小于0.05,确认了Moran’s值在95%显著水平下显著。结果同时表明了滴滴的上客和出租车上客的空间滞后有很强的空间相关性。同样的相关性也存在于滴滴的下客和出租车下客的空间滞后,见表1。
表1 全局Moran’s检验结果
Tab.1 Global moran’s I test results
注意:E[I]是的期望值,SD[I]是的标准差。
Local Indicators of Spatial Association(LISA)检验被用于寻找局部特征,以及确定热点和冷点。LISA分区图是用于解释高-高聚类、低-低聚类、高-低聚类、低-高聚类的图形工具。高-高区域是那些自己具有高值且临近区域也具有高值的区域,低-低区域是那些自己具有低值且临近区域也具有低值的区域。同样的,低-高区域是自己具有低值且临近区域具有高值的区域,高-低区域是自己具有高值且临近区域具有低值的区域。高-高区域和低-低区域是那些高值或低值区域的-致聚类,而高-低区域和低-高区域通常是空间的非一致区域。关于Moran’s检验的更多细节可以参考Xie等人发表的文章[19]。
在研究区域内,出租车的上下客有三个高-高聚类,分别是春熙路-盐市口商圈(中下侧区域),宽窄巷子(底部西侧区域)和电子科技大学沙河校区周边(东部区域)。春熙路是一条有大量商业聚集的步行街,附近有体量巨大的盐市口商圈,人流量巨大。宽窄巷子是成都市的著名景区,也是成都三大历史保护区之一,吸引大量游客前往。在电子科技大学附近有不少的商场聚集。滴滴的上客和下客热点主要集中在春熙路-盐市口商圈和东北部的大型居住区。在靠近火车站的地方和东边区域滴滴有高-低聚类,说明滴滴呈现非均匀分布的特征,如图4所示。
图4 单变量局部Moran’s I分区图
LISA的规则也可以用于双变量的局部空间相关性。图5表现了滴滴和出租车在中央商务区、宽展巷子、电子科技大学沙河附近都很密集。低-高区域出现在高高区域的旁边,说明滴滴在这些区域没有出租车的使用频率高。这可能是由于出租车更多的出现在这些区域导致的。但是,在北部的城郊(高-低区域),滴滴的使用频率更高。
图5 双变量局部Moran’s I分区图
本文通过挖掘出租车和滴滴的OD点数据,利用统计方法、热力图、全局和局部Moran’s检验分析了出租车和网约车的载客空间特征。分析结果表明:网约车的平均行程距离和平均行程时间都更长,而出租车的OD平均速度更快;滴滴和出租车的大部分热点都比较类似,主要差异在于出租车在市中心的活跃程度比滴滴更高;而滴滴的服务范围比出租车更广,特别是覆盖了出租车没有覆盖的城市外围区域;全局的Moran’s检验说明出租车的上客点、下客点,滴滴的上客点、下客点都分别存在空间相关性,同时,出租车的上客点和滴滴的上客点、出租车的下客点和滴滴的下客点也存在空间相关性;LISA检查识别了成都市的三个热点,包括春熙路-盐市口商圈、宽窄巷子和电子科技大学沙河校区周边,同时也发现在城市外围,有滴滴活跃而出租车不活跃的TAZ存在。
本研究通过实际数据说明了出租车和网约车行程的分布异同,可以帮助政策制定者认清出租车和网约车的服务范围、服务特征差异,也可以用于制定出租车和网约车的运价管理规范,为采取分区域的出租车和网约车管理政策提供决策依据。然而由于数据的限制,目前无法获取行程打车费用的数据、施工区的数据等,导致一些现象(比如滴滴的行程更远)无法解释,所以建议下一步获取更全的出租车和滴滴数据,以及相关的交通数据,用以支撑更精细化的研究。
[1] NGO V D. Transportation network companies and the ridesourcing industry: a review of impacts and emerging regulatory frameworks for Uber[D]. Vancouver: University of British Columbia, 2015.
[2] RAYLE L, DAI D, CHAN N, et al. Just a better taxi? A survey-based comparison of taxis, transit, and ridesourcing services in San Francisco[J]. Transport Policy, 2016, 45: 168-178.
[3] JIANG S, CHEN L, MISLOVE A, et al. On ridesharing competition and accessibility: evidence from uber, Lyft, and Taxi[C]. Proceedings of the 2018 World Wide Web Conference on World Wide Web, 2018: 863-872.
[4] CORREA D, XIE K, OZBAY K. Exploring the taxi and uber demand in New York City: An Empirical Analysis and Spatial Modeling[R]. 2017.
[5] BAO J, LIU P, BLYTHE P, et al. Exploring contributing factors to the usage of ridesourcing and regular taxi services with high-resolution GPS data set[R]. 2018.
[6] QIAN Ye J C, Chen Xiaohong, Zhen Hua. How taxi operation change in the development of E-Hailing APPs: a case study in Shanghai, China[C]. CICTP 2017, 2017.
[7] NIE Y. How can the taxi industry survive the tide of ridesourcing? Evidence from Shenzhen, China[J]. Transportation Research Part C: Emerging Technologies, 2017, 79: 242-256.
[8] RESEARCH D. Big data report on smart trips in Chengdu[R]. Beijing: DiDi Research, CBN Data, 2016.
[9] JIN S T, KONG H, WU R, et al. Ridesourcing, the sharing economy, and the future of cities[J]. Cities, 2018, 76: 96-104.
[10] Net Xinhua. http: //www. xinhuanet. com/tech/2016-03/ 30/c_128846667. htm.
[11] MORAN P a P. Notes on Continuous Stochastic Phenomena[J]. Biometrika, 1950, 37 (1/2): 17-23.
[12] MORAN P A. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society, Series B (Methodological), 1948, 10 (2): 243-251.
[13] LUC A. Local indicators of spatial association—LISA[J]. Geographical Analysis, 1995, 27 (2): 93-115.
[14] MICHAEL T. The saddlepoint approximation of moran's i's and local moran's ii's reference distributions and their numerical evaluation[J]. Geographical Analysis, 2002, 34 (3): 187-206.
[15] ANSELIN L, SYABRI I, SMIRNOV O. Visualizing multivariate spatial correlation with dynamically linked windows[J]. Urbana, 2002, 51: 61801.
[16] GEODa, Global Spatial Autocorrelation (2), Bivariate, Differential and EB Rate Moran Scatter Plot[EB/OL]. https: //geodacenter. github. io/workbook/5b_global_ adv/lab5b. html#bivariate-spatial-correlation-a- word-of- caution.
[17] Spatial Autocorrelation (Morans I) (Spatial Statistics) [EB/OL]. http: //resources. esri. com/help/9. 3/ arcgisengine/java/gp_toolref/spatial_statistics_tools/spatial_autocorrelation_morans_i_spatial_statistics_. htm.
[18] ANSELIN L, SYABRI I, KHO Y. GEODa: an introduction to spatial data analysis[J]. Geographical analysis, 2006, 38 (1): 5-22.
[19] XIE K, OZBAY K, YANG H. Spatial analysis of highway incident durations in the context of Hurricane Sandy[J]. Accident Analysis & Prevention, 2015, 74: 77-86.
[20] GOODCHILD M F. Spatial autocorrelation[M]. Norwich: Geo Abstracts Univ. of East Anglia, 1986.
Analysis the Spatial Characteristic of Taxi and Ridesourcing Service Trips
YANG Yan1,XU Chuan2, 3
(1. Sichuan Highway Planning, Survey, Design and Research Institute Ltd, Department of comprehensive transportation planning, Chengdu 610041, China; 2. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 611756, China; 3. National Engineering Laboratory of Integrated Transportation Big Data Application Technology, Chengdu 611756, China)
The aim of this paper is to describe and compare the statistic feature and spatial characteristic of regular taxi and ridesourcing service by mining the pickup and drop-off data of both types of services. Firstly, we got the pickup and drop-off data from taxi and Didi GPS data, then the origin and destination for each trip were extracted and the trip distance, travel time, average speed were acquired. Then, for taxi pickup, taxi drop-off, Didi pickup, Didi drop-off, globe Moran’sand local Moran’stests were conducted to uncover their hotspots and spatial characteristics. The results show that ridesourcing vehicles have longer trip distance and travel time, but the average speed of taxi is faster; although taxi and ridesourcing share some hot spots, ridesourcing vehicles are more active at the outer areas of the city where taxis are less available; autocorrelations exist in all types of OD points respectively; meanwhile we found traffic analysis zones which ridesourcing vehicles are more active exist in the outer range of the city.
taxi; ridesourcing; trip; gps data; heatmap; spatial autocorrelation
U491.1
A
10.3969/j.issn.1672-4747.2020.01.009
1672-4747(2020)01-0068-09
2019-01-14
综合交通大数据应用技术国家工程实验室开放基金项目(CTBDAT201912)
杨燕(1986—),女,工程师,研究方向:交通规划,E-mail:570668797@qq.com
胥川(1987—),男,西南交通大学交通运输与物流学院讲师,博士,研究方向:交通安全、数据科学,E-mqil:xuchuan @swjtu.edu.cn
杨燕,胥川. 出租车和网约车载客空间特征分析[J]. 交通运输工程与信息学报,2020,18(1):68-76.
(责任编辑:刘娉婷)