王亚歌 王洪海 韦良芬
摘 要:在绿色低碳理念逐渐兴起的时代大背景下,共享出行应运而生,挖掘用户多种出行方式的时空规律是城市管理与规划研究的有效方法。基于美国旧金山湾区BayWheels公开的时空轨迹数据集,从时间和空间的角度出发,采用数据可视化方式直观揭示用户骑行时空分布特征。研究发现,用户出行情况与工作日和非工作日关系密切,工作日用户出行具有明显的潮汐现象等时空特征。文章通过对用户出行时空轨迹数据的研究,多角度分析用户共享出行的时空规律特征,为完善城市管理与提高共享运营企业效率提供理论支撑,进而更好地推动城市的可持续发展。
关键词:共享出行;共享单车;共享电单车;时空数据分析
中图分类号:TP391 文献标识码:A 文章编号:2096-4706(2023)17-0015-06
Visualization Analysis of Spatiotemporal Data for Multiple Shared Travel Modes
WANG Yage, WANG Honghai, WEI Liangfen
(School of Computer and Artificial Intelligence, Chaohu University, Hefei 238024, China)
Abstract: In the context of the gradual rise of green and low-carbon concepts, shared travel has emerged. Exploring the spatiotemporal patterns of users' various travel modes is an effective method for urban management and planning research. Based on the publicly available spatiotemporal trajectory dataset of BayWheels in the San Francisco Bay Area of the United States, the spatiotemporal distribution characteristics of user cycling are intuitively revealed through data visualization from a temporal and spatial perspective. Research has found that user travel is closely related to both working and non working days, and user travel on working days exhibits significant spatiotemporal characteristics such as tidal phenomena. The paper analyzes the spatiotemporal characteristics of user shared travel from multiple perspectives through the study of user travel spatiotemporal trajectory data, providing theor
0 引 言
近年來,随着移动互联网、绿色出行理念和基于位置服务的发展,共享出行这种新兴的交通方式的发展突飞猛进,同时也正改变着城市交通结构。随着机动车保有量的持续增长和人口的聚集,城市公共交通问题日益突出,相较于其他出行方式,共享出行方式是一种值得提倡的新兴出行方式。共享出行方式旨在减少交通工具碳排放,为城市的中短途出行提供解决方案。由于其具有高效、便捷、绿色、灵活和价廉等优势,既能够满足用户需求,又能够避免闲置资源浪费,迅速受到广大用户和资本的追捧和喜爱。
国内公共自行车是最早共享出行方式且多数由政府出资投入使用的,推行的初衷在于绿色交通、低碳出行的理念。公共自行车的出现,为城市增添了靓丽,方便了城市短途出行,让大众重拾对自行车的喜爱。但是,由于公共自行车带有固定的停车桩,会存在停车桩的设置并不合理、停车桩不能够便捷快速地找到或者停车的时候找不到停车桩的种种问题[1]。
随着移动互联网的快速发展,一种新的共享出行方式即共享单车呼之欲出。在城市各个角落都可以发现色彩斑斓的共享单车,使用灵活便捷且老少皆宜,能够有效地解决人们出行“最后一公里”的问题[2],与其他公共交通出行产生协同效应。共享单车的出行数据迅速成为位置服务的热门研究对象,能够从大量的出行数据中挖掘出用户的时空出行特征[3]和共享单车减排效应的时空分析[4],突显其具有较高的研究价值和现实意义。相较于公共自行车、共享单车不存在停车桩的束缚,车辆的投入量大,共享单车使用表现更加便捷,受众普及率更高一些[5]。
继共享单车后,在共享运营的催化下共享电单车应运而生,它是集合互联网技术的新型交通工具,用户可通过网络租赁的方式,循环共享使用,比如熟知的美团、哈啰、电斑马等。共享电单车发展得如火如荼,出行需求与技术进步为共享电单车提供发展土壤,并助力推广新能源、智能化、数字化、轻量化交通装备。
共享电单车主要服务于高校校园、景区和城市部分区域,例如高校校区规模日渐扩大,随着共享电单车涌入大学校园,满足大学生学习、社交和日常出行需求,提高了出行效率,能够一定程度上促进大学生积极参加各种活动,更加丰富校园生活[6]。
共享电单车相较于公共自行车和共享单车,除了具备二者的相同优点外,还具备电子围栏功能,能够规范有序停车,骑行体验更佳,服务管理效果更好。但是,共享电单车仍然面临车辆电池技术突破、维护成本高、安全保障和交通管理难等问题,涉及多方面管理问题,曾一度被叫停,随着行业发展的规范化共享电单车发展仍未来可期[7]。国内共享电单车公开数据集并未对外公开,相关理论认识和研究不够完善。
近年来共享出行方式发展的蒸蒸日上,离不开物联网、人工智能和大数据技术的发展。随着公共自行车的出现、共享单车的发展以及共享电单车的爆发式增长,这三种共享出行方式进一步完善了城市慢行系统,不断推动智慧城市建设发展。
但是,由于用户出行数据隐私保护、数据采集机制落后等,使得目前国内关于共享出行的数据公开有限,研究较少且相关研究比较单一,即缺少将多种共享出行方式进行综合分析研究,而且目前国内共享单车和共享电单车的用户使用群体大,分布率和使用频率高。通过对三种共享出行方式的出行时空数据进行挖掘和分析,既能明确用户的出行规律,以可视化的方式解读用户出行时空特征,明确用户的实际出行需求,便于用户合理安排出行,避开出行高峰时间段。研究分析有助于为用户提供更多元化、個性化服务[8],有助于为城市决策者客观地评估共享出行方式的情况,有助于企业运营管理提出理论依据,有助于城市交通管理部门掌握慢行道路的使用现状以及趋势。
1 数据预处理
1.1 数据集概况
共享数据集选用的是美国旧金山地区的Bay Wheels公司公开的轨迹数据,包含2021年1月1日至12月31日一年的公共自行车、共享单车和共享电单车的经纬度出行数据。
官方提供的数据是按月公布的,因此需要利用Python中的Pandas模块对数据进行解析和读取,将全年的数据进行合并,合并后的数据集有2 035 151条。数据集共有ride_id、rideable_type、started_at、ended_at、start_station_name、start_station_id、end_station_name、end_station_id、start_lat、start_lng、end_lat、end_lng、member_casual 13个字段,即共享车辆的编号及类型、开始及结束时间、终点站和起点站的ID及经纬度坐标和用户类型,其中只有公共自行车才有start_station_name、start_station_id、end_station_name、end_station_id 四字段。
1.2 数据预处理
数据集存在数据冗余、错误数据和异常数据等情况,由于数据集直接影响后续的相关分析,数据预处理这一环节就显得尤为重要。
对数据进行清洗,先设置经纬度的过滤条件,即旧金山地区的经纬度范围,将不在此经纬度范围的数据点作为异常数据进行剔除;调用Python模块中的drop dduplicates和drop函数,去除共享单车数据中冗余重复以及重复的记录。另外,针对数据中存在的缺失值,采用的缺失值补全的方法,即使用某些值进行替代。
另外,为了方便后续的分析和研究需要对原始轨迹数据中的时间字段进行解析,获取不同时间周期内的出行情况,即将开始时间分解成,开始年、开始月、开始日、开始小时、开始分钟等字段,结束时间也同样如此。同时,计算出骑行时间、骑行距离并生成相应的字段,最后将处理好的数据进行存储。
2 时空数据可视化分析
数据可视化以一种更加直观、清晰的方式增加对数据的理解,主要以图形的方式呈现,针对要分析的具体问题,挖掘出数据中隐藏的关系,有助于提取有用的特征,具有很大的应用价值。尤其当数据量比较大的时候,常规的统计方法会出现数据崩溃的现象,使用Python的Pandas工具集,如直方图可以通过用pyplot的hist方法进行绘制。
基于三种共享出行方式的时空轨迹数据,对公共自行车、共享单车和共享电单车的这三种共享方式的骑行数据从时间和空间两个角度进行可视化分析。具体来说,先分析全年出行量、工作日和非工作日的骑行情况、骑行距离、时长时速以及用户画像的,然后通过热力图渲染分析用户出行区域情况。
2.1 时间特征可视化分析
2.1.1 全年骑行量分析
在图1中,docked_bike为公共自行车,classic_bike为共享单车,electric_bike为共享电单车。数据集的时间范围是2021年1月1日至2021年的12月31日。
总体来看,这三种共享出行方式中公共自行车的全年出行量相对较少,出行量波动较为平稳,这是因为旧金山每平方英里只有1.5个桩式公共自行车停车桩,华盛顿是其4倍多,说明公共自行车投放量有限,需求量大于供给。共享电单车出行量在这三种共享出行方式中属于最大的,同样在6—10月较其他月份出行量大,出行峰值在10月份,日出行量接近7 000。共享单车出行量介于以上二者之间,同样在6—10月的出行量较其他月份增长明显。可见,在寒冷季节用户使用量较少,温度相对较高的6—10月更适合用户选择共享方式出行,每月出行量与季节和温度有关。
2.1.2 工作日与非工作日骑行情况分析
将2021年6月内一周的骑行数据按照日期的星期属性进行划分,得到工作日的骑行量大于非工作日,三种共享出行方式的出行情况大致相同,因此这三种共享出行方式的出行量均与星期属性存在较强的相关性,作为日常通勤工具,用户在工作日选择共享出行方式用于出勤、上课等,在非工作日可能多用于游玩等,一周的骑行情况如图2所示。
分别计算2021年6月份工作日和非工作日在每个时间段骑行量,并总结分析工作日和非工作日的骑行情况。
在工作日,共享车骑行呈现出比较明显的多高峰出行,即出行早高峰和晚高峰,存在午间小高峰但不够明显。公共自行车在12点、14点和17点这几个时间段出现多个峰值,午间高峰较为突出。共享单车和共享电单车的骑行量在早上7点后快速增加,在早上8点达到高峰;在中午12点出现午间小高峰,在17至18点出现了骑行晚高峰。在晚高峰之后,共享单车和共享电单车的骑行量逐渐呈下降趋势,如图3所示。
在非工作日,三种共享出行方式并未出现明显的骑行早高峰和晚高峰,骑行量较高的时间段主要集中在10至17点,由于这三种共享方式均是全天不限时间使用,在下午和晚上的骑行量较工作日更受欢迎,因而在周末的凌晨0至2点这个时间段,三种共享出行方式均出现骑行高潮,该时段公交车处于停运状态且出租车数量较少,因而共享单车和共享电单车填补了公交和出租车运营的“空窗期”,如图4所示。
2.1.3 骑行时长时速分析
根据2021年6月份的三种共享出行方式的骑行数据,绘制骑行时长时速分布图。公共自行车、共享单车和共享电单车这三种共享出行方式的时间分布情况基本一致,工作日骑行时间的峰值区间在5至10分钟之间,而从非工作日骑行情况来看骑行时间则相对较长一些,骑行时间的峰值区间在5至12分钟之间,图5则以共享电单车为例进行说明。
根据骑行时间和骑行距离计算得到这三种共享出行方式的骑行时速情况,如图6所示。公共自行车用户骑行时速近九成的时速都低于10 km。共享单车用户的骑行时速的高峰区间在8至12 km,在时速10 km出现峰值。共享电单车骑行时速的高峰区间在10至15 km,在时速13 km出现峰值,时速远低于新国标最高限速的一半,与公共自行车和共享单车的城市慢行交通出行方式互为补充。三种共享出行方式的全程骑行速度大致相同,均属“慢行”范畴。
2.2 骑行空间特征可视化分析
2.2.1 骑行距离分析
数据集中的数据是经纬度坐标,属于球面坐标系统,而球面两点间距离计算不同于平面,因此采用haversine函数求解共享骑行数据中起点和终点之间的距离,其中,dij表示数据点起点和终点间的骑行距离,r表示地球平均半径;αi、αj表示数据点xi、xj的经度值,βi、βj表示数据点xi、xj的纬度值,且均转化为弧度形式表示。如式(1)所示:
根据2021年6月一个月的骑行距离数据,由图7和图8可知,工作日和非工作日的骑行距离分布情况相差不大。公共自行车骑行量少且骑行距离较短,可见用户的使用频率较低。共享单车在1 km的骑行数量达到峰值,骑行量随着距离增加而减少,属于短途出行。共享电单车的骑行距离的变化趋势与共享单车基本一致,骑行距离在1.5 km达到峰值,较共享单车的峰值增加了0.5左右。这三种共享出行方式的用户骑行距离都属于中短距离出行。
共享单车解决了用户在1至2 km范围内的出行需求,而针对2 km以上的出行距离则更多选择共享电单车,共享电单车骑行距离3至5 km以上也占一定比例,这也说明公共自行车和共享单车属于短途出行,共享电单车属于中短途出行方式,这就对续航能力要求不是很高,一定程度上降低了成本,而对于中长途的距离用户更可能选择机动车的方式。
箱形图能够反映原始数据的分布情况且可以将多组数据进行比较,箱线图中,箱体的中间有一条线则为中位数xm,箱子的上下底为数据的上四分位数Q3和下四分位数Q1,上边缘和下边缘分别是Q3+1.5IQR和Q1-1.5IQR,其中IQR为Q3与Q1的差值。在图9中,呈现出三种共享出行方式的骑行距离分布情况,根据图中的中位数可知共享电单车的平均距离相比较大。根据箱型图的形状得到共享单车的骑行距离分布比较集中,因为箱型图的高较小。根据箱型图中位数和上下四位数的间距可以得到,公共自行车和共享单车骑行距离主要分布在1 km左右,而共享电单车骑行距离主要分布在2 km左右,且只有共享電动车Q1的值高于1 km。
2.2.2 骑行热力图可视化分析
热力图通过用户骑行量渲染地图颜色,以描绘出用户骑行量及分布情况,区域颜色越深则用户越热衷出行该地区。通过BDP数据可视化平台绘制公共自行车、共享单车和共享电单车的起点和终点骑行热力图,数据以2021年6月份为例进行分析。
根据旧金山三种共享出行的热点区域,其中公共自行车和共享电单车骑行热点区域主要集中在城市东北部密集的城区和城市周边景点。共享电单车起点骑行热点区域分布更加分散且按照城市路网方格布局,基本上车辆已布满城市的各个地方,金金山东北角相较于其他区域放置更多的车辆,城市南边和西边主要是景区、新兴的综合区和住宅区和学校等。终点骑行热点区域更加集中,这是因为共享单车属于新能源需要充电,也能够说明共享电单车存在车辆调度管理以保证用户能够有车可以骑,需要工作人员在夜间将车辆回收并放回规定区域,如图10所示。
3 结 论
通过对多种共享出行时空轨迹数据的研究分析,多方面多角度的解读用户共享出行的时空规律特征。具体来说,从骑行时间特征上来看,每个月份的骑行量波动可能与季节温度差异有关;工作日的骑行量存在明显的骑行早晚高峰,而非工作日没有;公共自行车的骑行量最少,骑行距离和时速都相对较低;公共自行车和共享单车都为“最后一公里”服务,均属于短途出行。共享电单车大部分的出行距离在2至5 km之间,属于中短途出行的最佳选择,比共享单车和公共自行车更加省时省力,骑行时速相对较快。
从骑行空间特征来看,共享出行主要集中服务于城市的商业区、住宅区、景区和学校等区域,能够为通勤者和高校学生带来极大便利。其中,公共自行车骑行量受限于停车桩的规划,使用不够灵活,存在找停车桩的苦恼。共享单车解决这一局限,用户使用更加灵活,即用即扫,即停即放。共享电单车,需要更换电池和调度管理,需要工作人员在晚上将共享电单车托运到规定的区域,工作量和工作范围比较大,涉及的维护管理成本也比较大。
共享出行是新兴的绿色出行方式,凭借其便捷、经济、共享的特点,为用户的中短途出行提供多元化选择,践行绿色减排理念,助力构建智慧和低碳交通体系。充实城市公共交通的配套体系,让更多的用户参与到低碳出行中来,助力实现交通运输的可持续发展。同时为城市管理和建议者提升共享出行服务水平、巡查管理、及时充电、合理规划停车区域等提供理论支撑和建议。
参考文献:
[1] 蔡颢琳,徐健,朱利蓉,等.共享经济下公共自行车发展中的问题及对策 [J].现代商贸工业,2019,40(4):59-61.
[2] 王家宝,余园园,敦帅.共享单车:现状、问题与对策 [J].管理现代化,2018,38(5):99-101.
[3] 周超,周亚男,李振世,等.基于大数据的南京市共享单车时空特征研究 [J].西南师范大学学报:自然科学版,2018,43(10):66-73.
[4] 李文翔,唐桂孔,刘博,等.基于摩拜骑行数据的上海市共享单车减排效益时空分析 [J].环境科学学报,2021,41(11):4752-4759.
[5] 翟永,刘津,陈杰,等.基于马尔可夫链的无桩共享单车车辆投放规模分析 [J].北京交通大学学报,2019,43(5):27-36.
[6] 王丹.基于大学城调查数据的校园共享电单车用户出行行为分析 [J].统计与管理,2020,35(3):96-99.
[7] 周若蘭,郑琰.共享电单车发展现状的问题及对策分析 [J].物流科技,2021,44(2):78-80.
[8] 李想,李亚男,马红光.考虑乘客效用的多元化共享出行平台协同定价策略研究[J/OL].中国管理科学,2022:1-10.[2023-03-04].https://kns.cnki.net/kcms2/article/abstract?v=3uoqIhG8C45S0n9fL2suRadTyEVl2pW9UrhTDCdPD67s_kBxcpWeyaeLZSIuMe9jAVB8l8GgZhSpT7OmB-tQvwbFDZGvKeOz&uniplatform=NZKPT.
作者简介:王亚歌(1993—),女,汉族,河南泌阳人,助教,硕士,研究方向:数据挖掘、机器学习;王洪海(1975—),男,汉族,安徽寿县人,教授,硕士,研究方向:智能数据分析;韦良芬(1975—),女,汉族,安徽舒城人,教授,硕士,研究方向:计算机硬件系统研究。
etical support for improving urban management and improving the efficiency of shared operation enterprises, thereby better promoting the sustainable development of cities.
Keywords: shared travel; shared bicycle; shared electric bicycle; spatiotemporal data analysis