多尺度共享单车骑行需求影响因素分析

2024-03-28 07:37曹敬浛曹会通宋丹丹和龙祥
交通工程 2024年3期
关键词:工作日风力单车

曹敬浛, 田 旷, 曹会通, 宋丹丹, 和龙祥

(1.北京市智慧交通发展中心, 北京 100073;2.综合交通运行监测与服务北京市重点实验室, 北京 100073;3.北京市交通综合治理中心, 北京 100073;4.北京工业大学 城市建设学部, 北京 100124)

0 引言

近年来,机动化水平在不断增加,交通拥堵、空气污染等问题日益严重,绿色交通、低碳出行等城市发展理念逐渐兴起. 在此背景下,依托于移动互联网和共享经济的共享单车应运而生. 共享单车凭借其方便灵活、低碳环保、可达性强等优点在接驳公共交通,解决城市“最后1 km”的问题上拥有很大的优势,满足了轨道交通和地面公共交通均无法满足的端末交通需求. 但是城市空间内共享单车规模的扩大、骑行以及停放需求时空分布的显著差异给城市交通管理带来了巨大挑战,单车淤积问题成为现阶段共享单车监管治理的重要问题. 究其原因,主要是调度不及时、不合理,单车骑行和停放需求的不平衡等问题. 因此,开展共享单车骑行量的研究对于单车科学化、动态化的调度具有重要意义.

共享单车出行是我国特色的交通出行方式,故相关研究多由我国学者开展,内容上多聚焦于共享单车的出行需求预测和时空出行方式分析等方面的研究. 刘路美[1]以美国纽约市有桩公共自行车为研究对象,结合出行数据从出行者的性别、年龄、出行时段等方面对影响出行需求的主观和客观因素分别进行了分析,得出不同因素下的出行特征情况,并以此作为出行预测的基础. 张颖[2]通过多源数据的特征挖掘,确定了时间因素、天气因素、区位因素、使用因素4个角度的轨道站点周边共享单车骑行影响因素,并运用回归分析的方法确定了骑行量的正向和负向影响因素. 此外,文献[3-5]也是基于出行数据分析了单车的使用特性和影响因素,并以此作为出行预测模型中要素选择的依据,但并未针对影响因素开展量化的相关性分析. 晏鹏宇[6]运用主成分分析法分析了降雨量和温度对单车出行的影响,并以此为作为单车骑行量预测模型的变量. 虽细化分析了温度和降雨因素,但对于出行时间特性的分析有所欠缺. Chen等[7]通过在南京市发放调查问卷,分析了共享单车使用特征,并通过聚类分析判断了短途出行时共享单车、公共交通以及私家车等出行方式的选择. 冉林娜等[8-9]基于问卷调查数据,分别从出行者特性和环境特性分析了共享单车出行影响因素,并以此为基础开展出行方式选择的研究. 这些研究大多关注了共享单车的使用需求、使用特征等方面,对共享单车骑行影响因素的分析仍然有限. 而文献[10-12]多考虑了人口和土地利用特性对单车出行的影响,欠缺对天气等影响因素的分析. 甘雷琼[13]以公共自行车为研究对象,针对不同天气情况下的骑行量进行了分类汇总,但未开展相关性分析工作. 鉴于此,须进一步探究共享单车骑行需求的影响因素及其关系强度以支撑共享单车出行预测和单车调度方案等方面的研究.

1 数据描述及研究区域

1.1 数据描述

首先考虑对2019—2022年共享单车骑行年分布特征进行分析,以验证新冠疫情对共享单车骑行需求是否存在明显影响. 如图1所示,2019—2022年共享单车年骑行量逐年增加,至2021年趋于平稳,保持在9.5亿次以上水平. 2020—2022年新冠疫情期间全年骑行量仍在逐步上升,因此新冠疫情常态化期间共享单车骑行需求无明显变化.

图1 北京市共享单车出行量年分布

因此本研究主要基于北京市共享单车订单数据来开展,数据涵盖了2021年11月—2022年10月期间青桔单车、美团单车和哈啰单车共3家企业的订单数据,字段包含了订单编号、车辆编号、订单起止时间和位置等字段,包含数据大约1亿7 000万条.

1.2 研究区域确定

通过对全市的共享单车停放情况进行空间分析. 将订单中的租车位置X-Y坐标信息,转化为空间点状矢量数据,对还车点进行空间数据核密度分析,经计算,得到北京全市停放热力图. 如图2所示,全市停放热力图分6级显示,1级区域为红色显示部分,是全市的停放热点区域. 分类采用Natural breaks(Jenks)间隔方法,即Jenks自然间断点分类法,此方法多用于空间数据分类. 该方法可对分类间隔加以识别,并将相似值进行最恰当地分组,使各个类之间的差异最大化. 结果如图2所示,可发现共享单车租车热点区域多沿轨道站点分布,且多分布于北京市东南区域和西北区域,其中入栏管理区—朝阳CBD片区(图中蓝色框区域)较为集中. 因此本文选取该区域范围开展研究.

图2 某工作日北京市共享单车骑行热点分布

2 骑行需求多因素影响分析

2.1 数据预处理

因为在数据采集过程中可能存在数据缺失、数据重复、或者数据乱码等一系列的数据问题. 本文对数据的处理办法主要有以下2种:

1)数据筛选:由于研究区域坐标范围为东经116.443~116.473,北纬39.902~39.922. 因此对于不在该地理范围内的数据予以剔除.

2)数据拼接. 获取北京市2021年11月—2022年10月每天的天气、最高气温、最低气温、风力等数据. 根据日期,把共享单车的历史订单数据与获得的天气预报资料进行拼接,增加数据的维度.

经过数据处理后的单车数据字段表如表1所示.

表1 数据字段表

表2 不同天气条件下共享单车出行量数据描述

2.2 研究方法—单因素方差分析

基于方差分析的假设检验,可将观测到的总变异的平方和与自由度分解为对应不同变异来源的平方和与自由度,并通过比对系统性误差(不确定的控制性因素)与其他随机性误差,排除统计结果的偶然性并评估各组样本之间的差异是否具有显著性,进而评估该变量因素对总体样本的影响程度.

单因素方差分析(一维方差分析)的主要原理是分析单个控制因素取不同水平时因变量的均值之间的差异是否显著. 首先,单因素方差分析基于2个假设:①各观测量来自于相互独立的正态样本;②控制变量不同分组之间的方差相等. 其次,根据所有的方差是否可由该因素解释而被划分为系统性偏差部分和随机性偏差. 需要注意的是,当系统偏差明显超过随机性偏差时,认为控制因素取不同水平时因变量的均值存在显著差异.

单因素方差分析步骤如下:

则:

第i组样本数为ni(i=1,2,…,k);

第i组的样本值为Xi1,Xi2,…,Xini;

在得到F统计量的值之后,再根据自由度可从F分布表[14]中查找出对应的P值.一般来说,若得到的P值小于0.05,则表示因素A的效应显著,若小于0.01,则表示因素A的效应高度显著.

本文将研究节假日、工作日、天气条件、风力条件和温度条件是否为单车骑行量的影响因素,因此单因素方差分析适用于本文.

2.3 显著性分析讨论

受新冠疫情及相关政策影响,2022年5月公共交通管制和居家办公政策与常态化时期单车骑行量存在偏差,因此本部分的研究数据中均不包含2022年5月的数据.

2.3.1 天气条件

对2021年11月—2022年10月的共享单车订单数据(不包含节假日数据)以天气条件为依据进行统计汇总,再除以对应天气条件的天数,得到2021年11月—2022年10月不同天气条件下的日均共享单车出行量. 如图3所示,各天气条件下共享单车日均出行量未呈现出较为明显的差异,除在天气条件极差时共享单车日均出行量出现较大幅度跌落,其余天气条件下共享单车日均出行量无较大差异.

图3 不同天气条件下日均共享单车出行量

为量化确定天气条件与共享单车出行量间的关系,选择单因素方差分析法进一步分析其影响. 表3方差分析结果显示显著性结果为0.027,小于0.05,所以可认为不同天气条件下共享单车日出行量均值存在明显差异,故可确定之前天气因素对共享单车日出行量不显著影响的结果是由于疫情影响下异常共享单车数据引起的,所以天气因素显著影响共享单车日出行量.

表3 不同天气条件下共享单车出行量方差分析

表4 不同温度条件下共享单车出行量数据描述

3.3.2 温度条件

对2021年11月—2022年10月的共享单车订单数据以温度条件为依据进行统计汇总,再除以对应温度条件的天数,得到2021年11月—2022年10月不同温度条件下的日均共享单车出行量. 如图4所示,共享单车需求量呈现出了较为明显的3个等级. 当气温处于15~25 ℃时,日均共享单车出行量最高,为64 424辆;在5~15 ℃&25~35 ℃时,日均共享单车出行量为54 808辆;而当气温达到<5 ℃或>35 ℃时,日均共享单车出行量仅为35 199. 初步分析是由于居民总是倾向于在外界温度适宜的条件下骑行共享单车造成的.

图4 不同温度等级日均共享单车出行量

为量化确定温度条件与共享单车出行量间的关系,选择单因素方差分析法进一步分析其影响. 表5方差分析中显示,显著性结果远小于0.05,所以认为不同温度条件下共享单车日出行量均值存在明显差异. 即温度因素显著影响共享单车日出行量.

表5 不同温度条件下共享单车出行量方差分析

表6 不同风力条件下共享单车出行量数据描述

2.3.3 风力因素

对2021年11月—2022年10月的共享单车订单数据以风力等级为依据进行统计汇总,再除以对应不同风力等级的天数,得到2021年11月—2022年10月不同风力等级下的日均共享单车出行量. 如图5所示,订单数据仅存在轻风、和风两个风力等级情况,且在两种风力条件下共享单车日均出行量较为接近,初步判断风力因素对共享单车出行需求影响较小.

图5 不同风力等级日均共享单车出行量

为量化确定风力因素与共享单车日出行量间的关系,选择单因素方差分析法进一步分析其影响. 显著性结果如表7所示,方差分析结果显示显著性为0.939,远大于0.05,故认为不同温度条件下共享单车日出行量均值不存在明显差异,即风力因素不显著影响共享单车日出行量.

表7 不同风力条件下共享单车出行量方差分析

表8 工作日因素影响下共享单车出行量数据描述

2.3.4 工作日因素

对2021年11月—2022年10月的共享单车订单数据以是否为工作日为依据进行统计汇总,再除以对应工作日与非工作日的天数,得到2021年11月—2022年10月是否为工作日条件下的日均共享单车出行量. 如图6所示,工作日共享单车日均出行量为56 147辆,约为非工作日共享单车日均出行量的2倍,工作日与非工作日共享单车出行量呈现了巨大差异.

图6 工作日与非工作日日均共享单车出行量

为量化确定是否是工作日这一因素与共享单车日出行量间的关系,选择单因素方差分析法进一步分析其影响. 表9方差分析中显示,方差分析结果显示显著性远小于0.05,所以认为工作日与非工作日共享单车日出行量均值存在明显差异,即工作日因素显著影响共享单车日出行量.

表9 工作日因素影响下共享单车出行量方差分析

表10 节假日因素影响下共享单车出行量数据描述

2.3.5 节假日因素

对2021年11月—2022年10月共享单车订单数据以是否为节假日为依据进行统计汇总,再除以对应节假日与非节假日的天数,得到2021年11月—2022年10月是否为节假日条件下的日均共享单车出行量. 如图7所示,非节假日共享单车日均出行量达到了50 621辆,是节假日共享单车日均出行量的2.15倍,非节假日与节假日共享单车出行量差异明显.

图7 节假日与非节假日日均共享单车出行量

为量化确定是否是节假日这一因素与共享单车日出行量间的关系,选择单因素方差分析法进一步分析其影响. 表11方差分析中显示,显著性结果远小于0.05,所以认为节假日与非节假日共享单车日出行量均值存在明显差异,即节假日因素显著影响共享单车日出行量.

表11 节假日因素影响下共享单车出行量方差分析

3 结论

通过对骑行数据的热力分析确定研究区域范围,并结合环境和时间特征,通过单因素方差分析的方法探究天气、温度、风力、节假日和工作日不同因素对共享单车骑行量的显著性. 研究表明,天气、温度、节假日和工作日因素与单车骑行量存在显著性关系,而风力因素对于单车骑行无明显影响. 在后续的研究中,可将天气、温度、节假日和工作日因素考虑进共享单车出行需求预测的相关研究中,以实现考虑多种环境因素的共享单车骑行量精准预测,为共享单车停放管理、调度以及监管政策制定提供科学的决策支撑.

猜你喜欢
工作日风力单车
走进风力发电
共享单车为什么在国外火不起来
飞吧,单车
关于休闲的量的问题的考察
对恶意破坏共享单车行为要“零容忍”
共享单车(外四首)
大型风力发电设备润滑概要
你会测量风力吗
对《资本论》中工作日问题的哲学思考
如何选择风力发电机组的CMS系统