王志军,张豫徽,季彦婕,樊 瑶
(1.中铁第四勘察设计院集团有限公司,武汉 430063;2.东南大学,交通学院,南京 211189;3.东南大学,道路交通工程国家级实验教学示范中心,南京 211189;4.微软中国有限公司无锡分公司,无锡 214000)
绿色环保、机动灵活的公共自行车与常规公交相互衔接结合,能促进出行方式的多元化,满足多模式一体化出行需求,进而缓解城市内部交通压力、提升居民出行质量、降低能源消耗、减少尾气排放,是符合低碳发展要求的组合交通出行方式之一。自行车换乘常规公交作为一种特殊的组合出行方式,兼具了机动性和可达性的双重优势,可以扩大公交的服务范围,同时发挥公共自行车“点-点”的服务特点,解决居民出行的最后一公里问题。
目前部分学者采用问卷调查方法研究自行车与公共交通接驳行为特征,如Bachand-Marleau 等利用在线调查,研究了自行车与公共交通方式之间的接驳,该调查将受访者分为有接驳行为、潜在接驳行为、无接驳行为三类[1]。周强等[2]以公共自行车为研究对象,利用刷卡数据及问卷调查数据分析了公共自行车作为地铁接驳方式的使用特性。Bernatchez等[3]通过电话调查发现公共自行车站点布设密度是影响公共自行车吸引力的关键因素。Shaheen 等[4]通过问卷调查,统计分析出使用者与非使用者在个人属性、对出行环境和环保的态度以及对现有公共自行车系统评价方面的区别,并提出改进建议。曹雪柠等[5]利用问卷数据构建多项Logit模型研究土地利用和出行个体方面的因素对公共自行车换乘轨道交通的概率。柏玉珊[6]以南京市轨道交通为研究对象,对站点进行调查,分析乘客个人属性、出行属性、目的地可达属性、交通方式敏感性、换乘设施可达属性等影响因素对乘客换乘决策过程的影响并根据调查数据建立末端换乘方式选择行为模型。Pan等人[7]提出地铁站附近的自行车租赁站点的属性是影响骑行者是否选择自行车作为接驳方式的重要因素。
部分学者则采用大数据挖掘方法进行相关研究,如Ma 等[8]利用南京市地铁和公共自行车刷卡数据,可视化换乘高峰,并区分了“还车进站”和“出站借车”两种不同接驳模式的差异特征,并在文献[9]中分析了公共自行车接驳地铁使用时的自行车出行距离和出行时间分布,发现乘客采用自行车与地铁接驳出行的主要目的是通勤。在Zhao等人[10]的研究中,还得出了早高峰的公共自行车换乘地铁的骑行与晚高峰的地铁换乘自行车出行在空间上的分布相同等结论。Ji 等[11]利用地铁和公共自行车刷卡数据构建地理加权泊松回归模型探究换乘交通量与个人社会经济属性、出行相关变量和建成环境因素间的关系,发现骑行距离、地铁站点2 km范围内的公交密度、地铁站密度、公共自行车站密度、居民出行目的均对公共自行车换乘地铁的换乘量有显著影响。
总体而言,国内外对自行车换乘公共交通的研究主要集中于自行车与轨道交通的换乘,而关于公共自行车与常规公交换乘行为的研究则相对较少,且以定性分析、问卷调查数据分析为主。较少利用公交IC 卡刷卡数据、公共自行车借还数据研究公共自行车和常规公交换乘行为。
针对以上不足,本文拟以江苏省宜兴市为例,基于公共自行车借还卡、常规公交智能卡刷卡记录提取的接驳识别结果,结合个人属性、出行特性等因素,并考虑公交站点周边的建成环境,构建多层线性模型,研究不同因素对换乘量的影响机理。
江苏省宜兴市于2012 年9 月正式开设公共自行车项目,且市内不允许引入共享单车。截至2018 年11 月底全市已有137 个公共自行车站点,超2 600 辆自行车分布于各站点。宜兴市公共自行车实施免费政策,市民通过借车卡在公共自行车站点刷卡进行借还车,产生的借还车数据由宜兴市公共自行车公司进行维护。
本文所使用的数据来源于2018 年11 月份宜兴市的公共自行车卡刷卡数据(见表1)与公交IC卡刷卡数据(见表2),融合站点数据和公交车辆GPS 数据,运用关联规则挖掘算法,匹配用户自行车接驳公交的出行记录,共计识别出2 267 条公共自行车接驳公交的换乘记录,可获得用户个人属性(年龄、性别、月公交使用频次、月公共自行车使用频率、平均骑行时间和平均换乘等待时间等)、出行特性(出行距离、出行时间、公共交通使用频率等)等信息。
表1 公共自行车卡有效信息表Tab.1 Information of publie bicycle card
表2 公交IC卡刷卡数据记录表Tab.2 Bus IC card swiping data
同时,公交站点周边的土地开发强度、土地利用性质直接影响到站点的客流量。客流量不同的站点停留的公交线路数量、公交到站间隔等也有所不同,客流量较大的站点更有可能吸引自行车接驳用户。公交站点周边的道路条件则会影响接驳公共自行车的骑行体验。因此,本文在由刷卡数据提取的个人属性、出行特性基础上,考虑了站点周边建成环境对公共自行车接驳公交的影响[5,12],包括教育机构密度、公司企业密度、娱乐场所密度、交叉口密度、公共自行车站点密度、公交站点经停线路数量、公交站点距离CBD(Central Business District,中央商务区)的距离以及公交站点附近道路密度等。限于数据来源,本文主要以乘客个人特性、出行特性和站点建成环境为主确定换乘影响因素。
用户在各公交站点的换乘情况首先与接驳用户个人属性特征有关,其次受公交站点建成环境等影响,不同特征的公交站点具有不同的吸引力,而同类型的公交站点换乘特性往往具有更大的相似性,即换乘数据具有明显的嵌套性质,属于多层数据。传统线性分析模型只能对其中某一层次的数据进行分析,无法解释包含两层或者多层数据的组间差异,而多层线性模型可以很好地解决这些问题。
多层模型通过定义不同水平层的模型,将随机误差分解为两部分:由个体特征带来的个体效应和由个体的背景环境造成的组间差异。多层线性模型对相同的数据进行三次统计分析:(1)在组内的个体层分析组内效应;(2)通过整合第一层的个体数据得到第二层的组间数据进行组间分析;(3)忽略作为组的特性,对所有数据进行概率总结分析总效应。
多层线性模型的运算原理为:每个公交站点的换乘量(Yi)受在该站点进行换乘的个人属性(Xi)的影响,但影响程度因每个公交站点的建成环境(Wj)的不同而不同。其中,Wj对Yi的作用是通过影响Xi对Yi的截距和斜率实现。每个公交站点都有各自的回归方程Yij=β0j+β1j Xij+rij,其中i是每位换乘用户编号,j是公交站点编号。在每个公交站点内做同样的回归后,再分别以每个公交站点回归估计出来的β0j和β1j为因变量,以公交站点变量Wj为自变量进行第二次回归。通过这种方式可以探求换乘用户个人属性、公交站点环境对换乘量的影响。
多层模型基本形式包含3个主要公式。水平1上(换乘用户)的普通最小二乘回归如下:
式中:下标j代表第一层的个体(用户)所隶属的第二层的单位(公交站点);Yij为研究时间段内第j个公交站点的第i个换乘用户换乘次数;γ00和γ10分别是β0j和β1j的平均值;在第二层上为恒定值,是固定成分;μ0j和μ1j分别是β0j和β1j的随机成分,代表第二层的变异。
对于随机成分,方差和协方差的公式如下:
由(1)、(2)、(3)可得合并的多层线性模型:
2.2.1 变量说明
根据识别出的换乘用户相关记录,可知被解释变量为每位乘客每月在每个公交站点的公共自行车接驳公交出行次数,也即换乘量。解释变量区分为个人层面和站点层面的变量,变量选取具体情况如表3所示。
第一层次的变量为乘客个人属性变量,采用公共自行车接驳公交的换乘记录中所能获取的信息,包括性别、年龄、月公交使用频次与月公共自行车使用频次、该乘客换乘记录中公共自行车平均骑行距离和平均换乘等待时间。第二层次的解释变量为站点建成环境等相关因素。采用站点周边环境中影响换乘量的因素(见表3),包括教育机构密度、公司企业密度、娱乐场所密度、交叉口密度、公共自行车站点密度、公交站点经停线路数量、公交站点距离CBD 的距离以及200 m 范围内道路密度[9-10]。变量中各类兴趣点的密度是通过从高德地图平台爬取兴趣点类别及经纬度信息,并利用ArcGIS 统计公交站点200 m 范围内兴趣点的个数;道路密度是指一定区域内的道路长度与该区域的面积之比,计算公式为:
表3 变量说明表Tab.3 Variable description
式中:Li为区域i的道路长度,Ai为区域i的面积。
2.2.2 变量筛选
首先对变量进行多重共线性检验,以检验变量之间的强线性相关性,方差膨胀因子(Variance Inflation Factor,VIF)可以用来衡量变量之间的多重共线性,它与自变量的拟合优度r2直接相关,VIF可通过式(6)来计算:
一般来说,VIF 值大于10 则被认为是多重共线变量[8],检验结果如表4所示。
表4 多重共线检验结果Tab.4 Multicollinearity test
其次,利用最小二乘法回归分析确定两个层次影响乘客接驳换乘行为的主要因素。采用逐步回归分析法剔除不显著变量,进一步删选得到:第一层次的影响因素有年龄属性X2、月公交使用频次X3、月公共自行车使用频次X4和换乘平均等待时间X6;第二层次的影响因素有教育机构密度X7、公司企业密度X8、娱乐场所密度X9、交叉口密度X10、200 m范围内道路密度X13、距离CBD的距离X14。
多层线性模型在零模型和完整模型之间,可以通过添加不同的第一层次和第二层次变量以及设定不同的固定成分与随机成分,建构各种不同的分析模型研究问题。以下分别列出几种模型的构建过程及模型拟合结果。
2.3.1 无条件模型
当多层线性模型中没有任何预测变量时,主要用于判断是否有必要构建多层分析模型,其判断标准可用组内相关系数(ICC)来衡量。ICC描述了公交站台内各个用户之间的相关程度,测量了公交站点类型不同引起的方差占总方差的比例,也可以说明总的方差中由公交站点类型差异解释的方差比例;此时的模型与随机效应的方差分析模型相同,模型公式如下两式所示:
无条件模型的参数估计结果列于表5中。
表5 方差成分的最终估计Tab.5 Final estimate of the variance component
2.3.2 随机效应回归模型
只含有第一层次、不存在第二层次预测变量的多层线性模型称为随机效应模型,可用于研究没有第二水平的预测变量来解释第一层回归模型中的变异。与传统回归模型的不同在于,第一层回归方程中的截距和回归系数是随机的而不是固定的。随机效应回归模型方程如式(9)和(10)。在随机效应回归模型中主要关注统计量μ0~μ4的方差τ0~τ4。μ0~μ4是第二层方程中的残差或随机项,τ0~τ4是指用第二层的层间差异解释β0~β4之后的残差方差。表6 为随机效应回归模型的最终结果,与无条件模型的表5 相比,考虑第二层水平之间差异之后,模型的方差为1.124,相比无条件模型方差2.636 明显下降。由此可知,用户在公交站点的换乘量差异需要同时考虑个人层面的因素和公交站点各因素的影响,接下来将分别讨论不同公交站点层面的变量对换乘量的影响程度。
表6 固定效应的最终估计结果Tab.6 Final estimation under fixed effect
第一层:
2.3.3 考虑第二水平解释变量的多层线性模型
在随机效应回归模型的基础上,在第二层模型中增加站点层面的变量,当站点层面考虑公交站点200 m 范围内影响显著的各类POI(Point of Interest,兴趣点)个数时,模型形式如下所示:
模型拟合结果列于表7,由表可知,进入模型的三类POI数据变量的检验结果均显著,模型方差也有所下降,继续逐步加入公交站点建成环境以及周边设施设计等变量进行探索性分析,构建模型研究站点层面其他建成环境变量对用户换乘频率的影响。
表7 考虑站点周边POI变量的最终估计结果Tab.7 Final estimation considering POI variables around the busstops
在表7考虑的影响因素变量基础上,继续加入站点周边交叉口数量、道路密度、与城市中心的距离等变量,考虑其对用户换乘量的影响,模型拟合结果如表8 所示。其中X789为教育机构、公司企业、娱乐场所等POI 数量之后,某种程度上可用于表征站点周边土地开发强度。由模型拟合结果可知,考虑POI 数量、交叉口数量和道路密度等站点建成环境变量的模型方差成分为0.696,较随机效应回归模型的方差成分1.124 下降了38.1%,说明考虑站点层面建成环境变量的模型拟合效果更佳。
表8 考虑站点周边各类环境变量的最终估计结果Tab.8 Final estimation considering various environmental variables around the busstops
3.1.1 个人属性影响分析及建议
从第一层次变量的回归结果可以看出,最终进入模型的个人因素变量只有年龄属性,说明变量中性别的影响并不显著,年龄属性变量影响显著且系数为负值(系数为-0.105),代表年长用户相较于中青年用户月换乘次数更少,表明自行车换乘公交确实是对用户体能有所限制。
建议提高自行车换乘公交出行的舒适性与便捷性。自行车换乘公交的出行相较单一交通方式出行往往需要耗费更多的体力和时间,中老年人对于体力消耗尤为敏感。为了提高公共自行车换乘公交对这部分主要人群的吸引力,需要考虑到公共自行车的性能、自行车站点与公交站点步行通道的顺畅性、公交站台等候座位的设置、公交车的乘客友好型设计等方面,保障自行车换乘公交全过程的舒适与便捷。
3.1.2 出行特性影响分析及建议
在考虑站点差异的随机效应回归模型中,在考虑存在组间差异的情况下,用户自行车接驳公交换乘量因用户出行特征中平均公交等待时间、公交与公共自行车使用频率的差异而不同,具体影响程度由模型拟合结果可知:用户骑行公共自行车和乘坐公交的越频繁,采用公共自行车接驳公交的换乘量也越大,月公共自行车骑行次数的系数较月公交乘坐次数变量的系数更大,某种程度上说明越频繁使用公共自行车的用户更容易转向公共自行车接驳公交的使用模式中。等待时间的系数绝对值大小明显大于公交乘坐次数的系数与公共自行车骑行次数的系数,也说明公交等待时间对用户选择自行车换乘公交的影响程度更大。
建议:(1)实施公共自行车与公交系统的换乘优惠政策。目前宜兴市公交和公共自行车已逐步实现一卡通,为换乘优惠政策的实施奠定了基础。(2)缩短高峰期间高频换乘线路的发车间隔。用户自行车接驳公交时的公交等待时长变量是对用户换乘量负向影响最大的变量,这也说明应当尽可能提高公交发车频率,通过换乘记录可以找到每条线路换乘的高峰期,从而分时段分线路制定动态的发车时刻表;充分利用“宜兴享出行”App及公交站点显示屏等各类方式,加强公交实时信息广播,让乘客可以提前合理的安排出行时间,减少等待时间。
站点建成环境变量中对换乘量影响显著的变量有教育机构、公司企业与娱乐场所等各类POI数量、站点周边交叉口数量、道路密度以及公交站点与城市中心区的距离等。考虑站点建成环境变量的多层模型拟合结果见表8,三类POI 数量总和的模型检验结果非常显著,说明公交站点周边教育、公司企业、娱乐设施的数量越多,用户在该类型站点的平均换乘量相应会越少,城市中心区域地块一般开发强度高,在城市中心区域的公交站点的换乘次数明显多于非城市中心区域,结合建模结果,可知这是由于在城市中心区域换乘的用户人数更多,但人均换乘量较低;交叉口数量和道路密度可表示该区域路网是否完善,模型中交叉口数量和道路密度变量回归系数均为负,路网越完善的地方,公交和公共自行车可达性更高,单一交通方式即可到达目的地,因此对换乘量的影响为负。
建议合理布设公共自行车站点与公交站点。在规划新的公共自行车站点时应当同时考虑公共自行车与公交站点、慢行网络的一体化配套。
本文基于2018 年11 月份宜兴市的公共自行车卡刷卡数据与公交IC 卡刷卡数据,识别出2 267条公共自行车接驳公交的换乘记录,提取用户个人属性、出行特性等信息,并加入站点周边各类建成环境变量指标,从公交站点层面,融合用户个人属性、出行特性、公交站点周边土地利用、设施设计、交通环境等多样性指标,建立用于分析嵌套数据结构的多层线性模型。提取站点影响范围内各类POI 数量、道路密度、交叉口数量和站点距离CBD 的距离等4 个站点层次的影响因素,构建多层线性模型进行影响因素分析。结果表明,公交站点层次变量的引入有效提高了模型准确度,个人层面和站点建成环境变量均对换乘量有不同程度的正负影响,并在此基础上从个人属性、出行特征及站点建成环境方面进行分析并提出建议:提高自行车换乘公交出行的舒适性与便捷性;实施公共自行车与公交系统的换乘优惠政策;缩短高峰期间高频换乘线路的发车间隔;合理布设公共自行车站点与公交站点。
由于数据来源于刷卡数据,个人属性中的收入水平、是否拥有私人小汽车、电动自行车等因素并未包含在数据中,而这些因素均会对换乘行为产生影响。在后续研究中,可以进一步结合IC 卡数据和个人属性调查数据等,更加全面地考虑不同类型用户的公共自行车与公交接驳规律与接驳影响机理。此外,未来若能获取其他城市的同类型数据,可进一步进行对比分析研究,为不同类型的城市提供参考。