评价公交行程时间可靠性价值的Mixed Logit模型

2019-03-06 04:48:10倪安宁刘晏尘崔毓伟卢军莉

上海交通大学学报 2019年2期

倪安宁，刘晏尘，崔毓伟，卢军莉

(1. 上海交通大学船舶海洋与建筑工程学院，上海 200240；2. 兰州交通大学交通运输学院，兰州 730070)

行程时间可靠性有时会比行程时间长短对出行者的选择决策影响更大，如有些地区的地铁拥挤不堪而路面公交的客流量却不大，原因就是地铁的行程时间更加可靠.但长期以来，行程时间可靠性价值的研究和估测并没有像行程时间价值那样受到足够重视.美国运输研究委员会(TRB)发布的报告称[1]，交通建设与管理部门在缓解交通拥堵方面的投资项目，实际上创造出的效益比过去认识到的更大，因为在成本-收益分析中通常只考虑项目产生的时间上的节省，而如果同时考虑可靠性的改善，则这些项目的真正价值被低估了.从公交出行者的角度来看，评价行程时间可靠性价值就是量化时间可靠性的重要程度，得到公交出行者对降低行程时间不确定性的支付意愿，从而深入理解公交出行者的可靠性偏好特征，以便于制定有针对性的公交引导策略.

国外近几年兴起了行程时间可靠性价值的实证研究.Douglas等[2]在佛罗里达地区将行程时间可靠性用于交通运行状态评价，开发了高速公路行程时间可靠性预测模型.Nam等[3]以曼谷地区出行者在水路与公路客运2种出行方式间的选择决策为背景，得到该地区出行者基于可靠性的方式选择特征.Li等[4]则考虑了出行目的不同的人群评价特点，比较了澳大利亚地区通勤者与非通勤者的行程时间可靠性价值评价特征，发现通勤者对迟到更为敏感而非通勤者对早到更为敏感.Tilahun等[5]讨论了可靠性价值评价的不同指标，使用延误概率、行程时间标准差以及行程时间均值与极值之差，分别建立模型并分析了各指标的适用性.Yang等[6]使用和密度估计出行时间分布，运用HL-RF算法基于原始特征计算系统可靠性指数.Xiao等[7]在内源拥堵和时间选择状况下评价出行时间可靠性价值，在考虑随机出行时间的基础上修改道路拥堵模型.相反，国内目前对行程时间可靠性价值评价的问题研究较少，Lei等[8]用概率论方法考虑冲击波的动态性，提出用时间可靠性模型来描述具有冲击波性质的城市高速公路的出行可靠性.李伟等[9]定量分析了停车换乘出行方式的时间可靠性，在拟合和标定各子链行程时间分布以及结构可靠性计算中的HL-RF算法的基础上，设计了求解算法.徐光明等[10]根据各类路段通行能力降级参数，构建了基于出行时间可靠性的城市支路网络均衡分析模型.杨熙宇等[11]通过分析公交车辆行程可靠性特征，建立了考虑公交专用道情况下的车辆行程时间可靠性概念模型，并运用Vissim模拟软件对不同影响参数并考虑公交专用道条件下的车辆行程时间概念模型进行验证.侯立文等[12]根据出行时间可靠性的定义及其概念模型，研究了模型中路段行驶时间和路段选择概率2个重要的参数.综上所述，不同区域得到的评价结果差异显著，因此有必要研究国内出行者的评价特征，进而在我国的公交优先策略制定以及交通项目价值评估中引入可靠性价值这一重要指标.

本文以天津市区早高峰时段出行活动为背景，研究以公交方式出行时出行者行程时间可靠性价值的评价特征.

1 行程时间可靠性价值评价模型

出行者行程时间可靠性价值评价模型是建立在离散选择理论基础上的.但是，与预测出行方式分担率等传统离散选择问题在交通规划中的应用不同，评价可靠性价值关注的不是出行者的选择概率而是出行者的支付意愿.作为可使出行者产生支付意愿的可靠性价值具有很强的主观性和随机性，不同个体愿为提高可靠性而付出的价格是有差异的.因此，尽管多项Logit方法也可用来标定行程时间可靠性价值评价模型中的参数，但Mixed Logit因克服了多项Logit个体间的随机偏好限制而更为合适.通过对待定参数随机分布的假设，Mixed Logit模型能够体现不同出行者心目中可靠性价值的差异性，其效用函数形式为

Uijt=βiXijt+εijt

(1)

式中：Uijt为个体i在第t个情景中选择j选项的效用；Xijt为解释变量列向量，不同的表示可靠性指标的解释变量，构成不同的可靠性价值评价模型；εijt为具有独立不相关特性的误差项；βi为服从某种分布的待定参数行向量.

从行程时间不确定性概念本身出发，直接使用行程时间标准差来衡量可靠性，称为均值-标准差模型；从行程时间不确定性导致的后果出发，即以偏离出行者相对期望到达时间(延迟或提前)的程度来衡量可靠性，称为计划-延误模型.均值-标准差模型和计划-延误模型的区别在于描述行程时间不确定性的方式不同，前者认为行程时间不确定性本身就是出行者的负效用来源，而后者则认为行程时间不确定性造成的迟到和早到才构成了实际上的出行者的负效用.均值-标准差模型简单直观，而计划-延误模型更能反映出行者偏好选择的心理活动.本文比较了这2种可靠性描述指标下行程时间可靠性价值的差异，从而确定各个模型在不同情景下的适用性和合理性.

1.1 均值-标准差模型

均值-标准差模型认为出行者倾向于选择行程时间、行程时间标准差及出行费用三者的总效用最大的备选项，其效用函数形式为

Uijt=β0+βtTijt+βsσijt+βcCijt

(2)

式中：Uijt为出行者i在第t个情景中遇到的备选方式j的总效用；Tijt为出行者i在第t个情景中遇到的备选方式j的平均行程时间；σijt为出行者i在第t个情景中遇到的备选方式j的行程时间标准差；Cijt为出行者i在第t个情景中遇到的备选方式j的出行费用；β0为常数项；βt、βs和βc均为系数.

出行者会选择行程时间、行程时间标准差及出行成本的总效用最大的那种出行方式.因此，根据式(2)中的模型可得到行程时间价值(VT)及行程时间可靠性价值(VR)分别为

从而可得到可靠性价值相对时间价值的比率，即可靠性价值率(R)指标

(5)

可靠性价值率指标在交通项目评价中的应用也是目前可靠性价值评价研究领域的热点之一.

1.2 计划-延误模型

计划-延误模型以出行者需要按照一定的时间约束完成出行活动(如要在规定的上班时刻前到达单位的通勤出行)为前提.该模型以相对出行者的上班开始时刻或期望到达时刻的延迟或提前程度作为描述可靠性的指标，其效用函数形式为

Uijt=β0+βtTijt+βseSEijt+βslSLijt+βcCijt

(6)

式中：SEijt为备选方式j的提前程度，SE=max{0,tpa-(t+td)}，tpa为期望到达时刻，td为出发时刻；SLijt为延迟程度，SL=max{0, (t+td)-tpa}；βse和βsl均为系数.

根据式(6)中的模型可以得到类似的提前时间价值(VSE)和延迟时间价值(VSL)分别为

(7)

(8)

1.3 参数标定与参数分布设定

Mixed Logit模型的积分形式为

(9)

式中：Pij为个体i选择方式j的概率；Uij为可靠性价值评价问题的效用确定项，即由式(2)和式(6)所定义的效用函数；f(β|θ) 为效用确定项中待定参数β的概率密度函数；θ为概率密度函数的参数.

2 调查问卷设计及样本特征

不同形式的问卷会对行程时间可靠性价值的评价结果产生很大影响，造成不同研究所得的可靠性价值率差异显著[13].采用图形问卷形式可将抽象的可靠性概念直观地传达给被调查者，本文在比较和分析不同问卷模式[3-4]的基础上，以天津市区早高峰时段出行活动为背景，利用SP(Stated Preference)调查方法，制作了针对早高峰时段使用地面常规公交的出行者可靠性价值评价特征的图形化问卷程序.问卷情景利用线条长短来表示行程时间及其变化幅度，每个选项包含1次出行的5个可能的行程时间，时间条长短依据被调查者自行填制的信息随机生成，可靠性不同的2个选项构成1个决策情景，问卷共设置8个决策情景.整个问卷程序包括3部分：第1部分收集调查对象的年龄、性别和收入等社会经济属性信息；第2部分如图1所示，收集被调查者的出行习惯信息，包括出发时刻、工作开始时刻和通常的行程时间等，作为生成后续决策情景的依据；第3部分是决策情景，要求被调查者选择偏好的选项，如图2所示.程序依据被调查者自行填制的出行信息生成其熟悉的出行情景，从而得到贴近被调查者实际选择偏好的结果.问卷中的出行费用没有采用出行者的实际票价，而是以实际票价的2倍作为情景生成的依据.原因是调查对象基本都选择了票价为2元的常规公交出行方式，他们普遍对以2元为基准的成本波动并不敏感，而评价过程主要依据的是成本的相对量而非绝对量，因此调查情景设计中提高了出行成本，并在问卷中对此做出了说明.

共回收调查问卷165份，剔除不符合研究背景和信息不全的样本后，剩余133个样本共有 1 064 条记录可用于标定参数.按照本文模型中特性变量的分类，样本统计特征如表1所示.

图1 调查问卷预置信息界面Fig.1 The initial interface of survey program

图2 调查问卷决策情景界面Fig.2 Decision scene interface of the survey program

表1 调查样本基本情况统计Tab.1 Descriptive statistics of the sample

3 实证分析

在可靠性价值评价模型的基础上，引入性别(G)、年龄(A)、月收入(S)、出行时间范围(T) 共4个社会经济属性变量，其中S分为小于 3 000 元(低收入)和 3 000～5 000 元(中等收入)2类，分别用分段变量S1和S2表示，前者不仅含有调查对象中的低收入人群，还包括了无收入的学生.采用Stata 11进行参数标定.初步标定结果表明，G和A这2个变量的差异都不显著.前者说明所调查群体性别特性对其可靠性偏好影响不大；后者考虑到本文调查样本年龄分布不均匀且跨度较大，因此不能断言年龄对可靠性偏好是否有显著影响.将这2个变量剔除后得到模型参数的标定结果.

3.1 均值-标准差模型标定结果分析

表2给出了以行程时间标准差为可靠性评价指标的均值-标准差模型参数标定结果，模型标定采用了2 128个样本，得到对数似然值为 -618.150 43，卡方检验统计量为 88.07，模型无效假设检验P值为0，说明模型有效.因为对于服从对数正态分布的变量，Stata 11给出的是其自然对数的均值和标准差，要得到系数βc的估计值需依据对数正态分布均值和标准差公式予以转换，转换后得到费用系数βc服从均值为 -1.14 和标准差为 3.06 的负对数正态分布.

均值-标准差模型以标准差作为可靠性评价指标，βc的均值为 -1.14，依据式(3)和(4)可得出行者评价行程时间价值VT平均值为 6.84 元/h，行程时间可靠性价值VR平均值为 10.53 元/h.行程时间可靠性价值比行程时间价值要高，说明早高峰时段出行，对出行者而言时间可靠性比时间长短更为重要，因为这一时段的出行活动多为对时间准时性要求较高的通勤活动.依据式(5)可得R=1.5，表明早高峰出行者愿意花费 1.5 单位的行程时间换取1单位的可靠性.与国外同类型研究相比，本文得到的R处于中等偏高的位置，主要原因除了本文的调查对象多以通勤为出行目的外，还与被调查个体差异和调查地域的差异有关.S1和S2都为负值，说明与高收入人群相比，收入低的人更倾向于价格低廉的选项.公交出行本身就是廉价的出行方式，因此人们不希望每天都要发生的出行成本占月收入的比重过大，显然这一点在中低收入群体中更为突出.结果显示，S1和S2的系数分别为 -0.62 和 -0.87，说明中等收入群体选择低可靠性选项的意愿要比低收入群体略高.这说明尽管中低收入群体都偏好价格低廉的选项，但低收入群体比中等收入群体更为重视行程时间可靠性.原因是低收入群体迟到的惩罚成本更高，而中等收入群体的工作时间相对而言会有一定的弹性.T为正说明短途出行者的时间可靠性偏好程度高于中远途的出行者.在与调查对象的沟通过程中发现，行程时间超过30 min的人会比行程时间少于25 min的人提前更多的时间出门，而出行时间越短的出行者越是习惯于踩点出门，导致出行时间短的出行者对可靠性相对更为敏感.另外，出行时间更长的人由于已经花费了很高的时间成本而更倾向于选择费用成本较小的出行方式或路线.

表2 均值-标准差模型参数标定结果Tab.2 Estimation of parameters in mean-variance model

注：S1取值(1，<3 000元；0，其他)；S2取值(1，3 000～5 000元；0，其他)；T取值(1，<25 min；0，其他)

表3 计划-延误模型参数标定结果Tab.3 Estimation of parameters in scheduling-delay model

注：S1取值(1，<3 000元；0，其他)；S2取值(1，3 000～5 000元；0，其他)；T取值(1，<25 min；0，其他)

ln(-βc)服从均值为 -0.91、标准差为 1.45 的正态分布，根据 1.2 节中的推导可得VR的分布情况，其中lnVR～N(-0.71,1.452)，图3给出均值-标准差模型下可靠性价值的分布情况.图中，假设费用变量系数服从对数正态分布.可以看出，以行程时间标准差为可靠性衡量指标的出行者可靠性价值评价分布相对集中，其均值为 10.53 元/h.

图3 均值-标准差模型VR概率密度曲线Fig.3 Probability density curve of VR in mean-variance model

3.2 计划-延误模型标定结果分析

表3给出了以延迟或提前程度作为可靠性评价指标的计划-延误模型参数标定结果.模型标定采用了 2 128 个样本，得到对数似然值为 -568.869 27，卡方检验统计量为 103.52，模型无效假设检验P值为0，说明模型有效.依据对数正态分布均值和标准差公式转换后得到费用系数βc服从均值为 -1.29和标准差为 3.44 的负对数正态分布.

计划-延误模型以相对期望到达时刻的提前和延迟程度(SE和SL)为可靠性评价指标，表3中的标定结果显示SE和SL都影响着出行者的可靠性偏好选择，但SL的影响更为强烈.这说明从时间约束角度考虑出行者可靠性价值评价时，早到和迟到都会给出行者带来负效用，但迟到的负效用远高于早到的负效用.依据式(7)和(8)得到计划-延误模型下的迟到成本VSL平均值为 20.74元/h，早到成本VSE平均值为 2.56 元/h，以及行程时间价值平均值为 3.58 元/h.相比均值-标准差模型，此模型着重突出了迟到对出行者可靠性偏好的影响而低估了行程时间的价值.ln(-βc) 服从均值为 -0.79 和标准差为 1.45 的正态分布，可以得到lnVSE～N(-2.11,1.452)和 lnVSL～N(-0.02,1.452).图4和5分别给出了计划-延误模型下以提前和延迟变量表征的可靠性价值分布情况.

图4 计划-延误模型VSE概率密度曲线Fig.4 Probability density curve of VSE in scheduling-delay model

图5 计划-延误模型VSL概率密度曲线Fig.5 Probability density curve of VSL in scheduling-delay model

从图4可以看出，出行者对早到价值评价不高，几乎全部样本的VSE都落在了10元/h以内，表明尽管早高峰出行者不希望过早到达，但早到成本远远小于迟到成本.由图5可以看出，以延迟变量作为可靠性衡量指标的出行者可靠性价值评价相对分散，其均值为 20.74元/h，比均值-标准差模型下可靠性价值高出1倍，其原因是由于不同出行者从迟到角度评价可靠性价值的差异显著，抬高了平均水平，反映出了出行者从迟到角度评价可靠性价值存在明显的不一致性.之所以会出现这种不一致性，是因为不同出行者的迟到惩罚成本不同.

上述2种模型的分析结果都证明了行程时间可靠性是公交出行者出行决策的重要影响因素，行程时间可靠性对于被调查者而言都具有极高的价值水平.以标准差衡量行程时间可靠性的结果显示，可靠性价值与行程时间价值较为接近，而以延迟程度衡量行程时间可靠性则明显突出了以迟到成本表征的可靠性价值.这说明从公交出行者的角度来看，并非完全以行程时间波动幅度来判断出行方式的可靠性，而是更加关注是否会因时间不确定性而产生迟到的风险，因此更倾向于选择出发时刻不变情况下迟到风险较小的出行方式.由此可知，对于早高峰公交出行者而言，尽管时间-计划模型在一定程度上低估了行程时间的价值，但它更加符合早高峰出行者评价可靠性价值时的判断规律.图6给出了2种评价指标下VR和VSL的分布曲线对比图.

图6 2种评价指标下的可靠性价值对比Fig.6 Distribution curves of VR and VSL

综上所述，以延迟变量作为可靠性价值评价指标的评价结果显示出了比行程时间标准差更大的差异性.然而，无论以哪一类指标作为可靠性价值评价的依据，可靠性价值均值并不能完整地反映全体出行者的评价特征，所以应该考虑不同个体间的差异性.因此，可靠性价值分布曲线更适于估算交通建设项目在行程时间可靠性方面的改善给出行者带来的效益.

4 结语

本文研究了早高峰时段公交出行者的行程时间可靠性价值评价问题，利用SP调查方法，设计了基于调查对象预置信息的可靠性价值图形化问卷程序，结合可靠性评价指标不同的2种评价模型，得到天津市区部分公交出行者的行程时间可靠性偏好特征及其可靠性支付意愿分布曲线.结果表明，对早高峰时段的公交出行者而言，时间可靠性比时间长短对出行决策的影响更大，并且出行者评价行程时间可靠性价值时，不仅依据行程时间的波动幅度而且更为注重是否因时间波动而产生迟到的风险，不同出行者在评价以延迟表征的可靠性价值时差异显著.因此，交通基础设施建设项目评价不能只考虑由时间节省而产生的价值，还必须考虑出行者的行程时间可靠性价值.