预测通道客运分担率的MNL 模型特性变量选取

2010-11-09 08:17:54王江涛
关键词:客运标定旅客

王江涛,马 驷

(西南交通大学交通运输学院,四川成都 610031)

客运分担率是指某种运输方式或线路在同方向各种运输方式或线路中所承担的客运量比例,是旅客在各种运输方式之间选择的结果,它表明各种运输方式在通道客运市场所占有的份额。在规划建设客运专线时,需分析客运专线与通道内高速公路、民航的竞争关系,估计不同运输方式的客运分担率。

MNL模型是比较成熟的分担率估计方法,但是运用MNL模型估计通道内各种运输方式的客运分担率时,特性变量的选取方法及其值标定不统一,如:文献[1]、[2]选取进出站时间、候车时间、车上时间、总费用作为特性变量;文献[3]选取旅行时间,费用和发车频率;文献[4]选取时间和费用作为特性变量;文献[5]选取运行速度,单位里程运价和发班频率作为特性变量;文献[6]中选取用人均花费成本表示的各种运输方式的经济性指标,用乘客利用该运输方式的旅行时间(不包括市内交通耗费的时间)表示的快速性指标和用市区内交通走行时间与候车时间之和表示的方便性指标作为特性变量。

笔者根据效用理论和通道内各种运输方式特性,给出了在运用MNL模型预测通道客运分担率时应选取出行时间、费用收入比、发车频率作为特性变量,同时给出了相应的标定方法;结合西兰通道旅客出行特征调查数据,选取上述特性变量进行了实证分析和灵敏度分析,得出在客运专线的运营策略的制定时应主要考虑出行时间,费用和出行者收入变化的影响。

1 理论基础

多项模型(Multinomial Logit Model,MNL)是常用的非集计模型之一,表达形式如式(1):

式中:Pin为出行者n选择第i种运输方式的概率;Vin为出行者n选择方案i的效用函数固定项;An为通道内可供旅客选择的运输方式种类的集合。其中效用函数为:

式中:θ=(θ1,…,θl) 为未知的参数向量;Xin=(Xin1,…,Xink,…,Xinl)T是出行者n的选择方案i的影响因素向量 (Xin1,…,Xink,…,Xinl) ,其中Xink=1表示的是常数项,由该运输方式的技术经济特征确定,因此只标定效用系数θ1,…,θl就可以预测出客运分担率。

2 特性变量的选取

2.1 特性变量选取原则相关问题

1)效用函数中的特性变量有不同的形式,可以是各种运输方式的特性或出行者的特性,也可能是描述运输方式特征与出行者特征之间相互关系的变量。

2)旅客出行调查数据中特性变量的标定值必须因起讫点的不同而不同,否则将导致效用函数的参数无法估计。

3)模型中不能包含线性相关的变量,否则变量参数无法估计。当模型中包含线性相关变量时解决方法见文献[7]。

4)特性变量之间应相互独立。

5)在标定特性变量的值时不必进行量纲的统一。下证:

MNL模型中 θ=(θ1,…,θl) 的值是式(3)得出[8]:

对X=(X,…,X,…,X)T进行统一量纲得,代入式(3)得:

令θ=θ1αi即可得到式(3)。由此可得对特性变量标定时进行量纲的统一只会影响效用函数的固定项θ=(θ1,…,θl)的解,而不会对客运分担率的结果产生影响。

6)选择肢固有常数项变量和个人特性变量的总数取An集合中选择肢的数减去1,即为n-1。

7)与选择肢明显无关的个人特性变量或选择肢的固有变量只可用于其相应的选择肢。

2.2 特性变量的选取分析

特性变量Xink可以分为选择肢特性变量和个人特性变量,前者又可以分为选择肢固有常数项、选择肢固有变量和共同变量。

影响旅客出行方式选择的主要因素有时间(速度)、票价、方便性、拥挤度、舒适性和安全性等。

2.2.1 安全性

各种运输方式的安全性由各种运输方式的事故率等指标来表示,不因起讫点的不同而不同,安全性不宜作为特性变量出现在效用函数中。

2.2.2 方便性

方便性通常以间接旅行时间度量。间接旅行时间是指旅客前往乘车点的走行时间与候车时间。对于不同运输方式其间接旅行时间的标定值不因起讫点的不同而不同,因此,方便性不宜单独作为一个特性变量进入效用函数,解决方法如下:

式中:为选择第i种运输方式的旅客到达、离开车站的平均时间;ti

上车、ti下车、ti

候车分别为选择第i种运输方式的旅客上车、下车、候车的平均时间;Liod为OD之间的距离;Vi为第i种运输方式速度。

从式(5)可以看出标定出行时间时已考虑方便性。那么基于式(5)标定出行时间时,效用函数特性变量可不再选取方便性。

2.2.3 舒适性

现有舒适性的标定方法有以下3种:①用旅客恢复疲劳所需时间来反映,而恢复疲劳所需时间与乘车时间和乘车环境相关,由此得出舒适性与出行时间不独立,舒适性不能与出行时间同时出现在特性变量中,否则由各种运输方式出行时间的差异导致分担率结果出现误差;②按票价乘以一个系数得出,结合出行时间和费用可得舒适性与费用不独立;③用人均占有面积和振动频率来描述,这样出现与上述安全性相同的问题,因此基于上述标定的舒适性不能出现在特性变量中。

2.2.4 发车频率

发车频率的值按各种运输方式不同起讫点实际的日发车频数来标定。

2.2.5 出行时间和费用

出行时间的标定见式(5)。费用的标定公式为各种运输方式的票价率乘以各城市间距离来确定旅客出行费用,用式(6)表示:

结合式(5)、式(6)可得,对于同一种运输方式其出行时间和费用高度相关,但是出行时间和式(6)标定的费用不能同时作为效用函数的特性变量,笔者认为在标定费用时应以实际票价为其标定值,而由于各种运输方式内部又有不同等级的票价,因此在问卷调查时应包含旅客选择了哪种等级票价。例如:西安到兰州既有线开行普通旅客列车和快速旅客列车,且其票价有硬座、软座、硬卧和软卧之分,若在进行问卷调查时旅客A选择既有铁路作为其出行选择,同时调查A会选择哪种列车的哪种等级的票价。这就可以解决费用的标定时与出行时间高度相关。

2.2.6 收入

基于效用理论,收入为描述出行者特性的一个重要因素,因此收入应作为个人特性变量出现在特性变量中,同时必须满足2.1中第6)、7)条所述。

2.2.7 费用收入比

依据2.1中第1)条,考虑到出行费用对不同收入出行者的影响是相对的,可选取费用/月收入代替费用、收入变量。

基于上述分析,在运用MNL模型计算通道内各种运输方式的客运分担率时,可选取出行时间、发车频率、费用、收入(或费用收入比)作为特性变量。

3 实例分析

3.1 选取时间、发车频率、费用、收入作为特性变量

结合西兰通道旅客出行特征调查数据,选取出行时间、发车频率、费用、收入作为特性变量,使用TransCad软件计算,输出的数据统计报告如表1。

表1 数据统计分析报告Tab.1 Analysis report of parameters

(续表1)

表1中出行费用的参数应该是负值,发车频率的参数应为正值,而估计出的参数值不符合,选取费用单独作为该模型的特性变量在该例中不可取。

3.2 选取时间、发车频率、费用收入比作为特性变量

结合2.2.7条,选取出行时间、发车频率、费用收入比作为特性变量,使用TransCad软件计算,输出的数据统计报告如表2。

表2 数据统计分析报告Tab.2 Analysis report of parameters

分析表2得,各特性变量t统计量的绝对值都大于1.0,上述特性变量对该模型具有显著的解释能力;McFadden 系数在0.2 ~0.4 之间[9],为非常好的结果。

将表2中对应的参数值,代入式(2)得通道内4种运输方式的效用函数:

式中:Vt,Vhstr,Vfw,Vair分别表示既有铁路、客专、高速公路、航空等运输方式的效用值;T、C、F代表出行时间、费用收入比、发车频率。

通道客运分担率结果如表3。

表3 西兰(西安—兰州)通道客运分担率预测结果Tab.3 Prediction results of Xi’an ~ lanzhou transportation corridors mode split

分析表3表明,客运专线将吸引大量的旅客,其分担率随距离的增加显著增加,印证了客运专线的优势是中长途旅客运输。西兰客运专线的修建必将极大缓解陇海线的客运压力。

3.3 灵敏度分析

当某种运输方式的运行速度、票价和发车频率等供给属性变动时,其他运输方式的需求受到影响。第i种出行方式的需求弹性定义为[3]:

式中:ΔPk(j)为第j种出行方式被选择概率的变化幅度;xjm为第j种运输方式的第m个属性值;Δxjm为该属性值的变化幅度。当i=j时,计算得到的为直接弹性;当i≠j时,计算得到的为交叉弹性。

利用式(8)分析客运专线的各属性变化1%时出行需求的影响,其计算结果如表4。

表4 客运专线各属性敏感度分析结果Tab.4 Analysis of parameters sensitivity of passenger dedicate line

分析表4得,发车频率(Fhstr)的需求弹性值比出行时间(Thstr)、费用收入比(Chstr)的需求弹性值小很多,说明出行者在选择客运专线时对出行耗时和费用收入比的变化更敏感,而发车频率的变动和对出行需求的影响相对较小。因此在客运专线的运营策略的制定时应主要考虑出行时间,费用和出行者收入变化的影响。

4 结论

在运用MNL模型预测通道客运分担率时,由于舒适性、方便性等因素与出行者个人主观认知有关,难以准确标定,现有标定方法不能满足特性变量的独立性,笔者认为应选取出行时间、发车频率和费用收入比作为特性变量,能更有效的反映个人出行选择意愿,运用MNL模型计算通道客运分担率的结果更为准确。

运用MNL模型时也可以选取年龄和性别作为个人特性变量,但它们对模型的解释作用不大,所以一般情况不予考虑,即使选取它们作为特性变量,其t检验值也不能满足要求。在计算时把上述变量的标定值基本统一在一个数量级上,这样可以减小预测误差。

[1]Hensher D A,Bradley M.Using stated response data to enrich revealed preference discrete choice models[J].Marketing Letter,1993,4(2):139-152.

[2]张戎,吴晓磊,张天然.基于RP/SP融合数据的沪杭客运通道公铁客流分担率研究[J].铁道学报,2008,30(3):7 -13.

[3]Park Y,Ha H K.Analysis of the impact of high - speed railroad service on air transport demand[J].Transportation Research:Part E,2006,42(2):95-104.

[4]李军,朱顺应,王红,等.基于RP_SP联合数据的非集计模型应用研究[J].铁道科学与工程学报,2007,4(1):87 -90.

[5]杨忠振,王璐,蒋永雷.高速客运通道上多种运输方式的分担率分析[J].大连海事大学学报,2008,34(4):154 -157.

[6]聂伟,韩彪.都市圈内运输通道客流分担率推算模型探讨[J].铁道运输与经济,2008,30(6):53 -60.

[7]金安.LOGIT模型参数估计方法研究[J].交通运输系统工程与信息,2004,4(1):71 -75.

[8]Ben-Akiva M,Lerman S R.Discrete choice analysis:theory and application to travel demand[M].London:The MIT Press Cambridge,1985.

[9]Daniel M.A method of simulated moments for estimation of discrete response models without numerical integration[J].Econometria,1989,57(5):995-1026.

猜你喜欢
客运标定旅客
非常旅客意见簿
客运索道设备运行初期的管理与创新
使用朗仁H6 Pro标定北汽绅宝转向角传感器
我是人
故事大王(2018年3期)2018-05-03 09:55:52
大数据在铁路站段客运市场营销中的应用探讨
基于匀速率26位置法的iIMU-FSAS光纤陀螺仪标定
提高客运驾驶人安全意识
汽车与安全(2016年5期)2016-12-01 05:21:59
船载高精度星敏感器安装角的标定
给小旅客的礼物
空中之家(2016年1期)2016-05-17 04:47:43
台湾客运业:高铁躲过破产危机?