赵 鹏,翟茹雪,宋文波
(北京交通大学 交通运输学院,北京 100044)
高速铁路的运营为旅客出行需求提供了优质的服务,提高了旅客的出行效率,然而旅客需求与高速铁路能力之间仍存在不匹配现象,导致部分车次能力紧张,部分车次能力虚糜.在此背景下,准确把握旅客的乘车选择行为并制定相应的策略,对提高铁路部门收益及列车能力利用率、精细化管理列车席位能力具有重要意义.
关于旅客出行选择行为的研究已有较多成果,既有研究主要集中在旅客对不同出行方式、不同出行线路的选择:文献[1]建立动态广义费用的Logit模型,研究了郑州—西安运输通道内交通方式能力配置问题;文献[2]构建二元Logit模型,预测了京沪线旅客的出行方式选择;文献[3]在分析沪杭通道内客流结构和旅客出行方式选择特征的基础上,针对不同月收入的旅客构建Logit模型;文献[4]将旅客的选择因素分为主体因素、列车特性和随机因素三类,研究了铁路旅客乘车选择行为;文献[5]研究了旅客在G类和D类高速列车间的出行选择行为;文献[6]研究了京沪通道内出发时间和出行距离对旅客出行方式选择的影响.在既有模型中,通常假设旅客是“经济人”,即认为个体的偏好是同质的,然而这与实际不符,该假设忽略了个体异质性,导致模型结果存在局限性.因此,国外部分学者开始在旅客出行选择行为中考虑个体异质性:文献[7]基于潜在类别模型(LC模型)和考虑个体完整异质性的混合Logit模型(ML模型),研究了旅客的不可观测异质性并对两种模型进行对比;文献[8]利用ML模型,研究了个体异质性对旅客支付意愿的影响;文献[9]采用潜在类别方法,研究旅客对不同航线的选择偏好,并对旅客进行分类.然而,国内交通领域对个体异质性的研究较少,并且鲜有在高速铁路旅客乘车选择行为中运用.
本文作者在研究高速铁路旅客乘车选择行为时,引入个体异质性的影响.通过对影响旅客乘车选择行为的因素分析,设计并进行了旅客乘车选择行为意愿调查(SP调查).在此基础上,建立考虑个体异质性和不考虑个体异质性的旅客选择行为模型.最后,通过调查数据对构建的模型进行标定,根据模型结果对个体异质性在旅客选择行为中的影响进行分析.
由于个体之间在文化程度、经济条件、消费习惯等方面存在一定的差异,导致其对同一产品进行选择时会产生不同的偏好,这种差异性的选择偏好即为个体间的异质性[10].个体间的异质性受到多种因素的影响,通常可以将其分为可观测到的异质性与不可观测到的异质性.例如,性别、年龄、收入等是可以直接观测到的个体间的差异,而如教育程度、出行习惯、价值观念等是无法直接观测到的个体间的差异.个体异质性会影响个体的选择行为,在对旅客选择行为研究时,忽略异质性的存在会对结果产生显著影响,就不能准确把握旅客的选择行为.因此,本文在旅客选择行为研究中考虑个体异质性的影响.
数据采集是定量研究个体异质性与建模的基础.本文利用SP调查,对高速铁路旅客乘车选择意愿的相关数据进行采集,其关键是确定影响旅客选择行为的因素,然后在此基础上设计调查问卷.由于目前旅客对高速列车的安全性、舒适性、车上环境等需求基本已得到了满足,而列车在数据通信(即WiFi)和餐饮服务方面与旅客需求之间仍存在很大的差距,因此将这两方面作为区别车上服务水平的因素.通过上述分析,选择列车运行时间、发车时段、票价和车上服务水平作为影响旅客选择行为的属性,并以北京—西安的高铁列车为基准设计各属性的水平值,其中票价的水平值设置以高铁二等座票价为基准,目前全价票为515.5元.SP调查的各属性及其水平如表1所示.
表1 SP调查各属性及其水平
从表1可以看出,SP调查时的运行时间和车上服务水平有3个水平,发车时段有4个水平,票价有5个水平.将这些属性的不同水平值之间进行组合,可以得到180个情景,每种情境中有2列列车供旅客选择,旅客可根据需求选择更想乘坐的列车.为了最大程度降低旅客回答问题的数量,并保证构建模型时采用数据的精确度,采用正交设计法设计调查情景.利用SPSS软件进行正交设计后得到49种情景,排除不合理的7种情景后,将剩下的42种情景分到6份调查问卷中,每份调查问卷中包含7个情景,每个情景的情况如表2所示.每种情景下的各属性水平取值不同,旅客可根据相应的情景进行选择.
表2 调查情景问卷
在构建模型时,先对特性变量进行选取,然后在此基础上构建考虑个体异质性和不考虑个体异质性的旅客选择行为模型,并通过对比分析来量化个体异质性对高速铁路旅客乘车选择行为的影响.
在进行建模时,需要确定构建模型所需要的特性变量.这里的乘车特性变量选取是指对影响旅客乘车选择的因素进行筛选,包括旅客主体属性、列车出行属性和列车服务属性.综合分析,将用于情景设计的属性及旅客个体的部分属性确定为模型的特性变量,其中旅客个体属性的选取是根据参数标定结果决定的.在进行参数标定时,个人收入和费用来源比较显著,因此选取旅客的这两个属性作为特性变量,各变量的描述如表3所示.
表3 特性变量
表3中,票价与运行时间可以用数值形式进行定量描述,而发车时段和车上服务水平是0-1变量,其中发车时段和车上服务水平的取值较表1中各属性的水平值分别少一个.以发车时段为例,共有4个水平取值.从表3可以看出,可以由3个变量进行描述:当发车时段为水平2时,DT1=1;当发车时段为水平3时,DT2=1;当发车时段为水平4时,DT3=1;则当发车时段为水平1时,DT1=DT2=DT3=0.同理,车上服务水平的3个水平值可以由2个变量进行描述.
不考虑个体异质性的多项Logit模型(MNL模型)是最基本的离散选择模型,在旅客出行方式选择中得到了广泛的应用.然而在建模时,MNL模型是不考虑个体间差异性的,认为个体之间是同质的.以随机效用理论为基础,模型中个体q选择分肢i的效用函数Uiq为
Uiq=Viq+εiq
(1)
(2)
式中:Viq是与可观测变量Xkiq相对应的效用的确定项,本文中Viq是Xkiq的线性函数;εiq是不可观测的随机效用项,假设其服从Gumbel分布;K为变量的个数,Xkiq为选择肢i的第k个变量;βk为其相对应的待估参数.
根据效用最大化理论,个体q选择分肢i的概率为
Piq=prob[Uiq>maxUjq,i≠j,j∈An]
(3)
式中:An为各选择分肢的集合;Uiq为个体q选择分肢i时的效用,Ujq为个体q选择其他分肢时的效用.
旅客选择行为的MNL模型的选择概率如下
(4)
由于该模型中个体间是同质的,各变量的待估参数βk是固定值.本文基于MNL模型构建不考虑个体异质性的旅客选择模型,其效用函数的固定项为
ViqMNL=β1P+β2T+β3DT1+β4DT2+
β5DT3+β6CF1+β7CF2
(5)
由于MNL模型具有IIA特性,并且认为个体间是同质的,所以无法处理个体之间选择的差异性和个人偏好信息.针对MNL模型应用中存在的不足,ML模型做了一些改进,它是一种高度适应性的模型,形式与MNL模型相似,能够清晰地表达个体之间的选择偏好.与MNL模型相比,ML模型中解释变量的系数不再是一个固定不变的值,而是一个随机值并且服从某一分布函数[7],从而可以根据系数的分布函数来表现个体之间喜好的不同.其中,分布函数的参数一般可以通过估计得到,用来反映个体之间的异质性,通常分布函数的均值可以用来反映偏好的平均值,而标准差可以反映偏好差异间的变化幅度.基于随机效用理论,当个体q选择分肢i时,ML模型的效用函数可以表示为
Uiq=βiXiq+εiq=μβiXiq+σβiXiq+εiq
(6)
因此,ML中个体q选择分肢i时的概率表现形式为
(7)
式(6)和(7)中,βi不再是一个固定值,而是一个随机变量,其分布函数为f(βi|θ),用来反映不同个体间的异质性,其中分布函数的形式较多,如正态分布、均匀分布、三角分布等,在实际应用中应根据模型应用的意义及其变量自身的特点进行选择.θ是需要进行估计的未知数,为βi的分布函数的特征参数,如正态分布的均值和标准差.βi=μβi+σβi,其中μβi为βi的均值,σβi为βi的随机误差项,反映了个体q的异质性.σβiXiq+εiq是效用函数的误差项,μβiXiq+σβiXiq是包含了Logit模型误差项εiq的随机效用,使得随机效用项不再相互独立,从而避免了Logit模型的IIA特性[8].
本文利用MNL模型的变形形式来测量旅客间的可观测异质性,借鉴文献[9],MNL模型变形形式的效用函数固定项为
(8)
式中:Xk为效用函数中选择肢i的第k个变量;SEVh为个体q属性中的第h个变量;βXk、βXk_SEVh为需要估计的参数.
对于传统的MNL模型而言,其效用函数中特性变量的系数为一个固定的数值,通常不考虑个体的社会经济属性对特性变量的影响.为了研究个体的可观测异质性,本文在特性变量的系数中引入个体的社会经济属性(参见式(8)),用来研究个体自身属性对特性变量的影响,以此来体现个体可观测的异质性[10].将考虑个体可观测异质性的选择模型称为MNL-SOC模型,通过构建的模型可以研究个体的社会经济属性对票价和运行时间的影响,从而得到个体的可观测异质性.在建模过程中,通过分析个体属性对特性变量的影响,发现仅仅是个体收入和费用来源(是否自费)对列车票价敏感.因此,最终确定的MNL-SOC模型效用函数的固定项为
ViqMNL-SOC=(β1+βP-II+βP-FF)P+β2T+
β3DT1+β4DT2+β5DT3+β6CF1+β7CF2
(9)
ML模型既可以测量个体的可观测异质性,也可以测量个体的不可观测异质性,因而构建ML模型来研究旅客对票价和运行时间的完整个体异质性,效用函数的固定项为
ViqML=β1P+β2T+β3DT1+β4DT2+
β5DT3+β6CF1+β7CF2
拍摄X线片,测量比较术前、术后腰椎侧凸角度(Cobb角)、腰椎前凸角度(LL)、椎间孔高度、椎间隙高度、椎间孔面积及椎管面积变化。
(10)
在式(9)中,所有特性变量的待估参数都是固定不变的值;在式(10)中,票价和运行时间两个特性变量的待估参数β1和β2是服从某一分布的随机变量,而其他特性变量的待估参数为固定不变的值.
利用设计的调查问卷,于2017年7月在北京西站进行了为期2 d的SP调查.共发出480份问卷,回收有效问卷446份,获得有效数据3 122条,有效率为92.9%;其中男性285人,女性161人,男女旅客比例约为1.77∶1.受访者年龄主要集中在18~23岁、24~30岁、31~40岁、41~50岁这4个年龄段,占总调查人数的90%.旅客职业分布、年收入分布、出行目的分布及出行费用来源分布情况见图1.
表4 各参数的估计值
图1 调查结果Fig.1 Survey results
根据获得的旅客选择行为调查数据,通过Biogeme软件,对构建的不考虑个体异质性的MNL模型、考虑个体可观测异质性的多项Logit模型(MNL-SOC模型)和考虑个体完整异质性的ML模型进行标定,结果如表4所示.其中:t-test统计量用于检验变量的显著性,当其绝对值大于1.96时则认为变量显著;ρ2和Adjustedρ2用于检验模型的拟合优度,值越大说明拟合优度越好[11].
如表4所示,MNL-SOC模型、MNL模型和ML模型中各特性变量系数估计值的t-test统计量的绝对值基本都大于1.96,因此所选取的各特性变量的显著性都比较好,应在模型中保留.在ML模型中,β1和β2两个特性变量的系数都服从正态分布,这两个分布函数的均值和标准差的t-test统计量的绝对值也大于1.96,从而说明了系数分布函数假设的合理性.根据参数的标定结果,MNL模型、MNL-SOC模型、ML模型的效用函数分别为
ViMNL=-0.006 11P-0.568T+0.857DT1+0.644DT2+0.232DT3+0.41CF1+0.508CF2
(11)
ViMNL-SOC=(-0.0078+0.00109I+
0.00179F)P-0.569T+0.861DT1+0.649DT2+
0.230DT3+0.412CF1+0.508CF2
(12)
ViML=β1P+β2T+1.1DT1+0.857DT2+0.207DT3+0.549CF1+0.588CF2
(13)
根据参数标定结果可知,列车票价、运行时间、发车时段、车上服务水平均会影响旅客的乘车选择行为.从票价来看,3个模型中票价的系数估计值均为负值,说明票价越高旅客选择列车的效用越低.在MNL-SOC模型中,旅客的收入水平及费用来源(是否自费)的系数均为正值,说明当旅客的收入越高或者公费出行时,票价对旅客选择列车效用的影响越小.从运行时间来看,3个模型中运行时间的系数估计值均为负值,表明列车运行时间越长,旅客选择列车的效用越小.从发车时段来看,3个模型中发车时段的系数估计值均为正值,并且结合各个发车时段的系数估计值大小,可以得到旅客对不同发车时段列车的偏好:首先选择8:00—12:00的列车,
其次
选择12:00—16:00的列车,然后是16:00之后的列车,最后选择早上8:00前的列车.从车上服务水平来看,3个模型中,衡量车上服务水平的变量的系数估计值都为正值,说明提供免费餐饮和WiFi都会对旅客选择列车产生正效用;从系数估计值大小可以看出,WiFi对于旅客选择列车的影响更大.从ρ2值和Adjustedρ2值来看,ML模型的最大,其次是MNL-SOC模型,最后是MNL模型,表明ML模型的拟合优度最好,MNL-SOC模型次之,最后是MNL模型,充分说明:考虑个体异质性较不考虑个体异质性,更能反映旅客的实际选择行为;当考虑完整的旅客个体异质性时,旅客的乘车选择行为能够被更好地刻画.
支付意愿可以用来分析旅客对影响列车选择的各特性变量的偏好程度,根据各特性变量的系数估计值,能够得到各特性变量的水平值变化时旅客支付意愿的变化.因此,可以根据模型参数的估计值来研究个体异质性对旅客选择行为的影响.由于ML模型的拟合优度较MNL-SOC模型要好,并且能测量个体的可观测和不可观测异质性,因此通过比较ML模型和MNL模型中不同特性变量的旅客支付意愿来研究个体异质性对旅客乘车选择行为的影响.根据各模型的效用函数,可以得出旅客对某一变量Xk的支付意愿为
(14)
式(14)可以用来计算定量描述的特性变量变化时旅客的支付意愿.当特性变量不能定量描述时,如发车时段、车上服务水平等为0-1变量,对于此类特性变量,旅客支付意愿的计算公式为
(15)
式中:Vi1是变量水平值为1时旅客选择列车i的效用;Vi0是变量水平值为0时旅客选择列车i的效用.
根据式(14)和式(15),可以计算得到ML模型和MNL模型下各特性变量的旅客支付意愿,通过对比各特性变量的旅客支付意愿,可以得到个体异质性对旅客乘车选择的影响,各特性变量的旅客支付意愿如表5所示.
表5 各特性变量的旅客支付意愿
表5中多支付的比例是以北京—西安的高铁二等座全价票为基准计算得到的,数值变化中的水平1-2、1-3、1-4分别指的是水平值由1变到2、3、4.可以看出:相对于MNL模型,ML模型中各特性变量的旅客支付意愿都要低于MNL模型中的相应状态,由于ML模型的拟合优度较MNL模型的拟合优度更好,因此ML模型下的旅客支付意愿更能反映旅客的实际选择行为,从而表明当忽略个体异质性时旅客的支付意愿会被高估.
由于考虑旅客异质性的模型所得到旅客的支付意愿更符合实际情况,因此可以利用表5中ML模型得到的旅客支付意愿,对具有差异性的列车进行差别定价.如果A车比B车快1h,则可以在A车原有票价的基础上增加15%,或者给B车打8.5折;如果A车在8:00之前出发,B车在8:00—12:00出发,则可以给A车打8折或者在B车原有票价的基础上增加20%;如果A车提供免费WiFi而B车不提供WiFi,则A车在定价时可以适当提高票价,在原有票价基础上增加约10%.根据旅客的支付意愿,对各列车采取差别定价的策略,可以满足不同旅客的出行需求,均衡各列车的上座率.
1)通过对影响旅客乘车选择行为的因素及个体异质性分析,在确定影响旅客选择行为的属性及水平值的基础上,利用SP调查的正交设计,构造旅客选择情景并设计问卷.
2)在此基础上,分别以MNL模型、MNL模型的变形形式及ML模型为基础,分别构建了不考虑个体异质性、考虑个体可观测异质性和考虑个体完整异质性的旅客选择模型.
3)通过对北京—西安的高速铁路旅客进行调查来获取旅客乘车选择数据,并标定模型参数.结果表明:ML模型的拟合优度最好,更能反映旅客实际的支付意愿;当忽略旅客异质性时,旅客的支付意愿会被高估.