刘 琼,孙小慧,左 志
(1.新疆大学建筑工程学院,新疆维吾尔自治区 乌鲁木齐 830047;2.辽宁对外经贸学院信息管理学院,辽宁 大连 116052)
基于选择行为理论,MNL模型包括标准多项式Logit模型、条件Logit模型和混合模型。
(1)标准多项式Logit模型是离散选择模型的基础,是基于随机效用与效用最大化假设。其效用函数为
(1)
因此,个体n选择方案i的概率为
Pn(i)=P(Uni>Unj),(j≠i)
(2)
将公式(1)代入至公式(2)中,并假设εni服从广义极值分布时,则可以像导出二元Logit模型一样导出标准多项式Logit模型的形式,即个体n选择方案i的概率为
(3)
式中:J为选择集,比如高铁、大巴、私家车等。标准多项式Logit模型最为研究者诟病的一个缺陷是其无关选择独立性(Independence of Irrelevant Alternatives,IIA)假设:因变量的各个类别不存在相关性。
(2)将方案属性加入(3)式中,即可得到混合模型的函数形式为
(4)
式中:Zni为方案属性随个体和方案而变的属性。
为解决MNL模型未能考虑个体差异性与IIA假设的限制,随机参数Logit模型(Random Parameter Logit Model,RPLM)应运而生。
MNL模型假定参数βi为固定值,而随机参数Logit模型通过假定其参数βi为随机参数,并且服从某种分布,即βi~f(βi|θ)。f(βi|θ)是某种分布的概率密度函数,常见的分布形式有正态分布、对数正态分布、均匀分布,其密度函数是通过相应分布的参数θ集合来描述的。相对比公式(3),随机参数Logit的参数是非固定的,参数βi的第k个分量为
βnik=μki+σkiVnik
(5)
式中:μki为第i种因变量的第k个自变量的参数均值;σki为第i种因变量的第k个自变量的参数标准差;Vnik为样本n的不可观测随机效应并且其均值和方差分别为0与1。当所有的待估参数为固定参数即f(βi|θ)为1时,随机参数Logit模型退化为MNL模型。
本研究基于问卷调查法对乌鲁木齐至伊宁当地居民出行行为进行调查,现有的交通方式有:自驾、长途大巴、直达特快列车、 快速旅客列车、 城际动车和飞机。假设乌霍开通高铁,将发车时间划分为4个时间段且将高铁时速设置3个水平:200、250、300 km/h,对应的车内时间分别是3、2.5、2 h。车票价格根据高铁二等座车票价格设置3个水平,分别是181、193、277元;其他交通出行方式的票价和车内时间按照实际情况选取。收到问卷共计363份,其中有效问卷318份,问卷回收率为87.6%,满足标定选择行为模型对样本数量回收率的要求。
通过行为调查得到不同旅客个体特征和出行特征分布。其中男性旅客略多于女性旅客;年龄集中在25~40岁之间;职业多为公务员与企事业人员;大部分旅客为中等偏低收入。通过意向调查法可知旅客对于不同交通出行方式的选择偏好见表1。
表1 不同交通出行方式选择比例分布
将性别、年龄、教育水平、职业及月收入作为模型中的个体特征变量,是否拥有驾驶证、家庭或自己是否拥有小汽车作为模型中的出行特征变量;将不同交通方式的车上时间、费用或票价作为其方案变量。以此设计的模型变量见表2,为避免模型拟合出现多重共线性,对模型中的无序多分类及哑元变量指定了参照组。
表2 模型变量
基于stata17软件,拟合问卷调查得到的数据,其中系数估计值的显著性采用P值(p<0.05)进行检验。随机参数Logit模型在连续抽取系数向量βi的仿真计算过程中,应用Halton序列抽样方法,设定随机抽样400次计算仿真概率。方案变量的系数估计结果见表3。随机参数Logit模型中,方案变量的系数估计结果为随机项,可以用来描述不同旅客对方案变量水平的感知差异,因此表中列出了系数均值、系数均值标准差及P值;MNL混合模型的系数估计结果是非随机项,因此表中仅列出系数估计值和P值。个体特征及出行特征变量在随机参数Logit模型中的参数估计结果见表4,在MNL混合模型中的参数估计结果见表5。旅客的个体特征及出行特征变量对旅客选择行为的影响是确定的,因此在两个模型中的系数估计结果均是非随机项。
表3 方案变量的系数估计结果
表4 随机参数Logit模型的个体特征与出行特征变量的参数估计结果
表5 MNL混合模型的个体特征与出行特征变量的参数估计结果
评价离散选择模型的拟合优度指标有很多,其中较为常见的指标有: McFadden伪R2指标越接近0,表明模型拟合度差,越接近1,说明模型拟合度好;AIC(Akaike Information Criterion)与BIC(Bayesian Information Criterion)指标相对较小的模型拟合结果较好。Stata17软件给出了模型统计结果见表6,随机参数Logit模型其R2值相对较大,说明相较于MNL混合模型拟合结果的拟合优度更好。
表6 模型拟合统计量
根据表4的参数估计结果对出行方式选择行为进行如下分析:(1)长途大巴。变量Inco、Auto、Rapi系数估计值<0且统计结果显著,表明随着收入的增加,及自己或家庭拥有小汽车的旅客更不愿意选择长途大巴,而旅客对快速性属性的要求越高,越不会选择长途大巴。(2)直达特快列车Z。变量Age1、Age2、Age3、Aoto有显著的负向作用,表明40岁以下的出行者、家庭拥有小汽车的旅客不愿意乘坐该列车出行。(3)快速旅客列车K。变量Age1、Age2、Age3、Age4系数估计值<0且统计结果显著,表明50岁以下的出行者最不愿意选择该出行方式,可能是由于该出行方式的在途时间最长。(4)城际动车列车C与高铁。变量Rapi、Conv、Safe有显著的正向作用,表明重视快速性、方便性、安全性的出行者倾向选择该出行方式,原因可能是城际动车和高铁都能够为乘客提供良好的出行体验。(5)自驾。变量Gender有显著的正向作用,表明男性出行者倾向选择该出行方式;Occo1系数估计值<0且统计结果显著,表明公务员或企事业人员不愿意选择该出行方式;DL呈显著正向作用,或因为有驾照的出行者更青睐选择该种方式出行。
分析表5的参数估计结果可知:对快速性要求较高的出行者倾向选择城际列车、高速铁路,而不是其他慢行交通方式;对方便性要求较高的旅客不愿意选择普通火车出行;长途大巴、普通火车的变量Punc的系数估计值<0且显著,可见重视准时性的旅客显然不愿意选择这些准时性较差的交通方式;变量Safe在城际列车与高铁一列的系数估计值>0且显著,原因可能是城际列车与高铁能够提供给乘客足够的安全信任度。变量Edu在长途大巴和普通火车出行方式中显著呈负相关,表明随着教育水平的提高,选择该方式出行的概率就越小,原因可能是传统的交通方式难以保证高准时性,服务质量不高。变量Inco在各出行方式中的系数估计来看,个人月收入水平越高,出行者更不愿意选择长途大巴、普通火车,原因可能是传统的交通方式已经不能够提供舒适、良好的出行体验,很大程度无法满足高收入出行者的出行需求。
旅行时间与票价水平变量的系数估计<0且统计结果显著,说明旅行时间、票价水平变量与旅客对列车的选择行为负相关;票价水平变量的系数估计值小于旅行时间变量的系数估计值且统计结果显著,说明票价水平变量对旅客选择行为的边际效用大于旅行时间变量,影响旅客对短途高铁列车选择行为的关键因素是票价水平。
(1)通过引入出行票价或费用与在途时间作为出行旅客选择行为的影响因素变量,基于MNL模型构建乌霍线路不同交通方式的客流行为分析,随机参数Logit模型拟合程度更好,说明模型有较好的拟合能力,可能随机参数Logit模型允许选择者存在“随机口味差异”,更适合出行者对列车选择行为建模。
(2)准确拟合与预测旅客对不同交通方式出行行为的选择,有利于不同交通方式在相互竞争关系中协同发展,并为铁路运输部门规划与决策分析提供理论支持。还应进一步考虑个人特征与出行方案的交互关系,以分析不同旅客对各方案属性的敏感性,以及其他因素对旅客选择行为的影响。