宋溢露,羊 钊
(南京航空航天大学 民航学院,南京 211106)
近年来,随着我国民营机场体系的初步建立和地面交通的全面铺开,旅客在出行时的机场可选项增多.据统计,2019年全国旅客民航运输量6.6亿人次,同比增长7.9%,截至2020年境内运输机场(不含香港、澳门和台湾地区)达到241个,千万级机场达到39个.在多机场地区,各机场间具有不同程度的合作与竞争关系[1],支线机场数量的增加加剧了邻近机场对辐射范围重叠地区的客源竞争[2],旅客的选择行为更为复杂.因此,有必要对多机场地区旅客机场选择行为进行分析,这有助于明确机场群内各机场分工定位,避免内部恶性竞争,优化公共资源配置,提高资源利用效率,从而使中国更进一步向民航强国转变.
旅客选择机场的影响因素可归纳为机场基本设施服务、机场地面交通、机场延误处理、旅客航行属性和旅客基本属性五个方面.Skinner[3]和李海峰[4]强调了地面交通可达性的重要性.平均旅行时间、到达机场的交通时间、平均中转时间、航班频率及每周座位数被认为是影响旅客选择的重要因素[5].其他显著影响因素包括直达航班数量、机型[6]、航空公司的偏好[7]、机场购物区面积、执飞航空公司的数量、快速值机、航班晚点率[8]、旅客对机场设施、服务的感知满意度[9]等.
在研究旅客选择机场影响因素时,既有研究中,大多数文献利用多项Logit模型(MNL)分析旅客机场选择影响因素[5,10,11].国外学者利用了巢式Logit模型(NL)[12]、参数化随机选择集多项Logit模型(PCMNL)[13]、混合多项Logit模型(MXL)[14]等模型分析旅客选择机场行为.国内学者在MNL模型的基础上结合Kano模型[7]开展研究,提高模型准确度.PCMNL模型对MNL模型进行了改进,通过弹性分析克服了IIA特性,适用性高于多项Logit模型.同时,采用两层选择模型,第一层筛选出能满足一定条件的备选机场;第二层在选出的备选机场中进行最终选择,更加贴合实际,适用性比巢式Logit模型和交叉巢式Logit模型高.
鉴于此,本文基于PCMNL模型分析多机场地区旅客选择机场行为.先利用预问卷进行影响因素筛选,依据筛选出的关键因素和多机场地区各机场实际条件,编制并发放意向调查(SP)问卷,调查长三角浙江省嘉兴市2小时车程内地区旅客选择机场行为,建立PCMNL模型对其进行研究,并与MNL模型进行对比.研究多机场地区旅客机场选择行为,有助于预测该多机场地区各个机场在其共同市场的分担率,进一步明确该地区各个机场的定位,将对该地区机场整合资源高效运作提供参考,对其他地区的机场群提供借鉴.
本文依托长三角机场群浙江省嘉兴市2小时车程内开展旅客机场选择行为研究.选定出发地为浙江省嘉兴市,嘉兴市距离上海市、江苏省较近,2小时车程内的机场有5个,分别为上海浦东机场、上海虹桥机场、苏南硕放机场、杭州萧山机场、宁波栎社机场,其中,上海两机场为国际航空枢纽,杭州萧山机场为区域航空枢纽,五个机场等级分明,满足多机场地区的条件.
通过设置预问卷从影响旅客选择机场中的影响因素中选择较为重要的因素进行SP调查问卷的编写.预问卷共收回203份,其中有效问卷158份.筛选出的影响因素为航班起飞时刻、常用地面交通到达机场准点性、前往机场地面交通时间、机场航班准点率、机票价格和航班延误时机场应急处理.在实际调查中,航班起飞时刻与票价联系紧密,且当航班频率达到一定水平时,早中晚都有航班,故用航班频率和票价代替航班起飞时刻.得到SP调查问卷中的属性为常用地面交通到达机场准点性、前往机场地面交通时间、机场航班准点率、机票价格、航班延误时机场应急处理和航班频率.
SP问卷包括3部分:旅客基本情况、旅行信息以及情境选择.其中,情境选择部分通过实际情况设定属性水平,利用正交设计法进行选择情境设计,第一部分问题为“若要选择离港机场,以下哪个机场不在考虑范围内”,第二部分问题为“若要选择离港机场,会选择哪个机场”.
主体问卷采取网络发放的形式,共回收265份.旅客基本情况和旅行信息如表1.
表1 旅客基本情况和旅行信息
Table 1 Passengers’ basic information and travel information
变量受访者人数受访者百分比/%性别男12647.55女13952.45年龄18岁以下72.6418~25岁11141.8926~30岁7227.1731~40岁5922.2641~50岁145.2851~60岁20.75月收入800以下114.15800~15 009736.601 500~3 0009836.983 000~4 5002810.574 500~6 000186.796 000~8 00051.898 000~12 00072.6412 000以上10.38出行目的商务217.92休闲旅行9636.23上学6926.04探亲103.77其他62.26是否遇到延误是17787.62否2512.38
SP问卷结果为旅客在四个假定情境下做出的选择,以一位浙江绍兴的被调查者在假设情境二下的选择为例,其未将机场3列入考虑范围内,最后选择了机场4.该部分数据将用于PCMNL模型参数标定,其中,第一层和第二层选择数据各4 240组.
PCMNL模型构建整体思路如图1.
参数化随机选择集多项Logit(PCMNL)模型是Logit模型的一个分支,原理为最大效用理论.旅客机场选择决策中,效用由可观察效用和不可观察效用组成,旅客q选择机场i的总效用表示为
Uqi=Vqi+εqi
(1)
其中:Uqi是旅客q选择机场i的总效用,Vqi是旅客q选择机场i的可观察效用,εqi是旅客q选择机场i的不可观察效用.
可观察效用可以被一系列指标所衡量,在研究中,衡量指标为前往机场地面交通时间、常用地面交通到达机场准点性、航班频率、机票价格、机场航班准点率和航班延误时机场应急处理,则旅客q选择机场i的可观察效用表示为
Vqi=β0+β1xqi1+β2xqi2+β3xqi3+β4xqi4+β5xqi5+β6xqi6
(2)
其中:Vqi是旅客q选择机场i的可观察效用,β0、β1、β2、β3、β4、β5、β6是一组待定参数,xqi1、xqi2、xqi3、xqi4、xqi5、xqi6表示旅客q对机场i关于前往机场地面交通时间、常用地面交通到达机场准点性、航班频率、机票价格、机场航班准点率和航班延误时机场应急处理的效用.
由于εqi无法确定,旅客只能以一定的概率选择机场.旅客q最终选择机场i的概率表示为
Pqi=P(Uqi>Uqj,∀j∈C,j≠i)=
P(εqj (3) 其中:Pqi表示旅客q最终选择机场i的概率,C表示所有备选机场的集合. 旅客在选择机场时,会先划定部分机场作为备选机场,然后在备选机场里做进一步决策.PCMNL模型第一层选择构建的目的就是筛选出备选机场.当旅客q选择机场i的总效用Uqi大于一定的值时,旅客会选择该机场,这个值称为旅客q选择机场时的效用阈值.假设效用阈值满足标准逻辑斯蒂分布,则旅客q将机场i列入备选机场的概率为 (4) 其中:Mqi表示旅客q将机场i列入备选机场的概率,γ是一组待估向量组,ωqi表示旅客q考虑机场i的一组可观测属性向量,在研究中为前往机场地面交通时间、常用地面交通到达机场准点性、航班频率、机票价格、机场航班准点率和航班延误时机场应急处理. 图1 PCMNL模型构建思路Figure 1 PCMNL model construction idea 由于每个机场的效用阈值相互独立,则旅客q在机场选择集c内的概率为 (5) 其中:Pq(c)表示旅客q在机场选择集c内的概率,I表示机场数量,在研究中,I为5.其中分母是为了删除没有机场在其中的选择集对模型产生的影响. PCMNL模型第二层选择是在第一层选择选出的备选机场集中进一步决策,该层选择的模型本质上为MNL模型,因此旅客q在备选机场集c中选择机场i的概率为 (6) 其中:Pqi|c表示旅客q在备选机场集c中选择机场i的概率,η是一组待估向量组,xqi表示旅客q选择机场i的一组可观测属性向量,在本文中为前往机场地面交通时间、常用地面交通到达机场准点性、航班频率、机票价格、机场航班准点率和航班延误时机场应急处理. 如果机场i不在旅客q的备选机场集c中,则认为旅客q在备选机场集c中选择机场i的概率为0,用公式表示为 Pqi|c=0,i∉c (7) 综合第一层选择和第二层选择,旅客q选择机场i的概率为 (8) 其中:Pqi表示旅客q选择机场i的概率,Pqi|c表示旅客q在备选机场集c中选择机场i的概率,Pq(c)表示旅客q在机场选择集c内的概率,G表示所有机场的全部非空子集的集合,在本文中,G内集合的数量为31个. 第一部分部分参数标定针对PCMNL模型中对于备选机场的筛选,标定的是公式(4)中γ这一待估向量组的值.数据来源为调查问卷中“若要选择离港机场,以下哪个机场不在考虑范围内”这一问题收集到的答案,利用SPSS的多元Logistic回归进行参数估计结果如表2. 表2 第一层选择参数估计结果Table 2 The first layer selects the parameter estimation result 通过显著性检验,各系数正负满足逻辑要求,总体预测结果高于70%,说明参数计算的较为可行. 第二部分参数标定针对PCMNL模型中对于在备选机场中选择机场,标定的是公式(6)中η这一待估向量组的值.根据调查问卷中“若要选择离港机场,会选择哪个机场”这一问题收集到的答案,利用Stata软件进行多元Logit模型(MNL)进行参数估计结果如表3.其中航班频率这一变量因显著性不达标被剔除. 运算迭代次数为4次,小于10次,说明建模和程序上没有问题.Prob>chi2 = 0.0000表明与仅包含常数项的模型相比,该模型从整体而言具有更好的拟合优度.各系数通过显著性检验,正负满足逻辑要求,说明参数计算的较为可行. 表3 第二层选择参数估计结果Table 3 The second layer selects the parameter estimation result 命中率是指符合模型计算的结果与总结果数的比值,模型将使用命中率进行验证.通过再一次发放SP问卷,回收了125份,先对这些数据进行处理,为了模拟被调查者的选择,将每4个具体情况即每一假设情境视为一组,共得到500(125*4)个小组,排除其中最后没有做出选择的小组(问卷中关于“选择哪个机场”问题选了“都不选”选项的小组),共得到474个有效小组.针对这474个有效小组进行模型的验证,结果如表4. 其中PCMNL模型命中率为88.3%,MNL模型命中率为86.5%,前者命中率高于后者. MNL模型是PCMNL模型的一个特例,当所有旅客将所有机场列入备选机场的概率都为1时,PCMNL模型退化为MNL模型.通过对PCMNL模型的弹性分析[7],可得其克服了IIA特性,适用性比MNL模型高.在两者挖掘到的显著因素相同时,因素的影响程度不同,PCMNL模型通过两层选择的构建,精细化影响因素的作用范围,从而达到更高的预测精度. 表4 问卷有效小组各假设情境下各机场选择人数 及模型估算结果Table 4 The number of people selected by each airport under each hypothetical situation of the valid group of the questionnaire and the estimated results of the model 本文以多机场地区的旅客为研究对象研究其机场选择行为.利用预问卷确定选择机场的关键因素,依托长三角一具体多机场地区典型实例,编制发放SP问卷,调查旅客在关键因素水平不同的情境下对机场的选择.基于回收的数据构建参数化随机选择集多项Logit(PCMNL)模型,建立双层选择,利用SPSS和Stata软件分别进行两层选择的参数标定,最终模型具有88.3%的命中率,高于传统MNL模型.2.2 第一层选择——备选机场
2.3 第二层选择——机场选择
2.4 参数标定
3 结果分析
4 结 语