杨亚璪,唐浩冬,彭勇
(重庆交通大学,交通运输学院,重庆 400074)
新冠疫情对交通运输产生了严重的影响,据交通运输部统计,2020年全国36 个中心城市完成公共交通客运量441.5 亿人,同比下降33.7%。国务院发布的《抗击新冠肺炎疫情的中国行动》白皮书明确指出,2020年4月29日以后,全国疫情防控进入常态化阶段[1],即中国进入了后疫情时代[2]。目前,少数城市还会零星出现确诊病例,居民在出行过程中仍然存在感染恐惧和被感染的风险,居民对公共交通出行仍有抵制心理,转而选择出租车和私家车出行。在后疫情时代,研究新冠疫情这类突发公共卫生事件对居民出行方式选择行为的影响机理,可以更好地满足居民出行需求,提升居民的出行满意度。
出行方式选择行为的研究方法包括描述性统计分析、机器学习模型和离散选择模型这3类[3],其中以离散选择模型为主,包含多项Logit模型、分层Logit 模型、混合Logit 模型等[4]。大多数研究使用离散选择模型来描述基于调查数据的出行方式选择行为。Domarchi 等[5]建立多项Logit 模型并引入代表态度因素的虚拟变量,以探讨潜在心理因素对方式选择的影响;Arman 等[6]采用双层混合嵌套Logit 模型研究伊朗女性的出行方式选择行为;杨飞等[7]采用混合Logit 模型研究汽车分时租赁下个体异质性对出行选择行为的影响。出行方式选择行为受多种因素影响,刘志伟等[8]研究发现,无人驾驶汽车选择行为受到出行特征、社会经济属性、心理潜变量等因素影响;骆晨等[9]发现,家庭属性差异对大学生出行方式选择行为有显著影响。
目前,新冠疫情对居民出行方式选择行为的影响已取得一些研究成果。刘建荣等[10]利用Logit模型研究老年人对新冠疫情严重程度的感知以及对其出行行为的影响;王惠队等[11]基于累积前景理论研究重大公共卫生事件影响下医护人员的出行行为;Mohamed等[12]研究了新冠肺炎疫情对巴基斯坦居民出行行为的影响和由公共交通转向私家车的出行偏好变化情况;骆晨等[13]通过构建风险感知差异的多元Logit模型来分析疫情持续期对居民中长距离出行方式选择行为的影响;胡三根等[14]利用交通方式之间存在关联性的特点,分析疫情初期、中期和后期的居民出行方式选择行为与影响因素之间的关系;Luan等[15]利用随机后悔最小化和广义遗憾最小化研究新冠疫情暴发后期居民的出行心理变化及汽车购买意愿。
综上,既有文献研究了新冠疫情对特定群体出行行为的影响及疫情暴发期间居民出行行为的变化。虽有文献研究了后疫情时代的出行行为,但并未考虑到疫情本身和针对性防控措施的变化。相应出行方式和出行结构的变化是动态调整逐步趋于平稳,并向疫情前逐步回归的。虽然国内疫情得到了有效控制,但疫情持续时间和区域风险等级仍不明朗,后疫情时代下居民的出行行为尚需进一步研究。统计数据显示,2020年城市常规公交客运量同比下降36.1%,城市轨道交通客运量同比下降26.4%,而私家车保有量增加了973万辆。可见,新冠疫情对城市交通的影响在个体层面体现在出行方式选择的变化,在整体上则是出行结构发生了改变,居民出行更偏好私家车、共享自行车等物理距离较大的方式。本文采用混合Logit模型和潜在类别条件Logit 模型进行对比分析,旨在展示后疫情时代居民出行方式选择的偏好和变化,为公共交通的政策制定提供参考。
混合Logit模型以其灵活性可用于解决随机偏好问题,与之类似的潜在类别条件Logit 模型考虑了类别间的差异,在关于人群细分的研究中成为主流方法[16]。两种模型都有其优点和局限性,但哪种模型更适合研究后疫情时代下的出行行为尚未可知。本文基于城市出行主要的交通方式,确定常规公交、地铁、出租车、私家车为选择肢集合。根据实际情况设置选择肢的属性,包括等待时间、在途时间和行程费用,同时考虑居民的个人社会经济属性对出行方式选择的影响。
出行者n选择出行方式i的效用为
式中:Vni、εni分别为出行者n选择出行方式i的效用确定项、效用随机项;xnik为出行者n选择出行方式i的第k种出行方式相关属性和特有属性;βnik为对应的参数;Xni为能观测到的出行者n选择出行方式i的属性变量的完整向量;βn为对应的参数向量。
出行者n选择出行方式i的概率为
将等待时间、在途时间、行程费用对应的参数设置为随机变量,并且服从对数正态分布,则Vni表示为
式中:Cni为出行者n选择出行方式i的固定常量;Snik为出行者n选择出行方式i第k个人社会经济属性;βxk、βSk为对应属性的参数值。
将公交作为对比项,可得各选择肢的效用函数确定项为
式中:V1、V2、V3、V4分别对应地铁、出租车、私家车、公交的效用函数确定项;C1、C2、C3分别为地铁、出租车、私家车的固有常量;xwt、xdt、xco分别为等待时间、在途时间、行程费用属性变量;βwt、βdt、βco为对应的参数;Sge、Sag、Sed、Scareer、Ssa、Scar分别为性别、年龄、学历、职业、收入、是否拥有私家车属性变量;βge、βag、βed、βcareer、βsa、βcar为对应的参数。
假定有N个出行者,每个出行者面临T个出行方式选择集,每个出行方式选择集有J种方式,如果出行者n在选择方式集t中选择第j种方式,记ynjt为1,否则为0。每种选择方式由与该方式相关属性xnjt描述,出行者n由出行者相关的属性所描述。假定N个出行者可以被分成C个类别,且每个类别的参数不一致,即β=(β1,β2,…,βc),如果出行者n属于类别c,则出行者n面对一系列方案选择的概率为
通过指定出行者n选择的非条件似然值来判定出行者所属类别,其值等于式(6)在所有类别上的加权平均值,则出行者n属于类别c的概率可表示为
将每个出行者的对数非条件似然值相加得到样本的对数似然值,使用期望最大化EM(Expectation-Maximization)算法估计β和θ参数值,即
根据中国城市规划设计研究院发布的《2021年度中国主要城市通勤监测报告》,2020年重庆市单程平均通勤距离为8.9 km,平均通勤距离是衡量城市在综合了人们的选择后真实职住分离情况的指标[17]。因此,确定以10 km 的城市通勤距离为基础进行问卷设计。结合重庆市中心城区交通的实际状况对各属性水平值进行设置,如表1所示,考虑到公交、出租车和私家车易受道路交通状况等不确定性因素影响,设置水平1 和2 两类属性值更加符合现实情况。为了避免属性的多重共线性问题,利用正交设计形成合适的属性组合。基于《重庆市新冠肺炎疫情分区分级分类防控实施方案》,将新冠肺炎疫情风险划分为低、中、高风险,且中、低风险区域交通运输正常运转[18]。再根据全国城市交通客运量与新冠疫情确诊病例变化曲线(图1),将后疫情时代城市防疫状态设为两种情形,即处于低风险区(情景A)和中风险区(情景B),最终生成两大类共16个选择情景的调查问卷。问卷包括受访者的个人属性和影响出行选择因素的调查,具体如表2所示。
表2 个人属性水平及编码Table 2 Personal attribute level and code
图1 全国城市交通客运量及新冠疫情确诊病例变化情况Fig.1 Changes in national urban passenger traffic and confirmed cases of the COVID-19
表1 选择肢属性水平Table 1 Select limb attribute level
采用随机抽样法在重庆市开展网络问卷调查,共收集到650 份调查结果。考虑到老年人对网络不熟悉,同时在线下分发50份问卷,占比7.7%。对609 份有效样本进行整理分析,结果如图2所示。有效样本中,男性占比59.4%,女性占比40.6%,基本符合人口调查比例。年龄分布占比最多的是[18,25]岁,总体集中于[18,40]岁,较为符合中青年人对疫情敏感度最高的特征。受访者的收入主要集中在[3000,8000]元·月-1。调查样本的年龄、性别与收入分布与抽样计划基本一致。
图2 样本个人基本属性Fig.2 Basic attributes of sample individuals
如图3所示,采用桑基图展示新冠疫情对居民出行方式选择的影响。疫情前自由的出行环境使得公共交通在居民出行结构中占比59%;疫情期间由于各种限制措施,导致公共交通出行的比例骤减至27%,53%有出行需求的居民会选择私家车出行;随着疫情得到控制,社会进入后疫情时代,出行环境变得相对宽松,选择常规公交及地铁出行的比例逐步回升至40%左右,但当城市临时处于中风险区时,这种回升趋势会出现波动,说明居民对公共交通出行仍然存在感染恐惧。
图3 疫情不同阶段出行方式选择情况Fig.3 Choice of travel modes in different stages of epidemic
基于Stata16 软件,结合问卷调查得到的后疫情时代城市处于低风险区(情景A)和中风险区(情景B)出行方式选择数据,对式(2)进行计算,其中系数估计值的显著性采用P 值进行检验。混合Logit模型在连续抽取系数βn的仿真计算过程中,应用Halton数列方法,随机抽样150次计算仿真概率。
标定结果如表3所示。通过P值检验各参数的显著性。对照表2进行编码,标定结果中,性别参数符号为正表示女性,参数符号为负表示男性;年龄、学历、收入参数符号为正分别表示年龄越大、学历越高、收入越高;而私家车拥有情况参数符号为正表示未拥有私家车,参数符号为负表示拥有私家车。
表3 情景A、B下混合Logit模型参数标定结果Table 3 Parameter calibration results of mixed Logit model in scenario A and B
由表3可以看出:
(1)将公交作为参照方案,地铁、出租车和私家车这3 种出行方式的固定参数均显著,说明这3 种方式未被观测到的效用对其总效用各有影响。
(2)选择方式属性。等待时间、在途时间两个变量显著且参数符号均为负。说明等待时间和在途时间越长选择该交通方式的概率越低,这符合后疫情时代下居民出行的实际情况。其中在途时间参数值(情景A为-0.36331、情景B为-0.25364)绝对值最大,交通方式的在途时间是影响出行方式选择较为重要的因素,特别是通勤出行时对出行时间要求较高,而在途时间与道路通畅度以及停靠站点数直接相关。此外,行程费用变量不显著,说明居民在后疫情时代下出行时,对行程费用的敏感程度相较于等待时间和在途时间低。
(3)个人社会经济属性。在情景A中年龄在地铁、出租车和私家车的选择中是显著的,并且3 个参数都是负数。表明年龄越大,居民相较参照方案越不愿意选择地铁、出租车和私家车,即年龄越大选择公交出行的概率越高。重庆市65岁以上老年人乘坐主城区公共交通可以刷老年人免费卡,而老年人免费卡在早上9:00前不能乘坐地铁。性别在3个方案中均显著,除了地铁以外其余两个参数都为正,表明女性相对于参照方案来说,更倾向于选择出租车和私家车出行。这一点与出租车和私家车的在途时间较短且安全系数较高的特点相符。收入参数在3个方案中均显著,但出租车和私家车的参数为正,地铁为负,表明收入越高的人相对公交出行,更倾向于选择出租车和私家车出行。私家车拥有情况对于三者都为显著,除了私家车以外,其余两者参数都为正,表明有车一族更倾向于选择私家车出行。
在情景B 中,年龄、性别、学历这3 个参数均显著,年龄和性别参数与情景A相同。年龄越大更偏好公交出行,且女性相对于参照方案来说,更倾向于选择出租车和私家车出行。学历参数在3 种方式选择中均为正,表明随着学历的提升,居民选择地铁、出租车和私家车出行的概率都比参照方案大。即学历越高,选择公交出行的概率越小,且相较而言,在后疫情时代城市处于中风险区的情况下,选择出租车出行的概率最大。
通过混合Logit 模型计算结果,输出得到两种情景下各种交通方式的选择比例。情景A为:公交(19.7%)、地铁(42.8%)、出租车(8.5%)、私家车(29%)。情景B为:公交(13.2%)、地铁(33.3%)、出租车(16.2%)、私家车(37.3%)。
采用CAIC(Consistent Akaike Information Criterion)和BIC(Bayesian Information Criterion)两个指标进行类别C的选择。CAIC和BIC的计算公式为
式中:Q1、Q2分别为CAIC和BIC的值;lnL为样本最大对数似然函数值;m为拟合模型参数的总数。
CAIC 和BIC 值越小,模型拟合度越高。当两者无法同时满足时,通常选取CAIC 最小值的分类数作为最佳分类数。
通过Stata16 编程运行得到不同分类数的CAIC 以及BIC,结果如表4所示,其中LLF 为对数似然值。在情景A中,当类别为4时,CAIC的值最小。CAIC值越小,模型拟合度越高,因此样本可以分为4 个子集。在情景B 中,当类别为5 时,其CAIC 和BIC 均为最小值,说明最佳潜在类别数量为5,因此将情景B 的样本划分为5 个类别对情景A、B下的样本数据进行潜在类别条件Logit模型回归。情景A样本中4个类别的占比分别为:28.1%、28.6%、34%、9.3%。情景B 样本中5 个类别的占比分别为:36.2%、5.8%、40.3%、7.5%、10.1%。
表4 潜在类别条件Logit模型CAIC及BIC比较Table 4 Comparison of CAIC and BIC of latent class conditional Logit model
由表5可知,等待时间、在途时间、行程费用这3个变量的参数估计值在不同类别中显著性各不相同。说明不同类别的居民在对出行方式选择偏好上表现出较强的异质性。具体分析如下:
表5 情景A、B下模型回归结果Table 5 Model regression results under scenario A and B
(1)类别1人群
情景A、B 中3 个参数均显著,属于“出行平衡型”。这类群体选择出行方式时会同时关注时间和费用因素,不会对某一因素特别敏感,希望在各出行属性上得到平衡,私家车的属性恰恰能较好满足这类人群的出行需求。
(2)类别2人群
情景A 中在途时间、行程费用参数显著,等待时间参数不显著,且行程费用参数的绝对值在4个类别中最大,即类别2 人群属于“在途时间和费用敏感型”。这类人群能够接受较长的等待时间,但是不能接受费用的增加。情景B 中3 个参数均显著,且等待时间参数的绝对值在5 个类别中最大,同时行程费用参数相对于类别2不敏感,说明这类人群为“等待时间敏感型”。综上,类别2人群更偏好出租车出行。
(3)类别3人群
情景A中等待时间参数不显著,在途时间和行程费用参数均显著,且两个参数的绝对值都相对较小。说明这类人群为“在途时间和费用均衡型”,能够接受等待时间的增加,对出行方式的在途时间和行程费用相对敏感。情景B中3个参数均显著,且行程费用参数的绝对值在5个类别中最大,说明这类人群为“时间平衡、费用敏感型”,能够接受时间的增加,对出行方式的费用相对敏感。综上,类别3人群更偏好地铁出行。
(4)类别4人群
情景A、B 中等待时间、在途时间参数不显著,但行程费用的参数显著。说明这类人群属于“费用敏感型”,能够接受时间上的增加,对行程费用的敏感使得这类人群更偏好公交出行。
(5)类别5人群(情景B)
3 个参数均不显著,属于“出行随机型”。这类群体选择出行方式时不会关注时间和费用因素,任何一种出行方式都能满足这类人群的出行需求。
居民特性对潜在类别的影响如表6所示。情景A中将类别4作为参考基础,性别和收入在类别1、3 中均显著,在类别2 中性别不显著、收入显著,且类别1 中性别和收入参数均为正,类别3 中性别和收入参数均为负。说明类别1中,收入更高的女性更愿意选择私家车;类别3 中,收入较低的男性可能更容易成为“费用敏感型”。年龄在类别1 中不显著,在类别2、3 中均显著,且在类别2 中为正,在类别3中为负,说明类别2中,年龄越大对费用越敏感。情景B中将类别5作为参考基准,年龄和收入在类别1、2、4 中均显著且符号均为正,在类别3中年龄显著但收入不显著。说明类别1、2、4中,年龄越大收入越高的人群更倾向选择所在群体偏爱的出行方式。性别和收入在类别3、4 中均显著且性别参数为负、收入参数为正。说明类别3、4 中,男性更愿意选择地铁、公交,且类别3、4 群体随着收入增加,越不容易成为“时间平衡、费用敏感型”“费用敏感型”。因此在类别3、4中,收入越高的男性可能会成为“出行随机型”。
表6 情景A、B下居民特征对潜在类别的影响Table 6 Impact of resident characteristics on latent class under scenario A and B
采用AIC(Akaike Information Criterion)和BIC两项指标评估两类模型,结果如表7所示,指标越小表明模型的拟合优度越高。其中,AIC=-2 lnL+2m,BIC 如式(10)所示。由表7 可知,潜在类别条件Logit模型在情景A、B下的AIC、BIC 值均显著小于混合Logit 模型,即前者拟合优度比后者更好,且拟合优度平均提高13%。模型的预测精度显示,前者对情景A、B 预测精度分别为63.3%、67.9%,后者对情景A、B 预测精度分别为61.14%、67.03%。前者的拟合优度和预测精度都更高,用于分析后疫情时代居民出行方式选择行为更有优势。
表7 模型AIC、BIC指标对比Table 7 Comparison of model AIC and BIC indicators
本文以后疫情时代重庆市实际调查数据为基础,建立了基于混合Logit和潜在类别条件Logit的选择模型,分析了城市处于中、低风险区两种情况下的居民出行方式选择行为。对相关属性变量参数进行了显著性分析,所得主要结论如下:
(1)相比混合Logit 模型,潜在类别条件Logit模型的拟合优度更好、预测精度更高。
(2)出行方式属性中,等待时间、在途时间对居民出行方式选择行为有显著影响。个人社会经济属性中,年龄、性别、收入等对居民类别划分具有显著影响。
(3)根据居民对出行方式属性的敏感程度以及后疫情时代城市疫情防控状态,对居民进行类别划分。当城市处于低风险区时,居民可划分为出行平衡型、在途时间和费用敏感型、在途时间和费用均衡型以及费用敏感型。当城市处于中风险区时,居民可划分为出行平衡型、等待时间敏感型、时间平衡和费用敏感型、费用敏感型、出行随机型。
本文利用两种模型对比研究居民在后疫情时代下的出行行为。未来研究中,有必要从两个方面继续深入:①不同出行方式属性的弹性分析;②基于出行目的差异的居民出行选择行为。