基于潜在类别-Logit模型的共享自动驾驶汽车使用意向*

2022-05-14 12:22:06姚荣涵张文松祁文彦
交通信息与安全 2022年2期
关键词:等待时间行者意向

姚荣涵 龙 梦 张文松 祁文彦

(大连理工大学交通运输学院 辽宁 大连 116024)

0 引 言

自动驾驶汽车(autonomous vehicle,AV)是1种能够感知外部环境、无需人为操作、可使出行更安全、高效、舒适和环保的车辆[1]。共享经济使生活更经济、更便利。当自动驾驶汽车与共享经济相结合,则出现共享自动驾驶汽车(shared autonomous vehicle,SAV),将为人们提供1种新型的出行方式。

SAV类似于无人出租车,兼具网约车服务与自动驾驶技术二者之优势[2]。相比于AV,SAV因共享特性而使AV服务于不同收入阶层的人群。同时,SAV有助于降低或延缓人们购置车辆的需求,一定程度上有利于缓解交通拥堵和改善交通环境。相比网约车,SAV因无需人为驾驶,可避免无人接单现象;相比共享电动汽车,SAV因无需借助步行或其他方式而使出行更便利,且因无需担心站点没车可用而使出行更安心[3]。进一步的研究表明,在市区使用时,SAV可替代私人小汽车和公共交通;在郊区使用时,SAV可替代私人小汽车;1辆共享自动驾驶汽车可替代11辆私人小汽车[3],这将有效地减少城市交通量,从而缓解城市交通拥堵;当SAV与公共交通相结合,减少交通量和缓解交通拥堵的作用将更加明显[3-5]。此外,SAV可以显著提高各种场景下的可达性,减少高达90%的停车需求[6-7]。作为新型的出行方式,识别SAV使用意向的重要影响因素是预判SAV市场占有率和推广SAV服务的关键。

近年,国内外已有众多学者开展SAV使用意向研究。Krueger等[2]利用混合Logit模型得到出行费用、出行时间、等待时间是影响SAV使用的显著性因素,且不同人群的SAV使用意向存在明显差异;Webb等[8]运用离散选择模型也得到相似结论,向特定人群介绍SAV优点,会明显增加此人群的SAV使用意向;Nazari等[9]使用结构方程模型,发现安全担忧、绿色出行和网约服务接受能力是影响SAV使用意向的主要潜在因素。姚荣涵等[10]使用混合Logit模型对有、无私家车人群分别探究SAV使用意向的各影响因素,结果表明:出行目的、性格态度特征等也会显著影响SAV使用意向。此外,现有出行方式、工作安排、居住位置、接送乘客时间、到达目的地时间都显著影响SAV使用意向[11-12]。对于新型出行方式,EL等[13]建立离散选择模型框架后分析其使用和扩散情况。可见,已有文献大多采用离散选择模型、结构方程模型,根据意向调查数据分析SAV使用意向,识别其各种影响因素及其程度。

综上,SAV的使用会改变不同人群的出行习惯,且不同人群对于SAV的使用意向有显著差异,但现有文献未深入探讨人群的潜在类别,也没有分析各种影响因素对各类人群使用SAV的差异,因而影响因素广泛性和出行者异质性都值得进一步探讨。本研究依据社会经济属性、历史出行特性、行为态度特征和出行方式属性找寻影响SAV使用意向的深层原因,考虑出行者异质性建立SAV使用意向的潜在类别-Logit模型,获得不同类别出行者的特征及其影响因素,获知出行者选择SAV的行为。

1 调查问卷设计与统计分析

1.1 调查问卷设计

鉴于SAV目前尚处于测试阶段,本研究采用实际(revealed preference,RP)+意向(stated preference,SP)调查方法、以调查问卷形式获知并分析出行者对SAV的使用意向。根据调查目的,设计的调查内容分为社会经济属性、历史出行特性、行为态度特征[10,14]、出行方式选择4个部分。

采用RP调查方法获知受访者的社会经济属性、历史出行特性、行为态度特征。社会经济属性调查了解受访者的社会经济属性(如性别、年龄、收入);历史出行特性调查了解受访者在历史出行过程中所涉及的出行方式、目的、时间和费用等;行为态度特征调查了解受访者对SAV的基本态度以及与其他出行方式相比较时的区别认知,其中将SAV使用人群类型作为1个外显变量,根据3个问题把受访者划分为不同的SAV使用人群类型,以此获知受访者对SAV的使用态度。

采用SP调查方法获知受访者的出行方式选择,出行方式选择集为私人小汽车(private car,PC)、共享电动汽车(shared electric vehicle,SEV)、网约车(ride-hailing service vehicle,RHSV)和SAV。考虑同行人数、等待时间、行驶时间、出行费用及出行方式,为各变量设置3种水平,见表1。这里等待时间对私家车是取、停车总时间,对共享电动汽车是前往租车点和归还车辆的总时间,对网约车是等待接单和接单后等待车辆的总时间;行驶时间是指交通工具在出行路线上花费的时间,即不计因停车或还车操作而导致的绕行时间;出行费用对私人小汽车是停车、燃油、通行等总费用,对其他出行方式是租车费用。对比各方式技术性及便捷性,PC、SEV和RHSV等待时间参考日常情况进行设置,PC、SEV和RHSV行驶时间参考行驶距离除以行驶速度进行设置,PC出行费用参考日常情况进行设置,SEV出行费用参考盼达共享电动汽车的费用标准进行设置,RHSV出行费用参考滴滴网约车的费用标准进行设置,SAV等待时间、行驶时间和出行费用按等待更少、速度更快、费用更高的技术先进性原则进行设置。根据L27313正交表得到27个实验方案,将其随机分成6组后分别置于6套问卷中。

表1 SP调查考虑的影响因素及其水平Tab.1 Influencing factors and their levels considered by SP survey

借助问卷星平台于2018年3月实施此次调查,累计回收333份问卷,调查区域涉及中国25个省/直辖市。为提高数据可信性,根据答题时间、校验题目、数据逻辑对回收的问卷进行筛选,获得311份有效问卷用于数据统计分析、参数标定和模型解释,共涉及1 397个SP选择结果。

1.2 数据统计分析

表2列出了受访者社会经济属性各因素的取值分布。由表2可见:男女比例均衡,绝大多数为中青年,大多学历较高、没有小孩、收入不高,以学生和工作者为主,驾龄分布基本均匀,有无小汽车的比例相当。受访的学生和工作者因小汽车拥有、通勤需求等原因主要使用公共交通或出租车,对共享出行的意愿比较强烈。因此,所得样本能较好地反映人们对SAV的使用意向。进一步使用聚类分析处理历史出行特性调查数据,受访者的历史出行模式可分为舒适小汽车出行和经济公共交通出行2类,后者样本数约是前者的2倍,出行方式的快捷性、便利性和安全性是出行者考虑的主要因素。

表2 社会经济属性各因素分布Tab.2 Distribution of each factor of socio-economic attributes

由行为态度特征调查中有关SAV使用的问题,将SAV使用人群分为创新者、模仿者和不使用者。SAV投入市场时第一时间将SAV作为日常出行方式的受访者为创新者,无论SAV投入市场多久都不将SAV作为日常出行方式的受访者为不使用者,其他受访者为模仿者。根据开始使用SAV时SAV使用者的占比,将模仿者再细分为早期、主要和后期3类模仿者,这些人群分布见图1。表3针对历史出行特性和行为态度特征列出外显变量及其取值。

表3 历史出行特性和行为态度特征外显变量及其取值Tab.3 Manifest variables and their values of historical travel characteristics and behavioral attitude characteristics

由图1可见:29.3%的受访者属于创新者,当SAV初次投入市场时,该人群就愿意使用SAV;40.8%的受访者属于模仿者,当有人使用SAV之后,该人群才愿意使用SAV,其中早期、主要和后期模仿者分别占12.5%,26.0%和2.3%;29.9%的受访者属于不使用者。后期模仿者占比很低,当SAV使用人数达到90%时,该人群才愿意使用SAV;不使用者在SAV普及后仍然拒绝使用SAV。不低于70%的人对SAV持接受态度,这说明SAV具有市场潜力。相比私人小汽车、共享电动汽车、网约车和出租车,SAV在便利性、舒适性、快捷性、经济性和环保性方面都有明显优势,但受访者对其安全性存疑。

图1 SAV使用人群分布Fig.1 Distribution of SAVuser categories

2 SAV使用意向的潜在类别-Logit模型

2.1 潜在类别模型

潜在类别(latent class,LC)模型借助不可观测的潜在变量解释可观测的外显变量间的关系,从而将数据进行分类,用于研究出行方式选择行为时,可充分考虑出行者异质性[15]。潜在类别模型与传统因素分析模型和结构方程模型最主要的区别在于变量类型,前者处理类别变量,而后二者处理连续变量[16]。本研究所述外显变量和潜在变量均适合描述为类别变量,因此选用潜在类别模型。这里选择社会经济属性(见表2)以及历史出行特性和行为态度特征(见表3)涉及的15个变量作为外显变量。概率参数化所得潜在类别模型为[16]

完成潜在类别模型的参数估计之后,需要选取合适的指标对模型适配性进行检验,这里选择赤池信息量准则(akaike information criterion,AIC)、贝叶斯信息量准则(bayesian information criterion,BIC)、校正的贝叶斯信息量准则(adjusted Bayesian Information Criterion,aBIC)、熵(Entropy)这4个常用指标[9]。根据这些指标选取使潜在类别模型最优的潜在类别数。由于按潜在类别分类数据存在误差,需要评价分类的正确率,采用的2个指标[17-18]为

2.2 多项和混合Logit模型

离散选择模型在一系列独立和详尽的备选项基础上,运用效用最大化原则,假设出行者完全理性,认为出行者选择对自我效用最大的出行方式,用于分析出行者在多种备选出行方式中进行选择的意向。离散选择模型给出的效用函数由固定项和随机项组成。考虑上述调查问卷涉及的4种出行方式,出行者i选择出行方式j∊{1,2,3,4}(1,2,3和4分别表示PC,SEV,RHSV和SAV)的效用为[19]

式中:Uij,Vij和εij分别为出行方式j对出行者i的效用、固定效用和随机效用。

出行者i选择出行方式j的固定效用可表示为[13]

式中:xijm为出行者i选择出行方式j时对应的第m个外显变量;βjm为出行方式j的第m个外显变量对应的参数。

出行方式j对出行者i的随机效用是可由随机变量表示的未知效用(即误差项),当该随机变量服从不同分布时,则形成不同的离散选择模型。

多项Logit(multinomial Logit,MNL)模型假设随机效用服从Gumbel分布,即对任意出行方式和出行者都满足独立同分布,那么出行者i选择出行方式j的概率Pij为[19]

式中:J为出行方式数。

由此可见,多项Logit模型需要满足不相关选项相互独立的假设,即任意2种出行方式的选择概率比与其他出行方式无关。然而,城市交通中部分出行方式之间是否存在相关性并不确定,所以多项Logit模型在某些情况下会失效。

有学者提出考虑随机偏好差异的混合Logit(mixed Logit,MIXL)模型,认为外显变量对应的参数因个体偏好差异而服从某种分布(如正态分布、对数正态分布),这样既考虑个体偏好异质性又包容出行方式相关性。那么,出行者i选择出行方式j的概率为[19]

对于MNL和MIXL,使用极大似然法标定未知参数,对各变量参数进行t检验可得此参数的显著性,再分析参数值的符号和大小可得各因素对各出行方式使用意向的具体影响。

2.3 潜在类别-Logit模型

为考虑潜在类别对SAV使用意向的影响,先建立各种出行方式对各潜在类别出行者的效用函数,再将每个出行者属于各潜在类别的后验概率与所得各种出行方式对各潜在类别出行者的效用函数相结合,从而得到各种出行方式对每个出行者的效用函数。因此,潜在类别模型用于对总样本分类并获取各类别概率,多项和混合Logit模型作为对各子样本进行参数标定的基本模型。依据离散选择模型,出行方式j对属于潜在类别t的出行者i的效用函数为

本研究建模流程见图2。

图2 建模流程Fig.2 Procedure of modeling

3 SAV使用意向建模与分析

3.1 潜在类别分析

不同类别人群具有明显不同的出行方式选择行为,而人群类别属于不可观测的潜在类别变量。为使用潜在类别变量揭示出行者异质性及影响出行方式选择行为的外显变量间的关系,选取社会经济属性、历史出行特性、行为态度特征3个部分变量作为外显变量,利用Mplus 7.4软件建立潜在类别数分别为1,2,…,8的8个潜在类别模型。根据表征模型适配性的AIC,BIC,aBIC和Entropy寻找最佳的潜在类别模型,前3个指标均通过期望值与实际值之差来判断模型拟合优劣,其值越小表示模型越好;而Entropy描述分类准确性,其取值范围为[0,1],其值越接近1表示分类越准确[16]。图3展示了不同潜在类别数所得模型的各指标值。

图3 不同潜在类别模型的评价指标Fig.3 Evaluation indices for different latent class models

由图3可见:当潜在类别数大于3,AIC和aBIC基本上不再减小;当潜在类别数为3时,Entropy达到0.957,此时所得模型优于67%的模型。因此,最佳潜在类别数应取3,可得各因素各水平的条件概率。此时,各潜在类别的概率分别为0.160,0.376,0.465,由问卷数据所得其频率分别为0.164,0.370,0.466,二者确实稍有差异,进一步评价分类结果的正确率。经过计算,λ1为0.983,λ2为0.967,可知潜在类别数为3的分类是准确的。

按样本数据的分类结果和受访者的外显变量特征,将3个潜在类别变量代表的第1类、第2类和第3类人群分别命名为“冲动的积极创新者(impulsive and positive innovator,IPI)”“矛 盾的保 守创新 者(contradictory and conservative innovator,CCI)”“理智的保守使用者(rational and conservative user,RCU)”,其显著性外显变量的特征如下:①IPI收入和学历不高,不太了解SAV时就愿意使用SAV;②CCI收入较高,倾向于舒适小汽车出行模式,大多愿意使用SAV,但会有所顾虑,因习惯使用私人小汽车而出现矛盾的选择;③RCU学历高而收入不高,较理性地考虑SAV的经济性和其他因素,大多不愿意使用SAV或有较多亲友使用SAV后才愿意使用SAV。

3.2 SAV使用意向建模

根据式(7)和潜在类别分析所得概率,建立SAV使用意向的潜在类别-Logit模型。如前所述,将出行者分为3类,由Mplus 7.4软件把每位受访者归入对应的潜在类别;再将各子样本的社会经济属性变量、历史出行特性变量、行为态度特征变量和出行方式属性变量共同代入多项或混合Logit模型;之后利用R 3.4.1语言标定所建SAV使用意向的潜在类别-Logit模型的参数。

使用总样本数据和3个潜在类别的子样本数据分别标定多项和混合Logit模型。以总样本数据标定的模型作为对照模型,分析其他模型相比对照模型的差异。参数标定过程中,为避免多重共线性,使用逐步回归法,每步进行F检验,根据各变量的重要性逐个将其引入模型[19]。

利用多项Logit模型及总样本和3个子样本所得模型分别称为MNL,MNL-IPI,MNL-CCI和MNL-RCU模型,基于潜在类别模型将后3个模型所得概率加权求和后得到潜在类别-多项Logit模型,称为MNL-LC模型。利用混合Logit模型及总样本和3个子样本所得模型分别称为MIXL,MIXL-IPI,MIXL-CCI和MIXL-RCU模型,基于潜在类别模型将后3个模型所得概率加权求和后得到潜在类别-混合Logit模型,称为MIXL-LC模型。

建模过程中,先假设等待时间、行驶时间和出行费用的参数均服从正态分布或对数正态分布,找到极大对数似然函数值最小的模型;再对这些模型的参数进行标准差显著性检验。选显著性水平为0.05,MIXL-IPI和MIXL-CCI模型的3个参数均未通过标准差显著性检验,说明这2个模型不适用;MIXL和MIXL-RCU模型的等待时间的参数未通过标准差显著性检验,而行驶时间和出行费用的参数服从正态分布时通过标准差显著性检验,说明这2个模型在合适的条件下适用[19-21]。

表4~5分别列出MNL-IPI,MNL-CCI,MNL-RCU和MIXL-RCU模型对社会经济属性及历史出行特性、行为态度特征和出行方式属性的参数标定结果。可见,影响不同潜在类别的显著性因素不同,相同因素对不同潜在类别的影响程度不同;SAV使用人群类型是共有的显著性因素,创新者和模仿者对应的参数均为正值,且前者显著大于后者;影响SAV使用意向的显著性因素有性别、年龄、学历、驾龄、小汽车拥有量、儿童人数、历史出行目的、SAV了解程度、SAV使用人群类型、同行人数、等待时间和人均出行费用;MNL-RCU模型中人均出行费用是显著的,MNL-IPI、MNL-CCI和MIXL-RCU模型中人均出行费用是不显著的,这符合潜在类别的特征,说明应考虑不同潜在类别人群的异质性。

表4 不同Logit模型对社会经济属性的参数标定结果Tab.4 Results of parameter calibration for different Logit models for socio-economic attributes

表5 不同Logit模型对历史出行特性、行为态度特征和出行方式属性的参数标定结果Tab.5 Results of parameter calibration for different Logit models for historical travel characteristics,behavioral attitude characteristics and travel mode attributes

使用极大似然比、预测正确率和AIC评价潜在类别-Logit模型的拟合优度,见表6。从表6可见:①MIXL模型比MNL模型的极大似然比大、预测正确率高、AIC值小,MIXL-RCU模型比MNL-RCU模型的极大似然比大、AIC值小,这说明混合Logit模型比多项Logit模型能更好地解释出行者对SAV的使用意向;②相比Logit模型,潜在类别-Logit模型的极大似然比增加、预测正确率提高、AIC值减小;相比MNL模型,MNL-LC模型的极大似然比增加49.59%以上、预测正确率提高13.11%以上、AIC值减小6.93%;相比MIXL模型,MIXL-LC模型的极大似然比增加59.38%以上、预测正确率提高13.33%以上、AIC值减小8.64%。

表6 不同Logit模型的拟合优度Tab.6 Goodness-of-fit of different Logit models

对比子样本和总样本所得Logit模型的参数标定结果,可发现引入潜在类别所得Logit模型更能揭示各潜在类别人群的特性,而不引入潜在类别所得Logit模型会掩盖各潜在类别人群的差异,这说明潜在类别显著地影响出行者对SAV的使用意向。

3.3 SAV使用意向分析

由于MIXL-LC模型比MNL-LC模型的拟合优度高,利用前者的参数标定结果进行边际效应分析,即分析出行方式属性(即等待时间、行驶时间和出行费用)变化对出行方式选择概率的影响。边际效应是指某出行方式的属性变化1个单位引起的该出行方式或其他出行方式选择概率的变化。前者为直接边际效应,后者为交叉边际效应,其计算式为[21]

按式(10)~(11)计算样本均值处属性变化引起的平均边际效应。表7列出了总样本对应的出行方式属性的平均边际效应。可见,除SAV自身属性外,其他出行方式对SAV选择概率的影响为私人小汽车>网约车>共享电动汽车,当私人小汽车和网约车的等待时间增加1个单位时,SAV选择概率增加0.28%和0.16%。SAV属性变量的平均直接边际效应较大,等待时间和行驶时间的缩短需要通过提高SAV技术才能实现,人均出行费用的降低只需调整SAV定价即可实现。

表7 总样本对应的出行方式属性的平均边际效应Tab.7 Average marginal utility of various travel mode attributes corresponding to all the samples

固定各出行方式选择概率的比例,图4显示了SAV人均出行费用每增加1元对各出行方式选择概率的影响。可见,SAV人均出行费用的变化对SAV本身的影响最大,其次是私人小汽车、网约车、共享电动汽车;SAV选择概率越接近0.5,其人均出行费用对自身的影响越大,反之亦然。

图4 SAV人均出行费用对不同出行方式的平均边际效应Fig.4 Average marginal utility of the average travel cost of SAVfor different travel modes

表8列出了不同类型SAV使用人群对应的SAV属性的平均边际效应。可知,各类SAV使用人群对SAV属性变化的敏感程度排序为模仿者>不使用者>创新者,SAV属性对其使用意向的影响程度排序为等待时间>人均出行费用>行驶时间。因此,SAV投入市场初期,建议缩短SAV等待时间或降低SAV人均出行费用以便吸引模仿者和不使用者。

表8 不同类型SAV使用人群对应的SAV属性的平均边际效应Tab.8 Average marginal utility of the attributes of SAV for different kinds of SAV users

4 结束语

将潜在类别模型和离散选择Logit模型相结合,构建了SAV使用意向的潜在类别-多项Logit模型与潜在类别-混合Logit模型。根据参数标定、模型检验和边际效应分析的结果,找到影响出行者选择SAV的显著性因素及其灵敏性,并为SAV发展及市场开发提出了一些建议。研究结果显示:出行者潜在地分为冲动的积极创新者、矛盾的保守创新者和理智的保守使用者3类;由于考虑了各类人群间的异质性,潜在类别-Logit模型在分析出行方式使用意向时具有更强的解释性和更高的准确性;当选择私人小汽车的出行者面临较多的停车问题或者选择网约车的出行者不得不忍受过长的等待时间,这些出行者将会选择SAV;当SAV选择概率接近于0.5时,SAV人均出行费用的轻微降低最易引起选择私人小汽车的出行者转而选择SAV;SAV投入市场初期,为吸引模仿者和不使用者,建议通过技术手段减少SAV等待时间或者降低SAV人均出行费用。

本研究所述潜在类别-Logit模型还可用于SAV定价。就调查问卷设计、样本覆盖面等细节问题,还有改进空间。在潜在类别模型与混合Logit模型结合方面,还可探讨混合Logit模型中解释变量的参数服从正态分布、对数正态分布以外的其他分布。

猜你喜欢
等待时间行者意向
给学生适宜的等待时间
——国外课堂互动等待时间研究的现状与启示
做“两个确立”的忠实践行者
少先队活动(2022年5期)2022-06-06 03:44:20
逆行者
供应趋紧,养殖户提价意向明显
猪业科学(2021年3期)2021-05-21 02:05:38
Cлово месяца
中国(俄文)(2020年4期)2020-11-24 00:16:05
最美逆行者
草原歌声(2020年1期)2020-07-25 01:45:16
东方留白意向在现代建筑设计的应用解析
活力(2019年19期)2020-01-06 07:35:50
批评话语分析中态度意向的邻近化语义构建
中国修辞(2017年0期)2017-01-31 05:41:04
意大利:反腐败没有等待时间
公民与法治(2016年2期)2016-05-17 04:08:28
顾客等待心理的十条原则
视野(2015年14期)2015-07-28 00:01:44