摘要 文章着眼于分析影响乘客交通接驳选择的个人特征,首先利用Logistic模型对扬州市客运站乘客数据进行了研究,发现性别、年龄、职业、收入和消费水平是关键的影响因素;然后通过构建的模型预测了乘客的选择概率,并通过敏感性分析确保了其稳定性。研究结果为改善交通规划和乘客体验提供了有力的决策依据。
关键词 Logistic回归模型;乘客接驳方式;个人特征影响因素;交通运输发展;模型稳健性
中图分类号 U239 文献标识码 A 文章编号 2096-8949(2025)02-0028-03
0 研究意义及现状
乘客接驳方式对城市交通系统至关重要,它连接了公共交通和个人交通。研究这些方式有助于理解乘客的出行习惯,对城市交通规划和管理具有指导作用。客运站作为交通网络的关键节点,对经济发展和出行效率具有显著影响。深入研究客运站的运营有助于制定科学政策,促进交通行业的持续发展。
国内外研究者对乘客的接驳方式选择进行了深入研究。Liu C等[1]通过建立多项式概率模型分析了不同年龄段乘客的出行特点;王天送等[2]利用公交IC卡数据识别地铁与公交的组合出行模式,并建立了基于时间条件的出行链识别框架;孙智源等[3]通过混合方法分析了高铁站接驳方式的异质性和关联性,采用潜在类别条件Logistic模型和Aprior算法对乘客进行了分类,并研究了社会经济属性对接驳方式选择的影响;毕亚茹等[4]通过问卷数据研究了公交接驳轨道交通的感知特征,并计算了不同条件下的接驳阈值;马君泽等[5]分析了共享单车接驳出行的特征,考虑了建成环境因素通过时空地理加权回归模型(GTWR)进行了分析,结果显示它们对接驳客流量的空间分布具有显著的影响。这些研究为理解乘客的接驳方式选择提供了多维度的视角。
1 客运站乘客接驳方式调查与分析
1.1 Logistic回归模型的概念及特点
Logistic回归模型是解决分类问题的关键统计方法,它能够评估各因素对选择可能性的影响,帮助研究人员理解行为倾向和决策过程。模型的优势在于其处理多分类问题的适应性、精确衡量变量影响,以及通过拟合优度进行灵活性的调整。
1.2 数据收集与处理
该研究通过问卷调查方法,收集了客运站乘客的接驳方式偏好、出行习惯及个人信息等数据。问卷设计覆盖了乘客的基本特征和接驳选择,以确保数据的客观性和真实性。乘客个人特征描述性分析如图1所示:
1.3 样本有效说明
充足的样本量对提升数据分析和模型训练至关重要,它有助于得到更准确、可靠的结果,并增强统计结论的可信度。这样做可以减少误差、防止模型过拟合,并提高模型对新数据的预测准确性。该研究通过10折交叉验证,得到模型的平均准确率为93.49%,证实了结果的稳定性和可靠性。
1.4 卡方检验
在进行多元Logistic回归分析前,卡方检验有助于在模型建立初期筛选出与接驳方式选择显著相关的自变量。通过检验,可确定值得进一步分析的因素,结果如表1所示。同时,根据分析结果绘制相应的数据图,如图2~3所示。
表中乘客性别1为男性,2为女性,接驳方式1—7分别为地铁、公交车、私家车、出租车(含专车、网约车)、电动自行车、自行车(含共享单车)以及步行,不同性别样本对于选择的交通方式,共有1项呈现出显著性(plt;0.05),意味着不同性别样本对于选择的交通方式呈现出差异性。通过百分比的对比差异可知,男性选择地铁的比例为51.75%,明显高于女性的选择比例8.47%;男性选择公交的比例为20.28%,明显高于女性的选择比例3.39%;女性选择私家车的比例为40.68%,明显高于男性的选择比例15.38%;女性选择电动自行车的比例为16.95%,明显高于男性的选择比例6.99%。
其他组同理,p的取值均小于0.05,即说明以上变量都显著,所以需进行多元逻辑回归。
1.5 多元逻辑回归
先进行多分类Logistic回归模型的似然比检验,所得结果如表2所示:
对p值进行分析,如果该值小于0.05,则说明模型有效;反之则说明模型无效。通过对p值进行分析可知,该模型有效。部分显著的结果如表3所示:
将性别、年龄、职业、收入和花费共5项作为自变量,而将选择方式作为因变量进行多分类Logistic回归分析,并且以选择方式的第一项即1*(选择方式为第二项即为2*,下同)作为参照项进行对比分析,Y一共有7项,并且以1*作为参照对比项,因此最终会有6个公式,最终模型公式如下:
式中,X——性别;Y——年龄;Z——职业;O——收入;P——花费。相对于1.0来讲,在2.0的前提下,性别的回归系数值为-0.403,但是并没有呈现出显著性,意味着性别并不会对方式产生影响。同理,对其他情况进行分析,所得结果见表4所示:
由表4可知,只有性别在各项对比中不显著。
2 利用决策树构建选择模型并进行敏感度分析
在Logistic回归分析后,该研究使用决策树算法进一步构建模型,以深入理解乘客的接驳选择行为。决策树通过将特征空间细分为更精确的小区域,预测每个区域的结果标签。
敏感度分析用于检验模型对输入变量变化的反应,其过程可用图3表示,以确保模型的稳定性和有效性。分析结果揭示了模型对某些关键变量的敏感度,但整体显示出良好的稳定性和鲁棒性,这增强了模型在实际应用中的可靠性。
由敏感度分析,年龄对步行(回归系数为1.577、p值为0.000、OR值为4.839),职业对出租车(回归系数为-1.402、p值为0.000、OR值为0.246)的选择属于高度敏感;费用对出租车(回归系数为1.366、p值为0.019、OR值为3.919),职业对步行(回归系数为-0.859、p值为0.002、OR值为0.424),收入对公交(回归系数为0.514、p值为0.039、OR值为1.672)的选择属于敏感,性别对所有方式、其他变量在其他对比中都不敏感(p值均大于0.05)。
3 结语
该文针对扬州市客运站乘客,运用Logistic回归模型分析个人特征因素对乘客接驳方式选择的影响,发现收入和费用为显著性因素。研究构建的模型能够准确预测乘客的选择概率,并通过敏感性分析确保了模型的稳健性。研究结果为城市交通规划和乘客体验优化提供了决策支持。
参考文献
[1]Liu C,Bardaka E,Palakurthy R, et al.Analysis of Travel Characteristics and Access Mode Choice of Elderly Urban Rail Riders in Denver Colorado[J].Travel Behaviour and Society, 2020:19194-206.
[2]王天送,邵昀泓,周静.基于公交IC卡的地铁公交组合出行链识别与组合出行特征分析[J/OL].综合运输, 2024-05-22/2024-05-31.
[3]孙智源,韩璐,王天实,等.基于混合方法的高铁客运枢纽接驳方式选择异质性与关联性分析[J/OL].土木工程学报, 2024-04-23/2024-05-31.
[4]毕亚茹,于晓桦,杨大志,等.考虑个体感知的公交接驳轨道交通范围确定[J].交通科技与经济, 2024(3):45-54.
[5]马君泽,郑长江,吴非,等.面向地铁站点的共享单车接驳出行特征及影响因素分析[J/OL].吉林大学学报(工学版), 2024-05-09/2024-05-31.