徐 颖,江 炽,陈登翔,刘许文言
(1.武汉理工大学 自动化学院,湖北 武汉441000;2.武汉理工大学 土木工程与建筑学院,湖北 武汉441000)
无车承运人作为国家探索发展“互联网+物流”的新模式,对整个物流行业的发展具有重要的意义。该模式下主要由三个主要的参与角色,分别为货主、无车承运人平台以及承运人[1]。但作为一种新业态与模式,其在发展过程中仍面临诸多问题及困境。当前阶段无车承运人平台较为关注的目标是快速促进成交以及较低的承运成本。为实现无车承运人平台和承运司机利益双赢,如何对承运线路进行科学定价是目前无车承运人平台亟待解决的问题[2]。
本文以mathorcup2020年数学建模A题的源数据为例展开分析,以无车承运人视角对货运线路定价的主要因素展开研究。该无车承运人平台面向承运端司机,将需要承运的线路任务以一定价格提前发布到网络平台上供承运端的司机浏览并决定是否承运该运输任务。承运端的司机将根据平台所发布的线路任务及价格决定是否接单,一旦接单(即交易成功)则任务下架。若无司机接单,平台可调价(价格发布限3次),若任务未被承运将给平台带来损失。
回归分析[3]的作用大体分为三种,分别如下:①识别以及判断真正影响平台货运线路定价(称之为因变量Y)的指标(称之为自变量X),即实现所谓的变量筛选;②判断自变量X与因变量Y的相关关系的正负性;③求解不同的回归系数以反映各变量之间的相对重要性,可用于权重的估计。
由mathorcup2020年数学建模A题的源数据可知,各类指标既存在定量指标,如总里程、线路总成本等,同时也存在定性指标,如业务类型、成交对象、紧急程度、打包类型、车辆类型、地区等。其中,以定性指标居多。针对因变量Y以及自变量X中存在的定量变量,利用Stata软件中的summarize指令进行描述性统计,结果如表1所示。
表1定量变量统计分析结果
针对自变量X中存在的定性变量,可引入虚拟变量。利用Stata软件中的tabulate指令返回对应变量的频率分布表并生成虚拟变量。
最小二乘法[4]主要通过将误差平方最小化以及匹配最适合数据的函数进行拟合,常用于多元线性回归分析。利用Stata中的regress指令运用最小二乘法进行回归分析,观察到变量存在多重共线性,即其之间存在很强的相关性,此时,利用常规最小二乘法进行回归分析将使参数估计值的方差增大,变量的显著性检验将失去意义,可能将重要的解释变量排除在模型之外。
为解决这一问题,考虑采用主成分分析[5-7]尽可能消除多重共线性。
首先,对所有研究样本进行总体描述性统计分析。描述性统计分析结果如表2所示,可发现成交对象主要为B(即承运商),调价比例较低且续签率高。
将16 008个样本以及10个指标构成大小为n×p的样本矩阵(n为样本数,p为指标数),首先对10个特征变量做标准化处理,步骤为按列(各变量)计算均值以及标准差Sj,计算得到标准化数据xij,即:
进一步对标准化后的数据进行相关性分析,计算样本矩阵的相关系数矩阵R,即:
表2总体描述性统计分析结果
绘制出相关系数矩阵R图如图1所示。
图中,颜色越深代表相关性越显著。由图1可发现,总里程与线路总成本相关性强,X7相对X1的相关系数为0.997;业务类型与调价比例相关性强,X9相对X2的相关系数为0.501;车辆类型与线路总成本相关性强,X7相对X4的相关系数为0.557。
图1相关系数矩阵R图
再计算相关系数矩阵R的特征值λp和特征向量ap,根据特征值计算结果算出主成分贡献率以及累计贡献率,即:
上述所计算的特征向量、特征值、贡献率以及累计贡献率汇总如表3所示,由表3可知,前四种主成分的累计贡献率达74.3%,由此可以考虑选前四个主成分,它们能够很好地概括原始变量。
由表3对四个主成分进行分析可得出如下结论:①第一主成分F1在X1、X4、X7上有中等程度的负载荷,而在其余变量上的载荷都较小,可称第一主成分为货运线路成分;②第二主成分F2在X10上有中等程度的正载荷,而在X2、X9上有中等程度的负载荷,而在其余变量上的载荷都较小,可称第二主成分为司机对价格的评价成分;③第三主成分F3在X6上有中等程度的正载荷,在X3上有中等程度的负载荷,而在其余变量上的载荷都较小,可称第三主成分为运输端与地区成分;④第四主成分F4在X5上有中等程度的正载荷,在X8上有中等程度的负载荷,而在其余变量上的载荷都较小,可称第四主成分为订单要求成分。
表3主成分分析计算结果
为进一步直观地展示各样本的分布情况以及聚类过程,利用SPSS软件绘制出聚类分析树状图,如图2所示。
由图2可知,当分类数取4时,即此时总里程以及线路总成本为第一类,可描述为货运线路里程及成本;成交对象和打包类型为第二类,可描述为平台指派对象;车辆类型、需求紧急程度、业务类型以及调价比例为第三类,可描述为订单要求;地区以及是否续签为第四类,可描述为司机评价。
图2聚类分析树状图
由于多元线性回归分析时,变量存在多重共线性,因此采用主成分分析。经过标准化处理后,通过对各变量进行相关性分析,可发现变量间的相关程度,并对特征向量、特征值、贡献率以及累计贡献率进行计算,便于后续主成分分析。同时,绘制出聚类分析树状图可视化表示聚类过程。由于聚类时采用的参数以及方法不同,因此聚类结果与主成分分析结论略有差异,但通过分析可发现分析出来的影响因素大体相同,因此权衡后本文采用主成分分析结果描述平台货运线路定价的主要影响因素。
综上所述,影响无车承运人平台进行货运线路定价的主要因素为货运线路里程及成本、司机对价格的评价、运输端与地区、订单要求,共计四种,其中,货运线路里程及成本这一因素占最重要地位。