方启稳 朱安定 傅培华
[摘要]提出了一种基于数据驱动的公路货运合同物流的投标报价模型,该模型综合了国内生产总值、燃油价格、市场需求、货物重量、运输距离、承运商、货车长度匕个凶素,从而提高了第三方物流企业的投标预测水平。针对运输成本的非线性特征,利用BP神经网络模型,通过案例分析获得的实证数据进行训练,对短期报价进行预测。另外,利用遗传算法提高搜索性能。通过与多元线性回归算法和BP算法进行比较,提出的混合GA-BP算法具有较佳的准确度和性能。该研究为第三方物流公司带来的启示在于,历史数据在公路货运合同物流的招标报价决策中是有价值和有效的。
[关键词]公路货运;合同物流;投标报价模型;数据驱动
[中图分类号]F252; F542 [文献标识码]A [文章编号]1005-152X(2018)02-0046-07
1 前言
公路貨运(Road Freight Transportation)是现代运输的主要方式之一。据交通部统计数据显示:2016年我国营业性公路运输完成货运量334.13亿t,同比增长6.1%,货物周转量61 080.10亿t·km,同比增长5.4%,公路货运量占我国全社会货运量的77.46%。合同物流(Contract Logistics)是公路货运第三方物流(Third-Party Logistics,3PL)的一种主要形式,制造型企业把物流服务外包给第三方物流公司降低成本。第三方物流公司通过降低运输和仓储的成本,减少与物流有关的固定资产投入,提高信息准确性和订单履行率等方式,为制造型企业带来好处。为了控制物流成本和提高服务质量,大多数规模以上制造型企业都采取公开拍卖方式采购物流服务。对第三方物流公司来说,优化投标策略是非常重要的,而公路货物运输成本的估算和预测是其中最重要的内容。
然而,第三方物流有多种模式可供选择,如:专线物流、干线物流、社会物流等,通过组合这些物流模式最终优化物流成本。从供应链管理视角看,第三方物流供应商的选择标准和绩效评估中也同样包含运输成本这个指标。为了与客户建立长期有效的供应链协作关系,第三方物流供应商需要知道如何在“硬”的条款方面和“软”的关系方面进行权衡。除此之外,第三方物流公司还提供第三方购买服务(Third-Party Buying),以增加收入。因此,在招标中很难估计运输成本和投标价格。
近年来,随着第三方物流公司逐步完善基于业务交易的企业信息系统,积累了大量数据,本文在实证数据分析的基础上,结合反向传播神经网络算法和遗传算法的优点,提出了一种数据驱动的投标报价模型来预测短期投标价格。
2 相关工作
公路货运定价受多种因素的影响。燃油价格是基本影响因素,Havenga提出了基于货运流量的运输成本模型,发现对石油价格的负面预测将推高运费价格;车辆路径是另一个因素,Figliozzi研究了在竞争环境中,提前估算新增需求的成本增量可以帮助承运公司找到最优解;Topal发现根据先前零担物流公司的价格规划和零售商的订货行为,可以增强承运公司的定价决策;此外,因碳排放而增加的空气污染费、政府补贴,以及区域性定价决策等因素也会影响公路货运定价。
拍卖竞价属于竞争性定价机制。Kuyzu提出了一个在独立同步单拍卖中,以承运公司期望利润最大化为优化目标的随机投标报价模型;Triki综合出价生成、定价、车队路由优化的随机优化模型;Song研究了以出价估计和出价构造为目标的可计算优化策略方法;Hou认为在线拍卖受参与投标人数的影响,由此间接影响了最终成交价格。
然而,从这些研究中得出的模型并不一定满足具体第三方物流公司的实际需求。本文运用第三方物流公司的实证数据,提出了一个实用的非线性投标决策模型。
3 案例分析与实证数据
M公司是一家成立于1989年的第三方物流公司,最初专注于啤酒运输,1992年以来逐步成为专业的货运经纪人。依托白建的供需匹配平台,M公司在为卡车提供及时的回程需求的同时,也为公司带来了较好的经济收益。M公司涵盖第三方物流的综合服务,如物流系统设计、运输、仓储、调拨、包装等。其客户覆盖华东地区的电器、食品,纺织、电缆等制造型行业。
由于大多数客户以合同物流的形式外包物流业务,M公司需要对年度合同进行竞争性投标。投标价格决策是一个难题。然而,M公司在自身信息系统中积累了大量的业务数据。本文结合公司自身的数据和公共经济数据,对M公司的投标报价进行预测,优化投标策略。
基于M公司提供的2012-2015年的业务数据,我们选取了电缆和家用电器两个典型制造型行业作为目标行业。从四年历史数据中随机抽取200个样本,前190个样本作为训练数据集,后10个样本作为测试数据集。使用相对误差( Relative Error,RE)作为预测标准:
其中x是预测值,μ是测试值。我们的模型也采用其他的公共经济数据。
4 主要因素分析
4.1 三类主要因素
影响公路货运成本的因素主要有三类,即:宏观经济因素、市场因素和经营相关因素。
宏观经济因素包括:国民经济状况和燃油价格。公路货运需求与国家经济发展水平有着密切的关系。生产和消费的增长促进了公路货运的需求和价格。一般地,国内生产总值(GDP)用来反映国民经济状况;另一方面,燃油价格则受国际原油价格波动的影响。
市场因素主要为市场需求,受季节性、周期性波动,以及其他集中性促销活动的影响,如:阿里巴巴的“双11”网购节和京东6月18日购物节。
经营相关因素包括:货物规格、货车规格、路径和承运商。货物规格如重量、体积、包装、装卸要求、运输要求和其他具体限制条件,是成本估算的主要方面,实践上,我国货运市场通常按重量计价;货车规格如长度、车厢结构,实践上,货车长度是衡量油耗、过路费、车损的重要指标;路径包括起提货城市和卸货城市、路况,以及运输路程,实践上,我国货运市场统一按运输路程计价;最后,承运商本身直接影响成本,承运商规模越大,服务成本越低,服务质量越高。
总之,我们选择了7个影响因素:国内生产总值(Gross Domestic Product.GDP),燃油价格(FuelPrice,FP),市场需求(Market Requirement,MR),货物重量(Cargo Weight,CW),运输距离(TransportationDistance.TD),承运商(Carrier,CR),以及货车长度(Truck Specification,TS).
4.2 数据采集
国内生产总值(GDP)数据参见国家统计局官方网站,2012-2015年我国季度GDP数据见表1。
表1 2012-2015年我国季度CJDP
同样,燃油价格(FP)数据也可以从国家统计局官方网站获取,图1所示为#0号柴油的价格波动图。
市场需求(MR)数据采用交通部官方网站上的每月公路货运量,见表2。
运输距离(TD)数据可以从百度地图获得,提货城市与卸货城市对应的第一个百度推荐路径的距离用于计算TD值。图2显示了从贵阳市到安庆市的货运路径,第一条推荐路线总计1 354.8km。最后,货物重量(CW)、承运商(CR)和货车长度(TS)数据与具体的订单业务数据相关。
4.3 因素的相关性
七个因素中某些因素和运价呈线性相关,而另一些因素则呈非线性相关;而且有些因素也并非相互独立。我们采用灰色关联分析法(Gray Correla-tion Analvsis,GCA)区分这些因素的显著程度和相关性。
令Xi={xi(1),xi(2),…,xi(n),i=l,2…,m)为第i个因素的样本向量,x0-{x0(1),x0(2),...,x0(n))为输出的运价样本向量。定义Υ(X0,Xi)为因素Xi相输出X0之间的灰色关联度(Gray Correlation Degree,GCD),并采用式(2)进行计算:
其中,而ζ∈(0,1)为分辨系数。
表3列出了七个因素的灰色关联度,可见TD和CW是两个最高的相关因素,FP和MR是其次两个因素。其余的三个因素GDP、rIlS,以及CR与投标价格关系不大。
5 基于混合GA-BP算法的数据驱动合同物流投标报价决策模型
5.1 多元线性回归算法
多无线性回归( Multilinear Regression,MLR)是常见的基于历史数据的预测算法。根据表3的分析,我们选取了GDP、FP、MR、CW,以及TD五个较为显著的因素为MLR的自变量,分别记为X1,X2,X3,X4,X5,在表3中,这五个因素的灰色相关度几乎都大于0.7。同时,记Y为观察到的合同价格。MLR模型如式(4)所示:其中,β0是常数项,β1,β2,...,β5是回归系数。将n组观察数据输入式(5):
采用采用式(6)计算最小二乘法(Least SquareMethod)估计β值:式(7)计算拟合值Y:最后,采用式(8)计算误差函数(Error Function):
5.2 BP神经网络算法
由于合同物流的投标定价是一个复杂的问题,各因素之问存在相瓦作用,BP(Back Propagation)神经网络算法是典型的非线性回归算法,具有自学习、联想存储和高效求解三大优点。
由于各因素的尺度不同,我们先用式(9)对这些因素进行归一化处理:
我们采用7个输入神经元、15个隐藏神经元和1个输出神经元的三层结构(如图3所示)的BP神经网络,并选择Levenberg Marquardt(LM)算法作为训练方法。
BP神经网络训练过程如下:
步骤1:初始化最大训练次数和停止误差条件。
步骤2:输入训练数据集({xi}q,{yi}q),q=1,2,…,Q,其中Q是数据集大小,{xi}表示输入向量,{yi}表示真实价格的向量,采用式(10)-(12)计算每一个神经元输出值:
其中,N、M、L分别是输入层、隐含层、输出层神经元的个数。 {gpj}、{hpk)、{ypl}分别是输入层、隐含层、输出层的输出向量。{wji}、{wkj}、{wlk}分别是连接输入层、隐含层、输出层的权重矩阵。
步骤3:计算每一层的反向误差,返同步骤(2),直到完成训练数据集中的全部数据的训练。
步骤4:按照式(13)-(15)调整权重:
其中,θ是学习率参数。
步骤5:迭代执行步骤(2)-(5),直到每一个训练向量满足式(16)条件:
其中p=1,2…,a,l=1,2…,Q。{t1}表示每一层的输出向量,ε是给定的误差阈值。
最后,将测试数据集输入训练好的BP神经网络,得到预测值。但是BP神经网络算法仍然存在四个缺点:容易陷入局部最优解、收敛速度慢、需要经验设置参数,以及受初始权重设置的影响。遗传算法(Genetic Algorithm,GA)可以避免BP算法的缺点,它采用随机游动的全局搜索策略,在全体数据中并行搜索解空间,借助遗传算法,可以对个体进行滤波,而且遗传算法不受函数可微性和连续性的限制。
5.3 混合GA-BP算法
为此,我们结合BP神经网络算法和遗传算法的优点,设计了混合GA-BP算法,流程如图4所示。
6 实验与结论
我们在M公司两类产品电缆和家用电器的实证订单数据基础上,应用和比较MLR、BP和GA-BP算法,用训练数据集对BP神经网络进行训练,并利用测试数据集验证输出的正确性。
6.1 MLR算法
使用训练数据集,我们得到了两组β参数的估计值(见表4),MLR算法得到的电缆产品和家用电器产品的运价预测曲线和实际报价曲线的比较图如图5、图6所示。ε= 0.01.θ=0.1。BP神经网络算法得到的电缆产品和家用电器产品的运价预测曲线和实际报价曲线的比较图如图7、图8所示。
6.3混合GA-BP算法
如图9所示,仅仅经过50代,混合GA-BP算法的结果开始收敛。
混合GA-BP算法得到的电缆产品和家用电器产品的运价预测曲线和实际报价曲线的比较图如图10、图11所示。
为了检验混合GA-BP算法的性能,我们选择家用电器行业的结果进行比较,比较BP神经网络算法和混合GA-BP算法的迭代次数。设置误差目标为0.01,图12给出了BP神经网络算法迭代300次的曲线,图13给出了混合GA-BP算法迭代300次的曲线,通过比较两条曲线,我们发现混合GA-BP算法收敛速度明显比BP算法快,且最终误差更小。因此,可以得出结论,GA-BP算法对于预测公路货运投标价格具有更好的性能。
6.4 三种模型算法的比较
最后,表5、表6列出了三种模型算法对于电缆产品和家用电器的预测值与实际值的比较结果。从表中可见,对于三种模型算法应用的测试数据集,混合GA-BP算法的平均误差小于BP算法和MLR算法。因此,本文提出的混合GA-BP算法是一个更好的公路货运合同物流投标报价模型。本文利用数據驱动构建报价决策模型为第三方物流公司带来的启示在于,历史数据在公路货运合同物流的招标报价决策中是有价值和有效的。