基于K-means聚类方法的物流多配送中心选址优化研究

2020-01-17 07:15:44黄思奇许茂增

公路交通科技 2020年1期

王勇，黄思奇，刘永，许茂增

(1.重庆交通大学经济与管理学院，重庆 400074；2.电子科技大学经济与管理学院，四川成都 611731)

0 引言

物流配送中心选址问题是城市物流配送网络优化的初始环节，是指在一定数目的备选址位置中选择一定数量的地址作为配送中心的规划过程。基于聚类方法的多配送中心选址问题研究，是将涉及选址多重影响因素的聚类方法与选址决策方法相结合，选择合理的配送中心数量和位置作为优化目标，进而保证物流系统规划的可持续发展。

国内外学者在配送中心选址问题研究方面已取得了较多研究成果。部分学者通过目标函数和约束条件构建定量化的数学模型进行选址问题研究，并通过启发式算法进行求解，Dan和Yu[1]提出了应用随机规划模型研究不确定需求下配送中心的选址问题。李东等[2]设计了贪婪取走的启发式方法用于研究设施失效情况下的军事物流配送中心选址问题。姜燕宁和郝书池[3]构建了以系统总成本最低为目标的库存配置与选址决策模型，研究了随机需求情形下多级配送网络的库存-选址优化问题。李明等[4]根据产销平衡的思路建立相应的数学模型研究了多物流配送中心的选址问题。Ye[5]研究了基于梯形直觉模糊信息的多准则群决策，提出了将语言属性通过模糊数转化，从而进行定量计算。而对于一些难以应用数据进行衡量的问题，定性研究体现了优越性。Awasthi等[6]提出在选址因素不确定条件下运用模糊集理论进行选址问题研究。王勇等[7]人提出先建立多配送中心评价指标体系的方法，再结合三角模糊数和语言变量值来研究多配送中心的选址问题。楼振凯和戴晓震[8]应用模糊层次分析法和改进的理想解排序法(TOPSIS)研究了模糊条件下的物流配送中心选址评价问题。贾瑞玉和宋建林[9]应用K-means方法研究了基于聚类中心优化的最佳聚类数确定方法。梁昌勇等[10]设计了基于TOPSIS方法的多属性群排序方法，并将其应用于配送中心的选址排序问题研究中。然而，考虑城市物流多配送中心选址过程的多重因素影响，并进行方法融合方面的研究设计较少。

针对城市多配送中心选址过程需要考虑较多因素且因素间具有复杂相关性的问题，首先，应用模糊理论集理论，将语言变量模糊数和梯形模糊数相结合，在建立的综合评价指标体系下对各指标权重及其各指标进行评价；其次，应用K-means聚类方法对备选配送中心进行分类；最后，应用TOPSIS方法进行各聚类中心备选址的排序计算，得出多配送中心的优化选址方案，并进行了实例验证。所提的多配送中心选址优化方法，为城市物流网络优化中的选址优化相关问题提供了新的研究思路。

1 配送中心选址的评价指标体系和相关语言变量

1.1 配送中心选址的评价指标体系

配送中心选址过程涉及到的自然环境因素(气候条件、地质条件、水文条件和地形条件)和经济因素(建设费用、运输费用和运营成本)属于确定选址的前提条件和外部因素，而选址过程涉及的交通运输因素(道路设施、可达性和公共设施状况)和信息质量(信息基础设施和信息准确性)等是确定选址的决策因素，同时配送中心业务活动质量和客户服务质量属于配送中心选址确定并建立后运营中的管理范畴，因此，将配送中心评价体系分成两级指标，并分别从自然环境因素、经济因素、交通运输因素、信息质量、配送中心业务活动质量、客户服务质量这6个方面对配送中心进行综合评价，具体如图1所示。

图1 多配送中心选址的评价指标体系Fig.1 Evaluation index system for location selection of multiple distribution center

运用梯形直觉模糊数[11-12]表示各配送中心二级准则指标下的各属性权重值和各专家对配送中心评价指标下各属性的评价值。运用模糊集成的方法，将其评价值集成到一级指标上，最终得到综合评价值。

1.2 语言变量和对应的模糊数设计

根据建立的配送中心综合评价指标体系，将相关语言变量和相应的梯形模糊数，得到表1的对应关系，运用其描述配送中心评价指标体系下各属性权重的重要度及其权重。

表1 语言变量值及对应的模糊数表

运用上述语言变量值，结合相应的梯形直觉模糊数值，对综合评价指标体系中不同属性的重要度进行评价，从而确定属性权重。对各准则指标权重进行评价时，将语言变量值中的poor替换为low，fair替换为moderate，good替换为high，而其梯形直觉模糊数值不变，即将表1中的语言变量值缩写转变成 VL-VH。

2 基于配送中心评价指标体系的聚类研究

2.1 相关定义

针对表 1 中的语言变量及相应模糊数表，邀请多位专家对备选配送中心在综合评价指标体系下的二级准则指标进行评价，并对二级准则指标的自身权重进行综合评价，相关定义和符号如下：

定义1 参与指标评价的专家人数为s，p表示参与评价的专家集合：p={pi|i=1,2,…,s}。

定义4设定备选配送中心的个数为n，D表示备选方案的集合是D={DZ|z=1,2,…,n}，通过聚类算法可将备选方案分为F类，C表示备选方案的聚类集合：C={Cg|g=1,2,…,F}。

定义6 备选配送中心的聚类数据集表示为：w=(x1,x2,…,xn)，其中选出的k个聚类中心表示为：(β1,β2,…,βk)，每个聚类对象到聚类中心的距离使用欧式距离表示为：

d(xi,xj)=

(1)

定义7Y为一个给定的数据集，假定在数据集Y中有n个聚类子集，分别表示为：y1,y2,…,yn，其中，每个聚类子集中的样本数量表示为：k1,k2,…,kn；每个聚类子集均有一个聚类中心点，其聚类中心表示为：g1,g2,…,gn。因此，设定误差平方和准则函数公式E为：

(2)

2.2 模糊聚类方法

备选配送中心的聚类方法包括以下两个步骤：(1)运用模糊集成方法，对备选配送中心评价指标评价体系中的二级指标进行模糊评价，再结合二级指标体系中各自的权重，将二级指标的评价值集成到一级指标上。(2)将集成到一级指标上的指标值，通过K-means算法同模糊聚类算法结合，对备选配送中心进行聚类。

2.2.1二级准则指标下的模糊集成方法

(3)

式中，s为参与评价的专家人数;tk为一级指标属性t下包含的二级准则指标的个数;⊕为矢量相加，⊗为矢量之积。

2.2.2模糊K-means聚类方法

模糊K-means聚类方法的具体实现步骤如下：

(1)若梯形模糊数的表示形式为：w=(a,b,c,d)，则可将p(w)表示为梯形模糊数的集成数值：

(4)

(5)

(3)首先从备选的配送中心中选择k个对象作为初始的聚类中心，确定簇的数量为k。

(4)将ej,1，ej,2，ej,3作为聚类的输入，运用欧式距离公式计算出聚类对象到k个聚类中心的欧式距离d(xi,xj)，根据欧式距离并结合各聚类中心位置划分不同的聚类单元。

(5)在已划分好的聚类单元中，重新计算各个聚类单元的样本平均值，并将其值作为聚类单元的新中心。

(6)重复上述步骤(4)和(5)，并进行聚类结果的比较分析，进而计算公式(2)中的E值，E值越小，表示聚类结果越理想，当聚类中心不再改变或达到指定的迭代次数时，则聚类结束并得到聚类结果。

2.3 模糊聚类方法的有效性指标

应用模糊K-means聚类方法[13]进行计算时，由于k值是事先拟定的，为了评判最终聚类结果的合理性，需要对聚类结果的有效性进行评价验证。聚类结果有效性[13]的评价指标可以包括两个方面，一方面是外部标准，若得出的聚类结果与参考准则保持一致，则为合理的聚类结果，否则，为不合理的聚类结果；另一方面是内部指标，即通过聚类有效性指标确定最佳的聚类数。通常应用内部指标评价聚类结果具有一定的科学性和合理性。设定DB样本的类内离散度和各聚类中心间距：

(6)

(7)

d(hi,hj)=‖υi-υj‖

(8)

式中，n为聚类数目；s(ni)和s(nj)分别为每类中的所有样本到其聚类中心的平均距离；d(hi,hj)为类与类之间的中心距离；ni为类i中的样本个数；υi，υj分别为聚类中心。由此可知，DB越小表示类与类之间的相似度越低，从而聚类结果越佳。

3 TOPSIS排序方法

结合模糊聚类方法得到的聚类结果，应用TOPSIS排序方法进行聚类单元内的备选址评价排序[11]。若有h个评价对象和o个评价指标，则原始评价矩阵可表示为：

(9)

对指标进行标准化和去量钢化处理，具体计算公式如下：

(10)

(11)

(12)

(13)

TOPSIS排序方法[14]是检验各评价对象和正理想值、负理想值距离进行排序。其中，正理想值由待评价对象中每个属性值的最优值组成，而负理想值由待评价对象中每个属性值的最劣值组成，进而计算出每个方案与最优和最差值的距离。最优值和最差值分别表示为Z+和Z-，则n个评价方案的欧式距离公式如下：

(14)

(15)

4 算例分析

4.1 实例相关数据

以某企业在重庆市选择配送中心为案列，经过考察后有20个备选配送中心，分别用D1，D2，…，D20来表示。同时邀请5位专家对建立的指标体系中二级准则指标下的备选配送中心的选址评价及二级准则指标权重进行评价，其中5位专家用P={P1,P2,P3,P4,P5}表示。专家运用表1中语言变量值的模糊数，对指标评价体系下的二级准则指标的权重进行评价(如下表2所示)。运用2.2节中提到的二级准则指标下的模糊集成方法，应用模糊集成方法将相应的二级准则指标的权重值和专家对其的评价值集成到一级指标上，然后，运用2.2.2节中提到的方法将集成到一级准则指标上的值重新拆分成3个属性值，并表示为：qej,1,qej,2,qej,3。

表2 各专家对二级准则指标权重的评价

通过表2中二级准则指标权重的评价值和表1中的模糊数表相结合，得到二级准则指标下的评价值，通过模糊集成方法，将二级准则指标下的评价值集成到一级准则指标上。得到各备配送中心的综合评价值，由表3所示：

4.2 聚类和选址方案

结合选址方案的时效性和合理性，本研究将聚类数目设定在3到5之间。根据上述聚类有效性指标的计算公式(6)，(7)，(8)，具体的聚类结果和不同聚类结果的聚类有效性指标如表5和图2所示。

表3 备选多配送中心选址方案的综合评价

表4 备选配送中心的隶属度函数值

表5 聚类数为3-5的聚类结果

图2 不同聚类数目的聚类有效性指标Fig.2 Clustering Validity Indicators of different cluster numbers

当DB越小时，其聚类效果越好，表明聚类单元中同类别个体间的差距越小，而不同类别个体间差距越大。因此当聚类数为3时得到最佳聚类数目： {D1, D2,D4,D7,D11,D13,D14,D15,D16}，{D6,D8,D12,D18}，{D3,D5,D9,D10,D17,D19,D20}。为了进一步验证聚类结果的有效性，分别应用文献[17]提出的一种基于Spark框架的改进DBSCAN聚类算法和文献[18]提出的BIRCH聚类算法进行聚类比较分析，如表6所示。

表6 3种聚类方法的聚类结果和有效性指标

应用模糊K-means聚类方法后，在每个聚类单元中运用TOPSIS排序方法选取一个配送中心为最终配送中心。根据上表中的计算数值，可知当η值越小，其评价结果越高。因此，选取最小的η值作为各类中的最优评价值，即选出最优配送中心为D6，D9，D16。结合图2可知，此方法选出的配送中心位置合理。因此，基于模糊K-means聚类算法的物流多配送中心选址方法，将集成后的隶属度函数重新拆分成多个隶属度函数子属性值，能够挖掘有效的聚类属性特征和划分更合理的聚类方案，可以保证最终得到较优的配送中心选址方案。综合比较上述方法，本研究所提方法更具实践应用性。

表7 聚类数为3的选址排序

5 结论

研究了物流网络中的多配送中心选址问题，首先，对一系列备选配送中心建立了评价指标体系，通过对备选配送中心在指标体系中的二级准则指标及其权重进行综合评价，并将语言变量模糊数和梯形模糊数相结合，得到二级准则指标及其权重的评价值；其次，应用模糊集成方法将二级准则指标的评价值集成到一级准则指标上，并通过隶属度函数进行属性拆分；最后，将拆分属性值作为模糊K-means聚类方法的输入，并通过聚类有效性指标值选取合理的备选配送中心聚类方案，进而应用TOPSIS方法计算出聚类后各聚类中的排序，从而选出最优配送中心选址方案。最后，应用实例验证了所提方法的有效性，该方法也能应用到多级物流网络的配送中心选址过程中。