基于聚类分析的快递包装回收中心等级划分研究*

2020-12-07 05:09慕晶晶
物流工程与管理 2020年11期
关键词:消费水平相似性度量

□ 慕晶晶

(安徽工程大学 管理工程学院,安徽 芜湖 241000)

随着现代物流与快递业的不断发展,快递包装的使用量和需求量急剧增加,给社会环境带来了极大的压力。为了响应环保政策,建设环保节约型社会,减轻环境压力,各级政府和快递公司需要高度重视绿色物流的发展,因此,如何高效地回收与再利用快递包装物已经成为政府和快递公司亟需解决的难题。

学术界也对快递包装回收问题开展了深入研究。金万莉等[1]分析了徐州市快递包装回收的现状,针对快递包装回收过程中存在的问题提出相应的改善措施。娄亭亭等[2]运用AHP方法对校园回收站点、包装生产商联盟、第三方物流等三种主导模式的快递回收模式进行评价,并得到第三方物流主导快递回收模式最受青睐的结论。董祺悦等[3]对消费者快递包装分类回收意愿与行为的影响因素开展分析,探讨快递包装分类回收推广的条件和机制。黄旺明等[4]基于计划行为理论构建模型,研究了影响消费者快递包装回收意愿的关键因素。徐杰等[5]建立信息不对称及有限理性下,快递包装回收中政府、快递公司和消费者三方的博弈模型,并得到博弈模型的演化稳定策略。

对快递包装实施逆向物流进行回收再利用,建立回收中心是必不可少的,在对快递包装回收中心进行选址之前,需要确定其建设规模,这有利于合理地分配物流资源。对快递包装回收中心进行等级划分,既能直接反映各个区域的物流发展水平,也可以间接反映各个区域的消费水平和综合实力。本文选取上海市的16个市辖区作为研究对象,采用聚类分析模型,对各个市辖区的快递包装回收中心进行等级划分。

1 模型设计

聚类分析又称群分析,是对多个样本(指标)进行定量分类的一种多元统计分析方法。对样本进行分类称为Q型聚类分析,对指标进行分类称为R型聚类分析。

1.1 数据标准化处理

在对指标变量和样本进行分析之前,需要对其数据进行标准化处理,处理方式为

(1)

1.2 变量相似性度量

在系统分析或评估过程中,为避免遗漏某些重要因素,往往在一开始选取指标时,尽可能多地考虑所有的相关因素。而这样做的结果,则是变量过多,变量之间的相关度较高,给系统分析与建模带了极大的不便。因此,本方案研究了变量间的相似关系,按照变量的相似关系把它们聚合成若干类,进而找出影响系统的主要因素。

在对变量进行聚类分析时,首先要确定变量的相似性度量,常用的变量相似性度量有两种:相关系数和夹角余弦。本方案采用相关系数法对变量进行聚类分析。

记变量xj的取值(x1j,x2j,…,xnj)T∈Rn(j-1,2,…,n),则可以用两个变量xj和xk的样本相关系数作为它们的相似性度量,即

(2)

1.3 样本相似性度量

在对样本进行聚类分析时,要先确定样本的相似性度量,常用的样本相似性度量包括:绝对值距离、欧氏距离、切比雪夫距离和马氏距离。本方案采用欧氏距离度量样本点两两之间的距离。

(3)

1.4 类与类间的相似性度量

针对数个类别,可以采用最短距离法、最长距离法、重心法、类平均法、离差平方和法等方法度量它们之间的距离,本方案选取类平均法度量类与类之间的距离。

假设有G1和G2两个类,则有

(4)

它等于G1,G2两点的平均距离,n1,n2分别为G1,G2中的点个数。

2 算例分析

假设,需要在上海市的16个市辖区内分别建立一个快递包装回收中心,考虑到各个地区的人口数量,地区消费水平以及区域大小等因素,本方案运用Q型聚类和R型聚类的方法建立聚类分析模型,采用R型聚类法对其影响指标进行聚类分析,选取其中的代表性影响指标;再根据所选代表性指标采用Q型聚类法对快递包装回收中心进行聚类分析,以此来确定各个市辖区所建快递包装回收中心的规模大小。

2.1 建立评价指标体系

通过查阅相关资料,总结出6个影响地区消费水平和居民购买力的指标,建立上海市各地区消费水平评价指标体系,如图1所示。

图1 上海市各地区消费水平评价指标体系

2.2 数据资料

这六项指标的原始数据取自上海市各个市辖区统计局的国民经济和社会发展统计公报(2018年),指标值如下表1所示。

表1 上海市各地区消费水平评价指标数据(2018年)

其中:x1为人口密度(单位:人/平方千米);

x2为地区生产总值(GDP,单位:亿元);

x3为居民人均可支配收入(单位:元);

x4为一般公共预算收入(单位:亿元);

x5为一般公共预算支出(单位:亿元);

x6为社会消费品零售总额(单位:亿元)。

2.3 R型聚类分析

通过对影响上海市各个市辖区消费水平的评价指标进行定性和定量分析,可以看出某些指标之间可能存在较强的相关性。运用MATLAB软件计算6个指标之间的相关系数,相关系数矩阵如下表2所示。

表2 相关系数矩阵

根据表2可以看出,某些指标之间确实存在很强的相关性。为此,把6个指标根据其相关性进行R型聚类,再从每个类中选取具有代表性的指标。首先,对这些指标的数据分别进行数据标准化处理,变量相似性度量采用相关系数,类间相似性度量的计算采用类平均法。然后,运用MATLAB软件运行相关程序,得到指标聚类树型图,如图2所示。

图2 指标聚类树型图

从图2中可以看出,地区生产总值x2、一般公共预算收入x4、一般公共预算支出x5这3个指标之间有较大的相关性,最先被聚合在一起。如果将这6个指标分为4类,则在地区生产总值x2、一般公共预算收入x4、一般公共预算支出x5这3个指标中选取地区生产总值x2作为该类的代表性指标,人口密度x1、居民人均可支配收入x3、社会消费品零售总额x6这3个指标各自为一类。由此可以得到影响上海市各个市辖区消费水平的代表性指标,分别为:人口密度x1、地区生产总值x2、居民人均可支配收入x3、社会消费品零售总额x6。

2.4 Q型聚类分析

根据人口密度x1、地区生产总值x2、居民人均可支配收入x3、社会消费品零售总额x6这4个指标对上海市16个市辖区的消费水平进行聚类分析。首先,对相关数据进行标准化处理,样本间相似性采用欧式距离度量,类间距离采用类平均法进行计算。然后,运用MATLAB软件运行相关程序,得到各个市辖区聚类树型图,如图3所示。

图3 上海市各个市辖区聚类树型图

由图3可以明显看出,上海市16个市辖区的快递包装回收中心可以大致分为三个等级,具体划分结果如表3所示。

表3 上海市各个市辖区快递包装回收中心等级表

由表3可知,在浦东新区建立一级回收中心;在黄浦区、徐汇区、长宁区、静安区、普陀区、虹口区、杨浦区建立二级回收中心;在闵行区、宝山区、嘉定区、金山区、松江区、青浦区、奉贤区、崇明区建立三级回收中心。

3 总结

随着生活质量水平的不断提高,网购已成为人们日常生活中不可或缺的一部分,快递业也伴随着网购的发展而发展,快递量不断增加,快递包装的使用量和需求量也在日益增长,然而,快递包装的回收率却不容乐观,给环境造成了很大的压力。因此,如何解决该问题已经成为当前各级政府和各个快递企业着重思考的内容。

快递包装的回收再利用需要我们共同努力,提高快递包装的回收利用率,减少快递包装原材料的使用量,缓解环境压力,减轻对环境的污染,保护生态健康,提高可持续发展的能力,促进经济的绿色发展,带来更大的经济效益。

猜你喜欢
消费水平相似性度量
预计到2050年中国城乡消费水平将无明显差距
鲍文慧《度量空间之一》
浅析当代中西方绘画的相似性
中国人均消费世界排名与增长预测研究
——基于指数增长模型
代数群上由模糊(拟)伪度量诱导的拓扑
突出知识本质 关注知识结构提升思维能力
度 量
12个毫无违和感的奇妙动物组合
基于隐喻相似性研究[血]的惯用句
我国31省城镇居民消费水平(2007)