基于聚类分析的电子商务物流服务质量评价

2020-07-14 06:26赵梦函吴丽花
关键词:投递服务质量聚类

赵梦函, 吴丽花

(北京信息科技大学 信息管理学院,北京 100192)

0 引言

近年来,电子商务快速发展,我国物流行业业务量迅猛增长,进入飞速发展时期。但是由于我国物流起步较晚、发展时间较短、企业经验不足以及缺少行业规范等,电子商务物流行业的服务质量差别较大,客户投诉现象屡见不鲜[1]。对电子商务物流服务的质量评价,可使企业更清楚地认识到客户需求及自身短板,有效提升服务质量,更好地为客户服务。

对于电子商务物流服务质量评价的相关研究,或是以评价指标为重点,研究其内在相关性[2],提出改进建议[3];或是从建立评价指标体系出发,构建评价模型[4-6];或是以评价方法为重点,研究方法的改进[7]。本文以电子商务物流服务质量评价指标的构建为基础,采用聚类方法建立物流服务质量评价模型,从不同角度对模型评价结果进行分析,并针对性地提出物流服务质量的改进意见,形成电子商务物流服务质量评价的完整体系。

1 电商物流服务质量评价指标

关于企业服务质量评价指标方面,国内外学者做了大量的理论和实证研究。SERVQUAL 模型得到广泛认可和采用,被认为是适用于评价各类服务质量的最典型方法。SERVQUAL共包含5个层面:可靠性,指可靠地、准确地履行服务承诺的能力;响应性,指提供服务的迅速程度;保证性,指员工表现出的知识、礼节和能力等;移情性,指设身处地为顾客着想和对顾客给予特别的关注;有形性,指有形的设施、员工服装的整洁程度等[8]。但在具体到电子商务物流行业服务质量评估时,该模型需要结合行业的实际操作规范,进行必要的调整。盖青霞[9]基于物流服务质量最新的较完整的定义,提出了影响物流服务质量的以下几个指标:货品完好程度、货品精准率、人员沟通质量、误差处理、时间性等;段彦辉等[10]认为货物的完好率、订单响应时间、物流价格、服务便利性等是影响电子商务物流行业服务质量的主要因素。花均南等[11]采用 SERVPERF 模型中感知服务质量测量方法,直接用顾客对感知到的网购快递服务质量满意程度,来评价和衡量服务质量,从交付质量、时间性、人员沟通质量、误差处理质量以及便利性5个维度建立了网购快递物流服务质量评价的模型;黄阳[12]认为物流服务的质量可以通过质量保证率、商品配送延时率、服务成功率等指标进行衡量。

基于以上分析,SERVQUAL 量表作为服务质量评价的总体框架,对本文所研究的电子商务物流行业的服务质量评价也同样适用,但应根据行业特性,对评价维度进行整合,简化评价模型,构建实用有效的服务质量评价指标体系[5]。本文在SERVQUAL模型和相关研究基础上,提出物流配送的准时性、准确性、完好性、人员沟通服务质量等是影响电子商务物流企业服务质量的主要因素。本文评价维度如表1所示。

商品配送延误率衡量了商品由于各种因素未在承诺时间内送达收货人手中的延误程度。商品丢失损毁率综合反映了以下两种情况发生的频率:一是商品在运输过程中由于人为或意外事故导致包裹丢失的情况;二是包裹没有丢失但出现积压破损的情况。投递服务投诉率是企业投递服务质量好坏的综合体现和直接反映。此外,物流企业违规收费、误投事故等也会对电子商务物流服务质量产生影响,但这些事件发生概率较低,统一划分为其他类。

表1 电商物流服务质量主要评价维度

2 电商物流服务质量评价模型

2.1 评价流程

基于聚类分析的电子商务物流服务质量评价过程如图1所示。

整个评价过程分为3大部分:输入、分析及输出应用。评价的输入部分为与物流服务质量相关的各项指标;分析部分主要包括数据的预处理及聚类建模过程;聚类结果分析及质量改进建议为输出应用部分。

2.2 数据预处理

本研究共收集了2015年1月至2018年5月间来自32家物流企业的1046条有关服务质量评价的数据。数据来源为国家邮政局(http://www.spb.gov.cn/sj/ tjxx_1/index.html)每月公布的邮政行业消费者申诉情况。数据的预处理包含异常值的处理、缺失值的填补以及数据的标准化处理。

1)异常值处理。收集到的数据中可能存在不合理即异常值。异常值会加大聚类的复杂程度,影响聚类整体准确性,需要进行处理。常用的异常值处理方法是用均值或者其他统计量来代替,但这种方法改变了数据自身的分布,使数据的方差发生变化。当异常值观察数据非常少时,也可直接删除异常值,这样既不会对变量的原有分布造成影响,还可以简化模型的复杂程度。

本研究对收集到的数据进行统计探索,分析各项指标的分布情况。以丢失损毁率这一指标数据的分布情况为例,有近1000条观测数据的取值分布在0~50之间,只有2个观测样本的指标值分布在此区间之外,即异常值个数为2。由于异常值观察数据量很少,因此这里使用剔除法,将丢失损毁率大于50的异常数据值排除。类似地,对其他指标进行异常值的检测和处理,最终共排除掉13条异常数据,剩余1033条观测数据用于后续分析。

2)缺失值填补。数据收集过程中,个别观测样本的某一项指标可能较难获取,存在缺失值,这时就需要选择合适的方法对缺失值进行填补。对于区间型变量,常用的缺失值填补方法有均值插补法、期望值最大化法、极大似然估计法、多重插补法等。其中,均值插补法是以最大概率可能的取值来补充缺失的属性值,与其他方法相比,既可用现存数据的多数信息来推测缺失值,又易于操作,因此在实践中应用较多。

通过数据的统计探索,发现各项指标均存在缺失值,其观测数及所占比例如表2所示。由于各项指标缺失值所占总体比例均较小,采用了常用的均值插补方法对缺失值进行处理。

表2 各项指标的数据缺失情况

3)数据标准化处理。在电子商务物流质量评价这样的多指标评价体系中,各评价指标由于性质不同,通常具有不同的量纲和量级。当各评价指标间的量纲和量级差异很大时,如果直接使用原始指标值进行分析,就会突出数值水平较高的指标在综合分析中的作用,相对地,数值水平较低的指标的作用则会被削弱。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理,以便于不同单位或量级的指标能够进行比较和加权。

最常用的数据标准化处理方法是 min-max标准化法,它通过对原始数据的线性变换将数据统一映射到[0,1]区间上。对于正向指标即效益型指标,指标值越大结果就越好,其标准化转换函数为

对于逆向指标也称成本型指标,数值越小结果就越好,其标准化转换函数为

2.3 K-means聚类建模

聚类分析是一种无监督的学习方法,它能从样本数据出发,自动将目标群体划分几个具有明显特征的细分群体。本文研究的目的就是将不同物流企业的服务质量按照商品配送服务、投递服务、丢失损毁三个维度进行精细化划分,对不同类提出不同的管理建议,提升物流服务质量,因此聚类分析较为适合本文的研究。

将经过异常值和缺失值处理的数据标准化之后,利用SAS EM软件,采用K-means 算法对所收集到的关于电子商务物流服务质量的数据进行聚类分析。K-means的基本思想为:对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇,簇内点之间的距离尽可能的小,而簇间距则尽可能的大。利用K-means算法进行聚类的具体步骤如下:

1)从样本数据集中随机选取k个样本,作为初始聚类中心。

2)计算数据集中每个点到选择的初始聚类中心的距离,按照最小欧氏距离原则分配到k个聚类类别中,即对以下表达式求最小值:

3)使用每个聚类的均值作为新的聚类中心。

4)重复步骤2)、3),直到没有对象被重新分配给不同的类。

5)结束聚类循环运算,得到k个聚类,并给不同类打上归属的聚类标签。

3 聚类结果分析

对聚类类别k赋予2、3、4、5、6等不同的值,对所收集到的数据进行聚类分析。通过对比聚类结果发现,当k=3时,聚类效果最优,聚类结果如表3所示。

表3 K-means聚类结果

从表3可以看出,各类的类内间距相对较小,而类间距离相对较大,符合K-means聚类分析的原则,说明聚类结果较为理想。特别是对于类1,该类具有所有类别中最小的类内间距0.367 3,其与最近聚类的类间距离为2.223 3,说明该类与其他两类亦具有明显的区分度,综合来看是3个类别中聚类效果最好的一类。

从表3聚类结果可知,类1商品配送延误率类中心值仅为1.377 4,丢失损毁类中心值为1.497 6,投递服务投诉率仅为2.016 0,与其他类相比这些指标的值均较低,可以判断出该类企业属于电子商务物流服务的优质企业。由于类1所占比例最大,聚类频数为747,占总体样本比例的72.31%,说明电子商务物流行业整体服务水平较高。类2的企业各项指标的类中心值均远高于其他两类,特别是配送的延误率更是高达17.25,负向指标的值越大说明企业的服务水平越差,则类2属于服务水平低下的企业,但类2所包含的样本数较少,仅为63,占总体比例的6.1%,说明电子商务物流服务质量差的企业为少数。类3的企业属于中等服务水平的企业,各项指标值介于类1和类2之间且较为均衡,该类包含223个样本,占总体比例的21.59%。

4 服务质量改进建议

4.1 基于类别角度的服务质量改进建议

从上述聚类结果分析可知,类1内企业属于服务质量较优企业,其4个指标中,投递服务投诉率最高,说明对于此类企业来说,最需要改进的方向是提高投递服务质量。类3各项指标表现较为均衡,说明服务质量水平中等的电商物流企业在各方面保持现状,均衡发展即可。类2的企业各项指标表现均较差,但商品配送的延误尤为明显,所以应该投入更多精力来提高商品配送的效率,具体可以通过缩短订单响应时间、提高异常处理效率、合理安排配送线路等来提高商品配送的效率。

4.2 基于指标角度的服务质量改进建议

在K-means聚类中,各指标对物流企业服务质量的影响程度如表4所示。

表4 变量重要性

从表4可见,投递服务投诉率的聚类贡献度为1,说明投递服务是影响电商物流服务质量最重要的因素,物流企业均应该努力提高投递服务的水平。同时,丢失损毁率和商品配送延误率对物流服务质量也有很重要的影响。可以通过加强对物流配送人员的培训、引导配送人员分析自己在配送服务上的不足之处,改善投递服务质量。此外还可以建立灵活的奖励机制,加大对优秀配送人员的奖励,来提升工作的积极性,以达到改善服务质量的目的。

5 结束语

本文在服务质量模型(SERVQUAL)的基础上,结合电子商务物流行业特征,提出影响电子商务物流服务质量的关键指标,然后运用K-means 算法建立聚类模型。通过分析聚类结果,从类别角度和指标角度提出了提高物流服务质量的方法和建议,对物流企业服务质量的改进具有一定的参考价值。但是,本研究依旧存在一定的局限性,比如,指标体系建立不够全面,只分析了对电商物流服务质量影响较大的因素;此外,由于数据获取的困难性,本文只收集到部分物流企业的数据,样本量有限。在今后的研究中将逐步增加物流企业的财务能力、发展能力、盈利能力等评价因素,建立更加系统、完善的评价指标体系,同时扩大研究的企业范围,收集更多企业的相关数据,使所得的结论更具有实际指导意义。

猜你喜欢
投递服务质量聚类
一种傅里叶域海量数据高速谱聚类方法
传统与文化的“投递”
门诊服务质量管理的实践研究
西药房药学服务质量的提升路径及作用分析
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
新媒体环境下图书馆阅读推广服务质量的提高
论如何提升博物馆人性化公共服务质量
基于Spark平台的K-means聚类算法改进及并行化实现
大迷宫