基于RFM模型的物流客户价值研究

2019-08-01 03:43陈倩舒方晓平中南大学湖南长沙410075
物流科技 2019年7期
关键词:权重聚类消费

陈倩舒,方晓平 (中南大学,湖南 长沙 410075)

CHEN Qianshu,FANG Xiaoping (Central South University,Changsha 410075,China)

0 引言

随着宏观经济稳定增长和消费升级下的电子商务发展,物流行业得以迅猛发展,同时行业之间的竞争也日益激烈。许多企业已从以产品为中心转变为以客户为中心的营销策略,客户关系管理成为企业管理的关键部分。客户关系管理的核心问题是对不同类型的客户进行价值分类,采用不同的定制化营销策略,更好地服务顾客,以最大限度地实现企业的效益。由于表征客户价值的特征信息的多维化,增加了客户关系管理的难度。随着大数据时代的来临,大数据的商业价值已经显现出来,大数据与挖掘技术为企业处理海量客户数据与企业的经营决策提供了积极的帮助。

1 基于RFM模型分类原理

1.1 RFM模型介绍

RFM(Recency,Frequency,Monetary)模型是由Hughes AM于1994年提出的一种在企业角度方面考虑的可较全面分析客户一般购买行为的客户价值模型[1],模型包括3种指标:近度及额度分别表示最近的上次消费时间离样本数据截止日的时间距离、研究期限内(样本的时间跨度)的消费次数和消费总金额。消费近度越小,表示客户在近段时间内有消费行为,并且消费近度越小和消费频率越大,表示客户忠诚度较高,下一次消费可能性较大;额度是企业衡量客户利益价值的直接标准,额度越大说明客户价值越高。Stahl H K(2003)提出一种多元行为特征分析,RFM模型及修正模型,来判断客户价值[2]。Fader P S(2005)通过提出“等值”曲线模型,将具有不同历史行为,但未来价值相似的客户聚集在一条等值线上,证明了RFM模型可拟合传统现金流CLV模型[3]。一方面,现代营销表明,从企业角度来看的客户价值更高的是频率和额度更大的客户群,这类客户在未来的时间段内很有可能产生消费行为,具有较高的预测效果;另一方面,RFM模型计算所需的客户消费数据简单易得且模型计算方便,在企业实践应用中较为普遍。因此,企业可以使用RFM模型测量客户价值,并使用RFM模型指标对客户进行分类。RFM模型计算客户价值公式如下所示:

在大多数的RFM模型应用时,识别客户价值时各指标的权重相同,评估模型的关键在指标和权重两个方面。在近度、频率和额度3个因素中,近度和频率是描述客户行为的指标。有研究表明近度、频率是忠诚度的良好指针,如Stone B(2008)、Wu J和Lin Z(2005)发现在信用卡消费领域,近度和频率对客户下一次消费有重要影响,因而给予近度最高权重,频率、额度最小[4-5]。然而这并不表示额度不重要,毕竟从消费额度可以判断客户的交易规模与意愿。如果针对一个非高频率、非消费型行业,或者客户分层不是特别明显的行业,则又另当别论了。所以很多学者认为还是应当根据行业竞争性、客户类型(机构还是消费者)以及客户的一致性等特点设定指标权重。所以有学者认为三者必须结合、不可偏废才具有更好的判断价值,如Hughes AM(2005)就认为在同一问题研究时,各指标对企业判断客户价值而言地位同等重要,故各指标权重可设为相同[1]。林盛、肖旭(2006)建议采用AHP方法与专家咨询法相结合确定指标权重以便更好地考虑评估对象的具体情况[6]。学术界对各指标权重意见不一,是考虑到具体问题应当具体分析。因此在实际情况下,在识别物流客户价值时,应考虑指标权重对物流客户的价值的影响程度,本文应用层次分析法确定指标权重。

1.2 基于RFM模型分类

利用RFM模型对客户进行细分有两类方法,第一类是加权求和获得价值评判值,再分段划分类别。设置指标权重,使权重与RFM模型各指标的计算结果相乘得到各指标的加权指标值,让最终的加权指标值相加以获得RFM指标的总值,最后设置阈值以获得客户分类结果,并且大于阈值的为高价值客户,小于阈值的为低价值客户[4]。第二类是使用Sung(1998)提出的自组织特征映射网络(SOM)来对客户RFM指标进行分类,将每个客户的RFM各指标值与RFM各指标平均值进行比较[7],可得到2*2*2=8种分类结果,其分类表示如表1和图1所示:

表1 依据RFM模型指标客户分类结果

图1 RFM模型分析

RFM模型是计算客户价值并进行客户细分的重要方法,使企业和客户能够相互进行个性化与精准化的管理服务,并且RFM模型能够使企业快速的计算出客户的潜在价值及客户的生命周期价值。

面对不断增长的客户群,数据挖掘技术在客户管理方面的应用日趋增加[8]。其中,聚类分析方法是一种属于非监督型(unsupervised)机器学习的数据挖掘方法,这种分析方法适用于较大数据样本和较多变量分析的任务[9]。聚类分析是以分类对象的具体特征为依据进行划分,在数据样本间的差异性和相似的基础上进行分组,使同一组之间的数据样本尽可能相似,不同组内的数据样本尽可能有差异,划分的原则是组内样本最细、组外距离最大化,如图2所示:

聚类分析是进行客户细分的一个重要手段,因此在使用RFM模型时,有必要进行聚类分析[10]。聚类作为独立的工具获得数据分布情况,可作为其他算法的预处理步骤,简化计算工作,提高分析效率[11],其中K-means聚类算法常于客户细分。综上,本文在基于RFM模型的基础上利用K-means聚类算法对物流客户进行细分识别。

图2 聚类分析建模原理

2 案例分析

2.1 数据抽取

由于与客户在物流企业消费的行为方式,关于客户的消费信息的基础数据较容易获得。客户消费数据源自于企业A,全部数据都将进行脱敏处理,企业和客户的信息不会泄露。企业A客户历史消费数据是2018年1~4月国内31个大区的营业数据,一共2 674 258条。每条数据包含44个属性,包括客户编号、购买时间、购买区域、发货区域、发货日期、消费额及运输重量等。

2.2 数据预处理

因为企业在登记、保存客户消费数据时可能小部分客户消费数据存储不完整,导致物流企业采集的数据不一致、重复及不规则等质量不高问题,最终使处理后的结果有偏差。所以为了确保后续计算步骤正确,有必要在使用RFM模型和K-means聚类算法之前预处理客户消费数据。数据预处理主要包含数据清洗、指标规约、数据变换这3个方面的过程。

(1) 数据清洗

据统计,企业的数据一般存在1%~30%的误差,忽略数据质量问题易导致研究结果错误[12]。由于企业在输入客户消费信息时存在错误的地方,因此数据中存在无效值和缺失值,需要使用数据清洗技术来适当的处理“脏数据”,数据清洗是按照一定的规则对数据进行再一次查看和校正的过程,主要是用于删除重复数据、校正已有的错误及保证数据的一致性。

在企业A的2 674 258条客户历史消费记录中,有525 815位客户只有1次消费记录,将其定义为偶然客户,不列入分析。本文主要对有2次及2次以上有效消费记录的客户的2 148 443条记录进行分析,占企业A原始数据的80.34%。

选择与RFMS模型指标相关的客户编号、购买时间、消费额3个属性并删除与其弱相关或冗余的属性。在清洗数据发现此物流企业在采集客户消费数据时存在小部分的缺失值,由于原始数据量大,且只存在291条异常数据,对研究影响不大,本文予以剔除处理。具体剔除操作规则如下:

①剔除客户编号、购买时间与消费额为空的数据;

②剔除“*”和“—”等无效字符的记录。

(2) 指标规约

利用清洗好的企业A的客户历史消费数据,根据客户编号、购买时间与消费额3个属性计算每位客户的R指标、F指标及M指标原始值:

R:以天为单位,计算2018年1~4月各个客户最后一次购买日期至2018年5月1日的天数,为R指标值;

F:在2017年1~4月这一时间段内客户消费的总次数,为F指标值;

M:在2017年1~4月这一时间段内客户消费的总金额,为M指标值。

经过指标规约后的数据如表2所示:

(3) 数据变换

通过指标规约后,对每个指标的数据分布情况进行分析,其数据的取值范围如表3所示。从表3中数据可以发现,R指标、F指标及M指标取值范围数据差异较大。

表2 物流企业的RFM模型指标规约

表3 RFMS模型特征取值范围

在利用K-means聚类算法分析数据之前,一般需要将数据进行标准化变换,数据变换是指需要将数据转换成“适当的”格式,以适应挖掘任务及算法的需要。上述标准化处理之后,将原始数据均转换为无量纲化指标评估值,即各指标值都处于相同的数量级别,进行综合评估分析。

考虑到RFMS模型各特征的计量单位对聚类分析产生差异化影响,为消除数量级带来的影响,因此对RFMS模型中各特征值进行Z分数(Z—score)标准化变换。在以上讨论的界定下,R、F及M标准化变换计算公式如式(2)~式(4)所示:指R、F及M的团体平均数;σR、σF、σM及指R、F及M的标准差。

对数据进行Z-score标准化变换后,得到284 125位客户的RFM模型各指标变换计算大小如表4所示:

其中:T指样本数据截止日;Ti指客户上一次消费日;Mid指客户i在区域d消费额度

2.3 层次分析法确定指标权重

根据本文对R、F及M这3项指标权重的确定,邀请业内5位资深人士参与打分。首先对R、F及M这3项指标的重要程度进行两两比较,依据这5位资深人士的打分情况结果,得出以下的判断矩阵A如表5所示:

表4 客户RFMS模型特征计算结果

表5 指标判断矩阵

判断矩阵A通过一致性检验后得到RFM模型中各指标R、F及M权重分别为:wR=0.13;wF=0.23;wM=0.64。

2.4 基于RFM模型的K-means聚类

用K-means聚类算法中的有效性检验数发现,K=3时,聚类效果最佳,相应的聚类结果如表6所示。根据SOM对客户RFM指标进行分类,第1类属于一般价值客户,第2类属于一般发展客户,第3类属于重要保持客户。

表6 聚类结果

3 结论

随着物流行业的市场不断扩大与发展,物流企业的发展前景也愈加广阔,机遇与挑战并存。在物流行业激烈竞争的背景下,客户对物流服务商的服务质量要求也与日俱增,同时物流企业的发展离不开精细化的操作运营和管理。因此,根据客户对企业的价值进行细分,挖掘企业的核心消费者,从而制定符合企业战略的营销与管理方法,最终提升客户对企业服务的满意度,保证企业的利润率最大化,提高在物流行业的竞争力。

猜你喜欢
权重聚类消费
国内消费
新的一年,准备消费!
权重常思“浮名轻”
40年消费流变
为党督政勤履职 代民行权重担当
基于DBSACN聚类算法的XML文档聚类
基于公约式权重的截短线性分组码盲识别方法
基于高斯混合聚类的阵列干涉SAR三维成像
新消费ABC
一种层次初始的聚类个数自适应的聚类方法研究