基于模糊综合评价的商场会员分类研究

2019-10-31 03:50丁学利孙娓娓
阜阳职业技术学院学报 2019年3期
关键词:模糊综合评价法

丁学利 孙娓娓

摘  要:为有效对商场会员价值进行分类研究,首先运用K均值聚类并结合Fisher判别分析对商场会员进行分类,然后根据各会员群的最近一次消费时间间隔、总购买数量、总消费金额、单笔最高消费金额、平均消费金额、会员关系长度等多项指标构建模糊综合评价模型。通过计算相对偏差模糊矩阵及变异系数法构建的各指标的权向量对会员群进行了综合评价,得到了会员群的综合排序。该方法可有效地对大样本数据进行综合评价且评价结果更接近实际,也为商场运营商有效地对会员进行分类管理,实施针对性的营销策略等提供了理论参考。

关键词:K均值聚类;Fisher判别分析;模糊综合评价法;商场会员

中图分类号:O212         文献标识码:A             文章编号:1672-4437(2019)03-0081-06

在零售行业中,会员价值表现为不断地为零售运营商带来较好的销售额和较高的利润,也为零售运营商如何制定营销策略提供了数据支持。零售行业会采取各种不同方法来增强会员的忠诚度,同时吸引非会员成为会员。当前电商的发展使商场会员不断流失,给零售运营商带来了严重损失。因此,运营商如何有效地对会员进行分类管理,以及根据会员分类有针对性地实施营销策略来加强与会员的良好关系,成为商场运营商迫切解决的关键问题。

在对客户进行有效识别方面,可通过聚类分析、判别分析等[1-8]方法进行分类,然后利用RFM模型[9]、客户价值矩阵法[10]等对客户进行价值分析。但在对大样本数据的客户价值进行评价时,往往评价指标具有不确定性或模糊性,这些方法较难客观地对客户群进行综合评价。因此,本文运用K均值聚类法对商场会员进行分类,同时利用判别分析法对聚类结果进行判别,验证聚类效果,在此基础上利用模糊综合评价法对会员群进行综合评价。该方法可有效地对大样本数据进行综合评价且评价结果更接近实际。

1  数据来源与分析

1.1 数据预处理

本文采用2018年全国大学生数学建模竞赛C题[11]商场会员消费信息数据。商场会员消费信息共有911702条数据,其中包括异常数据(会员卡号出现科学计数法的数据,如会员卡号6.7738E+21,共计417条)、缺失数据(如有的会员只有消费时间,缺失会员入会时间,共计793个会员号)等。由于这些数据所占的比例非常小,因此可考虑直接删除。由于每个会员的消费记录不只一条,因此可用Excel透视表得到每个会员的总购买数量、总消費金额、单笔最高消费金额、平均消费金额。然后运用Access软件对数据进行处理和提取,包括分离商场会员与非会员的数据、提取会员最近一次消费时间间隔和会员关系长度(会龄),最后得到43105条会员消费记录。

1.2 指标选取

根据RFM模型[9]理论,反映顾客的价值包括三个指标:最近购买时间(R)、购买频率(F)及购买金额(M)。R值越小,F和M值越大,顾客价值越高。除了RFM所代表的评价指标,本文还使用了其他特殊变量反映会员的购买行为,如单笔最高消费金额、平均消费金额,其值越大,顾客价值越高;会员关系长度越长说明会员越忠诚。因此,本文选取如下6个反映顾客价值的评价指标: ——最近一次消费时间间隔(天); ——总购买数量(件); ——总消费金额(元); ——单笔最高消费金额(元); ——平均消费金额(元); ——会员关系长度(会龄/天)。表1是将会员号按升序排列得到的商场会员消费统计结果(由于版面限制,仅列出部分会员消费的统计结果)。

2  基于聚类-判别分析的会员分类

2.1 聚类和判别分析

聚类分析[1-5]的基本目标是按照一定规则把分类对象性质相似的归为一类,而把性质差距比较大的对象归到不同的类,其最终得到类内的对象会有很高的相似度,而不同类之间的对象具有较低的相似度。K均值聚类是一种适用于大数据且计算速度快的聚类方法,其算法的基本步骤是在给定数据的分类数K后,该方法会随机选取K个聚类中心,计算每个样本与这K个聚类中心的距离,依据距离最近原则将每个样本分别归到K个不同的类,然后重新计算这K个类的中心,继续计算每个样本与这K个中心的距离,并重新归类,继续上述操作直到达到设定的标准时,结束聚类过程。

判别分析[1, 2]是按照某种判别规则,对已经分类的研究对象,计算判别指标,确立判别函数,依据判别函数即可判定某一对象属于何类。Fisher 判别法是判别分析中常用的一种方法,其基本思想是投影降维,即将K类n维数据投影到某一个方向,使得类与类之间的投影尽可能分开,而类内离差尽可能小,从而得到一种线性判别函数,最终将各个类进行很好的区分。

在众多的聚类和判别方法中,K均值聚类和Fisher判别分析是适应性较强且处理大样本数据效果较快的方法。针对43105条大样本商场会员数据,选取K均值聚类和Fisher判别分析是比较合适的,因此本文选用K均值聚类和Fisher判别分析。其具体步骤如下:

Step1:以 , , , , , 为自变量,将样本数据z-score标准化,计算不同类别数下的平均轮廓值,确定K均值聚类的最佳类别数K;

Step2:选取K个初始聚类中心,运用K均值聚类算法得到最终的聚类中心和聚类结果(每个会员的分类号及每个会员群的数量及均值);

Step3:继续以 , , , , , 为自变量,用聚类分析的分类号作为分类变量,将所有样本作为训练样本进行判别分析,得到判别函数系数,建立Fisher判别线性函数;

Step4:用判别函数对所有样本进行判别分类,与聚类结果比较,检验聚类效果。

2.2  K均值聚类结果

为了确定K均值聚类的最佳聚类数K,首先计算分类数与平均轮廓值的关系,如图1所示。平均轮廓值越大,表明聚类具有越好的效果。由图1可知,当类别数为2时平均轮廓值最大,但分类数为2时,太笼统,效果不好。当类别数为6时,平均轮廓值较大,因此最佳聚类数可取6。使用SPSS 21.0软件,选取6个初始聚类中心,得到最终聚类中心(标准化后的聚类中心,见表2)。根据最终的聚类中心,可将会员分成6类会员群,见表3。由表3可知,会员群1的会员数最多,最近一次消费时间间隔较长,总购买数量、总消费金额、单笔最高消费金额、平均消费金额较少,会员关系长度最短。其余会员群的详细特征也可类似得出。虽然利用K均值聚类得到了聚类结果,但聚类效果如何,需进一步检验。

2.3  Fisher判别分析结果

以 , , , , , 为判别自变量,以聚类分析得到的分类号作为分组变量,使用SPSS 21.0软件对所有样本进行判别分析。SPSS 21.0自动选取具有会员分类号的数据进行训练,得到判别函数系数,见表4。方差检验判别函数的p值小于0.001,表明判别函数对商场会员类别的区分差异显著。SPSS 21.0利用判别函数可对每个会员所属的会员群进行有效识别,判别结果见表5。由表5可得到,每个会员群的聚类结果与判别结果基本一致,总的一致率(两者相同的样本数除以总样本数)达到96.2%。因此,K均值聚类得到的6类会员群是较合理的。虽然把商场会员合理地分成了6类会员群,但如何对每类会员群进行评价还需进一步研究。

3 会员群模糊综合评价

3.1  相对偏差模糊综合评价

针对多个方案实施客观评价时,待评价的指标因素一般较多且存在主观判断。因此,应根据多个指标进行综合评价且考虑评价指标因素的模糊性。模糊综合评价法[12-14]是一种有效克服模糊性的数学方法,其本质是最大隶属度原则。在建立模糊矩阵时,隶属度函数 可使用多种方式,如越小越优型、越大越优型等函数。但有些公式计算较繁琐,而相对偏差模糊矩阵的隶属度函数 计算简单且可较好地反映評价结果。设有 个待评价对象集合 , 个评价指标集合 。如果用 中的每个指标对 中的每个待评价对象进行评价,那么可得观测值矩阵 ,其中 为第 个评价对象关于第 个评价指标的指标值,具体的综合评价步骤如下:

Step1: 设置理想方案

3.2 会员群模糊综合评价结果

为更好地区分6类会员群的价值,以表3中 , , , , , 的均值作为评价指标,6类会员群作为待评价对象,进行模糊综合评价。由于变量 的值越小越好,因此可作为成本型指标,而变量 , , , , 的值越大越好,因而可作为效益型指标。理想方案 可设置为:

= (10.34, 250.42, 453165.81, 37422.52, 20397.5, 2528.21)

相对偏差模糊矩阵计算如下:

根据F值可将6类会员群进行综合排序,每类会员群的具体特征如下:

(1)会员群6综合排名第一,占总会员数的0.42%, 属于少数会员群。该类会员购买时间间隔最短,购买数量最多,交易金额最大,属于商场重要保持的优质会员群。商场应加大对这类会员的资源投入,增大其为商场创造利润的时间。

(2)会员群3综合排名第二,占总会员数的1.29%, 属于少数会员群。该类会员虽然购买时间间隔较大,购买数量也较低,但平均消费金额最大,属于商场重要发展的会员群。对这类会员,商场应为他们制定相应的营销策略,提升其忠诚度,使其逐步转变成商场的高价值会员。

(3)会员群4综合排名第三,占总会员数的4.96%, 属于少数会员群。该类会员购买数量和购买金额较大,属于商场普通保持的会员群。针对该类会员群,商场应及时了解会员需求,逐步提高其忠诚度和满意度。

(4)会员群2综合排名第四,占总会员数的19.79%, 各项指标一般,属于商场普通发展的会员群。该类会员群当前可能对商场的贡献一般,但其发展潜力巨大,应努力提升其价值。

(5)会员群1综合排名第五,占总会员数的64.28%, 属于多数会员群。该类会员购买数量和金额较少,会龄时间最短,属于商场一般发展的会员群。对此类会员,商场应谨慎对其投入资源。

(6)会员群5综合排名第六,占总会员数的9.25%。该类会员消费时间间隔最大,购买数量最少,消费金额最低,会员关系较长,属于非活跃低价值老会员群。这类会员,商场可减少对其投入的资源。

4 结束语

本文运用K均值聚类法对商场会员进行了分类,再利用判别分析法验证了K均值聚类效果,最后使用模糊综合评价法对6类会员群进行了综合排序。实例表明,该方法的分类和评价是有效的,可较好地对商场会员进行识别。本研究结果,为商场运营商有效地对会员进行分类管理,实施针对性的营销策略以及如何加强与会员的良好关系等提供了理论依据。

参考文献:

[1]赵铭,李雪,李秀婷,等.基于聚类分析的商业银行基金客户的分类研究[J].管理评论,2013(7):38-44.

[2]韩宏稳,张建磊.层次分析与聚类分析、判别分析在卷烟零售户分类中的应用[J].中国烟草学报,2014, 20(6):119-126.

[3]姚思雨.改进蚁群聚类算法在零售客户分类中的研究与应用[D].大连:大连海事大学,2018.

[4]左国才,杨金民.K-means算法在电信CRM客户分类中的应用[J].计算机系统应用,2010,19(2):155-159.

[5]胡雷芳.基于聚类分析的C2C电子商务客户价值服务营销对策研究[J].成组技术与生产现代化,2007,24(3):34-41.

[6]王轶华.基于层次分析法建立客户综合价值分析体系[J].华东电力,2006(4):36-39.

[7]曹云忠.基于SOM和粗糙集理论的客户分类研究[J].商场现代化,2009(1):43-44.

[8]黎晗.数据挖掘在客户关系管理中的应用----以客户分类为例[J].中外企业家,2015(36):82-84.

[9]徐文瑞.基于RFM模型的顾客消费行为与顾客价值预测研究[J].商业经济研究,2017(19):44-46.

[10]陈明亮.基于全生命周期利润的客户细分方法[J].经济管理,2002(20):42-46.

[11]2018年全国大学生数学建模竞赛试题[EB/OL]. (2018-09-20)[2019-03-02.]http://mcm.ustc.edu.cn/ahmcm/.

[12]高顺成.纺织服装类高校科技创新能力评价研究----基于相对偏差距离最小法[J].武汉纺织大学学报,2013,26(2):23-26.

[13]许一新,杨鹏辉,汪兆霞,等.基于模糊综合评价对购房影响因素的定量分析[J].阜阳师范学院学报(自然科学版),2017,34(2):96-99.

[14]彭清萍,付亚宾.基于模糊分析法的网络评价体系建构与实施[J].阜阳师范学院学报(自然科学版),2018,35(1):96-100.

猜你喜欢
模糊综合评价法
基于AHP—模糊综合评价的高校废弃物回收物流发展研究
精益建筑供应链绩效模糊综合评价
层次分析法下对成都市土地承包经营权抵押贷款风险评价研究
改进食堂的最优决策方法
本科生毕业设计(论文)质量评价体系研究
供电企业内部控制风险评估
民生银行客户满意度预警测评及其实证探析
民生银行客户满意度预警测评及其实证探析
基于模糊综合评价法的工程项目环境风险研究
实用的职业危害风险评估方法(S-H评估法)