基于大数据RMF管理模型的效益案例关联分析

2024-05-27 01:13祁弋珊彭松王茂美牛雅丽黄冠华
中国市场 2024年14期
关键词:关联分析

祁弋珊 彭松 王茂美 牛雅丽 黄冠华

摘 要:文章基于大数据模型研究大型百货商业会员消费情况与折扣策略管理问题,在确定会员群体的消费习惯、客户价值、生命周期、商业折扣活动效果等信息的基础上提出合理的管理建议,并从折扣和积分两个方面建立商业促销活动的评价指标。研究激活率与以上指标的相关性,笔者发现折扣商品的总供应量和积分发放量与客户激活率关系最为显著,折扣率增加、覆盖规模增加都会提升非活跃会员和失效会员的激活率。积分率的增加对活跃会员的激励作用可能更强,但对非活跃、失效会员没有明显激励作用。

关键词:RMF模型;Lasso回归;管理模型;关联分析

中图分类号:F222;C939文献标识码:A文章编号:1005-6432(2024)14-0187-04

DOI:10.13939/j.cnki.zgsc.2024.14.045

1 背景分析与模型分析

在零售行业中,会员价值体现在持续不断地为零售运营商带来稳定的销售额和利润,也为零售运营商策略的制定提供数据支持。

零售行业会采取各种不同方法来吸引更多的人成为会员,并且尽可能提高会员的忠诚度。当前电商的发展使商业会员不断流失,给零售运营商带来了严重损失。此时,运营商需要有针对性地实施营销策略来加强与会员的良好关系。

通过单据号、收银机号、消费时间三个字段,可以唯一的确定一张订单(小票),这张小票中可能包含不同品牌的若干个不同商品。也就是说,假设不存在两个顾客在同一时间、同一收银机进行结算,并在系统中记录了同一个单据号。

假设商业促销活动只有两种形式:一种为直接降价或打折,表现为客户付款金额与商品总金额的差距;另一种为商业积分,表现为会员积分的增加。

对于会员与非会员群体的退货情况,笔者选取了退货商品的平均单价、退货总件数、退货总金额这三个指标。会员群体中,大部分为本店会员,还有一部分为其他分店的会员,这一类会员也享有会员的权利,例如会员折扣与积分,但并不是本店进行会员管理的对象。

因此,对于本店会员与其他分店会员(简称为外店会员)的购买、退货情况,笔者进行了同样的分析。为了分析该商业会员群体的消费特征,笔者从多种角度将该商业的会员与非会员群体的消费情况进行对比,详见图1和图2。

会员与非会员的单价分布直方图指示了所有顾客购买商品单价的分布情况,由图1可以看出,会员与非会员在购买商品价格上的分布趋势大致相同。通过分布图大致可以计算出,会员消费单价基本处于同一水平,在最高值左侧,随着价格的降低,非会员与会员的购买比例逐渐下降;在最高值的右侧,随着价格的升高,非会员与会员的购买比例逐渐下降。会员与非会员的退货单价分布直方图指示了所有顾客退货商品单价的分布情况。由图2可以看出,会员与非会员群体千元以下小额商品的退货比例高于大额商品,非会员退货商品中小额商品所占比例明显高于会员群体,而大额商品所占比例低于会员群体。非会员退货商品更为集中在小额区域,会员退货则相对分散在各个价格区间。从单张小票购买量与购买金额的分布图中可以看到,会员与非会员的分布趋势基本一致,每次购买一件商品的顾客最多,金额大多为小额消费,会员单张小票的平均购买金额大于非会员。

2 购买力模型的构建

对于会员状态进行了划分,基于会员购买情况,可以将会员分为活跃会员、非活跃会员、流失会员。会员也可以在不同状态之间进行转换,转换的概率即为激活率。

利用已有数据,通过对不同状态下激活率的计算,笔者可以得出活跃会员、非活跃会员、流失会员三者之间进行区分的界限,即多久未购买可以被划分为非活跃会员或流失会员。

同时,根据历史数据计算不同状态的转移概率,即可建立起给予状态转换的会员生命周期模型。确定评价商业促销活动的指标,根据模型假设,笔者将从折扣和积分两个方面建立评价指标。

对于折扣方面,当月折扣率、优惠总金额、会员购买的优惠商品总数、优惠商品总数占总出售商品数的比例、平均每个品牌的折扣范围等指标,可以综合衡量打折的力度。

對积分方面,当月发放的积分总数和积分与总金额的比例(即积分比例)可以衡量商业发放积分的慷慨程度,这也是对会员的一种激励方法。笔者研究激活率与以上指标的相关性,以确定促销活动对激活率是否存在激励作用。

同时,由于指标较多,笔者将通过回归模型研究指标对激活率的整体影响。考虑到指标之间的相关性可能较强,笔者将通过Lasso回归进行变量的筛选。

为了研究商品的连带消费情况,笔者可以通过整合每次购买的商品记录,进行关联规则分析,找出顾客经常同时购买的商品组合,从而得知连带消费情况。根据连带消费偏好,给出商业促销活动的建议。针对会员的消费情况刻画每一位会员的购买力,对会员的价值进行识别。

根据RMF模型理论,RMF衡量客户价值,其中,R是留存率,M为消费金额,F为消费次数。笔者认为,RMF模型中的M消费金额,指示了会员的购买力情况。而消费金额越多,即购买力越高,同时最近一次消费距离当前时间越短,说明客户的价值越高。在RMF模型中,M代表顾客历史消费金额的总和,随着时间的变化而递增。

笔者认为会员的购买力会随着时间的变化而发生改变,综合考虑会员最近消费金额与历史消费金额,可以说明购买力的变化趋势。会员i在入会后第t季度的购买力Pi,t为:

Pi,t=Mi,t×25+Pi,t-1×35,t=1,2,3,…,n

式中,Mi,t为当季度消费额,Pi,t-1为上一季度的购买力,Pi,0为0。

3 购买力变化趋势分析

事实上,由于客户活跃状态并非一成不变的,笔者可以根据客户激活率得出客户在非活跃状态、活跃状态、流失状态间转换的模型,即为客户生命周期模型。会员的生命周期可以被定义为:入会(发展)→活跃期→非活跃期→失效(退出)期。

笔者认为,如何判定会员在一段时间不购买商品之后,就进入非活跃期;以及如何判定某个会员在更长的一段时间内不购买商品,即进入失效期,是非常关键的。假设Si,t为会员i在t时刻的状态,状态Si,t=-1,即客户i在t时刻为失效状态;状态Si,t=1,即客户i在t时刻为非活跃状态;状态Si,t=2,即客户i在t时刻为活跃状态;状态Si,t=0,即客户i在t时刻为发展状态。设M为金额的表示符号,Q为数量的表示符号,C为前往商业进行购买的次数的表示符号。对于发展状态,笔者认为一般来讲,可以被归为非活跃状态,也就是新会员的活跃度还不足以进入活跃状态。一般来说,笔者可以假设,在最近Δt1时间内,会员i前往商业超过c1次,或共付款超过m1元,或购买超过q1个商品,即被认为是活跃的;而以上条件都不满足,但在最近Δt2时间内,会员i前往商业超过c2次,或共付款超过m2元,或购买超过q2个商品,即被认为是非活跃的;其他情况下会员为失效、退出的。则有:

Si,t=2,Mi,t,Δt1≥m1∨Qi,t,Δt1≥q1∨Ci,t,Δt1≥c11,(Mi,t,Δt1

在最近Δt1时间内,会员i购买了至少一件商品,即视为活跃;若该会员在最近Δt1时间内,会员没有购买商品,但在最近Δt2时间内,会员购买过至少一件商品,则被视为非活跃;而在最近Δt2时间内,会员都没有购买过商品,则认为该会员已经流失。

则简化的模型为:

Si,t=2,Ci,t,Δt1≥11,Ci,t,Δt1=0∧Ci,t,Δt2≥10,其他

所以,笔者现在要确定Δt1和Δt2的大小。

笔者定义失效会员的激活率P0,2(t,Δt2,i)为以下情况。在t时刻,会员i在t时刻之前的Δt2时间段内一直没有购买任何产品,但在t时刻至t+1时刻内,购买了至少一个产品的概率。定义非活跃会员的激活率P1,2(t,Δt1,Δt2,i)为:在t时刻,会员i在t时刻之前的Δt1时间段内一直没有购买任何产品,在Δt2到Δt1这段时间内购买过至少一个产品,但在t时刻至t+1时刻内,购买了至少一个产品的概率。笔者假设,P0,2和P1,2与会员和当前时间无关,即P0,2(t,Δt2,i)=P0,2(Δt2),P1,2(t,Δt1,Δt2,i)=P1,2(Δt1,Δt2)。并且以统计上的频率来表示概率,于是有当激活率P0,2(Δt2)为P0,2(Δt2)的最小值时,Δt2为会员非活跃期,即会员保留非活跃状态的最长时间,原因是经过Δt2时间段会员没有购物,则下个月该会员恢复购物的可能性最低,也即最可能成为一个失效状态的会员。

所以,任何一个会员在最近Δt2时间段没有购买商品,即被认为由非活跃状态转化为失效状态。当激活率P1,2(Δt1,Δt2)為P1,2(Δt1,Δt2)的最小值时,Δt1为会员活跃期;与结论1相似,在Δt1这么长时间内,会员没有购物(即便他在Δt2到Δt1这段时间内购物了),他恢复购物的可能性最低,最可能从活跃状态转移到非活跃状态。

首先,笔者计算Δt2。对Δt2=j,j为2,3,4,…,11,12中任意一个数,对样本内某一个月a,分别计算在该月前j个月都没有购物的本店会员数量x1,再计算x1中下一个月购物的顾客数量x2,记P0,2(j,a)=x2x1为Δt2=j的条件下,第a月的失效会员的激活率。则Δt2=j时的P0,2(j)为:

P0,2(j)=∑aP0,2(j,a)24-j

其次,笔者对Δt2=2,3,4,…,11,12中的数分别计算P0,2(Δt2)的值,最小的值对应的Δt2即为非活跃期。即非活跃期为五个月。同理,笔者计算Δt1。对Δt1=k,k为1,1.5,2,2.5,…,4.5中任意一个数,对样本内某一个月a,分别计算在该月前k个月都没有购物,但在Δt2(=5)至k的这段时间内购物过的本店会员数量x1,再计算x1中下一个月购物的顾客数量x2,以P1,2(k,a,5)=x2x1表示Δt1=k的条件下,第a月的非活跃会员的激活率。则Δt1=k时的P1,2(k,5)为:

P1,2(k,5)=∑aP1,2(k,a,5)19

最后,对Δt1=1,1.5,2,2.5,…,4.5中的数分别计算P1,2(Δt1,5)的值,最小的值对应的Δt1即为非活跃期。在Δt1≥3时,P1,2不再随Δt1增大而减小,而是转为水平,所以活跃期为三个月。综上所述,模型给出的判断会员状态的标准为:会员在三个月内有消费记录,即被认为是活跃会员;在三个月内没有消费记录,但在五个月内有消费记录,即被认为是非活跃会员;在五个月内都没有消费记录的会员为失效会员。对会员消费记录进行处理,通过单据号、时间识别出属于同一次消费的记录,汇总每一次消费过程中,同时购买的商品,以编码的形式进行记录,构成商品购买数据集。在观察了约45万条由约2.5万位顾客产生的消费记录后,笔者认为该最小支持度计数应该确定为150次,置信度阈值为0.5。笔者通过编程找出了在此条件下的所有关联商品组合以及它们之间的关联关系的置信度,这些商品之间存在着关联关系,即连带消费倾向。

观察以上商品组,笔者发现,这些商品组几乎全部为化妆品,这一品类存在较多的连带消费情况。当仅改变模型中最小置信度时,生成的频繁商品组合及其支持度不会有变化;关联规则及置信度也不会改变,但会进行数量上的筛选。当仅改变模型中最小支持度时,生成的频繁商品及其支持度不会改变,但会进行数量上的筛选;关联规则及置信度会发生较大变化。令最小支持度计数分别为50、100、150来测试模型,发现最重要的同等数量的关联规则中,有超过80%的规则未发生变化。

因此可以说明,该模型有较好的稳健性,最小支持度和最小置信度的改变会带来频繁商品组合和关联规则的数量筛选,而对较重要关联规则内容的改变较少。根据以上结论,笔者给出对于商业促销活动的建议:促销活动的主要对象应为化妆品类,最好是针对同一品牌中的商品推出促销活动。参考存在连带消费关系的商品组合,可以推出优惠套装刺激购买,或通过对主动购买商品提供折扣,提高连带消费商品的销量。

4 模型评价与推广

折扣商品的总供应量和积分发放量是Lasso回归筛选出的显著的变量。总的来说,折扣率增加、打折活动覆盖的品牌和规模增加,都会提升非活跃会员和失效会员的激活率。

积分率的增加对活跃会员的激励作用可能更强,但由于积分率增加时,商业中一般打折力度较弱,所以积分率对非活跃会员和失效會员没有激励作用。商品的连带消费是商家经营过程中的重要现象,关注顾客在消费过程中的连带偏好,有利于商家进行促销活动的策划。

基于数据分析的会员状态的划分,明确规定了活跃会员、非活跃会员、流失会员之间购买时间的差异,并且通过数学方法证明了这一边界的确定方法,有理有据,在传统营销理论之余通过数学方法加以佐证。建立了商品组合关联规则的分析模型,不仅揭示了商品之间的连带消费关系,而且通过置信度指标可以看出商品关联关系的强度,具有很强的可解释性。同时,自动挖掘相比人工而言效率更高,应用性更强。

参考文献:

[1] 杨晓峰.试析基于大数据技术的BI分析系统在企业财务管理方面的应用[J].商场现代化,2022(20):171-173.

[2] 屈晶.基于Excel软件的电子商务销售与库存数据管理分析[J].科技资讯,2022,20(16):8-10.

[3]孙王江.电子商务网站营销数据分析技术初探[J].中国市场,2022(19):133-135.

[4]沈锋.产业关联视角下“信息基建”对企业数字化转型影响思考[J].数字技术与应用,2023,41(4):53-55.

[5]解璇,赵璐,孟子皿.教育-社会-认知控烟理论的干预研究[J].数据,2023(3):13-14.

[6]方正,杨洋.网上购物的管理模型研究[J].中国市场,2010(Z2):15-18.

[基金项目]北京电子科技职业学院横向课题“汽车改装市场分析”(项目编号:2019H014-001)。

[作者简介]祁弋珊,女,北京人,硕士,研究实习员,研究方向:应用管理与职业教育研究等;通讯作者:彭松,女,江西南昌人,硕士,助教,研究方向:劳动经济学与职业教育等;王茂美,女,山东日照人,硕士,讲师,研究方向:汽车节能环保与市场应用管理等;牛雅丽,女,河北唐山人,硕士,讲师,研究方向:应用管理与职业教育研究;黄冠华,女,辽宁锦州人,硕士,主任,研究方向:应用管理与社会经济研究。

猜你喜欢
关联分析
“鹰眼”大数据安全管控平台的技术实现解析
斑点叉尾MSTN基因4个SNP位点及其与生长性状的相关性
1996年~2016年档案学国家社科基金项目的文献计量分析
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
基于随机函数Petri网的系统动力学关联分析模型
关联分析技术在学生成绩分析中的应用
基于关联分析的学生活动参与度与高校社团管理实证研究
精准扶贫背景下广东省有户籍人口海岛灰色聚类分析研究
不同的数据挖掘方法分类对比研究