基于数据挖掘技术的网络营销策略的实证研究*

2021-04-25 06:07鲍俊颖吴瑶瑶
关键词:频数均值买家

鲍俊颖,吴瑶瑶

(重庆第二师范学院 数学与信息工程学院,重庆400065)

伴随“互联网+”网络时代的冲击,网络销售逐渐取代传统销售,网络销售行业竞争日趋严重。本文以淘宝某高级礼服商家为例,该店铺为淘宝皇冠店铺,近期销售额持续下滑,通过促销、聚划算等营销手段能够在短暂时期内增加较多的客流量,但是新流量的后期维护问题困扰着商家。同时,买家的回头率与回购的订单价的把控都存在严重缺陷[1]。而这些问题的存在主要是对顾客的资源发掘不充分,通过选取店铺销售数据中的11 013个样本进行分析,根据有效客户制定营销计划,实现精准营销(如提供价格折扣、产品对比等服务),使销售商在有效预算下获得利益最大化。此外,本文通过有效客户预测近期购买力,还能为商家减少货物积压等,有助于改良现有的销售模式、提高销售收益[2]。

1 分类树模型下的重购客户选择

1.1 RFM热度分析

以RFM模型度量买家价值及买家盈利能力,构建3个要素动态展示客户的整体轮廓,即最近一次交易的时间(记为R)、近期交易次数(记为F)和近期交易金额(记为M)。将时间段内客户的交易金额进行分等级评分,3类指标计算得到“有效”评分数为RFM=100R×10F×M[3]。

本文对店铺某季度的销售数据11 013个样本进行RFM分析,构建RFM模型所需数据(交易时间、金额、次数)。作出离散化之后的RFM块计数图和RFM热图,如图1。RFM块计数图呈现根据离散化方法设定的块的分布,每个条的高度代表着对应RFM得分的客户数量。该图主要用来查看每个RFM得分的客户数量分布是否均匀,我们期望均匀的分布。若不均分,则需要重新考虑RFM的适用性或者试验其他分箱方法[4]。图1中生成的125个组段样本数量大致上是相等的。RFM热图是交易金额均值在交易时间和交易次数上绘制的矩阵图,用于表示不同购买时间*购买频次分组时该组段的平均购买金额分布,从而能够快速确定高价值组段所在的区域;用颜色深浅表示交易金额均值的大小。其中频率分值为5分的几个组段其平均购买金额更大,并且其中又以时间顺序分值为3~5分的几个组段更大[5]。

根据离散化之后的数据计算样本的RFM值,选择RFM得分大于500的作为“最有价值”客户作为本次活动的促销名单,本文共选择出2 145位客户作为本次活动的促销名单,成为“最有价值”客户[6]。

图1 RFM块计数和RFM热图Fig. 1 RFM block count and RFM thermal map

1.2 重购客户特征分析

RFM模型的结果显示,购物频率和购物金额正相关,且购买频率为5的购物金额明显较大,商家可以针对RFM得分大于500的客户开展相应的促销活动,为进—步分析,研究频率得分和交易数间的关系,其结果见表1。

表1 频率得分和交易数对比Tab. 1 Frequency score and transaction number comparison

由表1可知,频率得分为5的这一组包括全部交易频数大于1次的客户,表1中呈现了交易频次多于1次的客户和只有1次交易的客户之间的差异。因此,将消费者分为1次购物客户和重购客户2组,比较这2组消费者之间的差异[7]。

本文研究对象为多变量,且不同变量对于客户群体具有不同方面的重要意义,根据数据属性,结合变量取值特点,需要考虑不同因素下不同客户群体的构成。本文运用分类树模型分析重购客户群体特征,分类树模型首先浏览全部变量来确定最优分组,再根据不同变量对客户依次递归划分。选取变量买家信誉、性别、年龄、地区、是否重购、次均交易金额,将是否重购变量视为响应字段,其结果见表2。

表2 树模型分析结果Tab. 2 Tree model analysis results

由表2可知,只有次均交易金额和买家信誉2个变量为模型提供显著贡献,响应率最高的一组次均交易金额介于49~107.743 33元,买家信誉高于4星级,这731人中有26.54%为重购买家;其次为次均交易金额小于或等于37.955元的人群,其中有25.77%为重购买家;以此类推,第11组的重购率只有7.1%。而11个亚群大致根据次均交易金额和买家信用划分的,意味着重购群体并不存在明显的性别、年龄、地区等差异。

前5组的响应率较高,但5,6组之间有较大差距,通过分析前5组,总结重购客户特征为:信用等级在4星级以上,而次均交易金额小于150.95元,并且如果次均交易金额小于107.743 33元,信用等级将更高,购买比例较大。

2 客户群体的聚类分析

不同的客户群体可看做是不同的客户类别,故可运用聚类分析对客户进行分类,为确定各类型特征,通过方差分析评估每个类别变量的重要性,根据变量在不同类别中的作用识别客户购买特征,定位有效客户群体。本文运用两步聚类法,选择买家性别、买家信誉、是否多次交易、RFM得分、次均交易金额和买家年龄为分析变量进行聚类分析,结合聚类图和预测变量重要性图,如图2将客户群成功地分成了4类,每个客户群的特点为:

图2 聚类分析每组类别详细信息和预测变量重要性图Fig. 2 Cluster analysis of each group of category details and the importance of predictive variables

类别1:人数占比为23.5%,男性为主,单次交易为主,年龄均值为28.65,次均交易金额均值为167.61,RFM得分均值为328.51,4星级买家居多。

类别2:人数占比为15.5%,女性为主,多次交易为主,年龄均值为28.08,次均交易金额均值为121.38,RFM得分均值为378.77,1钻买家居多。

类别3:人数占比为28.9%,女性为主,单次交易为主,年龄均值为27.81,次均交易金额均值为150.25,RFM得分均值为323.57,5星级买家居多。

类别4:人数占比为32.1%,女性为主,单次交易为主,年龄均值为27.83,次均交易金额均值为148.46,RFM得分均值为325.81,1钻买家居多。

上述4个客户群体中类别2多次交易占比为100%,与研究目标群体重购人群一致,则将类别2作为研究的特定群体。预测变量重要性图反映预测变量的重要程度,颜色越深,重要性越突出,则买家信用、性别、是否多次交易对该聚类模型更重要一些[8]。即定义重购行为特征为:以女性为主,买家信用大于1钻,RFM得分大于378.77,次均交易金额大于150.25。

3 Logistic模型下的购买倾向分析

在得到有效客户群体后,往往有针对性地根据这部分客户定制专门的营销方案,需要监测广告投放或营销方案的有效性,进而对更多未知客户的购买行为进行预测,从而更加精准地营销,同时为产品设计、生产和存储提供依据,实现利润最大化。购买倾向分析根据已有响应测试结果的少数客户作为训练数据,建立预测模型,运用该模型对其余客户预测评分,从而预测响应推广信息继而购买产品的客户。

将变量是否重构作为响应字段,选取买家信誉、性别、年龄、次均交易金额和RFM得分作为预测倾向。经测算整体模型质量为0.62,大于一般标准0.5,说明模型整体水平较好。作出检查分类表,如表3,训练样本中实际正响应的正确率为14.86%,测试样本的正确率为16.2%,即以此模型选择的客户中有16.2%发生购买行为,它大于指定的最小响应率2%,故此模型可以用于确定超过指定的最小响应率的客户。

表3 检查分类表Tab. 3 Inspection classification table

根据已有响应数据建立的购买倾向分析模型,对待确定客户的购买倾向进行量化打分,可以选出有可能发生购买的客户群体,实现精准营销。建立购买倾向分析的二项Logistic模型,二项Logistic模型可以根据不同自变量,计算每个客户的响应概率,即预测客户发生购买行为的概率,达到预测和判别的目的。设定阈值为0.25,根据计算结果,从1万多个客户中,共选出2 017个客户,针对这组客户制作活动方案,投放广告可以得到更高的购买响应率,提高购买率。

4 客户细分定位有效客户

基于RFM模型对客户的细分[9],计算最近一次消费时间、消费频数、消费金额得分的均值,将得分小于均值的视为低,记为0,其他视为高,记为1,再依据下述标准将客户分为8类[10],将每个客户定位到不同的类型,汇总如表4。

表4 客户类型汇总表Tab. 4 The summary of customer types

重要价值客户(111):最近一次交易时间间隔短、消费频数及金额均很高。这类客户具有很高潜在价值,是带来企业利润的最重要群体,此类客户的维系是企业利润的重要保证。

重要保持客户(011):最近一次交易时间间隔长,但消费频数和金额均很高。说明这是较长时间未消费的忠实顾客,需要主动发生联系。

重要发展客户(101):最近一次交易时间间隔短、消费金额高,但频数不高。虽然忠实度不高,却拥有很大潜力,如果企业适应他们的需求,通过针对性的营销策略迎合他们,即可提高购买次数,获得更可观的利润,故需着重发展。

重要挽留客户(001):最近一次交易时间间隔短、消费频数不高,但消费金额高。可能为即将流失或已经失去的用户,对这类客户企业应尽量挽回,是企业利润的潜在来源之一。

一般价值客户(110):最近一次交易时间间隔短,消费频数高,但消费数额较小。这类客户是活跃客户,但存在经济实力不够或者经济实力较强而产品不符合购买意愿的问题。若对于此类客户的销售投入较大,可能不能达到销售目标,但适当保持关系仍可使企业获取一定收益。因此,持有一般重要态度。

一般发展客户(100):最近一次交易时间间隔短,但购买频数和购买金额都较小,不能马上为企业赢得可观收益。

一般保持客户(010):购买频数较高,但长期不和该企业交易,并且消费金额很低,企业从这类客户得到更多收益已经较为困难。

无价值客户(000):无论是购买频数、购买金额,还是购买时间间隔,这类客户均不能为企业带来价值,因此不再需要维系和他们的关系。

由表4知,重要价值客户有704人。根据RFM模型,重要价值客户为分值最高的一类,故将这704名重要价值客户定位为有效客户。

5 结论

本文运用分类树模型,在RFM模型基础上进行优化,考虑潜在客户价值与创收能力;结合聚类分析,基于所有客户数据的分类,找到影响销售的关键因素,定位客户群体;运用二元Logistic回归模型,有效预测客户购买行为;针对分析结果,提出了客户当前价值和潜在价值在客户细分中的应用。通过数据挖掘技术,采用真实数据进行量化分析,可以清楚直观地定位更有价值的顾客,从而根据顾客群体制定销售方案,推广销售信息,预测销售数据,实现精准营销。同时,通过有效客户定位的结果,同样可以分析潜在客户的特征,如将预测购买力接近0.25的作为潜在客户,同时也可将客户分类中的重要保持客户、重要发展客户作为潜在客户进行促销。

猜你喜欢
频数均值买家
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
频数与频率:“统计学”的两个重要指标
浅谈均值不等式的应用
均值不等式的小应用
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
神一般的打字技术
拉风买家秀
频数和频率