张曦 隋毅 郝晶 倪杰清
(中国石油天然气股份有限公司规划总院)
随着国内成品油市场的发展,我国成品油零售市场正在形成一个油源多元化、竞争主体多样化、品牌服务及价格差异化的局面,且各营销企业在经营规模、经营品种、油品价格和油品质量等方面相差无几。成品油零售企业要想在市场竞争不断加大的情况下立足,必须从营销角度重新审视市场,构建精准营销体系,提升核心竞争力。本文从成品油零售客户精准营销角度,以客户交易数据为研究对象,通过结合业务实际需求,从客户的人口特征属性、消费行为、产品驱动、消费偏好、加油站偏好、忠诚度等各方面进行分析,运用数据挖掘中的聚类算法K-Means对客群进行细分,实现客户画像全面客观地展示,为企业的管理和制订差异化营销策略提供依据。
客户画像是客户的标识,是制定差异化营销策略的判断依据。客户画像主要包括客户的心理价位、产品风格喜好、客户黏性等。比如建立一个客户画像:男,31岁,喜欢消费 95号油,加油地点较为固定,常去的加油站为大兴方科加油站,对价格不敏感等。这样的一系列特征描述即为客户画像的典型案例,梳理这些特征的过程称为客户信息标签化。客户画像的核心就是为客户打标签。标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解”人。因此,基于客户画像的数据挖掘技术能更方便的让人理解客户并且易于计算机处理,从而更有效地利用挖掘结果,提高信息获取的效率,提升营销精确度。
聚类是按照事物的某些属性,将事物聚集成不同的类,使类内成员的相似性大,类间的相似性尽可能小。聚类的目的是从大量数据中寻找隐含的数据分布规律。聚类算法很多,不同角度分类不同,按聚类结果划分,可分为覆盖聚类算法和非覆盖聚类算法、层次聚类和非层次聚类、确定聚类和模糊聚类;按聚类变量类型划分,可分为数值型、分类型和混合型聚类算法;按聚类原理角度划分,可分为划分聚类、层次聚类、基于密度的聚类和网格聚类算法等[1]。
目前流行的数据挖掘软件中主要聚类方法包含K-Means聚类、两步聚类和Kohonen聚类等,其中K-Means聚类算法应用最为广泛。K-Means聚类也称为快速聚类,属于覆盖型数值划分聚类算法,是执行效率较快的聚类算法之一,对于成品油零售客户细分而言,此算法操作方便。
在本文的研究过程中,采用 IBM公司 SPSS Modeler作为数据挖掘工具,选取部分客户作为研究对象,通过对客户不同方面特征分析,建立客户宽表,并使用K-Means聚类方法对客户进行科学合理细分类,建立客户画像。企业根据客户群画像的特征,可针对不同客群制定差异化营销策略,最大程度地提升不同客群给企业带来的不同价值,增强对客户的吸引力,进而提升市场竞争力。以某省公司的主要消费汽油的高价值客户进行K-Means聚类分析为例,主要从以下5个方面选取衍生字段。
1.2.1 人口及客户价值
人口特征数据中,姓名和联系方式通过系统直接获取,性别和年龄则根据客户身份证号码进行计算。客户价值参考客户的月均消费额划分为高、中、低三类价值。月消费金额前15%的客户定义为高价值客户,后15%为低价值客户,中间则定义为中价值客户。
1.2.2 消费行为习惯和偏好
消费行为是通过抓取包括月均消费金额、消费量、频次,单笔消费金额及消费量的均值、极值和年消费金额及消费量等在内的数据分别统计客户单笔消费情况、月均消费情况和年消费情况。
消费习惯与偏好信息包括加满率和价格敏感度。取客户历史最大加油量作为其油箱大小,计算本次加油量与油箱大小比值,若不小于 0.85,则认为其加满,单个客户的加满次数与总加油次数的比率,即为加满率。价格敏感度,在经济学上是通过顾客需求弹性函数体现,即由于价格变动引起的产品需求量的变化。成品油零售客户的价格敏感度可以转化为研究油品单价和油量升数相关性。采用“张氏系数”指标进行研究,可以得出该客户的价格敏感度。
1.2.3 产品偏好
包括主要消费的油品种类、油品型号、对应消费金额、消费升数、该油品消费占比、是否消费非油品以及非油品消费频次前三的类别等。统计时,先按油品类型统计,再按油品型号统计,比如,汽油占比是以汽油占汽柴油消费总量为基数测算,而92号汽油占比,是以 92号汽油占汽油消费总量测算。客户主要消费的油品种类是以汽油消费占比为85%为界,超过的则定义为主要消费汽油。
1.2.4 忠诚度
忠诚度信息包括客户卡片级别、持卡时长、卡片余额、积分余额、持有加油卡数量、客户流失状态等。持卡时长是从开卡日期至现在的总时长。客户流失状态是以最近一次加油时间与模型运行时间差进行计算,以30天为界,将客户划分为活跃客户、不活跃客户、濒临流失客户和流失客户。
1.2.5 加油站位置偏好
地理位置信息包括客户开卡的站点、所属地市、省份和客户对于消费站点的偏好,根据这些信息可预测客户的职业倾向,属于传统人士还是商务人士,最常去的三个加油站点等。
通过对数据抽取、清洗、转换和剔除异常值,按不同指标分析方向提取衍生字段,通过因子分析对变量进行降维,可以获取能代表样本大部分信息的少数变量作为K-Means聚类算法的输入变量[2]。以汽油高价值客户的聚类分析为例,模型建立如下。
对原始变量和产生的一系列衍生变量,进行因子分析,并结合实际业务需要,选取每月消费金额、加油时间间隔、常去加油站个数、常去加油站加油升数占比、加油月份数量等具有代表性,能反映客户80%以上信息的多个变量作为聚类输入变量。
根据汽油高价值客户所具有的消费特征以及实际客户群体的类型,可分为中产居家型、进取商务型、拉活挣钱型、职业司机型和高品质工薪型5个类别,所以k的取值不小于5。在此基础上,根据轮廓系数(Silhouette Coefficient)值,运用枚举法,对k的取值进行最终确定。轮廓系数结合了聚类的凝聚度和分离度,用于评估聚类的效果。该值取值于-1到1,值越大,表示聚类效果越好。经过反复试验,确定选定k为5,此时轮廓系数为0.4,聚类效果良好。
运用IBM SPSS Modeler软件中K-Means节点进行聚类,最终聚类结果见表1。从表1中可以看出依据代表客户主要信息的变量将客户聚成5类,各个类别的客户数量分布较均匀,类之间的差异性明显:聚类2和聚类4中客户特征为95号汽油油量升数平均占比较高,分别为 0.79、0.73,接近 0.80,说明这两类客户主要以95号汽油为消费类型。而聚类2常去加油站平均为8.73个,远远超过聚类4的3.74个,说明聚类2的客户常去的加油站数量较多,生活圈相对较广,可为聚类2创建标签为进取商务油品型的客户,同时按照性别可分为进取商务男和进取商务女。相对来说聚类4可创建标签为传统居家油品型客户,同样可分为传统中产男和传统居家女。
表1 聚类结果
同样,聚类 1、聚类3、聚类 5中的客户以 92号汽油油量占比较高,说明主要消费92号汽油。聚类3常去加油站个数最多,常去加油站加油的占比最低,加油站点比较分散,可以把该类型的客户称为拉活挣钱油品型客户;聚类1时间间隔波动小,加满率较高,加油站点较固定,加油间隔也较固定,说明这类客户生活比较规律,可以认为是高品质工薪阶层油品客户;聚类5常去加油站加油占比最高,常去加油站个数最少,加油站点最集中固定,可以认为是职业司机油品性客户。
用少量的数据变量进行客户特征的描述,每个类内的客户具有的特征是相似的,类与类之间客户特征不相似。根据相似的特点,给每个类定义了多维度标签,根据不相似性,构建各自客户群画像。
数据驱动精准营销是对客户数据的深度挖掘与应用,从传统的关注促销活动向现在的关注客户消费特征进行转变,围绕客户偏好制订营销策略可以更好地实现以客户为中心的业务支撑。油品和非油品零售业务在传统营销上多以普惠促销为主,各类客群不分是否持有加油卡,也不分价值的高低均享受同等的促销优惠。以数据驱动的精准营销打破了这类常规做法,它强调的是差异化,不同客群应该采取不同的营销策略,在促销环节的各个节点融入数据分析,基于数据发现,主动实施差异化营销,节省促销成本,提高促销响应率和营销收益。
实现数据驱动精准营销通常包括8个环节,即客户智能分析、业务目标确定、营销计划制订、促销活动制订、促销活动执行、营销效果评价、促销活动事中调整及模型优化,是一个闭环的综合业务过程(见图1)。借助数据分析,可以发现数据中隐藏的规律和潜在的价值。
图1 数据驱动精准营销流程
基于客户聚类等算法,形成客户画像,进行客户的深度洞察,发现需要重点关注的客户群体,比如高价值客户、流失客户、沉睡客户等。针对这些目标客户群体,进一步掌握和了解客户的消费特征、消费习惯,比如常去加油站、月均消费金额、消费频次、是否购买非油品等,为后续的精准营销进行数据探索和支持。
营销业务目标通常划分为维系重要客群、提升产品销量与利润、处理产品库存、推广新产品及应对竞争对手等5个方面。围绕不同的业务目标,会制定包含不同促销要素的组合和促销效果评估指标,促销方案在促销客群、促销产品、促销站点、促销方式、促销渠道、促销话术等方面都会有不同的选择。
以营销业务目标为出发点,制订年度、季度或月度的营销计划,逐级分解和细化营销计划,主要内容包括营销的策略、时间周期、范围、促销活动类型等,完成营销计划的编制与下达。
按照营销计划,制订具体的促销活动,包括筛选目标客群、明确促销时间、促销产品、促销站点、促销规则、促销渠道、促销话术等,形成完整的促销方案。比如针对95号油高品质客户,进行CN98号油品满288减15的促销;针对流失客户进行充值优惠和多倍积分的促销等。同一个营销计划可以根据不同的客群特征,制订多个有针对性的促销活动。在这个过程中,数据分析对促销策划过程起到重要的支撑作用,通过数据挖掘分析功能能够辅助业务人员更精准地确定促销活动的细则。
促销活动的执行通常是多个信息系统联动的过程。依托于客户关系管理系统制定促销规则,经审批后下发至各渠道的执行系统,线下渠道主要是加油站管理系统,线上将是依托电子销售平台,推送至微信公众号等渠道中。
营销效果评价分为事前、事中和事后。事前主要是在促销活动开始前进行营销响应预测,基于历史的促销响应数据样本,建立预测模型,计算客户对于不同类型的促销方式的响应率,把它作为促销匹配和响应效果预测的重要输入。事中主要是对促销活动执行过程中的客户响应情况、销量的增长情况进行实时评价。事后主要在促销活动结束后,通过各型号油品和非油品的销量、交易金额、交易频次和客群响应等多项关键绩效考核指标衡量促销活动的效果,通过多维度剖析,总结促销活动经验,为产品定位、价格定位和客群定位提供指导建议。为了更准确地评价活动效果,除了单次活动的效果分析,也可以进行实验组和控制组的同期比较,可以更准确地剔除时间因素和随机因素,达到更精准的评价营销效果的目的。
根据事中促销活动效果的监控情况,可调整促销活动次数,以进一步提高促销响应率和营销收益。
模型优化是提升模型质量和效果的重要步骤。根据客户对营销活动的实际响应情况,持续进行营销响应数据的积累,不断修正客户对各类促销规则和促销方式的响应概率,以提高后续营销响应预测的准确性。
销售公司通过将数据分析结果运用在促销活动中,实现了差异化的客户定位,验证了数据驱动精准营销的整体效果。以广州销售公司为例,通过运用数据驱动精准营销活动使该公司在激烈的市场竞争环境中,显著提升了油品的销量。
流失客户挽回是目前应用最广的数据驱动精准营销活动。首先业务人员要查看客户智能分析的结果,掌握客户的画像特征,明确需要重点关注的客群。经过分析发现流失客户的占比将近20%,不活跃和濒临流失的客户占比将近32%。针对这一情况,将业务目标锁定为针对流失客户进行重点维系和关怀,相应制订了为期三周的流失客户挽回营销计划。活动内容主要是针对广州销售公司流失、濒临流失和不活跃的加油卡客户,精准推送消费赠送6倍积分、可兑换加油站商品等优惠政策,活动累计推送短信1.8万条,吸引客户持卡消费,提升客户价值,体现客户关怀,重建客户的品牌认同。
活动开展后,通过活动前后客户数量变化,可掌握客户挽回总体情况:不活跃客户人数从 6 407人下降至5 523人,挽回 884人;濒临流失客户人数从4 831人下降至4 447人,挽回384人;流失客人数从7 839人下降至7 451人,挽回388人,总计挽回1 656人。挽回的客户交易量达到20.3万升,交易额达到121.6万元,流失挽回率将近9.2%。
为了进一步验证流失客户挽回的效果,比较了促销活动前后日均挽回人数的差异(见表2)。流失、濒临流失、不活跃客户通过精准营销活动日均挽回人数分别提升了67%、49%和29%,验证了精准营销对流失客户挽回的提升效果。
表2 促销活动前后日均挽回人数的差异
同时,为了排除特定时间因素带来的误差(比如节假日迎来的客流),将广州和深圳两个地市的流失挽回情况进行了同期的对比(见表3)。总体流失挽回率广州相比深圳提升了 3.3倍,其中流失客户挽回率的提升度最高,可见精准营销活动效果显著,并不是时间因素引发的效应。
表3 促销活动前后日均挽回人数的差异
从三类客户群体挽回数量变化曲线可直观看出,不论哪种类型客户,数据驱动的精准营销都有明显的客户挽回效果(见图2)。在分析总体响应情况的基础上,进一步研究每个客群的响应情况,对响应客群的共性特征进行分析发现:最容易被挽回的客户群体有两个明显的特征,一是卡内余额大于100元的流失客户更容易被挽回;二是品牌摇摆的客户群体对于活动的响应程度最高,是最具有召回潜力的客户群体,说明该部分人群加油受价格和促销因素影响较大,符合这类客户的消费行为特征,进一步验证了客户聚类的结果。
图2 客户挽回的时序特征分析
国内成品油市场竞争不断加大,企业需要准确定位市场中的客户群及特征,为其提供个性化服务,才能实现企业和客户的“双赢”,运用数据分析方法对客户进行多维度、多层次的客观全面地挖掘,并使用聚类分析对客户进行分群,形成全方位的客户画像,是实现精准营销的基础。本文从结合业务实际需求的角度,提供了成品油零售行业的客户数据分析方法,搭建了客户分析指标体系,并运用聚类算法K-Means从原始数据中进行挖掘(K-Means算法的聚类数目k不只单纯的依赖于经验,而是通过实际业务需求和轮廓系数相结合进行确定),得出有规律的客户信息,实现客观全面的客户分群,构建不同客户群的标签画像,以用于精准营销。
此外,在实际中,该方法的运用改变了以往单纯依赖市场导向的营销模式,实现以用户价值为导向的有针对性的精准式营销,极大地降低了企业成本,满足了客户实际需求。