摘 要:随着互联网技术的不断发展,电子商务行业发展迅速,2018年全年实物商品网上零售额70198亿元,比上年增长25.4%。[1]网上购买已经成为消费者购买商品的主要渠道,大部分企业也通过各种电商平台建设了电子商务营销渠道,方便消费者的购买。消费者通过网络购买商品具备过程方便快捷、商品信息透明化的优势。但对企业来说,也出现了消费者品牌转换成本低导致忠诚度低的挑战。本文将研究如何利用消费者的网络购买数据来帮助企业分析重购客户特征。
关键词:SPSS;电子商务;重购客户
电商平台上买家数量多,质量不等,如何在大量的客户中寻找购买重复概率高的老客户是提高营销收益的重要方法,本文将采用DMTree的方法完成淘宝重购客户的特征分析,寻找符合响应率要求的客户,为提高营销ROI提供决策依据。
一、分析方法
DMTree是IBM SPSS Direct Marketing的“生成对产品做出回应的联系人概要”采用的分析方法,DMTREE算法用来构建一个树形模型,它可以根据预测变量的值,将实例划分成不同的组。当有多个预测变量时,首先浏览所有变量以确定最佳的分组方法,然后按照预测变量的次序递归划分。比如,有两个预测变量性别、年龄。那么,先按性别分两组,然后在各组内继续按年龄划分。IBM SPSS Statistics 将该算法应用到“生成对产品做出回应的联系人概要”,根据客户对测试活动的响应,对客户进行划分。[2]
本文研究如何在大量的电商客户中寻找重复购买率高的客户,可使用SPSS的直销模块中的“生成对产品做出回应的联系人概要”完成。分析步骤如下:
(1)收集整理某企业或某商品的电商客户的历史交易数据,数据内容应包括客户基本特征数据、客户交易记录数据。
(2)进行数据预处理,对重购客户和非重购客户进行标识区别。
(3)根据企业的投资收益标准,制定重购客户响应率的要求,使用“生成对产品做出回应的联系人概要”最后创建满足响应标准的重购客户的特征描述文件。
(4)寻找符合上述分析的重购客户特征的客户作为重点目标客户开展营销工作。
二、分析过程
(一)数据采集
数据的采集可以从企业的电商交易数据库中采集,采集的数据需要包含客户特征数据、客户交易明细数据。
(1)客户特征数据是指可以描述客户基本特征的数据,包括个人特征、家庭特征、地区人口特征等特征数据,例如性别、职业、家庭收入、家庭人口、地区等。目前电商平台上的个人特征数据非常有限,只有用户地区、年龄信息、信用等级等信息。
(2)客户的交易明细数据,也就是客户的购买流水信息,一般包括客户ID号、购买时间、购买产品型号、购买金额、购买数量等。
(二)数据预处理
在进行数据分析之前,需要将原始采集数据进行数据预处理,数据预处理包括处理缺失数据、重新生成新变量数据等。
(1)处理缺失数据。电商客户的特征数据中存在大量的缺失数据,需要进行处理对于缺失比较严重的数据不再进入后续分析,例如年龄数据一般来说缺失严重,或者真实性差。对于一些完整性好的特征数据,例如信用等级数据、省份数据,需要进行重新编码整理。
(2)为了完成后面的重购客户分析,需要在原始数据的基础上生成客戶是否重购的标识数据。本项目中需要通过客户的交易明细数据来生成客户是否重购的标识数据,作为后面分析中需要重购客户的正响应指标。具体方法可以采用RFM分析法分析每一个客户的购买次数或者分类汇总每一个客户的购买次数,然后使用“重新编码为不同变量”将购买次数等于1次的设置为非重购客户,购买次数大于1次的设置为重购客户。如图1以客户ID为分类变量,对具有相同客户ID的个案数据进行汇总计数。分析结果见图4,客户交易次数表。其中重购次数大于1的个案就是重购客户。
(三)分析数据
在分析中采用IBM SPSS 直销中的“生成对产品做出回应的联系人概要”模块,对重购客户进行特征分析。这个功能采用的树模型分析方法,其中因变量就是“响应字段”,自变量为其他客户特征变量,通过建立树模型,将自变量中按照贡献大小依次选出影响程度高的变量,去除影响程度低的变量。[3]如图3所示,将“是否重购”作为响应字段,肯定响应值设置为“是”,将其他变量作为概要分析变量。同时还需要设置目标响应率和分组大小,目标响应率可根据企业营销预算的收益目标来确定,分组大小是每个组客户的数量。
三、结果展示
经过上述分析后,会对用户按照前面设置的组大小进行分组和生成改组的是否重购响应率、累计响应率统计指标。如图4的示例,响应率表显示过程所识别的每个概要组的信息。概要描述仅包括那些向模型提供了显著贡献的字段的特征。不包括那些没有显著贡献的字段。各个概要按响应率的降序显示。响应率是作出正面响应(重购客户)的客户所占的百分比。累积响应率是当前概要组和所有先前概要组的组合响应率。各个概要按响应率的降序显示,这意味着累积响应率是当前概要组以及响应率更高的所有概要组的组合响应率。
指定的目标响应率为 50.00%。绿色行的累积响应率大于或等于50.00%,红色行的累积响应率小于 50.00%。尽管绿色区域中某些概要组可能有个别响应率小于50.00%,但该点处的累积响应率仍大于或等于50.00%。响应率表中的“描述“就是这一组客户特征信息,组大小就是这一组客户的数量。企业可以根据客户特征信息,发现重构率高的客户作为目标客户。
四、小结
本文研究了如何使用SPSS的DMtree来完成电商渠道的重购客户的特征分析,可以帮助企业精准定位重购客户,有目的的开展营销活动,有效降低营销投入,提高营销收益。
参考文献:
[1]国家统计局 2018年国民经济和社会发展统计公报.来源:国家统计局发布时间:2019-02-28.
[2]张新坡,刘石彬.IBM SPSS Statistics 特性介绍与实例之直销工具[EB].https://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1202zhangxp/,2012.
[3]张文彤,董伟.SPSS统计分析高级教程[M].北京:高等教育出版社,2018.1:361-369.
作者简介:岛宁(1978-),助教,中级经济师,研究方向:数据营销。