□ 李晴雯,涂 敏,段李杰
(湖北经济学院 工商管理学院,湖北 武汉 430205)
随着互联网时代的来临和经济全球化的发展,客户更加注重产品的个性化,企业和公司也纷纷把营销的重心从产品至上转移到客户至上。中国民航局2016年12月21日发布了《中国民用航空发展第十三个五年规划》,里面明确指出了未来十五年内我国航空业的发展计划,为航空产业的积极发展提出了很多切合实际的目标。在这种背景下如何准确识别有效的客户,借助价值分析获取稳定的忠实客群就成为广大公司企业决策的重要因素。
在目前的航空业市场中,随着行业中的放松管制,需求的不断增长,行业进入障碍减少,同行业竞争者之间的竞争压力越来越大。从前处于主导地位,甚至在某些市场,由于市场保护处在垄断地位的航空公司,受到了大量的来自于新兴航空公司,甚至私有化航空公司,廉价航空公司的冲击。当前,全球航空业约有2000多家航空公司,存在行业产能过剩现象。
在航空客运市场上,乘客面对众多的航空公司、航班、时刻、机型、票价、服务等,选择度越来越大,而乘客真正看重的是“让渡价值”,即总希望把有关成本,包括:货币成本、时间成本、精力成本、心理成本等降到最低限度,同时又希望获得更多的实际利益,包括:服务价值、个人价值、形象价值等,这就对航空公司提出了更高的要求。
如今在航空客运销售市场上,航空公司在销售上过分依赖代理人,把过多的财力、精力用在了鼓励和管理代理人上,支付代理费成了我国航空公司最大的销售成本,而最终取得的效果并不尽如人意,航空公司越来越处于被动地位,并且离其真正的消费主体――航空乘客越来越远,这严重影响了航空公司的可持续发展,没有建立顾客型的销售组织体系。
针对以上三个问题,本文通过K-means聚类的航空客运数据分析,帮助航空企业寻找客户价值,通过此模型的建立,找出各类客户的有效特征,并提出精准营销策略,为公司提高经济效益。
①所采用的数据:航空客运数据(数据来源于www.wldl.org/)。
②所运用的分析方法:聚类分析K-means算法。
①对数据进行预处理;
相关的地方性立法目前还不健全,特别是自然地理环境特殊的省份,例如西藏自治区发展高原农业和河谷农业,东北三省有广袤的东北平原发展专业化农业,都没有出台相关文件。“各地可结合当地的优势农产品布局,形成各具特色的农业机械化区域,进一步拓展农业机械化的服务和作业领域,突出综合性、多样性、优质高效性,实现农业机械化的跨越式发展,促进农业机械化与地区经济协调统一发展。”[5]即形成地理单元与行政区划紧密连接的农业机械化发展格局。伴随着我国经济的发展和全面深化改革进程的加快,农业机械化立法已经明显滞后于现实的发展,制约了农业机械化在发展农业现代化中的作用。
②分析数据结构,并观察特征;
③建立聚类分析模型,运用K-means算法进行分析;
④根据模型输出,得出结论;
⑤制定合理的营销策略,挖掘更多有价值的客户。
图1 方案设计流程图
本文使用的数据来源于合作公司提供的数据,因此它的航空客运数据,包括乘客基本信息、乘坐次数信息、积分信息等(数据来源于www.wldl.org/)。
K-means算法是输入聚类个数k,以及包含n个数据对象的数据库,输出满足方差最小标准的k个聚类。
k-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。
通过对原始数据的观察,发现原始数据中的若干数据存在缺失值,建立一个数据表格,发现数据总缺失率为0.2%,因此,选用缺失值补充来使原始数据更加完善。为了能更大程度地反应航空客户群的普遍情况,在该分析中选用全局处理中的“按字段所在列平均值/出现频次最高值补全”的方法补全表格中数据。
在进行了数据预处理之后,为了观察该航空公司客户的乘机次数、加权飞行公里数、以及平均时间间隔等维度在时间上的变动情况,采用时间序列的手段进行数据观测及分析,以下通过序列图和螺旋图来展示该部分数据。
4.3.1 序列图
图2 乘机次数、加权飞行公里数和平均时间间隔序列图
从以上序列图中可以发现,该航空公司在乘机次数、加权飞行公里数以及平均时间间隔这三个维度上都是随机的不平稳序列,在局部出现明显的、差异度较大的波峰。
4.3.2 螺旋图
图3 乘机次数螺旋图
从乘机次数螺旋图中可以发现,客户乘机次数随着是随着年份的推移逐渐增大的,说明该航空公司拥有一个不断增大的市场。
在分析中我们以航空客户信息的总乘机次数、加权飞行公里数、平均时间间隔和总票价为聚类标准,根据客户的这四个指标的相似性将客户分为4簇,基于聚类分析能实现对不同客户的分类,进行精准营销,提高航空公司收益。
4.4.1 新变量定义
为了使聚类指标更准确,在使用K-means算法前可以定义新的特征变量,在本次分析中,定义总票价为第一年票价和第二年票价之和。
4.4.2 特征变量的选择
本分析中选取元特征变量为会员卡号,即代表所有的客户;特征变量为总乘机次数,加权飞行公里数、平均时间间隔和总票价。
4.4.3 K-means聚类
设置簇的数量为3,将客户分为三类,从特征表格里面可以看到已经分类的数据。
表1 客户群细分特征表
4.4.4 箱线图检查
为了检验聚类模型的效果以及了解各个类别在不同维度上的分布情况,引入箱线图组件。可得出客户在总乘机次数、加权飞行公里数、平均时间间隔和总票价四个维度上的箱线图。下面列举出客户在总乘机次数、加权飞行公里数两个维度上的箱线图。如图4和图5所示。
图4 客户在总乘机次数维度上的箱线图分布
图5 客户在加权飞行公里数维度上的箱线图分布
从整体上观测,聚类模型性能大致符合预期。
从以上箱线图中可以观测到,三类客户在不同维度上的均值如下表所示:
表2
通过对以上数据整合,获得三类客户在不同维度上的排名如下表所示:
表3
从聚类以后的客户量来看:
表4
依据上述分析,可以总结如下结论:C3类客户数量最多,在总客户群中占比百分之八十以上,该类客户的单位总乘机次数、加权飞行公里数和总票价都较低,但是群体庞大,是公司收益的主要来源。C1类客户数量其次,各维度也占中等水平。C2类客户数量较少,占比不到2%,但是该类客户在总乘机次数和票价上都排名最前,平均时间间隔低,说明该类客户乘机频繁且为公司带来的单位收益较高。
中国航空市场竞争进入白热化,客户对产品和品牌定位的认知度越来越高。通过对消费者的消费行为的精准衡量和对建立的数据体系的分析,进行客户优选,并通过市场测试验证来区分所做定位是否准确有效。
通过对客户的细分,按照客户的特征将其分成了三类,针对数量庞大的客户群,可采用广告、群发短信等方式进行沟通,而针对数量较少但能为公司带来高价值的客户群,建议设专人一对一跟踪服务,及时了解客户具体需求并及时反馈。
建立顾客型的销售组织体系,使各模块的销售人员专业针对自己擅长的模块的客户进行营销。每个销售人员都能了解到消费者的特定需要,有时还能降低销售人员费用,更能减少渠道摩擦,为新产品开发提供思路。
对于不同的客户群体,设置企业个性化产品也是加强核心竞争力的重要手段。根据客户细分类别,可为价值最高的VIP大客户设立服务专区,让VIP大客户在专区内办理快递手续和进行结算服务;消费额一般的潜在客户群具有较大的提升空间,可对其采取积分制,当服务次数达到一定量时,给予价格优惠,加强合作减少流失。