数据挖掘技术在理财客线上迁移及细分的应用研究

2018-10-09 11:29封录
时代金融 2018年23期
关键词:数据挖掘聚类

【摘要】本文对数据挖掘的基本原理进行简述,运用数据挖掘工具及算法并结合实际说明了数据挖掘技术在银行理财客户的应用。通过建立模型实证分析理财客户线上迁移的有效性,并对银行理财客户进行聚类,实证分析银行理财客户分群的必要性。

【关键词】数据挖掘 理财客户 线上迁移 聚类

数据挖掘技术是指从大量的、随机的、有噪声的实绩运用数据中掘取事先不知道的但又可能有用的信息和知识的过程。[1]本文通过银行数据实证数据挖掘技术在银行中的具体应用与效果评估。

一、数据选取及预处理

本文选取某农商银行2015年3月20日(第一笔理财产品认购时间)-2017年9月17日共17023笔个人理财客户交易记录。通过数据清理后得到人口统计信息字段:户名、身份证号、性别、年龄;产品交易信息字段:产品代码、理财账户、购买金额、产品认购日期、产品成立日期、产品到期日期、封闭期时长、交易渠道(柜面、手机银行)等。

二、描述性统计

第一,根据银行理财客户基本信息及交易信息截止2017年9月17日共有7617户理财客户其中男性3979户,占比52.24%;女性3638戶占比47.76%。

第二,银行理财客户的年龄结构符合正太分布,主要集中在40-60岁。

第三,农商银行客户群理财资金量相对国有大型银行来说较少,主要集中在100万元以下。

三、客户理财手机银行渠道有效模型

为说明购买银行理财由柜面向线上迁移的有效性,本文建立了手机银行渠道有效模型:

假定M时点某客户第一次通过手机银行渠道购买理财;

M-N时期客户在柜面渠道购买理财次数接近于0

通过modeler构建模型,重点节点解释如下:

汇总1:以身份证号为关键字,汇总字段为认购日期最小值;合并是以身份证号为关键字的内部链接。

汇总2:以身份证号、交易渠道为关键字,总数做为默认模式;选择:丢弃交易渠道=“手机银行”and Record_Count=1的记录。

汇总3:以交易渠道作为关键字。

效果评估:通过手机银行渠道购买过理财产品的3213户理财客户,后续有103户返回到柜面渠道购买过理财,1302户在手机银行渠道购买过理财,有效率达92.7%。

四、理财客户分群及行为预测

第一,RFM模型是客户关系管理领域广泛应用的一种评价客户忠诚度、流失倾向的一种算法。RFM分析的三类重要指标:一是距上次交易的时间R(Recency),二是最近统计期内交易次数F(Frequency),三是最近统计期内交易金额M(Monetary Value)。[3]

建立良好的客户关系,通过无指导性的聚类分析,按类相似性最大化,类间相似性最小化的原则进行客户分群。[2]通过客户的共性,发现他们的交易习惯。这样既可以提高客户满意度又可以降低银行的营销成本。

第二,模型解释。

选择1(实验组):结束时间 >= "2017/09/18";

选择2(测试组):结束时间 < "2017/09/18";

填充:将购买金额转化为年日均金额;

通过K-Means聚类后分成四类,根据近因、频数、货币三个指标值区分出:聚类1(非活跃客户)、聚类2(活跃大客户)、聚类3(一般客户)、聚类4(流失客户),为提高营销精准性,选择出聚类2(活跃大客户)作为精准营销目标客户,展示如下图。

第三,结果预测。聚类2(活跃大客户)共有280户,在选择2(测试组)又有236户有交易记录,预测再次购买的准确率为84.28%,符合预测结果,证实能通过客户分层提升银行理财客户的精准营销要求。

五、结语

数据挖掘技术是一种先进的数据处理技术,对于数据挖掘技术的研究有利于提升银行的竞争力。[4]本文详细阐述了技术挖掘的概念,以客户理财手机银行渠道有效模型、RFM模型、K-Means聚类模型有针对性的分析了数据挖掘技术在银行理财客户线上迁移的应用,银行通过数据挖掘技术的应用能有效提高客户运营效率,增强核心竞争力。

参考文献

[1]傅国锦.数据挖掘技术在商业银行客户细分中的应用.金华职业技术学院学报[J].2007(8).

[2]Jiawei Han,Micheline Kamber著.范明,孟小峰等译.数据挖掘:概念与技术[M].北京:机械工业出版社.2001.

[3]王文贤,金阳,陈道斌.基于RFM模型个人客户忠诚度研究.金融论坛[J].2012(3).

[4]傅俊.数据挖掘技术及其在商业银行中的应用.软件导刊[J].2014(2).

作者简介:封录(1987-),男,汉族,江苏盐城人,江苏大学硕士,中级经济师,AFP持证人,CDA持证人,主要研究成果:cssci一篇、国内核心一篇。

猜你喜欢
数据挖掘聚类
基于DBSACN聚类算法的XML文档聚类
基于并行计算的大数据挖掘在电网中的应用
条纹颜色分离与聚类
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
一种层次初始的聚类个数自适应的聚类方法研究
数据挖掘的分析与探索
自适应确定K-means算法的聚类数:以遥感图像聚类为例
基于GPGPU的离散数据挖掘研究