银行个人客户信用评分模型研究

2015-09-17 13:19王雅静
现代商贸工业 2015年19期
关键词:个人信用信用卡数据挖掘

王雅静

摘 要:近年来,中国的信用卡业务飞速发展,为银行带来了丰厚的利润。但招揽信用卡用户的激烈竞争导致银行不断放宽对于信用卡申请者的要求,疏忽了风险的管理和控制。能否掌握信用卡客户的业务规律,并能设计相应对策以管理控制风险,是信用卡业务成败与否的关键。据此,针对银行信用卡客户,收集并处理他们的信息,利用决策树算法建立个人信用评分模型,并结合社会实际情况对模型做出调整建议。

关键词:

数据挖掘;决策树;信用评分

中图分类号:F27

文献标识码:A

文章编号:16723198(2015)19006402

1 个人信用评分

一般信用的考察对象有两个:企业和个人。对于不同对象研究方式不同,但考察目的相同,即分析借款人的還款意愿和能力。本文研究的是个人信用,个人信用指的是基于信任、通过一定的协议或契约提供给自然人(及其家庭)的信用,使得接受信用的个人不用付现就可以获得商品或服务。

个人信用评分,是指通过使用科学严谨的分析方法,综合考察影响个人及其家庭的内在和外在的主客观环境,并对其履行各种经济承诺的能力进行全面的判断和评估。针对不同的应用,个人信用评分分为风险评分、收入评分、响应度评分、客户流失(忠诚度)评分、催收评分、信用卡发卡审核评分、房屋按揭贷款发放审核评分、信用额度核定评分等。个人信用评分是对个人信用的一种定量化描述,用客观的方式来预测信用行为。它具有减少和控制风险、辅助准确决策等作用。

2 数据采集

2.1 指标体系的选择

在实际的环境中,并不是所有的数据项都可为研究所用,因而本文结合专家法和实际可获取数据,选取了衡量客户的信用情况的四大主要因素,即:基本情况、职业情况、家庭情况、与银行的往来业务关系。

2.2 数据的采集

指标体系确定后,我们确立了具体的考察指标,并拟出了一份银行客户信息的调查问卷,在银行进行发放,发放总数100分,回收86份,回收率86%。

3 数据预处理

现实世界中经过初步采集后的数据多半是有问题的,所以需要对数据源进行清洗和转换。数据预处理技术包括数据清理、数据集成、数据转换与数据归约。本文收集到的数据较少,内容也较简单,不需要进行数据集成与数据归约,所以本文的预处理过程只需进行数据清理和数据转换。

3.1 数据清理

初步采集的数据有很多是不完整的,本文对于这些空缺值采取最大频数填充法。下面以“学历”为例,介绍最大频数填充法(参照表1)。在教育程度中,存在6条空缺值,记录显示“大学本科”的频率为27.90%,且这些记录的“行业类别”信息都存在,其中5条都属于“教育”类,再对“教育”行业所有记录进行分析,有56.30%的记录学历为“大学本科”,是该行业最高的学历频率,所以可以将5条“学历”空缺值补为“大学本科”。

在采集到的数据中,有些数据存在明显错误,这类数据称为“伪样本”。如在数据源中发现有数据显示月均收入很低,没有任何担保却得到了大额贷款等。这些“伪样本”必须剔除。

3.2 数据变换

本文需要把原始数据中字符型的数据转化为数值型的数据,以达到适用于分析软件的目的。例如:“性别”、“健康状况”、“家庭人均月收入”等字段,要把这些文本型变量转化为数值型变量,以家庭人均月收入为例(如表2)。

经过处理,得到了86条记录,其中每个记录含有14个属性(1个决策属性和13个条件属性)。该数据集作为进入数据挖掘软件的测试数据集。

4 建立个人信用评分决策树模型

4.1 用spss软件生成树

在spss录入数据并定义变量属性,把“连续拖欠月数”作为本文的决策属性(因变量),而其他的属性都作为为条件属性(自变量),在CRT中选择GINl分类树,输出结果,得到GINI分类的决策树(如图1)。

4.2 属性赋权

给14个属性进行赋权量化(如图4)。

4.3 个人信用评分模型结果

个人评分模型建立过程(如图5)。

在对86个样本进行分析后,这三种级别的比例为(57.4%,31.08%,11.52%)。根据评估模型评分并结合得出的信用保险系数进行分析,得出信用评分与信用级别对应表(如表3)。

4.4 个人信用评分模型的调整

在银行的实际操作中,常常无法对中、低信用用户做出合理评价,对此,需要对其信息采取进一步收集的方法,以得出更完善的个人信用评分模型。具体的情况包含三个方面:

(1)实力较强的银行可以放低拒绝标准;

(2)在社会整体发展背景形势好的情况下,对于信用卡用户要求可以适当放宽;

(3)主客观评价建模方法相结合,才能得出更可靠的信用评分模型,本文只是采用了客观评价建模方法,还应引入主观建模方法(比如:AHP层次分析法、贝叶斯分析方法等)对本文信用评分模型进行调整、完善。

参考文献

[1]汪毅,朱顺泉.数据挖掘技术在客户关系管理中的应用研究[J].湖南大学学报,2003,(02).

[2]姜明辉,王欢,王雅林.分类树在个人信用评分中的应用[J].商业研究,2003.

[3]赵金涛.基于数据挖掘的银行客户分类模型研究[D].重庆:重庆大学,2009.

[4]曾辉.基于数据挖掘的银行个人客户信用评分模型的研究[J].对外经济贸易大学,2007.

[5]王瑜.银行客户关系管理现状及对策分析[J].华东理工大学,2013.

[6]刘慧.基于数据挖掘技术的信用卡申请评分模型的研究研究[J].东北财经大学,2011.

[7]戴巍.数据挖掘技术在银行个人金融业务CRM中的应用研究[D].哈尔滨:哈尔滨工程大学,2009.

猜你喜欢
个人信用信用卡数据挖掘
探讨人工智能与数据挖掘发展趋势
个人信用信息何以应由宪法保护?——一个制度论证的进路
论完善我国个人信用制度
信用卡资深用户
个人信用云平台
基于并行计算的大数据挖掘在电网中的应用
严重交通违法行为将直接与个人信用挂钩
信用卡诈骗
办信用卡透支还债夫妻均获刑10年
一种基于Hadoop的大数据挖掘云服务及应用