张胜 安徽泾县铜源村镇银行股份有限公司
引言:互联网的快速发展,社会进入大数据时代,农村金融机构面临的风险和挑战逐渐增加,信用风险主要体现在业务风险和资金风险等方面,对于信贷资金未能展开有效监管,同时,对于客户风险的把关存在问题,没有将授信统一,导致贷款发放不合理,对此,需要利用大数据,建立风险评估体系,及时掌握客户信息,做好信用风险管理,保证金融机构的信贷资金安全。
大数据主要指在特定时间内产生的各类数据,这些数据难以使用传统方法进行收集,而且大数据平台具有实效性,能够动态化发展。大数据的数量以TB、ZB等标准为主,并且不断上涨,难以在规定的范围之内进行储存和计算,数据流转阶段,以快速、动态化状态进行,包括结构化数据以及非结构化数据,大数据价值密度相对较低,但是商业价值相对较高。
当前,市场利率化形势明显,金融机构利差收入的优势受到影响,特别是农村地区的金融机构,营业收入出现下滑状态。随着大数据时代的到来,为农村金融机构的发展提供全新机遇,利用大数据分析方法对于农村金融机构重要性主要体现在如下几方面:
第一,为农村的金融机构带来更广阔的业务空间,互联网的快速发展,电商平台应运而生,金融机构网点也出现变化,产生各类结构化与非结构化数据,通过大数据技术,能够对客户信息深入挖掘,找出潜在客户,为银行产品创新提供全新途径,拓宽农村金融机构业务空间。
第二,大数据的应用,能够提高农村金融机构决策与判断能力。信息时代,银行业务的开展需要依托数据信息制定运营决策,应用大数据,通过海量数据信息当中寻找利于银行经营的数据信息,对于业务风险合理评估,并对资源展开优化配置。
第三,大数据的应用能够提高信用风险的管理能力,运用大数据技术展开精细化管理,为农村金融机构产品创新以及风险控制提供全新途径,转变传统经营模式,和电商之间进行联合,控制信用风险,提高风险管理工作水平[1]。
农村金融机构的大数据平台包括如下信息源系统:一是核心系统,二是信贷系统,三是外围系统,通过上述系统对于文本文件进行采集,并对元数据进行清洗,通过转换变为标准化数据,并按照法人机构进行区分,拆分数据信息,利用固定模型将数据整合,最终形成数据视图。这样后台可以按照账户、客户以及机构各层次展开汇总,便于前台对于数据的利用。数据挖掘过程包括数据信息采集、清洗、转换、整合、处理等内容。
数据挖掘方法种类多样化,将挖掘目标、数据模型等作为基础,建立多个模型形式,其中包括聚类分析、偏差检测以及关联规则等模型,金融机构可借助上述模型获取更高商业价值,提高金融机构核心竞争力。
决策树主要是树形结构,能够对分类预测起决定性作用,分析过程,不同节点都代表树形测试,各分支则代表测试输出,使用决策树算法具有分类精度高、生成模式相对简单、噪声数据优越等特点,所以取得广泛应用。
本研究所用的数据源为某农村金融机构中个人贷款的客户数据,选择个人工商户、小额信用贷以及企事业贷款,通过分析上述客户类型贷款情况,客户信息和贷款不良率信息如表1所示:
表1 客户信息和贷款不良率信息
可知小额贷款的人数相对较多,超过99%,由此可以看出,该金融机构面向的客户主要为农户。
表2 客户年龄层次信用贷款信息表
分析客户年龄层次,处于(18,25]岁年龄段的客户,贷款不良率为2.75%;处于(25,30]岁年龄段的客户,贷款不良率为2.52%;处于(30,35]岁年龄段的客户,贷款不良率为3.44%;处于(35,40]岁年龄段的客户,贷款不良率为2.73%;处于(40,45]岁年龄段的客户,贷款不良率为3.38%;处于(45,50]岁年龄段的客户,贷款不良率为4.53%;处于(50,55]岁年龄段的客户,贷款不良率为4.2%;处于(55,60]岁年龄段的客户,贷款不良率为4.15%;超过60岁年龄段的客户,贷款不良率为6%。发现不同年龄段之间贷款不良差距相对较小,超过60岁的客户在贷款不良率方面相对较高。
表3 为客户年收入信息表
对于客户收入进行分析,理论上来讲,客户拥有高收入,代表其还款能力相对较强,在贷款不良率方面应该低于低收入的客户。但是结果显示,收入≥20万的群体,贷款不良率3%;收入处于(10,20]万客户,贷款不良率1.36%;收入处于(5,10]万客户,贷款不良率1.29%;收入处于(2,5]万客户,贷款不良率0.88%;收入≤2万的客户,贷款不良率1.39%;高收入人群贷款不良率相对较高,和理论存在差异,因此,需要对其中原因展开深入探索。
表4 为客户学历和贷款不良率信息关系表
分析客户学历以及贷款不良率二者之间关系,无学历客户贷款不良率1.72%;小学学历客户贷款不良率1.60%;初中学历客户贷款不良率1.62%;高中学历客户贷款不良率10.76%;技校学历客户贷款不良率5.91%;中专学历客户贷款不良率1.69%;大专学历客户贷款不良率3.39%;本科学历客户贷款不良率0.98%;研究生学历客户贷款不良率0.00%;呈现出“中间高,两头低”这一问题,小学学历人贷款人数相对较高,和农村地区实际情况相符[2]。
通过上述案例分析,可以看出大数据在农村金融机构的客户信息和客户筛选方面不但高效,而且准确度高,可对农村金融的信用风险分析过程起到指导性作用。
大部分农村地区已经设立了金融机构网点,面向农民提供信贷业务。利用大数据平台,可对客户职业、年龄相关信息进行挖掘,寻找客户信息和信用风险存在的关联,结合风险信息对于客户进行管理,实现精准营销。然而,农村的金融机构信用风险的管理还存在不同程度问题,主要表现在如下几方面:
第一,数据标准尚未完全建立,还存在大量冗余数据,难以共享,虽然收集到大量数据,但是,由于数据形式没有统一,导致数据质量参差不齐,数据处理以及标准化体系的建设还不深入,难以以获得理想的分析结果[1]。
第二,数据种类不丰富,对比商业银行互联网金融,农村金融机构在数据采集方面略显不足,对此,可与电商平台或者政府机构展开合作,将数据结构加以丰富。
第三,专业人员素质有待提升,部分农村金融机构尚未设置数据分析相关部门,都是将数据分析过程外包给专业公司,由于金融机构缺乏专业数据分析人才,对于信用风险的分析相对不足,数据覆盖面窄,难以将业务有效联系。
第一,建立数据标准,将冗余数据删除,统一数据格式,保证数据分析过程信息获取质量,对于农村金融机构客户基本信息展开深入分析,制定营销策略,展现数据分析价值。
第二,丰富数据类型,可借鉴商业银行的运作模式,利用“互联网+金融”的形式,采集信用信息数据,或者和政府部门、电商平台等展开合作,丰富数据结构,提高信用信息数据获取的真实性。
第三,培养专业人才,农村金融机构可设立数据分析部门,培养大数据技术人才,联系自身业务,对于信用风险数据展开全面挖掘和分析,通过人才培养,不断拓宽数据信息覆盖面积,对于信用风险原因展开全面分析,展现大数据在信用风险防范方面的应用价值。
结束语:总之,结合农村金融机构面临的信用风险问题,依托大数据技术建立管理平台,并利用决策树模型,建立完善的信用风险体系,为相关人员制定决策提供依据。大数据管理平台的应用,能够减轻机构管理信用风险期间各项成本,并提供精准数据支持,保证银行数据和客户信息的对称性,对于信用风险全面管理。