数据挖掘技术在村镇银行信用风险预测中的应用研究

2014-09-28 05:25郭佳
科技经济市场 2014年6期
关键词:信用风险数据挖掘预警

郭佳

摘 要:为了更好的解决农村资金存在较大缺口问题,中国银监会大幅度降低了新设金融机构的进入门槛,允许产业资本、民间资本到农村地区设立村镇银行,基于村镇银行的经营特点,信用风险仍是其面临的主要风险之一。本文依托省教育厅高等学校科学技术研究重点项目,对数据挖掘技术在村镇银行信用风险预测中的应用进行分析研究,针对国内外发展现状,明确研究内容、研究方法以及拟解决的重点难点问题,从而达到有效预警和防范村镇银行信用风险的目的,使村镇银行能够持续稳健发展,对农村金融市场发展和农村经济建设具有重要的现实和长远意义。

关键词:数据挖掘;信用风险;预警

0 引言

村镇银行是指经中国银监会依据有关法律、法规批准,由境内外金融机构、境内非金融机构企业法人、境内自然人出资,在农村地区设立的主要为当地农民、农业和农村经济发展提供金融服务的银行业金融机构。村镇银行可经营吸收公众存款,发放短期、中期和长期贷款,办理国内结算,办理票据承兑与贴现,从事同业拆借,从事银行卡业务,代理发行、代理兑付、承销政府债券,代理收付款项及代理保险业务以及经银行业监督管理机构批准的其他业务。

从河北银监局统计数据获悉,截至2012年底,我省已有村镇银行26家。村镇银行的建立改善了河北省农村金融服务不足和金融竞争不充分的问题,增加了农村信贷资金的供给和农村金融产品和服务的创新,推进了农村经济发展水平和农民生活水平的提高。但不容忽视的是,村镇银行信贷资金营运蕴含巨大的信用风险。如何加强信用风险管理,促其稳健持续经营,是村镇银行面临的重要挑战。

信用风险又称违约风险,是指交易对手未能履行约定契约中的义务而造成经济损失的风险,是金融风险的主要类型。在大量的贷款数据中隐藏着许多可以为贷款决策提供有用信息的知识,数据挖掘(Data Mining) 充分利用了数据库技术、机器学习、人工智能、统计学等理论和方法,将有用知识找出来。

1 国内外研究现状

国外一些学者对村镇银行信用风险影响因素进行了研究。

JoseA.G.Baptista 等人(2006)应用多元回归统计方法分析了贷款风险的影响因素,结果表明贷款数额、贷款用途、贷款期限、贷款利率、借款人有无违法记录、借款人经营理念、借款人经营思路、借款人经营水平、借款人拥有土地面积都是贷款风险的影响因素。

RubanaMahjabeen(2008)通过分析孟加拉国发放小额贷款的风险情况,认为贷款总额、贷款周期、借款人拥有的耐用商品价值、借款人的抵押品价值等因素都会对贷款风险产生影响。

我国学者对村镇银行信用风险进行了研究,认为现代信用风险,一般是指由于借款人违约而导致损失的可能性,还包括由于借款人的信用等级的变动以及履约能力的变化,导致其债务的市场价值变动而引起的损失可能性。我国村镇银行资产业务比较单一,主要是贷款业务,其经营面临的风险主要是信用风险,即贷款信用风险。村镇银行的信用风险除了具有其他银行的风险属性外,还有其特殊的表现。

第一,风险偶然性、突发性大。农业作为弱势产业,本身具有很大的风险,农业对自然条件的依赖性很强,抵御自然灾害的能力弱。我国自然灾害多发,农村往往是重灾区,同时与"三农"相关的灾害保险不发达,一旦发生自然灾害,损失难以避免,因此村镇银行对农贷款的自然环境风险突出。

第二,违约风险不容忽视。村镇银行是"草根银行"、"穷人的银行",不仅服务弱势产业,还服务弱势群体,面对的是大量的农户和农村微小企业,缺乏以往的信用记录和有效信用评估办法,其放贷也缺乏必要的财产作抵押,村镇银行处于不利地位,其信贷资金存在严重的风险隐患。再加之一些农户信用意识、法律意识比较淡漠,认为不按时还款,自身也没有什么损害,欠账不还,签字不认,逃、废、赖债在不同程度存在。当某些农户没有按时足额偿还贷款时,其他借款者会跟风拖欠贷款,可能引发"多米诺牌效应",导致村镇银行不良贷款增加。另外,农民作为一个文化水平相对较低的群体,他们对金融知识缺乏了解对市场信息获取渠道也不够畅通,不能选择较好的投资方向,这无疑会影响他们贷款投资的获利能力,在客观上造成还款能力不足的可能性,这一问题也将转化为一定的信用风险。

第三,风险集中度较高。村镇银行设置在县、乡镇,经营地域范围狭小,信贷支持的域内的产业结构比较单一。目前村镇银行选址的重要依据就是看中当地的某一特色产业,业务定位也主要是服务这一特色产业,如果当地的特色产业在生产经营中出现问题甚至亏损,收不抵债,村镇银行就会因信贷业务过于集中而使信用风险凸显。

第四,风险与收益不对称。村镇银行从事的信贷业务主要是小额信用贷款,并且农业生产受自然因素的影响很大,农业经营收益具有不确定性,从而影响村镇银行资产业务的安全和获利,一旦发生贷款无法按时归还,很难追究其责任。为了降低风险,村镇银行要对贷款项目进行调查,调查越深入、详细,风险就越小,但投入成本会越大,造成银行风险与收益不对称。

所以,村镇银行的信用风险确实存在,针对不同情况,应该找出相应措施,使用计算机技术和网络技术,建立信贷数据库,利用数据挖掘技术,建立风险评估分类模型,对贷款人的信用、偿还能力等进行分析,提出贷款决策建议,同时对农户贷款的使用和偿还情况进行监控,使还款违约率降至最低,从而实现村镇银行的可持续发展。

2 研究的主要内容

(一)通过调研河北省村镇银行,分析影响信贷风险因素

以河北省村镇银行为研究对象,通过走访调研,收集各种资料,通过定性分析,找出信用风险的原因,对影响信贷风险的因素进行分析,提出相应措施。

(二)使用属性相关性的特征选择算法确定影响村镇银行信贷风险的关键因素

村镇银行的信贷风险影响因素主要有借款人文化程度、贷款数额、产品市场现状、产品发展潜力、贷款有无担保、借款人技术和能力、借款人经营水平、借款人信用状况、借款人家庭收支状况、借款用途、贷款期限、借款人经营思路等。这些因素对贷款偿还效能和客户信用等级计算会产生不同程度的影响,利用属性相关性的特征选择算法,有助于识别重要因素,剔除非关键因素。通过分析具体村镇银行农户小额贷款偿还的历史数据,计算出负债率、偿还与收入比率等,确定哪些因素是主要因素。村镇银行就可以据此调整贷款发放政策,以便将贷款发放给那些以前曾被拒绝,但根据关键因素分析,其基本信息显示是相对低风险的申请。endprint

(三)建立风险预警模型

(1)根据各种信号,及时判断单个借款人或单笔贷款的风险程度和风险性质。

(2)根据个别借款人分析评价其行业的贷款风险程度。

(3)及时关注风险的变化。调整对企业的风险等级、关注程度和策略计划。

使用决策树、贝叶斯分类两种方法,建立风险评估预警模型,通过对比分析,确定最优模型,使用模型对已发生贷款数据以及新申请数据进行分析预警。

3 研究方法

在研究方法上,将综合数学、经济学、管理学、统计学、信息技术等学科的相关理论和方法,研究样本将以模拟数据和实际数据相结合,理论推导和实际应用相结合的方法开展研究工作。其他研究方法还有文献调查研究方法,以因特网、图书馆为主要渠道,广泛搜集国内外相关研究主题的文献资料,并通过阅读对其进行分析和提炼。

在实际研究过程中,还将充分重视将各种研究方法有机地结合起来,以达到相互弥补、相互印证的目的。同时,根据研究的进展和需要,可以随时补充和引进新的研究方法或调整技术路线。

其技术路线为:

(1)收集数据,进行数据清洗,建立训练数据,去除数据中的噪声,并妥善解决遗失数据问题。

(2)属性选择,确定关键属性,消除无关或冗余属性,并构建属性集。

(3)运用决策树分类方法中的ID3算法进行分类模型构建,建立风险决策树,并对风险决策树进行剪枝,由决策树提取分类规则,确定贷款偿还能力所依赖的决策属性,并测试数据。

(4)运用概率统计学的贝叶斯分类进行分类模型构建,并测试数据。

(5)两种分类模型进行对比,确定较优的模型,并进行改进,测试数据。

(6)建立预测模型以利用贷款客户的年龄、收入与职业等参数预测其信用情况,达到对信贷风险的有效预警与防范。

4 拟解决的重点难点问题

(1)根据村镇银行的实际需求,进行特征选择、属性相关性计算,构建属性集,数据清洗,并确定关键因素。

(2)建立风险评估分类模型。

(3)选取最优风险评估分类模型,达到对信贷风险的有效预警与防范。

参考文献:

[1]吴正锋,董梅生.银行信贷风险预警的动态模型[J].安徽工业大学学报(社会科学版),2005(3).

[2]祝健,张传良.我国村镇银行信用风险防范对策分析--马克思金融风险理论的视角[J].当代经济研究,2010(12).

课题:河北省高等学校科学技术研究重点项目--《基于数据挖掘技术的河北省村镇银行信用风险预测系统研究与构建》,编号:zd20131083。endprint

(三)建立风险预警模型

(1)根据各种信号,及时判断单个借款人或单笔贷款的风险程度和风险性质。

(2)根据个别借款人分析评价其行业的贷款风险程度。

(3)及时关注风险的变化。调整对企业的风险等级、关注程度和策略计划。

使用决策树、贝叶斯分类两种方法,建立风险评估预警模型,通过对比分析,确定最优模型,使用模型对已发生贷款数据以及新申请数据进行分析预警。

3 研究方法

在研究方法上,将综合数学、经济学、管理学、统计学、信息技术等学科的相关理论和方法,研究样本将以模拟数据和实际数据相结合,理论推导和实际应用相结合的方法开展研究工作。其他研究方法还有文献调查研究方法,以因特网、图书馆为主要渠道,广泛搜集国内外相关研究主题的文献资料,并通过阅读对其进行分析和提炼。

在实际研究过程中,还将充分重视将各种研究方法有机地结合起来,以达到相互弥补、相互印证的目的。同时,根据研究的进展和需要,可以随时补充和引进新的研究方法或调整技术路线。

其技术路线为:

(1)收集数据,进行数据清洗,建立训练数据,去除数据中的噪声,并妥善解决遗失数据问题。

(2)属性选择,确定关键属性,消除无关或冗余属性,并构建属性集。

(3)运用决策树分类方法中的ID3算法进行分类模型构建,建立风险决策树,并对风险决策树进行剪枝,由决策树提取分类规则,确定贷款偿还能力所依赖的决策属性,并测试数据。

(4)运用概率统计学的贝叶斯分类进行分类模型构建,并测试数据。

(5)两种分类模型进行对比,确定较优的模型,并进行改进,测试数据。

(6)建立预测模型以利用贷款客户的年龄、收入与职业等参数预测其信用情况,达到对信贷风险的有效预警与防范。

4 拟解决的重点难点问题

(1)根据村镇银行的实际需求,进行特征选择、属性相关性计算,构建属性集,数据清洗,并确定关键因素。

(2)建立风险评估分类模型。

(3)选取最优风险评估分类模型,达到对信贷风险的有效预警与防范。

参考文献:

[1]吴正锋,董梅生.银行信贷风险预警的动态模型[J].安徽工业大学学报(社会科学版),2005(3).

[2]祝健,张传良.我国村镇银行信用风险防范对策分析--马克思金融风险理论的视角[J].当代经济研究,2010(12).

课题:河北省高等学校科学技术研究重点项目--《基于数据挖掘技术的河北省村镇银行信用风险预测系统研究与构建》,编号:zd20131083。endprint

(三)建立风险预警模型

(1)根据各种信号,及时判断单个借款人或单笔贷款的风险程度和风险性质。

(2)根据个别借款人分析评价其行业的贷款风险程度。

(3)及时关注风险的变化。调整对企业的风险等级、关注程度和策略计划。

使用决策树、贝叶斯分类两种方法,建立风险评估预警模型,通过对比分析,确定最优模型,使用模型对已发生贷款数据以及新申请数据进行分析预警。

3 研究方法

在研究方法上,将综合数学、经济学、管理学、统计学、信息技术等学科的相关理论和方法,研究样本将以模拟数据和实际数据相结合,理论推导和实际应用相结合的方法开展研究工作。其他研究方法还有文献调查研究方法,以因特网、图书馆为主要渠道,广泛搜集国内外相关研究主题的文献资料,并通过阅读对其进行分析和提炼。

在实际研究过程中,还将充分重视将各种研究方法有机地结合起来,以达到相互弥补、相互印证的目的。同时,根据研究的进展和需要,可以随时补充和引进新的研究方法或调整技术路线。

其技术路线为:

(1)收集数据,进行数据清洗,建立训练数据,去除数据中的噪声,并妥善解决遗失数据问题。

(2)属性选择,确定关键属性,消除无关或冗余属性,并构建属性集。

(3)运用决策树分类方法中的ID3算法进行分类模型构建,建立风险决策树,并对风险决策树进行剪枝,由决策树提取分类规则,确定贷款偿还能力所依赖的决策属性,并测试数据。

(4)运用概率统计学的贝叶斯分类进行分类模型构建,并测试数据。

(5)两种分类模型进行对比,确定较优的模型,并进行改进,测试数据。

(6)建立预测模型以利用贷款客户的年龄、收入与职业等参数预测其信用情况,达到对信贷风险的有效预警与防范。

4 拟解决的重点难点问题

(1)根据村镇银行的实际需求,进行特征选择、属性相关性计算,构建属性集,数据清洗,并确定关键因素。

(2)建立风险评估分类模型。

(3)选取最优风险评估分类模型,达到对信贷风险的有效预警与防范。

参考文献:

[1]吴正锋,董梅生.银行信贷风险预警的动态模型[J].安徽工业大学学报(社会科学版),2005(3).

[2]祝健,张传良.我国村镇银行信用风险防范对策分析--马克思金融风险理论的视角[J].当代经济研究,2010(12).

课题:河北省高等学校科学技术研究重点项目--《基于数据挖掘技术的河北省村镇银行信用风险预测系统研究与构建》,编号:zd20131083。endprint

猜你喜欢
信用风险数据挖掘预警
法国发布高温预警 严阵以待备战“史上最热周”
园林有害生物预警与可持续控制
浅析我国商业银行信用风险管理
基于并行计算的大数据挖掘在电网中的应用
京东商城电子商务信用风险防范策略
机载预警雷达对IFF 的干扰分析
一种基于Hadoop的大数据挖掘云服务及应用
个人信用风险评分的指标选择研究
信用风险的诱发成因及对策思考
基于GPGPU的离散数据挖掘研究