【摘要】本文介绍了数据挖掘技术定义以及常用的数据挖掘技术,研究了数据挖掘技术应用于银行信贷业务中风险控制的可行性,并阐述了具体实施步骤。
【关键词】数据挖掘技术 银行信贷 风险控制
一、引言
利率市场化的加快和金融体制改革的深入进一步加大了银行的信贷风险[1]。然而银行对信贷风险控制重视不足,普遍只重视贷前评估,而对企业贷后跟踪评估严重缺乏,就是贷前评估体系也建立在利率市场化以前的金融体制上,没有能随着利率市场化和金融体系改革进程做出与时俱进的调整[2]。持续上升的不良贷款率要求银行改进目前的信贷风险评价体系,正视目前信贷风险控制中存在的问题,特别是加强贷后对企业跟踪评估,增强信贷风险控制水平,实现银行对信贷全过程监控,努力降低信贷风险。
银行信贷风险就是贷款到期后,借贷方无法还本付息的可能性。信贷风险是一种银行不可避免的必须面临的,同时又是难以彻底消除一个问题。如何通过各种措施控制风险在一个可承受的范围之内是每一个商业银行必须回答的问题。银行信贷风险产生原因既有国家宏观经济增长放缓、产业结构调整、淘汰落后产能等客观因素,也有银行自身风险管理的内在原因,尤其是银行在长期顺周期环境下建立的较为粗放的信贷评价体系和事后补救的管理模式[3]。这种评价体系和管理模式导致银行对抵御经济波动带来的风险准备严重不足,贷后风险管理严重缺失。目前,银行对信贷资产质量要标本兼治,重点需强化前瞻性的信贷战略布局,建立適应利率市场化和金融体制改革后的评价体系、加强贷后的跟踪评价、夯实风险管理基础,走出一条稳健发展的银行信贷新路子。
经济活动表现为资金流动,企业偿还债务能力、资产经营状况、获取利润、成长情况、融资、股权结构以及企业规模都是通过资金的运动表现出来。而资金运动需要支付系统平台的支撑。随着我国社会经济的加速发展和金融体制改革的不断深入,尤其是信息科学技术的急速发展,如何利用这个覆盖广泛、功能齐全、效率极高、参与规模日益激增、沉淀有大量资金汇划的支付系统平台,进行数据挖掘加工、预测企业的资金运行状况、建立新的信贷评价跟踪体系、防范信贷风险、维护商业银行效益和国家金融的稳定,具有十分重要的意义。
二、数据挖掘技术
数据仓对于很多人、企业来说还属于一个相对抽象的概念,目前普遍接受的观点认为数据仓是由科学仪器、传感设备以及电子邮件等多种数据源构成的一个海量的、多元化分布的数据集。其主要特征表现为规模宏大数据、数据种类繁多、有价值数据极少、极快速的数据处理。这四大特征是划分数据仓与传统数据的标识,也显示我们数据的应用研究日趋成熟。面对着日益膨胀的数据,银行如何能从种类繁多、海量的数据仓中提取到对银行有价值的信息,为银行本身服务,特别是用于银行的信贷风险控制,才是每个银行职工多关心的,而且这一点也必将在不久的将来为银行业所接收。
数据挖掘技术,又称为数据库中知识发现(Knowledge Discovery from Database,缩写KDD),它是一个从数据仓中进行抽取、转换、分析,从中提取有价值的可以用于辅助决策的关键性数据,并对数据进行模式处理、发现其内在规律,深入研究这些规律发生作用的表现形式,以及主客观因素对这些规律的影响,并且以一定的置信度对未来进行预测,用来为决策行为提供有利的支持[5]。在数据挖掘过程中集成并提高数据的价值,将数据从数据源转换为目标数据,是实施数据挖掘的前体和基础。数据挖掘的核心是通过算法或其他分析方法对目标数据源模式处理、获取目标数据隐藏的规律。模式化处理的作用就是验证数据挖掘的结果正确有效性,获取的规律是否经得起实践的检验,其置信度的高低,以及该规律是否可以作为该事件领域内的一个准则。
数据挖掘常用的技术有[6]:
(一)传统统计分析
主要包括相关性分析、回归分析及因子分析等,一般先由用户提供假设,再由系统利用数据进行验证。
(二)神经元网络
主要用于解决具有上百个参数的问题,包括分类和回归,诸多数据挖掘工具和软件都包含了该技术。如PolyAnalyst,BrainMaket,Neurosell和OWL等,它也是金融领域中常用的挖掘技术。
(三)决策树
主要用于分析主客观条件对得到的规律所起的作用大小,该方法是应用最为广泛的分类方法。
(四)基于事例的推理方法
该推理方法的主要思想是在预测未来情况或进行正确决策时,系统查找与现有情况相类似的案例,运用最佳的与案例相同的解决方案直接解决问题。
(五)遗传算法
遗传算法是计算数学中用于解决最佳化的搜索算法,是借鉴了进化生物学中的一些现象而发展起来的。其基本思路是通过计算机模拟,并对数据模型进行优化获得最佳模型。
(六)非线性回归方法
这种方法的基础是在获得了大量观察数据的基础上,利用数理统计方法和预定的函数模型,拟合因变量与自变量之间的回归模型
(七)基于贝叶斯网络结构算法
贝叶斯网络(Bayesian network),是一种概率因果网络、信任网络、知识图等,是一种基于概率推理的贝叶斯网络(Bayesian network)是为了解决不定性和不完整性问题而提出的,广泛应用于多个学科领域。
三、数据挖掘技术的主要步骤
从经济活动中产生的海量数据进行数据挖掘得到有价值的数据是一件比较困难的事,它包括目标定义、数据收集、数据整理、数据挖掘、结果评估和分析决策几个步骤:
(一)目标定义
对挖掘数据的目标有一个清晰、明确的定义,也就是挖掘数据是为了解决什么问题,制定的目标应是可行的、可以通过数据能够进行操作与评价。
(二)数据收集
大量的有价值的真实而又完整的数据是数据挖掘的前提和基础,没有数据、数据价值不高或者数据真实度、完整性差,数据挖掘也就无从做起或者从数据挖掘中得到的规律置信度不高。因此,收集大量有价值的数据是数据挖掘的首要步骤。
(三)数据清理
数据清理是数据挖掘的必要环节。对原始数据进行描述和初步探索,检查数据的质量等,通过数据清理,可以对数据做简单的泛化处理,对数据进行抽取、转换和装载,将数据转换成模型,然后对得到的各个模型进行初步评估,从而在原始数据的基础之上得到更为丰富的数据信息,进而便于下一步数据挖掘的顺利进行。
(四)数据挖掘
利用人工智能、数理统计等各种数据挖掘方法对所得到的数据进行挖掘,选用合适的数据挖掘工具,对选择算法作适当的调整和修改,发现有用的知识与模式,这是一个迭代循环的过程,也是整个数据挖掘过程的核心步骤。
(五)数据挖掘结果的评估
数据挖掘的结果存在有实际意义的、没有实际意义的和与实际情况相违背的三种状况,需要进行可视化应用分析,按照数据挖掘的操作方法评估挖掘的结果,然后不断调整挖掘方案和预处理原始数据等。
(六)知识的应用
将最终得到的知识转换成业务的应用才是挖掘的精髓,只有数据或者图像的结果不是数据挖掘的目的,只有通过数据挖掘获得的知识得以应用、辅助决策才是数据挖掘的归宿和目的所在。而作为银行利用数据挖掘技术一个主要目的就是利用数据挖掘降低信贷风险。
四、用数据挖掘技术在分析行业景气指数、企业绩效中的应用可行性分析
信贷是银行常见的一种经济活动,信贷风险是指商业银行在经营信贷业务时,由于企业内部或外部各种不确定因素的共同作用下,遭受损失的概率。信贷风险根源于不确定的市场经济活动本身和企业的经营状况。当下商业银行的贷款管理规定,一般是按季结息,贷款期限大都是6~12个月或1年期以上。不良贷款就是贷款出现欠息或到期后超过90天不能偿还。对于一些不良贷款,银行为保全资产通常还会采取再融资、延期、签补充协议调整原合同要素等方式来使贷款风险延期暴露。此外,很多潜在风险贷款还要受其它多种因素的影响或触发才会暴露[3]。这种贷款方式和事后补救的做法已经远远不能适应当下利率市场化和金融体制改革后的要求,如果仍采用这种贷款方式也必将使银行蒙受更大的损失。因此,在当下利率市场化的加快和金融体制改革的深入的背景下,银行如何发放贷款,如何确定发放贷款的额度、贷款时间就必须根据企业产品所属行业的背景和企业的经营绩效来确定。
企业经营绩效是衡量企业经营状况的重要指标。1999年财政部、2006年国资委分别在《国有资本金绩效评价指标体系》、《国有资本金绩效评价操作细则》、《中央企业综合绩效评价管理暂行办法》及《中央企业综合绩效评价实施细则》四个文件中提到企业的经营绩效应该包含至少四个方面的指标:企业的盈利能力、资产质量、财务风险和成长能力[7]。
企业的盈利能力是指企业获取利润的能力,是企业资本增值能力,通常以一定时期内企业收益数额的多少及其水平的高低表示。盈利能力指标主要包括营业利润率、成本费用利润率、盈余现金保障倍数、总资产报酬率、净资产收益率和资本收益率六项;企业的资产质量是指特定资产在企业管理的系统中发挥作用的质量,具体表现为变现质量、被利用质量、与其他资产组合增值的质量以及为企业发展目标做出贡献的质量等方面,它包括流动资产、长期投资、固定资产、其他资产(含无形资产、递延资产)等四个部分;企业的财务风险指在各项财务活动过程中,由于各种难以预料或控制的因素影響,财务状况具有不确定性,从而使企业有蒙受损失的可能性,企业的财务风险可以分为流动性风险、信用风险、筹资风险、投资风险;企业的发展能力是指企业扩大规模、壮大实力的潜在能力,主要包括营业利润同比增长率、营业总收入同比增长率和每股净资产相对年初增长率等多项指标。
因此为了准确的评价企业的绩效和企业产品对市场的适应性,必须数据仓中收集大量的不同行业、不同企业在特定时间段(通常近10年或更长)这四个方面能力的财务数据。然后对这些数据进行整理,剔除一些资料不全、信息不完整或者经营跨行业产品的企业。根据不同行业的企业产品特点设定不同的绩效参数Ai,采用主成分提取的方法,对反映筛选企业的盈利能力、资产质量、财务风险和成长能力的数据进行挖掘,构建不同行业的企业综合绩效指数和不同行业绩效参数Ai,并用logistic等动态模型拟合分析各行业的绩效发展状况(图1)。
行业绩效参数Ai极高的行业,这些行业可能为将要淘汰的行业,银行应该杜绝贷款;对于那些行业绩效参数Ai较高,但是绩效逐年降低的行业,这些行业不久就可能沦为将要淘汰的行业,银行应该谨慎贷款;对于那些行业绩效参数较低或很低,绩效指数稳定或逐年增加的行业,说明这些行业投入产出比较高,银行应适当增加这些行业的贷款,增加银行的盈业利润。
上述是从宏观上进行分析,为银行贷款提供指导。但是具体到每一个企业,如何提供贷款,贷款数量多少,贷款周期多长,贷款过程中如何监控企业资本运行状况,则必须进一步进行数据挖掘,分析这类企业的经营状况与绩效的关系。
五、用数据挖掘技术在分析企业信贷风险中的应用可行性分析
银行贷款的对象是企业,因此银行发放贷款给企业,不仅根据企业所在行业的绩效参数,以及企业的绩效,而且要依据企业经营状况来确定贷款的数量和时间。企业的经营状况是决定企业绩效高低的主要因素,而企业的经营状况主要由企业的融资结构、所有权结构和企业规模等确定。为了降低银行信贷风险,就必须在上述绩效数据挖掘的基础上,进一步对不同行业的各个企业的融资结构、所有权结构和企业规模等数据,以及它们与绩效关系进行深度挖掘,确定各种融资结构、所有权结构最适合以及比较适合比例关系和有利于提高企业绩效相适应的企业规模。
企业的融资结构是指企业全部融资来源及其比例关系,因此企业的融资结构涵盖了企业的融资方式(内源融资和外源融资)、资产负债率水平、企业不同债务(流动债务和长期债务)之间、债务来源(银行贷款和商业信用)之间的比例关系等信息。
企业通过负债能够获取纳税收益,促使企业提高财务水平,缩减代理成本,尽可能的使企业价值最大化,但负债也导致企业各种费用和债务风险的增加。企业负债分为流动负债和长期负债流动负债具有周期短,利率低等特点。企业流动负债率越高,债权人越有保证,但流动负债率过高,就会使一部分资金滞留在流动资产形态上,影响企业的获利能力。因此企业应将流动负债率测定一个较为合理的界限,低于这个界限,说明资产负债率有可能会高,企业信用受到损害;高于这个界限,说明一部分资金被闲置,资金使用效率不高,造成资金浪费。长期负债具有期限长、利息相对高、绝对数可能负债大等特点。企业如果能够正确有效地利用长期负债,它就会为企业提供更多的获利机会。但是如果企业经营不善,它又可能形成筹资风险,从而加剧企业经营风险,造成高负债高风险,也是影响资产负债率高低的一个重要因素。
企业融资可以分为内源融资和外源融资。内源融资由企业留存收益和折旧构成,外源融资依据其融资方式又分为股权融资和负债融资。融资结构是一个动态的结构,不同的企业以及同一企业的不同阶段其构成不同。融资结构不仅反映了企业的融资风险和融资成本,而且影响企业的资源、金融资产在全社会市场中的配置和企业的经营策略,决定着企业的融资能力和经营绩效。由此融资结构已经成为企业、金融机构和监管部门共同关注的课题。
企业的所有权结构表现为股权结构,它包括第一大股东持股比例(OC1)、前五大股东持股比例(OC5)、前十大股东持股比例(OC10)和股权制衡度(Z值)。第一大股东持股比例、前五大股东持股比例和前十大股东持股比例可以反映企业股权集中的程度,股权集中度对公司绩效的影响表现为积极和抑制两个方面的作用。对公司绩效的积极作用表现为:首先,与股权分散相比,股权集中使股东与公司的利益更加趋于一致。“利益趋同效应”认为股权集中度高的公司,大股东更有动力追求公司价值最大化,减缓代理问题;其次,股权集中能够促进对企业管理层的监督,“监督效应”认为股权集中的大股东为了自身利益会加强对管理层的监督,不断的优化管理层的结构。股权集中的抑制作用表现为一种“侵占效应”,是指大股东利用控制权侵占中小股东的利益。当股权集中程度的提高表现出“利益趋同效应”+“监督效应”>“侵占效应”,则股权集中度的提高有利于提高公司绩效;而当“利益趋同效应”+“监督效应”<“侵占效应”,抑制公司绩效的提高。由此可见,企业股权集中度与绩效紧密相关关系。
企业规模是指劳动力、生产资料和产品在企业集中的程度。公司规模并非越大越好。公司在提高公司规模的同时,公司投入和产出都在不断的提高,但是单位投入所带来的产出可能是下降的。此时,企业规模扩大不利于企业绩效的提高。
因此上述这些因素对企业绩效存在显著作用,通过挖掘不同行业相应企业与融资结构、所有权结构和企业规模相关的数据,對所有数据进行整理,以企业绩效作为因变量,以反映企业绩效这些相关数据作为自变量,采用非线性模型拟合,挖掘不同行业这些因素与绩效之间的非线性模型(图2),通过对模型求解进一步挖掘不同行业的企业取得较好绩效这些因素的取值范围,为银行对企业发放贷款具有显著的指导价值[8]。
六、结论与建议
银行充分利用上述数据挖掘结果确定对不同行业的企业是否放贷。
第一,绩效参数Ai极高的行业,这些行业可能为将要淘汰的行业,银行应该杜绝贷款;
第二,对于那些行业绩效参数Ai较低,但是绩效逐年降低的行业,因此这些行业不久就可能沦为将要淘汰的行业,银行应该谨慎贷款;
第三,对于那些行业绩效参数较低或很低,绩效稳定或逐年提高的行业,说明这些行业投入产出比较高,银行应适当根据下列情况采取不同的贷款策略:
一是企业绩效极高,企业的融资结构、所有权结构和企业规模均处于最佳状态,银行在提供一定量的贷款后,仍处在最佳状态,银行应放心贷款给这类企业;
二是企业绩效较好,但是企业的融资结构、所有权结构和企业规模处于较为适合状态,在提供贷款后,企业的融资规模仍然处于较为适合状态,对于这类企业,银行可以贷款给他们,但是贷款后银行要密切注意这类企业的融资状况和所有权变化,一旦出现异常情况,立即中断贷款,或督促企业纠正一些不良行为;
三是企业绩效较好,但是企业的融资结构、所有权结构和企业规模有一项或两项不在较为适合的范围,银行应督促企业纠正这些问题后,才能贷款给这类企业,如果这类企业资产负债水平极高,银行应杜绝贷款给这类企业;
四是企业绩效不好,但是企业的融资结构、所有权结构和企业规模都处于比较好的状态,这些企业可能存在其他问题,银行应督促企业找出影响企业绩效的因素,在解决这些不利因素后可以贷款给他们,并在贷款后要注意跟踪这些企业运营状况,一旦出现问题,应立即督促企业归还贷款,更不能采取过去的事后补救办法,给银行带来更大的损失;
五是企业绩效不好,同时企业融资结构、所有权结构和企业规模都不合理的企业,尽管企业所在行业绩效参数低,但是企业管理自身存在多方面的问题,银行也不能贷款给这类企业。
无论是绩效好的企业还是绩效一般的企业,一旦银行发放贷款给这些企业,一定密切关注这些企业的融资结构、所有权结构和企业规模的变化,一旦这些变化严重影响企业绩效,为了降低信贷风险,银行应终止对这些企业的放贷,绝不能采取事后补救的方式。
参考文献
[1]吴炳辉,何建敏.中国利率市场化下的金融风险理论[J].财经科学,2014(3):1-10.
[2]娄馨月.商业银行信贷管理问题与对策探析[D].西南财经大学,2012.
[3]魏国雄.商业银行的信贷战略风险管理[J].金融论坛, 2015,239(11):10-17.
[4]中国人民银行南昌中心清算中心课题组.数据挖掘技术应用于支付系统业务数据分析探讨[J].金融与经济,2014,11:78-80.
[5]David H.,Heikki,M.数据挖掘原理[M].北京:机械工业出版社,2006:15-19.
[6]李丽.基于数据挖掘的用户缴费信用风险评估研究[D].哈尔滨工业大学,2010.
[7]赵顺娣,周姣.国有资本金绩效评价指标体系完善研究.财会通讯,2009,20,29-30.
[8]张姌.科技型企业融资结构与经营绩效关系研究[D].华东师范大学,2016.
作者简介:张姌(1991-),女,汉族,江苏扬州,上海农商银行闵行支行,硕士,主要研究方向:互联网金融。