姚慧敏
(山西晋路道生实业有限公司 山西省太原市 030000)
当前影响商业银行发展的关键因素就是企业客户失信,不良贷款给商业银行带来了较大的经济损失,增大了银行业信用风险,因此对企业客户的信贷风险进行有效评估、预测具有重要意义,能够显著增强商业银行风险管控能力。随着大数据时代的到来,商业银行可以充分发挥大数据算法的优势,对企业客户资料信息进行全面的搜集、审核,依托大数据技术开展企业客户信息分析、建模操作,并构建企业客户信贷风险评价模型,由此能够显著降低商业银行不良贷款问题,这对企业信贷风险管理能力和的提升和持续发展均有很大的帮助。
基于大数据算法下,对商业银行企业客户信贷风险评价模型进行构建的过程中,会应用到数据挖掘模型,包括:支持向量机、多元判别分析法、神经网络模型、Logistic 回归模型及决策树模型等。不同模型的用途和功能有所差异,由于商业银行面向的是企业用户,所以应对合理模型进行选取。
(1)支持向量机。作为模式识别领域内的全新工具,支持向量机在二分类、模式识别、回归分析等方面有着广泛运用,其作为经典监督学习模型,建立在统计学习理论的基础之上,有效弥补了经典学习法的弊端,例如:局部极小、维数灾难等[1]。即使样本较小,支持向量机也拥有较强泛化能力,然而也存在模型性能同参数值选择质量密切相关的问题,无法有效处理大量数据,会惩罚不正确参数;
(2)多元判别分析法。建立在财务比率前提下的多元辨别分析法,属于多变量统计模型,可以结合辨别函数对指标进行运算,并有效分类处理判别指标。该模型规定数据必须达到下述标准:不同组数据协方差一致、服从正态分布、已明确相关参数,其中参数包括:判别代价、先验概率、均值向量等,所以该模型应用范围有限;
(3)神经网络模型。该模型主要构成是处理单元,对人的大脑神经系统进行了简化抽象模拟和建模处理,属于特殊并行分布式处理器,拥有很多连接,且可以借助学习的方式来掌握知识,从而有效解决问题。该模型具有多方面的优势,例如:自适应和自学习能力较强,神经网络能够对未知系统进行处理;非线性模拟能力较强,属于一种非线性模型;对数据分布没有要求,无需对自变量、因变量函数关系进行描述,也不要求组间协方差一致;可以对定性变量进行处理,信息综合能力优越,非常适用于不确定、繁琐非线性目标[2]。然而神经网络模型也存在一定不足,即:需耗时开展权重学习,存在反复循环状况;无法获取直观解答,要由专业人士开展研究和定义,对其他人而言有着较高要求;获取权重的过程非常不容易结实,且比较繁琐。
(4)Logistic 回归模型。作为多元回归模型,Logistic 回归模型适用于非正态分布,且数据相应变量值非连续性的状况,规定因变量Y 应为二元变量,数值是0、1。明确自变量X 时,因变量于特定水平中取值为1 的概率就是其条件期望,该模型广泛应用在分类问题中,具有良好的稳健性、准确性。然而该模型严格规定着样本质量、容量,预测结果概率转化为S 型,为非线性过程,可能会出现预测结果不够准确的问题。
(5)决策树模型。运用该模型进行建模的过程中,根节点涵盖了所有数据,需要结合指标对最优变量进行探寻,参考该变量值的特定条件,将数据划分为数据子集(≥2 个),不断重复直至符合提前设定条件即可停止,可以获得倒着的树形图[3]。在回归、分类问题的处理中都会应用决策树模型,鉴于该模型在重复迭代过程中很容易因为较小的数据变化而出现差异化的分支结果,所以存在稳定性差、方差较大的问题,
针对商业银行企业客户信贷风险评价问题,综合分析各方面要素,可以依托神经网络模型对信贷风险评价体系进行构建,以此来提高商业银行的信贷风险管理水平。
神经网络一般包括输入层、隐含层、输出层,其中输入层负责传输信号,隐含层可以通过非线性函数、线性函数进行传递,输出层发挥着线性加权功能。各网络结点代表独立神经元,传递函数一般都为Sigmoid 型函数。各对神经元间均对加权系数进行了连接,能够对上下传输的两个神经元的刺激进行减弱、强化处理。所取加权系数一般是权值,权值的修改规则叫做权值算法。专家系统构建在BP 神经网络的前提下,可以结合特定算法来学习样本数据,对网络权值进行明确,输入信息、理想输出共同构成了样本[4]。若网络实际输出、理想输出相同的情况下,代表完成训练,反之则应对阈值、权值进行合理的调整,确保网络输出同期望输出相统一,由此能够提高自适应能力和自学习能力。若完成神经网络训练,那么能够运用到商业银行企业客户信贷风险评价工作中。本研究所选取的是BP 神经网络,在此基础上构建了商业银行企业客户信贷风险评价模型,详如图1 所示。
图1:基于神经网络的商业银行信贷风险评价模型
表1:定性评价指标的评价标准
基于神经网络的商业银行信贷风险评价模型在明确指标值、归一化处理方面:对于多项商业银行信贷风险指标,可以划分为定量、定性两类。因为各项指标基于差异化的角度对商业银行企业客户信贷风险活动能力进行了体现,指标量纲存在差异,因此不能开展比较工作[5]。所以要想明确最终评价值,要定量化处理定性指标,可以借助专家打分法,选取0-100 的分值,定性评价指标的评价标准分值详见表1 所示。
此外,还要兼顾神经网络训练收敛问题,借助无量纲归一化处理指标的方式,有效降低指标量纲干扰,归一化处理公式如下:
选取某省多家商业银行,掌握和分析银行企业客户经营、贷款等各方面的状况,在深入了解企业客户贷款信息的基础上,开展实地走访调查,借助网络途径来搜索企业财务报表资料,统一汇总、整理银行企业客户的财务数据,特征变量即所涵盖的指标为17 个,企业存在还贷不及时违约状况与否表示响应变量,为y。进而,开展建立商业银行神经网络信贷风险评价模型操作之前,应对样本数据开展预处理,需要归一化处理相关数据信息。数据归一化处理主要指的是将全部数据进行[0,1]范围内数值的转化,有效消除不同维度数据在数量级方面的差异,减少数据在输入、输出过程中由于数据量级差距大而出现过大网络预测误差问题的发生几率。
本研究主要通过R 语言来构建商业银行神经网络信贷风险评价模型,主要运用的是nnet 软件包。在对单隐藏层前馈神经网络模型进行建立时,借助nnet ()函数,包括了两大不同的模式,分别为:结合已知数据构建模型、参考既定公式构建模型。可以采取随机的方式对数据集进行测试集、训练集的划分,前者为30%数据,而后者为70%数据。对R 代码进行运行的过程中,能够获得三层网络结构,其中输出层是两个节点、隐含层是八个节点、输入层是十七个节点。该模型的权值衰减参数是1e- 05,迭代次数是627 步,此时网络相对稳定,为收敛状态,且实际数值同预测数值二者的相关系数为0.8524。由此体现出基于BP 神经网络构建的商业银行信贷风险评价模型预测效果较好。
对于商业银行企业客户神经网络信贷风险评价模型的评价:
(1)该模型预测的准确性较高。完成信贷风险评价模型构建工作之后,通过 predict()函数开展预测测试集的操作。本研究的测试集中共涵盖的企业共为46 家,信用较差的企业为8 家,该模型所预测的不良信用企业为6 家,其中2 家被误判为拥有良好信用的企业;信用较好的企业共38 家,评价模型通过预测所判定的信用较差的企业为1 家,预测信用情况准确的企业共37 家,模型预测的正确判断率达到了72.4%,错误判断率是27.6%,因此模型预测明确程度较高。因此实际运用信贷风险评价模型的过程中,借助神经网络对企业客户信用进行预测的实用性较强,且最终预测结果能够基本反映出企业客户的实际信用状况。
(2)该模型应用的进一步展望。商业银行神经网络信贷风险评价模型具有较高的预测准确性,但是也有一些不足,有待进一步的完善和健全。在对神经网络信贷风险评价模型进行建立时,因为需要获取企业相关数据信息,所以选取样本量不大,同银行所掌握数据总量相差较大[6]。同时,本研究应用到17 项企业特征变量,同商业银行对企业客户信用开展评估时所选取的指标不可能完全相同。商业银行借助此信贷风险评价模型开展时间评估工作时,可以调用数据库内的全部数据信息,所以可以有效增强预测精确程度。大数据技术的广泛应用,使商业银行可以借助网络媒体,从多个角度来获取企业客户的信息,包括:财务信息、电子商务信息、社交媒体信息等,所获得的可能是非结构化数据,也可能是结构化数据。所以不要结合实际状况,合理、科学地对特征变量进行调控、修改,从而达到增强模型信贷风险预测精确程度的目的。
处在当前大数据时代背景下,借助神经网络模型来构建商业银行企业客户信贷风险评价体系,能够使信贷风险预测精确性、效率得到显著增强。因为数据挖掘法类型较多,各具优势,这就要求商业银行要结合所获取的企业客户数据信息特征,对合理的大数据算法进行选取,建立有效的信贷风险评价模型,确保商业银行信贷审核工作的有效开展,全面改善信贷风险评估准确程度,减少不良贷款问题的出现。