基于BP神经网络的科技企业信贷风险评价实证研究

2022-11-18 10:49
关键词:信贷风险指标体系神经网络

郭 璇

(中铁第一勘察设计院集团有限公司, 陕西 西安 710043)

科技金融是为实现科技创新活动与金融资源配置相互融合、相互促进而进行的一系列系统的制度安排,对创新型国家的建设有着重要意义。目前我国资本供给的渠道以银行信贷为主,科技企业的快速发展促使信贷业务增加,对银行的发展也提出了新的要求。为此,在政府的推动下,银行类金融机构创新服务模式,成立了科技银行,专为科技企业量身定制,为其提供发展所需的信贷资金。信贷风险评估是银行信贷管理的重要环节,而建立科学合理的信贷风险评价体系、选用严谨可行的评估方法是银行信贷风险评估的关键,可以提高对科技企业的信贷审批效率,降低信贷风险。

20世纪70年代之前,传统的信贷风险评价依靠的是经验和感觉,以定性分析为主,如德尔菲法、5C信用评价法等都是由信贷风险度量领域的专家根据经验,对企业的信用质量进行评价。20世纪70年代以后,国外的学者研究出了一系列基于数理技术的信贷风险评价模型,通过定性分析与定量分析的结合,使企业信用状况测量更为精确。从20世纪80年代开始,人工智能(AI)技术越来越多地用于客户风险识别和评估,Davis (1992) 比较分析了神经网络与其他研究方法在信用评估中的效果,Rosenberg和Gleit (1994) 从应用层面讨论了神经网络在信贷决策中的作用[1],West David(2000)在信贷评价研究中提出五种神经网络模型[2],Cimpoeru和Smaranda Stoenescu(2011)将神经网络应用于信用风险评估,并证明神经网络优于逻辑回归[3]。国内研究方面,郭文伟和陈泽鹏(2012)证明了Mixed-logistic信用风险评价模型的有效性[4];郭文伟、陈泽鹏、钟明(2013)提出了基于MLP神经网络构建小企业信用风险预警模型[5];张宏民(2014)将神经网络和专家系统相结合,建立了信用风险评价模型[6];冯贵艳(2016)将GA-BP神经网络作为信用评价方法,建立了针对建筑企业的信用评价模型[7];You Zhu,Chi Xie等(2016)在研究中构建了基于逻辑回归和人工神经网络的两阶段混合模型,预测中国中小企业在供应链融资中的信贷风险,并证明了该模型具有很好的分类能力[8];黄薷丹(2018)分析比较了不同大数据算法的利弊,针对所搜集的样本数据特征,选取了神经网络模型来构建商业银行企业客户信贷风险评价体系,并进行实证分析[9];霍源源、姚添译、李江(2019)基于Probit模型构建了制造业企业信用风险评估方法,通过指标选取及检验[10];常千、高天惠、朱家明(2021)以人工神经网络及模糊数学理论为基础,针对中小微企业风险评价及银行信贷策略规划,构建BP神经网络模型和模糊综合评价模型[11]。

梳理国内外相关研究文献可见,基于数理技术的信贷风险评价模型不断发展,从最初的判别分析模型、logistic回归分析模型,到决策树法,再到人工神经网络,为实践中控制信贷风险评价提供了较为坚实的理论依据。本文在综合国内外研究成果的基础上,引入BP神经网络模型,构建科技型企业的信贷风险评价指标体系,选取深交所创业板上市公司中176家科技企业为实证研究样本,运用因子分析法,利用MATLAB R2014a软件对模型进行训练和测试。以期为科技银行甄别出信用等级高、市场前景好的科技企业提供借鉴,从而提高信贷审批效率,降低信贷风险,将有限的金融资源流向优质的科技项目,促进科技金融的发展。

一、科技企业信贷风险评价指标体系构建

对于科技企业信贷风险评价,选择合适的评价指标是达到准确和客观要求的关键,评价指标的选取是评价的前提和基础。评价企业信贷风险指标体系虽然在理论上和实践上有一定的差异,但基本思路趋于一致,即通过选择较为典型的财务和非财务指标,从偿债能力、盈利能力、营运能力、发展能力等方面进行评价。针对科技企业信贷风险评估指标体系,赵昌文,陈春发等(2009)提出评价高新技术企业信用状况的七要素,并筛选出17个定量指标和3个定性指标[12];汪泉和曹阳(2014)详细分析了科技企业信贷风险特点,提出 “SPECAIL”信用评价法对科技金融的信用风险进行识别、度量与控制[13];霍源源、姚添译、李江(2019)认为流动资产比率、资产负债率及总资产增长率等10个财务变量可以显著地反映企业偿付能力和发展能力,并作为风险测度模型的解释变量[10];于颖(2021)从投贷联动角度,提出了包括技术风险、财务风险、其他风险等3个一级指标、11个二级指标、44个三级指标的银行科技信贷风险评价指标体系构建[14]。本文考虑科技企业的“科技”属性,在现有文献的基础上,选择技术开发人员比重、研发投入占营业收入比重、资本化研发支出占研发投入比重、资本化研发支出占当期净利润比重等4个典型指标考察科技企业的创新能力,并将其纳入到信贷风险评价指标体系。从而形成了包括偿债能力、盈利能力、营运能力、发展能力、创新能力等5个一级指标、17个二级指标的科技企业信贷风险评价指标体系,如图1所示。

图1 科技企业信贷风险评价指标体系图

二、样本分析与数据处理

(一)样本设计

应用BP神经网络的实证分析包括两个阶段:第一阶段要对网络进行学习训练,第二阶段在完成训练的基础上进行测试,所以本文的样本分为训练样本和测试样本。类似于评价指标的选取,样本的设计也需要遵循一定原则,首先,样本必须具备相关性,即与研究内容相关,本文所选取的样本企业必须为科技企业。其次,样本要具备适度性,样本容量既不能太小,也不能太大,样本容量太小不具备代表性,会影响结果的准确性和普适性,反之,又会不经济,造成浪费,增加研究人员的压力。

本文根据研究特点及样本选取原则,并结合科技企业的界定,选取深交所创业板上市公司176家科技企业为研究样本,利用国泰安数据库以及这176家企业2020年的年度报告收集整理数据,剔除部分指标数据残缺的企业,最终获得由160家科技企业组成的实证样本。将其中120家样本企业作为训练样本,40家样本企业作为测试样本。

(二)数据的处理

1.数据归一

在BP神经网络的训练过程中,输入向量与权值相乘并减去阈值后传递给激活函数进行处理,激活函数是sigmoid函数。为了避免神经元饱和,消除原始数据对BP神经网络学习训练的影响,需要将输入数据的范围与经过隐含层和输出层处理后的输出范围相适应,即对指标数据进行归一化处理。归一化处理的方式有很多种,本文运用公式1对指标数据进行处理,使得数据的范围位于[0,1]之间。

(公式1)

2.KMO 和Bartlett 球形检验

考虑到定性分析选取的17个指标中的一些指标之间可能存在很强的内部依赖关系,因此有必要寻找相关性较强的指标的公共因子,从而达到精简指标的目的。本文运用因子分析法,抽取指标间的公共因子,以包含绝大多数重要信息的少数综合指标替代原始指标,减少指标数量,降低输入维,提高训练效率。本文运用KMO 和Bartlett球形检验可以用来判断进行因子分析的可行性判断,经过SPSS分析,KMO检验得到的取样适切性量数为0.604,Bartlett球形检验的显著性为0.000,小于0.01,符合进行因子分析的条件。

3.因子分析

在KMO和Bartlett球形检验的基础上,本文利用SPSS软件对所选的160家科技企业的17个信贷风险评价指标进行因子分析。首先从Excel表中将评价指标数据转入SPSS;然后点击“分析/降维/因子分析”,并进行“描述统计”“抽取”“旋转”及“选项”的基础设置,其中提取方法采用主成分分析法;最后得到SPSS因子分析结果,见表1所示。

由表1可见,前六个公共因子的累积方差百分比为79.429%,大于75%,近乎达到80%。因此,本文根据总方差解释表抽取前六个因子为公共因子,分别用A、B、C、D、E、F来代表,并结合因子荷载矩阵分析可得:公共因子A反映科技企业盈利能力信息,主要包括x4(资产报酬率)、x5(净资产收益率)、x6(营业净利率)、x7(成本费用利润率)4项原始指标;公共因子B反映科技企业偿债能力信息,主要包括x1(流动比率)、x2(速动比率)、x3(资产负债率)3项原始指标;公共因子C反映科技企业营运能力信息,主要包括x8(应收账款周转率)、x9(存货周转率)、x10(总资产周转率)3项原始指标;公共因子D反映科技企业发展能力信息,主要包括x11(净资产收益率增长率)、x12(净利润增长率)、x13(营业收入增长率)3项原始指标;公共因子E反映科技企业研发投入资本化能力信息,主要包括x16(资本化研发支出占研发投入比重)、x17(资本化研发支出占当期净利润比重)2项原始指标;公共因子F反映企业进行科技研发投入的人力、财力、物力,主要受到x14(技术开发人员比重)、x15(研发投入占营业收入比重)2项原始指标的影响。

将整个评价指标体系反映的信贷风险综合信息用R表示,根据总方差解释表中的结果,得到6个公共因子对R的信息贡献率表达式为:

R=0.2492A+0.1678B+0.1179C+0.1017D+0.0905E+0.0672F

(公式2)

进一步将A、B、C、D、E、F等6个公共因子值带入R中,得到原始评价指标x1、x2、…x17对R的信息贡献率表达式,式中各指标的权重即为各指标对评价体系整体的贡献率。

R=0.1829x1+0.1802x2-0.1472x3+0.2478x4+0.2227x5+0.2466x6+0.2583x7

+0.0997x8+0.023x9+0.0771x10+0.2062x11+0.1776x12+0.0344x13+0.0385x14

+0.0505x15+0.1163x16+0.0794x17

(公式3)

表1 因子分析总方差解释表

三、基于BP神经网络的训练及测试

(一)企业初始信贷状况评价

BP神经网络学习训练需要已知样本企业的初始信贷状况作为期望输出。由于目前科技银行的相关业务还不成熟,不仅难以获得科技企业的信贷状况数据,而且难以保证数据客观性。因此,本研究将在因子分析的基础上采用“3σ”法则对企业的初始信贷状况做出评价。

目前,我国银行在评估信贷质量时遵照央行颁布的《贷款风险分类指导原则》,按照风险的大小进行分类,将贷款质量划分为五级,即正常、关注、次级、可疑和损失五个等级。因此,本文在对企业初始信贷状况进行评价时参照银行信贷的五级划分标准,将企业初始信贷状况分为AA(正常)、A(关注)、BB(次级)、B(可疑)、C(损失)五类,具体见表2所示。

表2 企业初始信贷状况划分标准

将样本中各科技企业的信贷风险综合信息R与表2所示的信贷状况划分方法相对应,即可得到科技企业的初始信贷状况。

(二)基于BP神经网络的训练及测试

1.BP神经网络的训练

结合BP神经网络的基本原理,本文构建了一个三层的BP神经网络模型,即隐含层的个数为1。模型中各要素的设定遵循以下规则:BP神经网络的输入维根据样本的指标数确定;输出维根据信贷风险评价对输出结果的要求设定;对于隐含层神经元数量的确定比较复杂,没有普遍公认的理论和方法作为指导,本文根据已有研究成果并结合反复试错的方法来决定。

从160家科技企业的实证样本中抽取120家科技企业作为训练样本,训练样本的信贷风险评价指标为经过因子分析抽取出的6个综合评价指标,因此,确定BP神经网络的输入维为6。输出层的输出结果要与初始信贷状况相比较以实现对BP神经网络的训练,样本企业的初始信贷状况有五个等级,设定输出维为5,输出向量与信贷等级一一对应:AA级为(1,0,0,0,0),A级为(0,1,0,0,0),BB级为(0,0,1,0,0),B级为(0,0,0,1,0),C级为(0,0,0,0,1)。经过多次训练试错,确定隐含层神经元数量为4的时候效果最优,误差相对最小。

借助MATLAB R2014a实现编程,本文构建了BP神经网络信贷风险评价模型,在算法的选择上采用动量BP算法,即通过在梯度下降算法中加入动量因子的方式,加速收敛,缩短训练时间。训练采用批量处理的方式,将那些用于训练的样本数据同时输入,通过计算样本的偏差对权值和阈值做出相应的调整和修正。权值的初始化利用rand函数实现,为一个较小的随机数,同时将阈值合并到权值中,相当于多了一个恒为1的输出。激活函数选用logsig(S型对数)函数,动量因子设定为0.8,学习率设定为0.1,设定迭代的次数不超过3 000次,训练希望达到的误差为0.01。

在MATLAB R2014a中运行程序,训练误差如图2所示,观察到误差(errRec)从第一次迭代中的0.2 896开始,在经过237次迭代之后达到0.008 188,小于训练目标误差,停止训练。

图2 BP神经网络errRec收敛图

2.BP神经网络的测试

运用40家科技企业的指标数据对训练好的模型进行测试,得到的测试结果与期望结果的对比情况如表3所示。对比结果,模型的输出的正确率为87.5%,错误判断表现在将4家AA级科技企业误判为A级,将1家C级科技企业误判为BB级。《贷款风险分类指导原则》中将BB、B、C这三类合称为不良贷款,测试结果没有出现将后三类贷款划分为AA或A级贷款的状况,说明BP神经网络能够准确的划分优良贷款和不良贷款,在对科技企业信贷风险评价中表现出较高的准确性。

表3 测试样本企业预测与初始信贷状况对比表

四、研究结论与建议

(一)借助BP神经网络不断优化评价模型

目前对企业开展的信贷风险评价已经在定性分析的基础上引入了定量分析模型,但仍然处于探索阶段,存在许多不足,需要进一步探索和优化。因此,在信贷风险评价过程中选择好的信贷风险评价模型,对于提高信贷风险评价的效率和准确性非常重要。通过实证分析结果,可以看出BP神经网络在区分优良贷款和不良贷款中表现出较高的准确性。因此,银行在对科技企业的贷款申请进行审批的过程中,可以借助BP神经网络的分类功能以及在处理非线性问题时表现出的优良特性,优化信贷风险评价模型,提高对科技企业信贷等级划分的准确性,降低信贷风险。但是,受样本量的影响,当前基于BP神经网络的信贷风险评价方法评价精度仍有待进一步提高,因此,有必要将存量科技型企业的信贷业务以基于BP神经网络的信贷风险评价方法进行复盘,通过“数据投喂”,不断提升基于BP神经网络的信贷风险评价方法的精度。

(二)合理构建科技企业信贷风险评估评价指标体系

指标体系是否合理决定着评价结果是否准确,并影响科技企业的发展和银行信贷风险。在选取评价指标时,首先,应根据信贷风险评价的要求以及科技企业的特点,遵循系统性、全面性、科学性和重要性以及可操作性原则。其次,在具体指标选取的过程中,要将这些原则相结合进行考虑,不可偏颇,不能为了达到系统性和全面性就不考虑可操作性方面的限制。本文按照设定的指标选取原则构建了包含5个一级指标,17个二级指标的信贷风险评价体系,在实务操作中,应综合分析被评价科技企业的具体特性,对指标体系进行不断完善,特别是在非财务指标的选择上,可以聘请经验丰富的专业人员,对科技企业所处的行业特点以及整体宏观环境等进行评价,从而使指标体系更加全面合理。再次,科技企业公司治理模式、企业发展时期、经营者的管理素质和能力等非量化因素对全面评估科技企业信贷风险状况具有十分重要意义。因此,在评估指标体系构建时,需要合理把握财务与非财务因素、定量化和定性化因素的构成关系,并不断完善评价指标体系,使指标体系在尽可能全面反应信贷风险的基础上更加精炼,更加合理,从而提高信贷风险评价效率。

(三)充分考虑科技企业的特殊性,综合评价科技企业信贷风险

本文在对原始信贷评价指标进行因子分析时,信贷风险综合信息系数R中部分指标的权重与同类指标相比表现出了较大的差异,这些差异反应了科技企业的特性导致的信贷风险影响因素的特殊性,应当予以重点关注。

盈利性指标比偿债性指标的权重更大,由此可见,对科技企业信贷风险影响最大的因素是企业的盈利能力。技术研发的不确定、市场接受度不明朗是导致科技企业高风险的关键,盈利能力是企业通过自身经营活动创造资金的能力,传递出企业科技创新能否获得成功,决定着企业能否实现由高风险到高效益的转变。因此,在做出针对科技企业的信贷风险评价时,应该着重关注反映其盈利能力的因素。

在衡量发展能力的指标中,营业收入增长率与其他两项指标的权重相比明显小很多,这一差异表明在评价科技企业信贷风险时虽然要关注其成长能力,不能要求科技企业同普通企业一样一直保持均匀的营业收入增长率。因为营业收入取决于价格和销量两个因素,价格的高低反映产品本身的特质,销量的大小反映产品的市场需求和市场占有率,这两个因素恰好体现了科技企业的关键点——科技产品成果化和市场化。科技企业对信贷资金大量需求的时候,也正是在寻找创收点的时候,不可能保持较高的营业收入增长率,而是会随着科技产品成果化、市场化的成功呈现突破性增长、呈现一个阶梯型状态。

创新能力方面,资本化研发支出占研发投入比表现出比技术人员比、研发投入占营业收入比更大的权重,这一点更好的解释了科技企业高于一般企业的信贷风险源于其创新技术成果化、产业化的不确定性。在对科技企业的信贷风险进行评价时,既要重点关注科技产品或服务成果化的情况,同时也要考虑到不同企业科技产品的特殊性,对于研发周期较长的科技企业,在短期内可能难以取得较高的研发支出资本化比重,此时就要综合科技产品的特性予以确定。

(四)在非上市科技企业中试点BP神经网络的信贷风险评价

本文以上市科技企业为研究对象,构建的基于BP神经网络的信贷风险评价对非上市科技型企业也同样具有借鉴意义。在非上市科技型企业信贷风险评价中试点采用基于BP神经网络的信贷风险评价方法,具有两大优势:一是采用基于BP神经网络的信贷风险评价方法可以有效控制银行的信贷风险,帮助银行进军在非上市科技型企业信贷的“蓝海市场”,提高银行信贷效率。二是提升金融服务实体经济的效率,缓解中小科创型企业“融资难、融资贵”的问题,以金融工具促进实体经济高质量发展。当然,在非上市科技型企业应用基于BP神经网络的信贷风险评价模型时,需要根据非上市科创型企业的行为特征,不断优化非上市科创型企业指标体系,加强指标间权重关系研究,进而优化基于BP神经网络的信贷风险评价模型,提高银行对非上市科技型企业信贷风险评价的效率和信度。

猜你喜欢
信贷风险指标体系神经网络
农村信用社信贷风险管控思考
神经网络抑制无线通信干扰探究
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
新常态下银行信贷风险管理探析
商业银行信贷风险形成的内部因素
基于神经网络的拉矫机控制模型建立
四川农户小额信贷风险防范研究
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定