谢 菲 姜睿清
(1.深圳信息职业技术学院,广东 深圳 518172;2.南昌大学 公共政策与管理学院,江西 南昌 330031)
近年来,中小微企业作为吸纳就业的主力军,在增强经济活力、加快产品创新、推动建立健全高效的生产体系等方面扮演着举足轻重的角色。据统计,截至2021年末,我国市场主体总量达1.54亿户,比2012年末增长1.8倍,年均增长率达到了12.1%(1)数据来源:国家统计局《新动能茁壮成长 新经济方兴未艾——党的十八大以来经济社会发展成就系列报告之九》。。数据显示,在2022年全年,共新登记市场主体2908万户,日均新登记企业数量达到2.4万户,年末市场主体总数近1.7亿户;我国中小企业股份转让系统挂牌公司6580家,全年挂牌公司累计股票筹资232亿元(2)数据来源:国家统计局《中华人民共和国2022年国民经济和社会发展统计公报》。。随着“双创”政策升级,中小企业创新能力迅速提升。2021年企业R&D经费占全国的比重为76.9%,较上年提高了0.3个百分点(3)数据来源:国家统计局《2021年全国科技经费投入统计公报》。,企业的发展质量效益不断提升。这进一步促成中小企业发展壮大,成为经济社会发展的中坚力量,其发展态势及所处困境应当引起全社会的充分重视。然而,2020年春节爆发的新冠疫情对中小微企业而言无疑是一个巨大的打击,导致经济下行压力持续加大,市场需求锐减,经营成本骤增,极大地削减了营业收入,破坏了企业的流动资金,许多中小企业面临回款不畅、成本高昂、资金紧张等困难。我国中小企业协会调研结果显示,84.46%的企业受疫情影响严重,98.43%的企业被迫延期复工(4)数据来源:中国中小企业协会《关于发生疫情和疫情防控对中小企业影响的调查问卷》。,大量中小微企业还面临合同违约、融资难、资金链断裂等困境,生存形势严峻。2023年李克强总理在两会《政府工作报告》中提出“对受疫情影响严重的中小微企业、个体工商户和餐饮、旅游、货运等实施阶段性贷款延期还本付息”,帮助中小微企业摆脱困境迫在眉睫。
目前,中小微企业面临的最大困境之一是无法获得足够的融资以满足自身发展需要。这是因为中小微企业往往存在内部信息披露不真实、财务制度不健全等问题,增加了信贷审批获取真实信息的难度。同时,相比于大企业,中小微企业普遍信用意识较为薄弱,容易出现报表虚假、债务拖欠等不良现象。这些因素导致中小微企业与银行等金融机构之间存在严重的信息不对称,信贷机构难以对中小微企业的还款意愿、整体信用状况、综合还款能力作出准确评估,同时缺乏风险共担机制,这大大降低了相关金融机构的放款意愿。而处于发展起步阶段的中小微企业又具有相较大企业更为急迫的资金需求,亟待资本注入。如何协调庞大资金需求与获取融资困难之间的矛盾,将社会资金与中小微企业的融资需求相对接,是解决中小微企业发展问题的重要突破口。
银行等金融机构的放贷意愿建立在对企业信息准确而全面分析的基础之上。针对中小微企业画像难问题,部分银行推出了“发票贷”这一全新的金融产品。该产品以授信企业在税控机上采集的发票信息作为应收账款金额认定的依据,并在此基础上确定授信金额。其优越性在于,发票信息相较财务报表更难作假,销售发票信息、上下游客户付款信息以及企业的资金流向信息等可以更客观地反映企业经营情况,有利于银行了解企业的经营动态和销售变化,帮助第三方金融机构采集真实数据,挖掘企业潜在风险,准确进行客户画像,更好地解决中小微企业征信困难的问题。
因此,本文以“发票贷”为研究对象,聚焦中小微企业与银行之间信息不对称的问题,探讨对非结构数据的信息挖掘方法,建立合适的信贷模型以服务于信贷决策,为推出“发票贷”产品的银行提供决策参考。
2020年,银保监会发布了《商业银行小微企业金融服务监管评价办法(试行)》,要求构建更加完善的小微企业金融服务体系,鼓励商业银行顺应发展新趋势,加快产品和服务模式创新,为小微企业健康发展提供更加精准有效的金融服务。在此背景下,“发票贷”这一种全新的“信息贷”金融产品应运而生,一方面可以满足国家大力扶持中小微企业的政策导向和摆脱疫情影响的迫切需要,另一方面有助于扩大信贷市场的授信群众,拓展信贷服务,是非常具有研究价值的创新型产品。
推出“发票贷”的核心问题在于如何从真实可靠的发票数据中提取信息对中小微企业的财务和非财务状况进行评估。只有真正把握中小微企业的信用状况和履约能力,银行才有足够的放贷信心,这对银行数字素养来说是一个巨大考验。同时,商业银行的利率定价和授信额度实质上也是对其风险管理能力的考验。如何根据中小微企业的风险评估进行差异化定价,为客户提供合适的授信额度,并确定相应的贷款政策,是具有现实意义的科学问题。
因此,为服务于银行实践,本研究聚焦以下科学问题:(1)如何根据发票中的非结构化数据对中小微企业的整体信用状况进行评估;(2)如何根据中小微企业的信用情况进行风险管理,确定贷款组合的定价及额度分配。
评估和管理企业信用风险是银行信贷风险管理的首要任务,对此,国内外众多学者为此贡献了丰富的研究成果。早期风险评估模型主要以评价模型为主,采用5C、5W、5P等评价指标体系进行综合评价,通过银行信贷专家的主观打分以及模糊评价方法进行风险衡量。以5C为例,其标准化信息库要求包含品质、能力、资本、抵押、条件等指标,通过综合评价数学模型进行模糊评价,确定信用等级。然而,这类评价方法对信贷人员的专业水平具有很高的要求,成本较高,而且准确率及真实性不容乐观。随着信贷风险事件的频发,越来越多的学者开始引进定量分析方法。Zhu Lei等基于对预警来源的研究,对物联网公司进行Z-Score模型分析,发现物联网公司的长期偿债能力较弱,应致力于多元化投资[1]。Li Xinfei等构建Z-score模型评估3098家A股公司的企业财务风险,分析发现新冠肺炎疫情增加了高风险企业的数量,研发投入可以有效降低企业财务风险[2]。Wu Desheng等以中国数据为样本对Z-score模型进行了优化与调整,结合MLP-ANN算法构建了混合企业危机预警模型,并证明了混合模型的平均正确分类率高于Altman Z模型和纯神经网络方法[3]。然而,Z-score模型建立在正态分布的理想假设之下,无法适应复杂多变的金融市场。Yue Huabo应用Logistic模型对企业财务风险管理进行分析,结果显示该模型的准确率高达90.88%,在实践中能够有效地对企业财务风险进行管理和分类[4]10。Attigeri等使用两种模型对银行识别客户的性质进行评估,分析发现Logistic回归比神经网络表现出更好的性能[5]3652。国内学者的大量实证也表明,Logistic模型具有更高的预测精准度,在预测是否违约的基础上可以计算具体违约概率,具有更广泛的应用范围,使其从若干统计预测模型中脱颖而出。潘泽清[6]81、Zhou Qingping[7]6等应用Logistic模型对上市公司的违约概率进行评估,结果肯定了该模型的适用性、针对性,并且具有较高的拟合度。当然,该模型也存在一些缺陷,需要进一步探究。Dumitrescu Elena等研究发现,传统的Logistic模型无法准确捕捉信用评分数据中可能出现的非线性效应,因此在信用风险建模中需要注意引入非线性效应,例如连续变量的离散化、类别合并等[8]1179。随着银行业务的迅猛发展,风险管理对银行的批量数据处理能力和量化分析能力提出了更高的要求。因此,以KMV、人工神经网络等为代表的高级计量模型得到快速发展。Kang Li利用神经网络模型得到了较好的预测效果[9]351。Sameer结合遗传算法和KMV方法,结果显示该复合模型的准确度明显优于传统模型[10]345。衣柏衡、朱建军采用KMV法对小额贷款公司的信用风险进行了评估[11]27。戴昕琦在商业银行信用风险评估的研究中发现,C-SMOTE-RF模型不仅在总体分类精度上要高于Logistic模型、RF模型和SMOTE-RF模型,而且第I类错误率和第II类错误率都更低,第II类错误率更是降低到了10.2%[12]143。
综上所述,企业信贷风险的评估方法已经获得了长足发展,从简单的模糊综合评价到统计量化方法再到机器学习,其突破主要发生在风险评价模型及计算方法上,而数据采集则基本沿用5C、5W、5P等具有普适性的指标体系,缺乏针对特定企业、特定信贷产品的评估方法。因此,本文的创新之处在于,针对中小微企业可提供的有限且非结构化的数据,建立适合“发票贷”实践的指标体系,并采用Logistic回归模型综合定量和定性评价结果计算企业的违约风险。
如何构建贷款组合分配模型是银行分散投资风险的核心问题。目前的相关研究根据目标的不同大致分为三类。一类是以组合风险最小化为目标的决策模型。Philipp J.Kremer等考虑了五个非重叠地区的发展,对比八种最先进的风险最小化方案,分析其绩效和风险特征,发现GMV-LO投资组合实现了最低风险,与其他投资组合相比表现出边际改善[13]274。Bogdan Grechuk、Michael Zabarankin探讨了单周期和多周期公式中的最小化一致风险度量投资组合问题,以一致风险度量的形式识别代理人的风险偏好[14]741。第二类以最大化收益绩效为目标。Ortobelli Sergio等创新了最大化固定收益投资组合绩效的优化方法,并对2002—2012年期间美国固定收益市场进行实证应用[15]403。第三类则是目前较为流行的,以贷款组合整体收益率的VaR和CVaR来衡量组合风险。理性的投资者具备非满足性和风险回避两大特征,在风险确定的情况下追求最大化收益,或者在收益确定情况下追求最小化风险。风险价值VaR指在给定时间间隔、置信水平及正常的市场条件下投资组合的最大损失,恰好反映了投资者的两大需求。陈涛等建立了线性规划下最小CVaR(Conditional Value at Risk)套期保值模型[16]612。CVaR作为VaR的修正方法,在次可加性和凸性等方面具有显著优势,而且求解方式也更加简单。段翀以贷款组合的风险调整资本收益率最大化为目标、风险价值VaR为约束条件,建立最优化模型,为投资组合的确定提供了新思路[17]93。
综上所述,目前对于贷款组合确定的研究大多采用目标规划的方法,求解思路因银行目标的改变而改变,且以贷款定价或额度分配中的单一路径进行决策。但在实践中,银行的目标并不单一,会随着经济环境和运营情况的改变而改变,且贷款定价及额度分配也需要综合考虑。因此,本研究试图在目标函数及决策变量的选取上寻求创新,建立银行利益最大化和单位贷款风险最小化的多目标模型,并引入可调动的参数将多目标转化为单目标,使模型更契合实际;同时,引入RAROC定价模型确定基准利率,并将利率增量与企业贷款额度及风险水平综合考虑,从而更全面地反映风险组合中的风险溢价。
技术路线如图1所示。
图1 技术路线图
1.评价指标体系
信息不对称是导致中小微企业贷款难的重要原因。中小微企业往往存在信息不透明、数据不健全等问题,因此在发票贷中,从企业的发票数据中提取企业的征信信息是最主要的任务。
银行通常从定量和定性两个方面对普通企业的客户信用评价设置评价指标,定量评价指基于宏观经济数据及客户提供的财务报表,运用统计模型对定量指标进行违约风险的分析和判断。定性评价是指评价人员根据相关信息和经验,对客户基本情况和主要风险特征进行定性分析和判断。对于面向中小微企业的发票贷,从定量评价角度考虑,进销项的发票额度及其变化情况可以直观反映企业的业务状况和经营能力,发票的正负与有效比例可以反映企业的交易质量。从定性评价角度考虑,企业的属性、信誉评级及历史信贷记录可以很好地衡量企业的信用水平。相关研究表明[18]371,中小微企业借助供应链融资可以降低中小微企业信用风险状况发生的可能,因此也可以根据进销项发票数据中的进销方单位代号提取能反映企业与上下游之间关系的数据特征,拓展仅考虑融资企业经营和信用状况的固有思路,从供应链融资环境视角进行评估。
建立可参考的评级指标体系如表1。
表1 评级指标体系
(1)企业盈利能力(X1)
银行可以根据特定企业的进销项发票信息,得到该企业每一年的进销项平均值、方差、峰值和毛利率情况,其中毛利率=(进项额-销项额)/销项额。银行可以分别计算企业指定年份里这些数字特征的算数平均数,也可以依照如“越接近的年份数据越重要”这样的规则自主设定权重计算加权平均数,以此来反映企业的业务规模和稳定情况,表征企业的盈利能力。以年进项金额方差(X12)为例,X12=A1*第1年进项方差+A2*第2年进项方差+…+An*第n年进项方差,其中A1-An为银行可自行确定的各个年份的权重。
(2)供应链运营能力(X2)
根据企业进销项发票上的单位代号,可以提取企业的上下游情况。本文以季度为单位,计算企业每个季度的上下游企业数量,求平均值(X21、X24)以反映供应链的规模,求方差(X22、X25)和留存率均值(X23、X26)来检验上下游的忠诚,判断供应链是否稳定。其中留存率需要考虑企业的具体交易单位代号的变化情况。假设某企业某季度的上游企业为A、B、C,下一季度的上游企业变为B、C、E、F,未发生变动的企业有2个,分别为B和C,则其当季留存率=2/3。计算所有季度的留存率平均值得到X23。
(3)企业交易质量(X3)
有效发票是指为正常的交易活动所开具的发票。而在为交易活动开具发票后因故取消交易会导致发票作废,即发票无效,因此发票无效率可以在一定程度上体现企业交易的稳定情况。负数发票是指在为交易活动开具发票,并已入账计税后,购方因故产生退货并退款而开具的发票凭证,其数量可以反映企业的交易质量。发票无效率(X31)=无效发票/发票总数,负数发票率(X32)=负数发票数/发票总数。
(4)企业属性(X4)和信誉评级(X5)
企业属性包括企业所属行业(X41)及企业性质(X42),行业划分以2017年发布的《国民经济行业分类》为依据,可分为A-农林牧渔业、B-采矿业、C-制造业等十余种行业。企业性质(X42)包括全民所有制企业(即国有企业)、集体所有制企业、联营企业、三资企业、私营企业及其他企业。X41和X42均根据分类进行赋值。
信誉评级(X5)采用银行内部根据企业的实际情况人工评定的信誉等级进行赋值。
2.二元Logistic模型的建立
二元Logistic回归模型是一种采用最大似然估计法进行参数估计的多变量统计分析方法,将一件事情发生与否作为被解释变量。由于事情发生概率的微小变化很难用一般方法进行观察和处理,因此通常先将取值通过Logit变化转换为目标概率值,采用最大似然估计法计算相关参数,进而计算出相应变量取某个值的概率,即一件事情发生的概率。
在本研究中,假设一家企业的违约情况为Y,则Y=1表示企业违约,Y=0表示企业未违约。若违约概率为p,则1-p表示不违约概率,p的取值范围为[0,1]。通过Logit变换后,p变换为Q(-∞→+∞),Q对p=0或p=1附近的微小变化非常敏感。Logistic回归模型的具体形式为:
(1)
其中,pi为第i个事件发生的概率,它是由解释变量xi构成的非线性函数,将非线性函数转化为线性函数:
β0+β1X1+β2X2+…+βnXn
(2)
其中β0,β1,…βn是参数,Xn为指标对应数值。由于Logistic模型中被解释变量是不连续的二元变量,其残差分布不满足正态分布,因此采用最大似然估计法。最后利用二元Logistic回归模型得到各个企业违约的概率模型:
(3)
为保证研究的科学合理性和现实可行性,针对定量和定性指标分别建立二元Logistic模型,获得定量违约概率(P定量)和定性违约概率(P定性),以两个模型的准确度为权重(α,β)加和获得P0(∈[0,2]),再对其归一化获得违约概率P(∈[0,1])
P0=α*P定量+β*P定性
(4)
1.基准利率——RAROC模型
RAROC模型最初在1970年代后期由Bankers Trust提出,将贷款的期望损失视为成本的一部分,用经风险调整的资本回报率来衡量银行的风险管理能力和去除风险后的盈利水平,在风险管理和绩效评估方面表现出色,被国际许多先进商业银行认可并投入使用,是当前理论与实践界认为最科学的参考定价模型。
因此,本文考虑建立RAROC定价模型来确定各个企业的基准利率。其推导公式如(5)(6)所示。式中r0是基准贷款利率,A是贷款金额,i是资金成本率,oc是经营成本率,DC是占用的存款,RAROC是风险调整的资本收益率,EL是预期损失,EC是经济资本。
(5)
(6)
其中预期损失EL的计算公式如(7)所示。式中P是违约概率,LGD是违约损失率,EAD是违约敞口风险,即贷款额度。
EL=P*LGD*EAD
(7)
经济资本EC是商业银行为了弥补可能出现的意外损失而计提的资本,该值与企业的违约概率和违约损失率相关。新巴塞尔协议中给出了经济资本的计算公式如(8)(9)所示。其中ρ为风险因子载荷。
EC=LGD*
(8)
(9)
2.贷款组合模型
银行建立中小微企业贷款组合模型的实质及目的就是在保证信贷风险可承受的同时,实现银行利润的最大化。因此,本文以银行的风险最小化和利润最大化为目标,以总量控制、贷款组合风险的VaR风险控制和实际贷款为约束构建贷款组合的运筹学模型。
(1)目标函数
本文考虑贷款额度增加所带来的风险溢价,令贷款利率为ri=r0+βjxi(j=1,2,3,4)。其中ri表示第i家企业利率,xi为第i家企业的贷款额度占总贷款额度的比例。βj(j=1,2,3,4)与企业的违约概率相关,将所有企业的违约概率组合以四分位点为依据分为四个级别,其中P25%—P50%是指违约概率处于贷款组合中25%—50%的企业,对应关系如表2。
表2 违约概率与β参数对应关系
A.贷款组合带来的总收益I最大化,同时考虑利率提高可能会带来的顾客流失率li。
MaxI=∑xiri(1-li),li=g(ri)
(10)
B.贷款组合携带的风险最小,即单位贷款额度的信贷风险最小化,Ri代表风险期望即预期损失。
(11)
(2)约束条件
A.VaR约束
VaR即风险价值,指在金融市场正常变化下,某一资产在某种概率水平下和将来一段时间内的期望损失最大值。可表示为:
P(L>VaR)=c
(12)
其中L为投资组合在持有期内的损失,VaR为置信水平1-c下处于风险中的价值。将VaR以收益率的形式作为约束条件可得到:
P(u0<-VaR)=c
(13)
u0表示贷款组合的期望收益率。由中心极限定理可得到:
(14)
(15)
即VaR=φ-1(1-c)σ(X)-u(X),其中φ(x)为标准正态分布的分布函数,u(X)表示贷款组合的收益率期望,σ(X)表示贷款组合的收益率方差。
B.实际贷款约束
由于是信用贷款组合,有分配比例加和与利率上下限的约束。
∑xi≤1,Td≤ri≤Tu
(16)
对于决策变量βj有如下约束,其现实含义是指违约概率越大的企业其风险溢价越大,即随着贷款额度增长,利率增长速度也越快:
β1<β2<β3<β4
(17)
(3)模型建立
本文将xi和βj(j=1,2,3,4)作为决策变量,构建贷款组合配额及定价的最优模型。银行可以根据自身偏好以及经济环境的繁荣或衰退确定两个目标的权重λ1和λ2。对于风险偏好型银行,或者经济环境处于繁荣期时,可使λ1>λ2;反之,则λ1<λ2。依此将多目标转化为单目标。
s.t.φ-1(1-c)σ(X)-u(X)≤VaR
∑xi≤1Td≤ri≤Tu
β1<β2<β3<β4
ri=r0+βjxi,li=g(xi)
(18)
为验证模型的有效性,本文选取2020年高教社杯全国大学生数学建模竞赛中提供的123家有信贷记录的中小微企业数据作为样本,包括企业信息、进销项发票详细信息和贷款年利率与客户流失率的统计数据。代入模型,利用SPSS25软件获得各公司的违约概率如表3。
表3 违约概率计算结果
经营成本率(OC)用银行总体的经营费率表示,由商业银行的业务管理费与贷款总额相除得到;资金成本率(i)用资金付息率表示,由银行利息支出除以银行的计息负债总额得到;风险成本由上述的违约概率与风险暴露相乘获得的预期及非预期损失表示。RAROC值采用企业所属行业的历史RAROC、银行业平均RAROC和银行贷款业务评价RAROC的平均值来表征,即RAROC=Average(行业历史RAROC,银行业平均RAROC,贷款业务平均RAROC)。按照国际信用评级穆迪投资服务有限公司的历史企业贷款数据统计结果,选取企业贷款违约损失率LGD=59%。根据公式,分别计算预期损失EL、经济资本EC和基准利率r0。其中xi表示第i家企业的贷款额度。
根据银行贷款年利率与客户流失率的统计数据,将三类信誉评级顾客的流失率平均值作为该贷款年利率(ri)的对应客户流失率(li),进行回归拟合得到关系:
(20)
为简便运算,这里假定两个目标函数的重要程度相等,即λ1=λ2。因此获得目标函数如下:
(21)
根据银监会规定,为控制风险,在95%置信水平下银行贷款组合实际损失与期望损失不得超过现金与备付金之和,银行现金与备付金之和须大于等于贷款总额的5%。根据上述规定及风险价值内涵,可得VaR=5%*∑xi,置信水平1-c=5%,得到φ-1(1-c)=1.65,代入式子得到约束条件:
0≤xi≤1
β1<β2<β3<β4
(22)
在Python中应用遗传算法,调用Python Geatpy库求解上述优化模型,种群规模2000,迭代数2000000,采用实数编码方式“RI”获得最优目标函数,得到贷款组合结果如表4。
表4 贷款组合结果(部分)
分析表4贷款组合结果可发现,本文设计的决策支持模型所获得的信贷利率和贷款额度可以充分体现中小微企业的信用风险,对于违约概率低、信用风险较小的企业将获得更大的贷款额度和更小的利率波动系数,同时基准利率体现不同行业的外部性收益和信用风险,实现了差异化、精细化的贷款组合决策。
综合新冠疫情、银行信贷能力以及中小微企业的信贷需求等因素,据中国银行业协会正式发布的《2022年中国银行业服务报告》可知,截至2022年末,中国银行业金融机构用于小微企业的贷款(包括小微企业贷款、个体工商户贷款和小微企业主贷款)余额达到59.70万亿元,其中单户授信总额1000万元及以下的普惠型小微企业贷款余额为23.60万亿元,同比增速23.60%,可见帮助中小微企业渡过难关、走出困境是目前国家鼓励的,也是激发市场活力、稳定市场信心的必要之举。然而疫情带来的经济下行加剧了银行对中小微企业风险评估和信贷策略选择的难度。本文以信贷产品“发票贷”为研究对象,试图提供能提高银行对中小微企业贷款信心的风险评估方法,优化面向中小微企业的信贷策略,追求信贷利率与风险的精确匹配,实施个性化和定制化的信贷策略制定,有助于打破中小微企业融资难困境和打造服务型银行提供助力。
本文首先根据发票贷的主体发票所包含的数据进行最大化信息提取,建立了包含企业盈利能力、供应链运营能力、企业交易质量、企业属性和信誉评级等一级指标的指标体系,综合考虑了定量和定性评价水平,运用二元Logistic回归构建了违约概率计算模型。经实践,该模型可以顺利通过检验,具有较高的准确预测度,能达到理想效果。根据模型中获得的违约概率计算RAROC模型中的经济资本和违约损失等参数,根据代表银行的行业平均水平确定资金成本率和运营成本率,进而代入RAROC定价模型获得基准利率定价。然而,该定价模型以企业的违约概率和所属行业为主要影响因素,未考虑贷款额度增加所带来的风险溢价。针对此问题,本文在利率定价和贷款额度之间建立关系,引入与企业违约概率相关的参数,具有“越可能违约的企业,贷款额度增加伴随更大幅度的利率上浮”的内涵,使贷款利率定价实现精细化和差异化。最后以贷款利率和相关参数为决策变量,设计了以企业收益最大化和风险最小化为目标,以组合风险价值VaR为约束条件的多目标规划模型。模型考虑了银行自身偏好和经济环境的变化,提供给银行一定的权重调整空间,具有实践需要的自由度。经真实数据检验,该模型可通过遗传算法求解,具有现实可行性,可以针对中小微企业贷款作出差异化且合理的决策选择。
丁鑫妮原系南昌大学管理学院管理科学专业本科生,现为东南大学经济管理学院硕士研究生。她在本文作者的指导下承担了数据收集与分析的主要工作。