刘平山 曾梓铭
【摘 要】 “两票制”改革下,医药产业链面临重构,医药中小企业融资需求不断增加,从而催生出万亿级别的供应链金融市场。然而,由于医药供应链上信息不对称以及信用风险传染,医药中小企业存在较高的信用风险,如何有效评估医药供应链金融信用风险是把握亿万市场机会的关键。文章结合医药行业特征,构建医药供应链金融信用风险评估体系,并在因子分析基础上,运用梯度提升决策树(Gradient Boosting Decision Tree,GBDT)进行信用风险评估。通过与支持向量机(Support Vector Machine, SVM)、Logistic回归模型和BP神经网络对比,发现GBDT模型具有更高的预测准确率和分类真实性,验证了供应链金融模式下GBDT模型应用于医药行业信用风险评估的优越性和有效性。
【关键词】 医药供应链金融; GBDT模型; 两票制; 信用风险
【中图分类号】 F830.56 【文献标识码】 A 【文章编号】 1004-5937(2021)16-0024-08
一、引言
2017年1月,国家卫计委发布了《关于在公立医疗机构药品采购中推行“两票制”的实施意见(试行)》(国医改办〔2016〕4号),“两票制”改革正式开始试行。“两票制”是指药品从制药厂销售给经销商开一次发票,经销商销售给医院再开一次发票。在“两票制”的政策下,医药流通环节大大缩减,医药产业链上下游两端“多、散、乱”的问题得到有效解决,提高了医药行业的供应链效率,为医药行业的健康发展创造了良好环境。与此同时,医药行业面临重构,扁平化趋势突出,包括制药企业、医药流通企业和代理商等都面临较大的压力和挑战。由于处于供应链强势地位的医院有着普遍的赊销和较长的回款账期,使得处于供应链弱势地位的医药分销企业面临越来越大的资金压力,对融资的需求也不断增加。新的压力也产生了新的機会,从而催生出万亿级别的供应链金融市场。
然而,由于医药供应链上信息不对称,商业银行对于医药中小企业的营运情况、盈利状况等信息掌握不完全,融资过程存在较大不确定性,容易引发信用风险。同时,加上信用风险在供应链上具有传导性,单个企业的信用风险容易传染到供应链上其他企业,使风险危害成倍扩大,对供应链稳定运作产生冲击[1]。我国医药供应链金融处于发展初期,商业银行对利用供应链金融进行融资的医药中小企业的资信水平评估尚不成熟,医药中小企业仍存在较高的信用风险。如何在“两票制”政策下有效评估医药中小企业的信用水平,降低贷款风险的发生,是把握亿万级别市场机会,促进医药供应链金融健康发展的关键。
为提高供应链金融下医药中小企业信用风险评估水平,从医药供应链金融视角,构建基于医药行业的信用风险评估体系,并运用GBDT模型进行信用风险评估。通过与SVM模型、Logistic回归模型和BP神经网络的评估效果进行对比,验证GBDT模型的准确性和有效性,为供应链金融下医药行业信用风险评估提供借鉴。
二、相关文献回顾
关于供应链金融的内涵,Allen et al.[2]最早提出完整的概念框架来分析中小企业信贷问题,初步提出了供应链金融的概念,认为供应链金融能够有效解决中小企业融资困难。Atkinson [3]指出供应链金融是技术和服务的结合体,通过联系供应方、需求方和金融服务商,为供应链上下游企业提供产品和服务,以加快资金周转、增加供应链的可视度和降低中小企业的融资成本。胡跃飞等[4]从银行角度出发,认为供应链金融是对供应链上各企业的金融资源进行有效整合,并通过引入金融服务商为供应链中的资金流管理提供一系列解决方案。Gomm[5]提出,供应链金融通过对供应链中的现金流进行有效的管理和控制,可以降低融资风险和融资成本,提高供应链的整体运作效率。Wuttke et al.[6]认为,供应链金融是在供应链的基础上,使买方可以使用反向保理,从而提供透明灵活的资金解决方案,实现供应链融资结构的优化。卢强等[7]认为供应链金融主要由供应链上的参与者和支持者构成,是建立在供应链网络交易关系基础上的金融活动,其融资贷款的基础不是简单的软信息或硬信息,而是供应链网络的资产和运营资金。
在供应链金融风险度量指标的选择方面,熊熊等[8]从质押物的特征、交易对手的能力和行业环境等方面设计供应链金融风险评价指标,建立了主体和债权评级的信用风险评估体系。黄静思等[9]结合供应链的影响因素和企业的宏观环境,通过层次分析法得出要重视整个供应链的系统风险。逯宇铎等[10]利用汽车行业的中小企业数据进行实证分析,得出供应链金融信用风险发生与资产负债率和产权比率呈负相关关系,与企业的营运能力、偿债能力、成长能力和供应链的关系强度呈正相关关系。刘艳春等[11]建立了SEM和灰色关联度模型,发现企业自身状况、行业风险和供应链营运能力与供应链金融下企业的信用风险正相关,认为要加强中小企业数据库的建设。范方志等[12]选取融资企业财务数据、核心企业财务数据和融资项目的特征等指标,采用定性与定量相结合的方法评估中小企业信用风险,发现中小企业信用风险主要来源于自身。何平均等[13]在供应链金融信用风险评价指标中加入了客户集中度,得出客户集中度能够显著提高Logistic回归模型的预测准确度。
在供应链金融风险评估的模型选择方面,胡海青等[14]结合核心企业信用状况和供应链关系,发现基于SVM的信用风险评价模型在供应链金融风险评估中更具有优越性。李晓宇等[15]基于商业银行视角,从第三方企业、核心企业、融资企业和外部风险四个方面进行供应链金融信用风险评价,构建了基于Logistic分析的信用风险评估模型,为商业银行降低信贷风险提供借鉴。吴屏等[16]通过归纳供应链金融风险因素的特征,建立基于BP神经网络的信用风险评估体系并验证了其有效性。徐鹏[17]通过结构方程模型对线上农产品供应链金融风险进行评估,解决了风险指标关联性较重的问题,发现信用风险对线上农产品供应链金融的影响最大。戴昕琦[18]利用随机森林与SMOTE算法,并结合线上供应链金融融资模式特点,建立信用风险评估模型,证明了基于C-SMOTE算法的随机森林模型能显著降低商业银行线上供应链金融风险。李健等[19]以汽车供应链作为样本,运用随机森林模型和盲数理论筛选变量,并通过对比多种评估模型的预测效果,发现PSO-SVM模型具有较高的预测准确率。刘兢轶等[20]从制造业中小企业的财务数据出发,构建了供应链金融模式下中小企业信用风险评估指标体系,并结合因子分析和Logistic回归模型进行信用风险评价。
当前对供应链金融信用风险评估的研究主要集中在汽车、制造业和农业等领域,关于医药领域的研究较少。此外,在评估模型的选择上,使用集成算法的研究较少。GBDT模型由于其数据处理能力强、调参优化时间短和对异常值的鲁棒性强等特点,在各个领域得到广泛的应用。例如,谭中明等[21]从借款人决策行为角度出发,通过Logistic回归模型筛选显著性变量,运用GBDT对P2P网贷借款人的信用风险进行评价,实验结果表明GBDT具有较高的预测精度和稳定性。鉴于此,通过结合医药供应链金融的特点,从融资企业状况、核心企业状况、融资项下资产状况和供应链整体状况四个层面,构建基于医药行业的信用风险评估体系,并通过对比GBDT模型、SVM模型、Logistic回归模型和BP神经网络的信用风险评估效果,以进一步完善供应链金融下医药企业信用风险评估方面的研究。
三、评估体系与算法模型
(一)评估体系
供应链金融以整条供应链为考察对象,改变了传统的风险管理模式,将针对单个企业的风险,转换为整条供应链的风险,因此,仅以单一融资企业的财务数据作为评估标准的传统信用风险评估体系不再适用。通过对以往文献采用的评估指标进行归纳和总结,结合医药供应链金融信用风险的特征,从融资企业状况、核心企业状况、融资项下资产状况和供应链整体状况四个层面,构建医药供应链金融信用风险评估体系(详见表1)。
1.融资企业状况。融资企业作为供应链金融业务的融资主体,其自身状况对信用风险评价具有重要影响。该实验主要从企业基本素质、盈利能力、偿债能力、成长能力和营运能力五个方面进行融资企业状况评价。其中,企业基本素质主要由企业规模、财务披露质量和企业管理水平表示;盈利能力、償债能力、成长能力和营运能力主要参考传统信用风险评级指标,由相关财务数据表示。
2.核心企业状况。核心企业是供应链金融的切入点,能够为融资企业提供支持和担保,是维持供应链金融稳定运作的关键因素。本文从盈利能力、偿债能力和信用状况三方面反映核心企业状况。这三方面因素能够体现核心企业还款意愿的强弱,一旦中小企业无法偿还贷款,核心企业也可以通过履行回购协议和担保义务,有效降低信用风险的发生。
3.融资项下资产状况。融资项下资产是金融机构重点关注的对象,一方面,融资项下资产与企业的盈利情况密切相关,直接影响企业的还款能力;另一方面,一旦企业违约,金融机构将通过变卖融资项下资产变现,以弥补损失。本文运用存货质量、应收账款质量和预付账款质量来衡量融资项下资产状况。
4.供应链整体状况。供应链整体状况影响着供应链节点上的每个企业,当供应链整体运作出现问题,链上每个企业的运营状况也会受到牵连,从而增加信用风险发生的概率。本文从宏观环境和供应链运营状况两个角度来衡量供应链的整体状况,其中宏观环境由地区经济环境和行业发展前景来衡量,供应链运营状况由信息化水平和协同处理能力来衡量。
(二)算法模型
GBDT是一种基于Gradient Boosting策略训练出来的决策树类算法,主要由梯度提升、决策树算法和缩减三部分构成。GBDT的核心思想是减少残差,其每一次迭代是为了减少上一次迭代所产生的残差。当模型预测结果与实际观测值不一致时,在残差减少的梯度方向生成一棵新的决策树,以减少上一次的残差,连续反复迭代直至输出结果与实际观测值基本趋近一致。模型不断优化改进的一个标志是模型的损失函数迭代下降,GBDT算法就是在损失函数梯度下降方向构建新的模型。
1.初始化估计函数,使损失函数极小化
f0(x)是只有一个根节点的树,L(yi,c)是损失函数,其中c是使损失函数最小化的常数。
2.令迭代次数为m=1,2,…,M
(1)对样本i=1,2,…,N,计算损失函数的负梯度,把它作为残差估计:
(2)拟合残差对rm j生成一棵回归树,以估计回归树叶节点区域,得到第m棵树节点区域Rm j,j=1,2,…,J。
(3)对j=1,2,…,J,利用线性搜索估计叶节点区域的值,令损失函数最小化:
(4)更新学习器fm(x):
3.在相同的叶节点区域将所有cm j值累加,得到最终回归树
四、信用风险实证分析
(一)数据的收集与说明
以供应链金融业务发展相对成熟的医药行业为研究对象,通过在中小板和创业板上选取110家医药企业、2017—2019年度数据作为研究样本。定量指标数据主要通过国泰安数据库、锐思数据库以及行业报告中获取;定性指标数据主要参考企业公告和新浪财经等相关财经网站披露的信息进行评分。以下对财务披露质量、企业管理状况、对外担保情况、履约情况、信息化水平和协同处理能力六个指标的衡量方式进行详细说明,主要参考戴昕琦[18]和李健等[19]的研究进行衡量。
1.财务披露质量。根据企业是否有因财务披露问题而受到处分进行评分,分值区间为0—1。无处分为1分,存在一项处分扣0.2分,扣完为止。
2.企业管理状况。根据企业高管是否因为管理原因受到处分进行评分,分值区间为0—1。无处分为1分,存在一项处分扣0.2分,扣完为止。
3.对外担保情况。根据企业的对外担保数量进行评分,分值区间为0—1。无担保为1分,存在一笔担保扣0.2分,扣完为止。
4.履约情况。根据企业是否因未履约而被起诉进行评分,分值区间为0—1分。没有因未履约而被起诉为1分,存在一起诉讼扣0.2分,扣完为止。
5.信息化水平。参照李健等[19]的研究,企业信息化水平可表示为存货占用资金与流动资金之比,因此供应链整体信息化水平可用融资企业与核心企业存货占用资金与流动资金之比的均值来衡量。
6.协同处理能力。参照李健等[19]的研究,企业协同处理能力可用企业的存货周转率来衡量,因此供应链整体协同处理能力可用融资企业与核心企业存货周转率的均值来衡量。
(二)因子分析
由于选取了30个初始变量,变量维数较高,无论是使用经典计量算法或机器学习算法,都存在模型指标的高相关性和高维性,导致模型拟合过度、参数估计无效等后果。因此,先对变量进行因子分析,提取出具有主要解析能力的变量,再利用得到的变量进行实证分析。
在做因子分析之前,需要检验各变量之间的关联度,判断变量是否适合做因子分析。利用KMO和Bartlett检验对因子分析的可行性做出评判。一般情况下,当KMO值大于0.9,说明很适合做因子分析;介于0.8—0.9之间说明适合;介于0.6—0.8之间说明一般适合;在0.5以下说明不适合做因子分析。表2为KMO和Bartlett检验的结果,其中KMO值为0.649,KMO>0.6,说明能够对以上变量做因子分析。
利用最大方差旋转分析法,选取特征值大于1的主成分变量。主成分变量特征值大于1的是前9个变量,其特征值分别是4.032、3.303、2.961、2.363、2.170、1.802、1.798、1.592和1.086,方差贡献率分别为13.439%、11.009%、9.871%、7.876%、7.233%、6.007%、5.992%、5.305%和3.620%,累计方差贡献率达到70.352%,表明这9个主成分能够较好地反映所有变量信息。因此,选取F1—F9作为初始变量,进行实证分析。
由表3旋转后成分矩阵可知,F1在X4、X5、X6、X7和 X24上具有较高的载荷,可以表示为融资企业的盈利能力和存货质量;F2在X8、X9、X10和X11上具有较高的载荷,可以表示为融资企业的偿债能力;F3在X18、X19、X20和X21上具有较高的载荷,可以表示为核心企业的盈利能力和偿债能力;F4在X16、X17和X26上具有较高的载荷,可以表示为融资企业的营运能力和预付账款质量;F5在X15、X29和X30上具有较高的载荷,可以表示为融资企业的存货周转能力和供应链运营情况;F6在X2和X3上具有较高的载荷,可以表示为融资企业的基本素质;F7在X12和X14上具有较高的载荷,可以表示为融资企业的成长能力;F8在X22和X23上具有较高的载荷,可以表示为核心企业的信用状况;F9在X25和X28上具有较高的载荷,可以表示为应收账款质量和行业发展前景。
(三)实证结果分析
模型的评估效果主要以训练集准确率、测试集准确率、总体准确率、第一类错误率和AUC值这五个指标衡量。其中,第一类错误率表示模型有效识别违约企业的能力,该值越小,说明模型识别违约企业的能力越强。AUC值表示模型的分类性能,该值越接近于1,说明分类真实性越高。
将因子分析提取出来的9个因子作为解释变量,运用Python3的Anaconda科学计算平台构建GBDT模型,对330个样本进行信用风险评估。为确保模型的有效性和泛化能力,选择70%的样本作为训练集,30%的样本作为测试集。
为了进一步优化GBDT模型的分类性能,需要对相关参数进行调试。首先将learning_state定为0.1,然后利用网格搜索法对其他参数进行优化。经调试,得到n_estimators=70,max_depth=9,min_samples_split=50,max_features=3,subsample=0.5。以训练集231家企业(样本数的70%)的数据为基础,将9个解释变量作为输入变量进行训练,构建GBDT预测模型。运用得到的GBDT模型对测试集样本进行测试,并将评估结果与SVM模型、Logistic回归模型(LR)和BP神经网络进行对比,结果见表4。
由表4可知,GBDT模型的训练集准确率、测试集准确率和总体准确率均高于SVM模型、Logistic回归模型和BP神经网络,说明GBDT模型具有更高的预测准确率。GBDT模型的第一类错误率为19.2%,远低于其他3个模型的第一类错误率,表示GBDT模型能更有效地识别违约企业,防止违约风险的发生。
AUC值可由ROC曲線下的面积来表示。由图1可知,GBDT模型的AUC值为0.97,比SVM模型的AUC值高了0.01,并高于Logistic回归模型和BP神经网络的AUC值,说明GBDT模型具有更高的分类真实性。
五、结论与建议
从医药供应链金融视角,构建了基于医药行业的信用风险评估体系,并在因子分析基础上,运用GBDT模型进行信用风险评估。通过与SVM模型、Logistic回归模型和BP神经网络对比,发现GBDT模型具有更高的预测准确率和分类真实性,证明了医药供应链金融模式下GBDT模型的优越性和有效性,更符合商业银行对融资企业信用风险评估的要求。根据研究结论,本文提出如下三方面建议:
第一,医药行业要构建具有自身特性的信用风险评估体系。医药行业要充分分析“两票制”改革对自身产业链的影响,结合医药行业的特性选择合适的评价指标和有效的算法模型,构建具有医药行业特色的信用风险评估体系,为企业融资贷款决策提供科学的评判依据。同时,成立相关的风险管理团队,根据经济环境和政策的变化,及时制定科学的风险防控措施。另外,要健全企业财务制度,提升品牌影响力和加强资金流转性,以提高供应链金融下医药企业自身的信用等级,加强信贷审批的竞争力。
第二,商业银行要完善医药行业信用数据库。商业银行需要对医药供应链上的每个参与方进行信用审核,加强信用数据库建设,帮助有融资需求的医药企业创建信用档案,作为企业申请融资贷款和商业银行进行信用风险评估的重要参考依据。同时利用大数据技术及时更新企业信用数据,对企业的经营状况实时动态跟踪,帮助商业银行对风险事件做出快速响应。此外,商业银行要根据医药企业的需求和医药产业链的运作特点,进行金融产品创新,优化业务流程,以丰富融资途径和提高融资效率,减少信用风险事件的发生。
第三,政府应为医药供应链金融的发展创造良好的市场环境。我国医药供应链金融处于发展初期,尚未构建完善的评估体系对企业的信用风险进行研究,因此政府需要加大金融市场监管力度,完善相关法律法规,强化政策激励措施,为医药供应链金融的发展创造良好的市场环境。同时要建立相关征信机构,搜集医药产业链上每个参与方的信用信息,并对社会公开企业的不良信用记录,以强化企业的信用意识,降低企业的违约风险。
【参考文献】
[1] HALLIKSA J,VIROLAINEN V M,TUOMINEN M.Risk analysis and assessment in network environments:a dyadic case study[J].International Journal of Production Economics,2002,78(1):45-55.
[2] ALLEN N B,GREGORY F U.A more complete conceptual framework for SME finance[J].Journal of Banking and Finance,2006,30(11):2945-2966.
[3] ATKINSON W.Supply chain finance:the next big opportunity[J].Supply Chain Management Review,2008,
22(4):14-17.
[4] 胡跃飞,黄少卿.供应链金融:背景、创新与概念界定[J].金融研究,2009(8):194-206.
[5] GOMM M L.Supply chain Finance:applying finance theory to supply chain management to enhance finance in supply chains[J].International Journal of Logistics,2010,13(2):133-142.
[6] WUTTKE D A,BLOME C,FOERSTL K,et al.Managing the innovation adoption of supply chain finance—empirical evidence from six european case studies[J].Journal of Business Logistics,2013,34(2):148-166.
[7] 卢强,宋华,于亢亢.供应链金融中网络连接对中小企业融资质量的影响研究[J].商业经济与管理,2018(9):15-26.
[8] 熊熊,马佳,赵文杰.供应链金融模式下的信用风险评价[J].南开管理评论,2009,12(4):92-98.
[9] 黄静思,宋河,宋新红.供应链金融贷款风险识别与评价方法研究[J].金融理论与实践2014(2):46-49.
[10] 逯宇铎,金艳玲.基于Lasso-logistic模型的供应链金融信用风险实证研究[J].管理现代化,2016(2):98-100.
[11] 刘艳春,崔永生.供应链金融下中小企业信用风险评价——基于SEM和灰色关联度模型[J].技术经济与管理研究,2016(12):14-19.
[12] 范方志,苏国强,王晓彦.供应链金融模式下中小企业信用风险评价及其风险管理研究[J].中央财经大学学报,2017(12):34-43.
[13] 何平均,李菁菁.客户集中度与供应链金融信用风险——基于中小企业板制造业上市公司的实证研究[J].征信,2018(7):21-26.
[14] 胡海青,张琅,张道宏.供应链金融视角下的中小企业信用风险评估研究——基于SVM 与BP神经网络的比较研究[J].管理评论,2012,24(11):70-80.
[15] 李晓宇,张鹏杰.中国商业银行供应链融资的风险评价研究.金融论坛,2014(9):49-56.
[16] 吴屏,刘宏,刘首龙.试析线上供应链金融信用风险——基于BP神经网络的模型设计[J].财会月刊,2015(23):105-108.
[17] 徐鹏.线上农产品供应链金融风险防范研究[J].华南农业大学学报,2016,15(6):93-103.
[18] 戴昕琦.商业银行信用风险评估模型研究——基于线上供应链金融的实证[J].软科学,2018,32(5):139-144.
[19] 李健,张金林.供应链金融的信用风险识别及预警模型研究[J].經济管理,2019,(8):178-196.
[20] 刘兢轶,王■婧,王静思.供应链金融模式下中小企业信用风险评价体系构建[J].金融发展研究,2019(11):63-67.
[21] 谭中明,谢坤,彭耀鹏.基于梯度提升决策树模型的P2P网贷借款人信用风险评测研究[J].软科学,2018,32(12):136-140.