公司债券信用利差微观影响因素研究
——基于机器学习方法的分析

2024-02-28 08:26江海潮刘一达
吉林工商学院学报 2024年1期
关键词:公司债券利差评级

江海潮,刘一达

(湖南科技大学 商学院,湖南 湘潭 411201)

一、引言

自2007年中国证券监督管理委员会颁布实施《公司债券发行试点办法》以来,中国公司债券市场迅速发展。截至2021 年末,中国债券市场上存有公司债券10 302 只,票面总额达9.3 万亿元,占债券市场的7.19%。与此同时,公司债券违约风险明显增加。根据中国债券信息网披露,不仅民企债券不时发生违约,国企债券也发生过违约,我国债券刚性兑付被打破。仅2021 年,中国公司信用类债券违约金额达854.6 亿元,债券违约率为0.95%①数据来源:中央国债登记结算有限责任公司中债研发中心《2021年债券市场分析研究报告》。。因此,结合公司债券信用风险确定不同信用公司债券价格特别是不同信用债券的利差,是识别公司债券风险、保护公司与投资者利益、促进我国债券市场平稳可持续发展的核心课题。

信用利差一般被认为是投资者对违约风险高于无风险利率水平补充的利差,即投资者风险补偿。理论上讲,不同的信用债券有不同的信用利差补偿,不少学者展开了深入研究,探讨公司债券信用利差决定因素。早期Merton(1974)[1]利用Black-Scholes(1973)期权定价理论,构建了结构化模型,发现企业资产价值波动、杠杆率、资产负债率等因素均会影响公司债券信用利差,但该模型通常会低估债券信用利差[2]。此后,诸多学者在Merton模型基础上引入信用风险、利率、所有权结构等因素,以拓展公司债券信用利差解释能力,进一步发现债券信用利差受公司杠杆率[1]、信用评级[3-4]、产权性质[5]、所有权结构[6]等复杂因素非对称影响。一些关于我国的经验研究表明,我国债券具有信用差异性[3][7],信用评级影响债券融资成本[4][7],产生债券信用利差[8-10],并发现债券信用利差由众多复杂因素决定[5][7][9-12]。陶雄华等(2020)[10]指出了信用风险对债券信用利差的具体贡献,但没有系统地讨论主要因素对公司债券信用利差的具体贡献,而且主要采用计量模型方法确定因素的影响效应。赵静和方兆本(2011)[13]对我国公司债券信用利差影响因素做出过结构化分析。因此,我国公司债券信用利差影响因素有哪些,如何测度因素的信用利差贡献,各因素的信用利差贡献有多大仍需要深入探讨。为此,本文在已有研究基础上,以我国上市公司二级市场公司债券为研究对象,运用多种机器学习方法,测度各因素影响公司债券信用利差的SHAP值,进而确定各因素的影响贡献。

与以往的研究相比,本文的贡献主要有两点。第一,与已有研究不同的是,使用多种机器学习方法对影响公司债券利差各主要因素进行学习训练,极大提高了模型对公司债券信用利差的预测能力与结论的稳健性。第二,创新地使用SHAP方法识别公司债券信用利差影响因素贡献率,发现了公司债券信用利差影响因素多样性、不同信用公司债券主要影响因素存在信用异质性。此外,本研究还为债券投资者进行债券投资的决策、识别债券风险、选择信用利差影响因子提供了相关的参考。

二、文献回顾

公司债券信用利差影响因素十分复杂。早期Fisher(1959)[14]思考债券定价因素,试图揭示债券价格差异内在原因。其后Merton(1974)[1]利用Black-Scholes的期权定价理论,提出了结构化模型,分析公司债券定价,拓展了公司债券利差内在决定因素研究。后续研究一是沿着债券微观个性因素展开研究,发现债券期限、债券发行量、票息利率、债券人保护性条款、债券杆杠比率等因素非对称影响公司债券利差[8],但Emo等(2004)[15]认为仅仅考虑债券个性影响因素对公司债券信用利差的解释能力相当有限。二是思考债券信用利差市场决定因素。何平和金梦(2010)[4]、陈关亭等(2021)[7]发现市场债券信用评级对债券发行成本具有重要影响力,进而影响不同信用债券利差。王安兴等(2012)[16]通过时间序列回归分析发现公司债券利差变化受市场投资换手率、月交易天数比例等市场因素的影响。三是关注公司层面因素。方红星等(2013)[5]发现公司产权结构可能是影响债券利差因素之一,有证据表明国有产权通过直接和间接作用途径降低投资者面临的违约风险,从而使公司债券获得较低的信用利差。Boubakri和Ghouma(2010)[6]发现跨国公司股权结构影响债券利差,因为跨国公司股权集中度被债券持有人和评级机构视为违约风险信号,股权越集中违约风险就越高,进而要求提高债券的信用利差。凌爱凡和谢林利(2023)[12]基于Merton 违约模型,把公司权益极端尾部风险与公司债券信用利差的理论相联系,实证了公司杠杆率是极端尾部风险影响公司债券信用利差的重要渠道,公司杠杆率与公司债券信用利差具有正相关关系。赵静和方兆本(2011)[13]认为公司股票波动率、流动性指标、公司杠杆比率、行业类别及市场系统性风险这些影响因素对公司债券信用利差有较好的解释力。近几年,随着股权质押这种新的融资方式的发展成熟,许多学者也研究了股权质押对公司价值和公司融资成本的影响。史永东等(2021)[17]发现公司控股股东股权质押显著提高了发债企业二级市场信用利差,这种现象在控制权转移风险较高的企业中表现得更加明显。四是研究了公司债券信用利差宏观影响因素。国内外许多学者将利率期限结构、GDP增长率、宏观经济波动、货币增速、货币政策等宏观因素引入公司债券定价模型,发现宏观因素非对称影响公司债券利差[9][11]。

现有研究表明,公司债券信用利差的影响因素众多、作用机制复杂、效应不一,但究竟哪些因素是公司债券信用利差的主要影响因素,现有研究则关注不多。陶雄华等(2020)[10]、晏艳阳和刘鹏飞(2014)[18]使用传统线性回归模型和向量自回归模型方法,分析公司层面因素与宏观因素对公司债券信用利差的影响程度。这些文献对研究我国公司债券信用利差影响因素有重要意义,但线性回归模型或向量自回归等模型方法存在方程分析复杂、高维度、具有噪音的金融市场数据解释能力不高、样本外的预测误差较大等缺点,需要用机器学习方法予以完善,进而提高模型的预测能力。

本文侧重于公司债券信用利差的微观影响因素,针对已有研究不足,使用多种机器学习方法对2008—2022年我国公司债券信用利差影响因素进行深入分析,再使用SHAP值解释性方法计算各影响因素对公司债券信用利差的贡献率,从而识别出债券信用利差的主要影响因素,并进一步分析债券信用利差主要影响因素的影响。

三、研究设计及说明

为深入分析公司债券信用利差影响因素及计算各影响因素贡献率,识别出主要影响因素,构建如下研究路线。(1)手动整理现有公司债券信用利差影响因素的文献,筛选影响公司债券信用利差因素。(2)对影响因素进行相关性检验。为检验因素之间是否存在多重共线性,主要采取方差膨胀因子(Variance Inflation Factor,VIF)检验,除去VIF值大于10的因素,确保因素间无多重共线性。由于篇幅原因,VIF检验结果未予列示。(3)通过建立多种线性机器学习模型对非线性数据进行训练,通过调节模型的超参数,得到符合预期拟合优度R2的预测器,比较线性机器学习与非线性机器学习模型的拟合效果。(4)采用SHAP的解释性方法计算各影响因素的贡献率,研究公司债券信用利差重要影响因素。(5)通过建立多元回归模型,探究重要影响因素对债券信用利差预测的影响。(6)通过信用评级分组,探究重要影响因素对不同评级债券信用利差的异质性影响。

(一)机器学习模型及参数设定

本文采用随机森林模型、BP神经网络、K近邻模型和支持向量回归模型四种经典的非线性机器学习模型以及普通线性回归、Lasso回归和Bridge回归三种线性回归对样本进行训练,各模型设定参数如表1所示。

表1 模型参数设定

(二)SHAP的解释性方法

机器学习模型相比于传统的线性回归模型,往往具有更高的预测准确率,但因过于复杂使其解释性低下。Lundberg 和Lee(2017)[19]提出了解释机器学习模型的SHAP(Shapley Additive Explanations)统一框架,用于解释机器学习模型中每个因素对目标预测值影响的大小。

为确定因素SHAP值,记xij为机器学习模型f(x)上的第i个样本的第j个因素,集合M为所有特征的全集,|M|为特征集M中元素的数量。机器学习模型f(x)在特定样本点xi上的预测值f͂(xi)可以表示为:

其中,ϕ0为预测值的均值E(f͂(x)),作为模型预测的基准值。ϕij为样本xi中的第j个特征的SHAP值,代表了该特征对预测值影响的大小。当ϕij>0 时,表示该因素对该样本正向影响;当ϕij<0 时,表示该因素对该样本具有负向影响。ϕij的计算公式如下:

其中,S表示的是集合M中不包含特征j的子集,vi(S)表示在样本为xi时特征集合S下的预测值,表示在特征集合S中增加特征j所引起的预测值的改变,代表了特征j对特征集合S的边际贡献。项目代表了特征集S的权重。

若训练集有N个样本,则某一特征j的贡献值(Contribution Value,CV)由训练集上该特征上所有样本的SHAP值绝对值的均值刻画,其计算公式如下:

本文记某一特征j的贡献率(Contribution Rate,CR)为CRj,由该特征的贡献值占所有特征SHAP 值之和的比例来刻画,其计算公式如下:

(三)样本SHAP值的多元回归模型的设定

为了探究信用利差影响因素对债券信用利差预测的影响,本文参照已有研究设定如下多元线性回模型:

其中,SHAPi,j为样本i在影响因素j下的SHAP 值,Bondi,jˉ为样本i的个券层面变量(不包括影响因素j),Cori,jˉ为样本i的公司层面变量(不包括影响因素j),Yeari为样本i的时间趋势项。本文主要关注各影响因素系数β1的方向和大小,为了便于比较各影响因素系数β1的大小,对所有连续变量进行标准化处理,系数β1的绝对值|β1|越大,代表对被解释变量SHAP 的影响越大。

四、数据与样本

(一)样本选择

为研究公司债券信用利差主要影响因素,以2008—2022年我国A股上市公司在沪、深证券交易所的固定利率公司债月度交易数据作为研究样本,并对样本进行如下处理:(1)剔除金融行业上市公司样本;(2)剔除ST、*ST类上市公司样本;(3)剔除债券计息类型为浮动利率和累计利率的样本;(4)剔除可赎回、可回售的债券样本;(5)剔除关键变量数据缺失的样本;(6)对所有连续变量在0.5%和99.5%的水平上进行Winsorize处理,以剔除异常样本干扰。最终得到11 183个观测样本,涉及229家上市公司发行的515只债券。

本文使用python 10.1 软件中的机器学习算法和SHAP 方法进行样本训练,使用了python10.1 中的sklearn库和shap库。

(二)相关变量说明

债券信用利差(CS)为被解释变量,定义为公司债券到期收益率与同一交易日具有相同剩余期限的无风险债券到期收益率之间的差额,无风险债券到期收益率通过我国国债到期收益率曲线得到[20],某一月份的公司债券信用利差等于该月有效交易日信用利差的均值。

已有研究表明,债券个性因素是公司定价的基础性因素。本文考虑信用评级(Rating)、债券发行规模(Bondsize)、月交易天数比例(Day)、债券剩余期限(Term)、换手率(Tyr)作为公司债券个性因素的代表。其中信用等级采用通用做法转化为有序量表,样本中信用评级AAA级赋值为3,AA+级赋值为2,AA级及以下赋值为1;债券发行规模为债券发行价格与债券发行数量的乘积;月交易天数比例参考王兴安等(2012)[16],为月度有交易天数与月度市场总交易天数之比,取值在0和1之间;债券剩余期限为债券交易月度债券剩余期限的日均值;换手率为债券月度交易额占发行额的比例。

公司个性因素选取产权性质(Soe)、公司规模(Size)、资产回报率(Roa)、资产负债率(Lev)、股价收益波动率(Volatility)、股权质押比例(Pled)、第一大股东持股比例(Firstshare)、公司所属行业(Industry)。其中产权性质,当发债公司产权性质为国有时赋值1,其他赋值0;公司规模为资产总量;资产回报率为公司净利润除以总资产余额;资产负债率为总负债除以总资产;股价收益波动率为每月有效交易日股价收益波动率的均值;股权质押比例,若当月发债公司控股股东不存在股权质押,赋值为0。需要说明的是,由于上市公司只汇报公司规模、资产回报率、资产负债率的季度数据,因此参考张春华等(2017)[21]做法,采用三次样本插值把季度数据转化为月度数据,转化后数据能较好地反映季度数据的变化趋势。由于公司所属行业为名义变量,采用均值编码对上市公司编码赋值。

使用债券所属年份(Year)作为时间趋势项,用以解释其他自变量解释不了的因变量的外生增加或下降。

(三)样本描述性统计

表2展示了样本相关变量的描述性统计结果。经过Winsorize处理后可以看到,月度公司债券信用利差的均值为1.907%,最小值为-0.378%,最大值为18.09%,说明我国公司债券信用风险普遍存在且存在异质性。债券剩余期限的均值为2.812 年,标准差为2.251 年。月交易天数比例和换手率的均值分别为0.314、0.714%,表明我国公司债券交易市场并不活跃,公司债券的流动性较差。发债上市公司的规模和资产回报率存在较大差异,公司规模最小值为17.76亿元而最大值达26 801亿元,资产回报率最小值为-8.173%而最大值为12.517%,发债上市公司各月份的资产负债率均值为60.45%,股价收益波动率的均值为2.231%。发债上市公司第一大股东持股占比最小值为7.84%,最大值为86.35%。股东股权质押比例均值为5.699%,标准为18.58%,表明各月份中我国发债上市公司股东以股权质押方式进行融资的比例并不高,但质押比例具有较大差异。

篇幅原因,样本数据各变量的Pearson相关系数未予列示。

五、实证结果与分析

使用多种机器学习方法对2008—2022年我国公司债二级市场的月度样本进行训练与预测,以SHAP方法识别公司债信用利差影响因素的贡献程度,通过对比多种机器学习方法进行重要性程度排名,并针对重要影响因素进行全面分析。

表3报告了机器学习方法进行样本拟合的比较结果。通过比较训练集与测试集的均方根误差(RMSE)和决定系数(R2)可以发现,在相同的训练集上,采用非线性机器学习方法拥有比线性机器学习方法更好的拟合和泛化能力,其中随机森林方法无论是在训练集还是验证集上的拟合能力与泛化能力均高于其他非线性机器学习方法。

表3 不同机器学习方法拟合效果

表4报告了四种非线性机器学习模型对信用利差影响因素的贡献率结果,加权贡献率为以各机器学习模型的Test R2作为权重进行加权。通过全面分析各个影响因素,主要有以下发现。

表4 非线性机器学习方法下各影响因素的贡献率

第一,以加权贡献率是否大于平均贡献率为标准,信用利差影响因素可以分为两部分。第一部分为重要影响因素,包括信用评级、月交易天数比例、股权性质、时间趋势、公司规模五个影响因素,具体加权贡献率分别为17.9%、13.1%、10.9%、10.1%、8.9%,合计贡献率高达60.9%。其中,信用评级在所有模型中贡献率均为第一且远高于其他影响因素,说明债券信用评级是投资者识别债券信用利差的首要因素。时间趋势的加权贡献为10.1%,在所有模型中均位列第四,但并不具有明显的经济学意义,因此在后续分析中不考虑时间趋势项。第二部分为次要影响因素,包括企业资产负债率、债券剩余期限、控股股东股权质押比例、资产回报率、公司所属行业、第一大股东持股比例、公司股价波动和债券换手率,次要影响的因素贡献率从2%至6.4%不等,合计为39.1%,均低于平均贡献率,说明这些因素对公司债券信用利差的影响较小。

第二,进一步分析重要影响因素对公司债券信用利差的影响。表5报告了重要影响因素在不同机器学习方法下对SHAP值的线性回归系数β1,回归模型使用公式(5)。

表5 重要影响因素在不同机器学习方法下对SHAP值的线性回归系数

1.信用评级的增加会推动债券信用利差的预测值减小。图1中左图展示了随机森林模型下,不同信用评级的SHAP值分布以及对应经过同一比例放缩后的概率密度曲线,其他模型分布相似不再赘述,下同。其主要存在两个特征:一是随着信用评级的增加,SHAP值的分布曲线整体向下移动,表5中信用评级的回归系数在1%的水平上显著为负也反映了该特点,说明随着信用评级的增加会导致信用利差的预测值减小;二是信用评级为AA+级和AA级及以下的SHAP值分布总体处在0以上,而AAA级的SHAP值总体分布处在0以下,说明在不考虑其他因素的作用,当债券拥有AAA级的信用评级时,该债券预期的信用利差会低于债券信用利差的总体水平,反之会高于债券信用利差的总体水平。该结论与已有文献的结论一致,信用评级可以发挥降低信息成本、提升配置资源效率的作用,高信用评级的公司债券有更低的信用利差。

图1 信用评级与股权性质概率密度曲线图

2.产权性质为国有时,债券信用利差的预测值更小。表5中产权性质的回归系数在1%的水平上显著为负,图1中右图显示,当公司的产权性质为国有时,SHAP值总体分布处于0以下,表明国有上市公司发行的公司债券具有更低的信用利差。国有企业由于要承担政府的部分社会职能,过高的风险承担不利于实现政治目标和社会稳定[22],因此相对于非国有上市公司,国有企业会更加倾向于风险规避与稳健的投资策略[23],在二级债券市场上体现为更低的公司债券信用利差。

3.债券月交易天数比例增加会推动信用利差的预测值增大。月交易天数比例在一定程度上反映了公司债券的流动性水平。不同模型下债券月交易天数比例的回归系数较为稳定,范围从0.1656至0.1816,并且均在1%的水平上显著为正,说明债券交易频率对债券信用利差具有正向影响。从博弈论的角度对此可能的解释为,当投资者认为某一资产的信用风险提高时,为了维持资产组合的风险水平,会更倾向于优先交易相对风险更高的资产,使得该资产的交易频率增加,而市场上其他投资者也同样明白这一点,因此在交易时会要求更高的信用利差。解文增和王安兴(2014)[11]则认为债券月交易天数比例可能是公司债券投机性的代理变量,不能很好地反映公司债券的流动性水平。

4.公司规模的增加会推动信用利差的预测值减小。表5中公司规模的回归系数均在1%的水平上显著为负,说明发债公司的公司规模对债券信用利差具有负向影响。与预期一致,公司规模越大,财力雄厚,社会信誉高,融资约束少,融资渠道多,债券违约的可能性越低。

第三,公司债券信用利差的影响因素存在信用异质性。

表6报告了不同信用评级下重要影响因素的贡献值。结果显示,月交易天数比例、股权性质、公司规模在不同信用评级的公司债中均存在显著差异。可以发现,当信用评级为AA级及以下时,月交易天数比例和股权性质的贡献值显著高于同模型下信用评级为AAA级和AA+级的贡献值,表明月交易天数比例和股权性质对低信用评级公司债(AA级及以下)的影响更大。公司规模的贡献值在同模型不同的信用评级下差距不大,表明公司规模对不同信用评级公司债券信用利差影响的差异性较小。

表6 不同信用评级下重要影响因素的贡献值

六、结语

结合使用多种机器学习方法,检验了债券个性因素和公司个性因素对2008—2022年我国公司债券二级市场公司债券信用利差的影响。研究结果表明:第一,信用评级、月交易天数比例、公司产权性质、公司规模为公司债券信用利差的重要影响因素,企业资产负债率、债券剩余期限、控股股东股权质押比例、资产回报率、公司所属行业、第一大股东持股比例、公司股价波动和债券换手率为次要影响因素。第二,公司债券信用利差预测值与信用评级、公司规模、公司产权性质显著负相关,与债券月交易天数比例显著正相关。第三,公司债券信用利差的主要影响因素对不同信用评级组别的影响存在异质性。月交易天数比例和股权性质对AA级及以下的低信用评级公司债券信用利差影响更大,公司规模对不同信用评级公司债券信用利差影响的差异性较小。

由研究结论得到的政策启示是,相关监管部门应该关注信用评级、债券交易频率、产权性质等多重因素对我国公司债券市场的影响。在我国公司债券信用评级整体偏高的背景下,信用评级依旧是投资者识别公司债券信用风险的主要影响因素,因此监管部门应该采取措施加强信用评级的信息中介功能,强化信用评级机构的行业公信力。此外,民企相对于国企公司债券信用利差更高,反映了较为严重的融资约束,政府部门应该加强改善融资环境,纾解民营企业融资难等问题,从金融方面支持其更快更好发展。

猜你喜欢
公司债券利差评级
外汇储备规模、国内外利差与汇率的变动关系分析
外汇储备规模、国内外利差与汇率的变动关系分析
期限利差如何修复
分析师最新给予买入评级的公司
创投概念股评级一览表
《钱经》月度公募基金评级
《钱经》月度私募基金评级发布