我国房地产上市公司信用评级研究
——基于BP神经网络方法

2020-07-22 06:10

上海立信会计金融学院学报 2020年2期

（对外经济贸易大学信息学院，北京100029）

信用评级是对借款人信用风险的评估，评级对象一般为个人、企业、政府等。信用评级过程中须采集受评对象的定性与定量信息，以数字形式度量受评对象偿还债务的能力和意愿，预警其潜在违约可能性（唐于婷，2019）。信用评级机构一般基于受评对象的财务与非财务数据、经营业绩水平和行业指数等，运用各类信用评级模型给出评级结果。评级结果不仅可以衡量受评对象的当期信用水平，也能在一定程度上反映其未来信用评级预期。

自2017年下半年起，我国对房地产进行密集调控，2018年全国范围出台各种调控政策400余次，创历史新高。国家的一系列调控措施引发行业变动，房地产企业的收入端与成本端经营均遭遇较大困难与挑战。此外，我国资本市场根基浅、起步晚，“市场有效性”体现不足，上市公司的真实信用水平与股票价格往往不能如实匹配。因此，加强对严调控背景下的房地产上市公司（以下简称“上市房企”）潜在信用风险的度量与预警，通过上市房企评级结果反映政策收紧环境下的房地产市场现状，对增强我国金融市场的稳定性、降低资本市场投资者损失具有一定的理论和现实意义。

一、文献综述

信用评级的概念最早可追溯至1890年，由穆迪公司创始人John Moody首次提出并运用于债券评级管理。20世纪20年代后，市场对信用评级服务的需求大幅增长，信用评级机构不断提高评级技术，开发优化评级模型，信用评级被投资者普遍视为衡量风险的重要依据。

国内外学者研发的信用评级模型大致可分为三类：经验类、统计类与智能类。

经验类信用评级模型，包括“5C”“LAPP”等要素信用分析模型。此类模型对评级人员的能力要求较高，极易受到评级人员的主观影响，因此评级结果不够稳定，公正性、有效性不足（徐国伟，2006；楼裕胜，2013；徐伟强，2014）。

统计类信用评级模型，一般以统计分析方法为基础进行信用评价。Altman 于1968年提出Z－score模型，该模型属于多元线性模型，从受评对象的短期偿债能力、累积利润、资产盈利能力、资产利用率、财务结构稳定度五个方面入手，用最小二乘法得到违约情况与这五个指标的线性回归式。后来，Altman 等（1977）改进Z-socre模型，建立ZETA模型，以提高受评对象的信息覆盖度与模型识别精度，优化分类结果。但是，这两种模型均忽视非财务数据的影响，变量间的非线性关系反映不足。Collins和Green（1982）、Gentry 等（1987）研究发现了信用评价效果优于ZETA模型的Logit模型。1997年，美国KMV公司开发KMV模型，将研究重点放在股票市场价格波动对企业违约的影响上，试图对信用风险进行有效度量。统计类模型要求评价指标是线性关系、服从正态分布，限制条件较多，与实际问题贴合度不高，因此适用范围较窄。

智能类信用评级模型。人工智能技术因其超强的学习能力与高效的数据处理优势被引入信用评价领域，相关的研究与应用随着计算机和大数据的发展逐步深入。Odom和Sharda（1990）首次将神经网络应用于信用评价；Desai 等（1996）验证了神经网络的非线性映射能力在信用风险评估中的明显优势。近年来，国内学者也不断优化与拓展BP神经网络的应用场景：吴德胜和梁樑（2004）用遗传算法优化神经网络，克服网络信用评价过程中的局部极小缺陷；杨海深和傅红卓（2009）用BP神经网络预测股票指数；胡援成和康鸿（2010）用BP神经网络对主权债务危机进行早期预警，认为其总体效果优于二元Logistic 方法；王肖芳（2015）建立因子分析－BP神经网络模型对生态农业效益进行评价。智能类信用评级模型克服了传统信用评级模型的不足，极大地提高了信用评级的精度与效率。

二、研究方法与模型构建

本文将统计分析与机器学习相结合，在因子分析与聚类分析的基础上，构建对我国上市房企进行信用评级的神经网络模型。

（一）因子分析与聚类信用评级模型

因子分析法是常用于综合评价的多元统计方法。在多指标综合评价场景中，因子分析可在覆盖绝大部分原始信息的前提下，对多个变量进行降维，以突出主要影响因子，降低数据处理难度，简化问题研究过程。其基本思路是简化指标变量之间的错综关系，根据指标变量之间的相关性进行分组，将相关性较高的变量分在一组，而不同组的变量之间相关性则较低。变量分组后的组数即为公因子的个数。从变量实际经济意义的角度看，提取的公因子反映了经济变量之间的相互作用关系。通过因子旋转在公因子上增加载荷集中度，提高主因子代表性，能够更好地突出公因子的实际经济含义（何晓群，1998）。

本文构建上市房企信用风险评价指标体系的基本思路：通过因子分析法对众多评价指标进行降维处理，根据相关性提取公因子，并乘以相应权重计算综合评分；然后，以因子分析综合评分为基础进行K－Means聚类分析，对Z值进行聚类，分别表示不同的信用评级。

因子得分包括单个公因子得分和综合因子得分。单个公因子得分Fj可表示为成分得分系数βji与变量xi的乘积之和：

再将每个因子的方差贡献率ω作为其权重，计算综合因子得分Z：

（二）预测上市房企信用评级的BP神经网络模型

人工神经网络是由大量神经元组成的复杂网络架构，通过模拟人类大脑的运行处理过程，抽象简化繁杂的非线性信息并进行学习；根据不同的连接方式，可分为前馈神经网络和反馈神经网络。BP神经网络是最常见的前馈神经网络，其结构一般包括输入层、隐含层和输出层，信息在网络中总是向前传播，上一层的输出值作为下一层的输入值，直至最后输出层输出。

BP神经网络具备信息前向传播的特点。假设输入为x1，x2，…，xj，对应的权重分别为ω1，ω2，…，ωj，则在神经元胞体内部的激活函数计算过程为：

y值是该神经元的输出值，可以继续作为前馈神经网络中下一层结构的输入值沿着神经网络架构向下传递。

BP神经网络主要通过梯度下降与反向传播算法来优化神经网络性能。梯度下降算法可在训练过程中确定最优权重和偏置，以最小化代价函数MSE为目标，即实际输出y（x）能够尽可能拟合所有的训练输入x。梯度下降法沿下降最快的方向使代价函数到达最小值处。经过一次梯度下降后的新参数值为：

ω、b为初始参数值，经过一次梯度下降后分别到达了ω′、b′的位置；η为学习率，表示一次下降的距离。η值太小会导致运行时间过长，太大会错过函数最低点。ω′、b′作为新的参数值再次进行梯度下降，直至代价函数到达最小值点，此时的权重和偏置是使神经网络拟合性能最优的参数组。

反向传播算法是将网络总误差从输出层反向传播到输入层，再应用梯度下降算法来正向逐层修正参数，如此循环往复，直至达到期望输出值，此时的权重、偏置数组为最佳参数组。

BP神经网络具备以下优点：（1）非线性拟合能力强，可通过学习输入值与输出值的关系，拟合出二者的映射关系式；（2）内部多隐含层结构保证信息的精确传递，实现合理的输出值分类；（3）具备优良的深度学习与信息处理能力，能识别像素、音素等。因此，BP神经网络可应用于函数拟合、分类、图像识别等多个场景，实际应用非常广泛。

在应用于上市房企信用评级时，BP神经网络也具有其他评级方法难以替代的优势：（1）其非线性拟合能力极大简化了复杂的内部机制，可构建“黑箱”自动提取数据逻辑；（2）其泛化能力和容错能力可以保证实际情况中的良好运行（吴凤和吴义能，2017）。

本文将因子分析和Z值聚类的结果作为目标输出，建立BP神经网络进行学习与拟合，模型达到精度要求后，用训练好的网络预测我国上市房企未来的信用等级，并根据模型结果进行后续观测与分析。

三、数据选取与指标体系构建

（一）研究对象及数据来源

本文采集上市房企的26个财务及非财务指标数据。从Wind数据库房地产行业140家A股上市公司中删除数据缺失者，最终确定2017年100家、2018年98家上市房企作为研究样本集。所有数据均来自Wind数据库、上市房企财务报表及中国证监会官方网站。

（二）指标体系构建

本文从财务、非财务两个维度构建上市房企信用风险评价指标体系，共选取26个指标，详见表1。

表1 我国A股上市房企信用风险评价指标体系

1.财务类指标

最常用于构建企业信用评价指标体系且文献中出现频率最高的盈利能力、营运能力、偿债能力、发展能力（常方媛，2016；张超和孙英隽，2018）等指标首先被纳入本评价指标体系。

其中，偿债能力大类下的资产负债率具有一定的特殊性。房地产行业的运营过程一般是先借贷、再销售回款，因此房地产企业的资产负债率普遍较高，但其背后的原因却可能完全迵异：（1）经营状况较好的企业，一般是由于其销售行为持续进行和预收账款较多而导致资产负债率较高；（2）经营状况较差的企业，往往由于负债过多而出现较高的资产负债率，该类企业偿债能力堪优、信用风险较高。因此，从资产负债率中剔除预收账款后再纳入本评价指标体系，以便在统一标准下衡量企业的经营与信用情况。

此外，房地产业具有两个重要的行业特性：（1）住房是兼具消费、投资双需求的特殊商品，易受政策、经济周期等因素影响而供需失衡，普遍存在高库存危机；（2）房地产业是体量、资本投入双高的行业，极度依赖融资与资金回笼能力，十分重视资金链运转。因此，流动性也是本指标体系的重要组成部分。

2.非财务类指标

非财务类信息很大程度上与财务信息同样反映企业的经营情况，因此若要对企业进行全面评级，不能只考虑财务指标（赵文睿，2016）。曾繁荣和刘小淇（2014）通过实证分析发现，引入非财务类指标可以提高上市公司财务困境预警模型的准确率。陈敏和陈晓园（2015）认为非财务指标对房地产企业财务分析具有重要意义，并建立了适用于房地产行业的非财务指标体系。因此，本文在构建评价体系时引入企业规模、董事会结构、员工情况三类非财务指标，以提高模型的可信度、全面性与风险评估能力。

四、实证分析

（一）因子分析

因子分析主要包含三个主要步骤：

第一步，数据标准化。利用SPSS软件对原始数据进行Z－score标准化处理（薛薇，2017），以消除量纲影响，使数据处于相同的数量级，共得到26个标准化处理的变量。

第二步，相关性检验。应用SPSS软件进行Kaiser-Meyer-Olkin检验和Bartlett球形检验。KMO测度值=0.712，大于0.5，说明变量间的相关性较强，偏相关性较弱，因子分析的效果较好；Bartlett 球形检验结果Sig=0，小于0.05，数据呈球形分布，原始变量之间存在相关性。因此，数据适合做因子分析。

第三步，进行因子分析，结果见表2和表3。

表2 因子分析结果

初始特征值大于1的8个成分作为公因子予以保留，其累积方差贡献率达到78.084%，对原有信息具有较强的覆盖与解释能力。

表3 成分得分系数矩阵

成分得分系数矩阵中，各公因子实际意义更加显著。表3中的成分得分系数即为各变量在该因子上的得分权重。因此，可根据公式（1）将各变量与其权重乘积加总，得到各公因子（F1，F2，…，F8）得分。由于各公因子权重已由表2中的公因子方差占比确定，因此公式（2）可变化为如下综合得分公式：

（二）聚类分析

K－Means聚类分析是以样本之间的相似度为基础，不断计算、迭代以确定聚类中心并完成聚类的过程。同一聚类中心附近的样本点可归属于同一类。参考叶永刚和吴良顺（2016）的综合得分公式，计算出样本集内各上市房企的Z值并进行聚类，确定9个中心点，如表4所示。

表4 K－Means聚类分析结果

再以数值大小相邻的两中心点均值（1.125，0.585，0.290，0.055，－0.150，－0.380，－0.620，－1.030）作为边界，按因子分析综合得分Z值将上市房企样本分为9个等级（1～9）。结合典型样本的财务与非财务数据对企业Z值等级进行观察、定性判断，得出结论：企业Z值等级值越小，其信用状况越好、违约风险越小；企业Z值等级值越大，其信用状况越差、违约风险越大。因此，将企业信用等级设为与Z值等级相对应的9级。表5为企业信用等级（Z值等级）划分及样本分布情况，可以看出基本呈现正态分布。

表5 100家上市房企2017年信用等级分布

（三）基于BP神经网络的实证

利用聚类分析划分的等级数作为神经网络目标输出值，进行BP神经网络建模。具体步骤如下：

第一步，建模准备。提取前述100家上市房企2017年度的26个财务与非财务指标数据，以已构建的26个指标作为输入端，以信用等级数作为目标输出，学习率η取0.001，最大迭代次数设为1000次。

第二步，划分训练集与测试集。采用随机抽取的方法，从样本公司中抽取75家作为训练样本，其余25家作为测试样本。

第三步，数据归一化。由于输入数据的单位不同，部分指标的数值范围较大，会造成神经网络收敛慢、训练时间长、小范围数据输入作用易被淹没等问题。故采取以下公式将数据映射到区间[0，1]：

第四步，寻找最佳隐含层节点数。隐含层节点数过多或过少都将直接影响训练结果，其确定标准并不统一，一般参考公式为：

其中，n是隐含层节点数；n1、n0分别为输入与输出神经元个数；α 取0，1，2，…，10，α∈Ν。

但该公式并非一概而论，还要结合具体情况进行确定。用MATLAB 软件计算出n 取1，2，3，…，20时的训练集、测试集以及总数据集的均方根误差（rmse），发现n＝3时总数据集rmse 最小，故确定隐含层节点数为3。

第五步，创建神经网络。构建3层BP神经网络，其中输入层含26个输入神经元，输出层有1个节点。由于企业信用评级为整数，因此对神经网络计算输出结果进行取整，循环往复确定各层之间的最佳权重，并得到拟合结果最优的神经网络结构。

经过以上训练，网络输出值与期望值之间的拟合优度R2为0.9002。经过6次迭代后，误差已十分接近起始预设值0，模型最优正确率较高。由此可知，该神经网络具备良好的拟合优度，可用于实际预测。

（四）仿真测试

利用创建的BP神经网络，对前述98家上市房企2018年度的信用评级进行仿真预测分析，结果见表6。

表6 98家上市房企2018年信用评级预测结果

由表5和表6可知，信用评级较差（信用等级值为6～9）的上市房企数由2017年的30家增加到2018年的37家，而信用评级优良（信用等级值为1～4）的上市房企数则由33 减少到22家；100家上市房企2017年的实际评级结果集中在5、6两个等级（共57家），由BP神经网络预测得到的98家上市房企2018年信用评级结果也普遍集中于5、6两个等级（共67家），两年结果具有一致性。

对98家企业进行因子分析和聚类分析，得到2018年的信用评级实际值，与BP神经网络模型预测值一同标示在平面坐标图中，并按预测值绘制企业信用等级值趋势线（见图1）。其中，x轴为98家上市房企按2018年股价涨幅降序排列时的次序编号，数值越小，对应的企业股价涨幅越大；y轴为企业信用等级值（即Z值等级），数值越小，企业信用状况越好。

图1 98家上市房企2018年信用等级对比关系示意图

由图1可见，98家上市房企2018年的信用评级实际值、BP神经网络模型预测值总体重合度较好，说明模型预测的准确程度较高。另外，98家上市房企2018年的信用评级实际值与预测值之间的拟合优度R2为0.734，也说明BP神经网络仿真测试的拟合效果较好。

此外，信用等级值趋势线从左到右呈现上扬态势，即上市房企的股价涨幅逐步下降，而信用状况在变差，说明股价涨幅排名居前的上市房企，其信用水平整体优于排名靠后的上市房企。信用等级值为1～3的10家上市房企中有9家的市场表现居于行业排名前50%，其中4家居于行业排名前15%；信用等级值为9的3家上市房企则全部位列市场表现排名后15%，印证了这一模型分析结果的可靠性。

五、结论

本文选取较为完备且贴合行业特性的指标群，建立上市房企信用风险评价指标体系，以房地产行业严调控背景下2017年和2018年的上市房企数据为样本，构建BP神经网络模型，对上市房企进行信用评级。实证结果表明，该模型正确率较高，能较好评估宏观调控背景下我国上市房企的信用等级。

第一，上市房企信用评级越优，其市场表现越好，因此上市房企的信用评级可作为资本市场投资的有效参照标准。近几年房地产市场处于宏观严调控中，股市表现较为悲观且不稳定，投资者应更多关注信用评级优良的上市房企，此类企业更可能具有相对稳定良好的资本市场表现；而对于信用评级显著低于行业平均水平的公司，投资者基本难以在资本市场上获取超额收益。由此可见，结合上市房企的信用评级进行投资，能帮助投资者在一定程度上规避政策环境变化带来的风险，降低损失。

第二，我国上市房企的整体信用水平下降。在经济下行与政策持续收紧背景下，我国房地产企业在资金端、销售端均面临较大压力与挑战。上市房企的整体信用水平下降，信用状况发生恶化的企业数量显著增加，形成不良的投资预期，这也与2018年房地产板块股价几乎全数下跌的实际情况相符。

第三，BP神经网络可较好用于实际信用评级。由BP神经网络模型结果可知，用训练好的神经网络进行样本信用评级，网络期望值与输出值的拟合优度达0.734，信用评级预测值与真实值有良好重合度。由此可见，BP神经网络在实际用于测度我国上市房企信用评级和信用风险时，具备超强的学习能力与容错性，实用而且有效。此外，从理论上讲，该模型也可推广至“非严调控”情景，仅需在具体实施时对神经网络的训练学习对象等细节进行相应调整即可。

我国房地产上市公司信用评级研究——基于BP神经网络方法