上市公司股价崩盘预警模型研究

2023-05-30 10:22李昊泽尉昊
金融经济 2023年3期
关键词:风险预警

李昊泽 尉昊

摘要:本文选取A股上市公司作为研究对象,构建Cox回归模型探讨财务指标与非财务指标对上市公司股价崩盘的影响。实证结果显示:财务指标与非财务指标对股价崩盘有一定的预警作用,在所选取的指标中,现金流比率等因素对防止公司股价崩盘的发生起到保护作用,即现金流比率越高,公司股价崩盘风险越小;而管理层持股比例等作为危险因素,会加剧公司发生股价崩盘的可能性。进一步将Cox模型与集成学习模型相结合,发现模型的预测性能显著提升。研究发现了股价崩盘在时序上的变化规律及风险预期,为企业持续经营与风险防范提供参考借鉴,有助于促进资本市场的平稳运行;风险预警模型的建立有助于利益相关者有效识别股价崩盘风险,在一定程度上保护股东和投资者的权益。

关键词:Cox模型;股价崩盘;集成学习;风险预警

中图分类号:F832.5        文献标识码:A        文章编号:1007-0753(2023)03-0070-09

一、引言

近年来我国资本市场股价崩盘事件时有发生,例如2019年进入退市期的华泽钴镍连续41个交易日跌停,2021年顺丰控股因业绩巨亏导致一字跌停等。股价崩盘事件的发生不仅会直接影响市场投资者信心、企业利益以及资本市场的稳定发展,还可能引发系统性金融风险,对实体经济发展造成影响。2021年召开的中央经济工作会议明确提出“稳字当头、稳中求进”,因此防范资本市场金融风险显得尤为重要,而作为金融风险之一的股价崩盘风险也成为宏观经济与微观金融领域关注的重要方向。

二、文献综述

基于信息不对称理论与信号理论,股票市场的信息不透明会让投资者无法了解企业的真实运营状况,大部分情况下投资者需要依靠企业披露的信息和其他市场分析信息进行判断。一些学者从财务信息的角度进行了分析,赵文耀等(2019)、楚有为(2021)发现当上市公司的研发投入、去杠杆幅度和去杠杆压力越大时,企业股价崩盘风险越大,易导致股价崩盘的发生。张丹妮和周泽将(2021)研究发现,企业商誉价值越大,股价崩盘风险越高,同时由于商誉减值流程的复杂性和灵活性,商誉减值隐藏也会加剧企业股价崩盘风险(张新民和卿琛,2022)。与之相反的是进行分红和股息率较高的公司通过股利政策可以减少过度投资行为,使得企业发生股价崩盘的可能性降低(马超群和田勇刚,2020)。类似公司“高送转”等事件的发生,向市场传递出企业未来具有良好盈利前景的信息,从而有效抑制了公司的股价崩盘风险(唐雪松等,2019)。

企业年报、社会责任披露等非财务信息的相关研究角度也是学者们关注的热点。其中,管理者捂盘假说(权小锋等,2015;田利辉和王可第,2017)从企业内部经营的角度洞察了股价崩盘发生的内因,即企业管理者通常会采用“报喜不报忧”的披露策略,在一段时间内刻意隐瞒坏消息,致使负面消息积累到一定上限后集中释放,导致企业股价短时间内快速下跌,引发股价崩盘。王嘉鑫等(2022)发现管理层在非财务信息可读性披露的基础上配合进行语调操纵,其语调越积极,股价崩盘发生的上升效应就会越强。谭建华和王雄元(2022)的研究结果表明公司会策略性地利用年报文本信息掩饰违规,该行为减弱了短窗口期市场反应,加剧了信息漂移现象,提高了股价崩盘发生的可能性。而当年报中市场风险信息披露程度越高,公司未来股价崩盘的概率越低,而在年报文本可读性较强、文本相似度较低以及文本語调积极的公司中,上述负相关关系更加显著(朱杰,2022)。另外,年报篇幅、上市公司披露企业社会责任指数等因素能够在不同程度上抑制股价崩盘的发生(熊浩和钱润红,2022;黄金波等,2022)。

在企业财务和风险预警上,Cox模型在国内外均得到了较为广泛的应用。国外学者对于Cox回归模型的应用主要体现在财务风险(Lane等,1986)以及现金流变量的相关预测(Henebry,1996)上,而国内主要用于研究商业银行信贷风险管理(宋雪枫和杨朝军,2006)、信用违约风险(周勇等,2008)等。近年来已有学者将机器学习的思想迁移到Cox模型的应用中,挖掘Cox模型在预测方面的应用价值。王小燕和袁欣(2018)利用基于惩罚组变量选择的Cox模型构建了企业财务危机预警模型,对财务指标进行筛选并比较了Cox模型与Logistic模型的预测准确率。李鸿禧和宋宇(2020)利用基于时间相依的Cox回归构建了财务预警模型,克服了传统Cox回归依赖截面数据的缺陷,把握了面板数据时间序列的属性,进行了样本外检验。宋光磊和刘红霞(2010)利用Cox模型对公司董事会治理风险预警机制进行了研究。

此外,近几年部分学者也运用其他方法进行企业财务分析和风险预警。向实等(2022)运用支持向量机方法对债券违约风险监测进行预警研究;杨贵军等(2022)基于首末位质量因子的BP神经网络建立财务风险预警模型;孙玲莉等(2021)将基于Benford律的随机森林模型应用在财务风险预警中;王小燕和张中艳(2021)研究发现网络结构具有一定的匹配性,因此带网络结构的自适应Lasso财务风险预警模型有利于指标识别和预警能力的提高。

与已有文献相比,本文可能的边际贡献如下:(1)以往关于股价崩盘风险的相关研究聚焦于传统因果推断方法下对股价崩盘风险理论机制的剖析与解释,鲜有学者利用机器学习方法建立股价崩盘风险预警模型去挖掘其研究价值与现实意义;(2)Cox回归模型能够得到未来一段时间内动态的预警结果,而股价崩盘的发生与企业会计期间内的运营管理和经营业绩密切相关,并不是小概率突发事件,因此利用Cox模型克服了以往预警模型“时间点”预测的缺陷,更多体现的是“时间段”预测的结果;(3)虽然部分学者利用Cox模型对公司财务风险预警模型的构建进行了有益的尝试和探索,但传统Cox模型的预测精度仍有待提升,本文创新性地利用机器学习中的集成学习改良优化Cox模型,旨在构建出预测性能更优、鲁棒性更强的股价崩盘预警模型。

二、研究设计

(一)Cox模型

在传统计量经济学和机器学习领域中,常见的二分类响应变量模型包括Probit模型、Logistic模型、K近邻模型、决策树模型以及支持向量机模型等,这些模型通常将响应变量中的事件发生结果视为一种静态的过程,忽视了“从无到有”的事件动态转变信息。一般来说,上市公司重大风险事件通常不是某个时间点上的危机,管理层“捂盘”行为即为一个很好的例证,公司管理层隐匿负面消息的时间越久,公司发生业绩“爆雷”或股价崩盘的风险也就越大。而生存分析是以事件发生的动态演进思路作为建模的切入点,Cox模型正是生存分析中一种常用的建模工具。相较于生存分析中的参数回归方法,Cox模型放宽了对风险函数具体形式的假定,同时也能够得到对事件发生风险的有效估计,因此受到经济学者的广泛关注。Cox模型的基本表达形式为:

其中,h(t|x)为风险函数,表示公司经营t期后出现股价崩盘的概率;b0(t)是基准风险函数,即不受外生变量影响下的风险函数;exp(·)表示的是部分风险,这是一个时间不变的标量因子,只会增加或者减少基准风险;xi为各协变量,其变化会扩大或者减小基准风险。

(二)样本及变量选择

本文以A股上市公司为研究对象,选取2010—2020年时间区间的样本,并对原始样本做出以下处理:(1)剔除金融类公司样本;(2)剔除样本期内被ST和退市等特殊处理的公司样本;(3)剔除数据缺失的公司样本。相关数据来源于国泰安数据库和WIND数据库。

本文采用是否发生股价崩盘(risk)和生存时间(T)作为被解释变量。参照雷振华和楚攀(2013)、鲍新中等(2015)、朱永明和邵庚云(2013)以及俞富坤(2021)等的做法,将“死亡公司”定义为A股上市以后首次发生股价崩盘的公司;将“健康公司”定义为A股上市以后没有发生过股价崩盘的公司。公司生存时间以样本公司首发上市时间作为起点,对于死亡公司样本,以公司首次发生股价崩盘的年度作为终点;对于健康公司样本,以2020年度作为终点。在研究样本数据选取方面,对发生股价崩盘公司使用首次发生股价崩盘当年的数据,未发生股价崩盘的健康公司使用2020年的数据,因此将在观察期内已经发生股价崩盘公司的生存时间表示为非截尾数据,将在观察期内未发生股价崩盘公司的生存时间表示为截尾数据。

解释变量分为财务指标和非财务指标两个维度,其中财务指标分别从公司偿债能力、营运能力、盈利能力、发展能力等方面选择代表性指标,非财务指标则借鉴谭建华和王雄元(2022)、黄金波等(2022)的研究确定,同时考虑到公司年报文本信息的重要性,加入年报篇幅、年报语调两个指标。具体的变量说明和定义如表1所示。

(三)模型构建

本文采用Cox模型对各影响因素进行研究,构建预警模型并借助相关指标对模型进行评估,然后利用机器学习中的Cox集成学习模型对预警模型的预测性能给予进一步优化,从而挖掘Cox集成学习模型的最佳表现。具体操作步骤如下:

首先在全样本上构建Cox模型,研究所选取的指标对股价崩盘的影响,解释风险因子与股价崩盘事件之间的统计意义与经济逻辑,并通过绘制累积基准风险函数与个别协变量的生存函数探究股价崩盘的时间变动风险与协变量对企业经营存续时间的影响。

其次建立股价崩盘预警模型,在构建模型之前需要对数据集按8∶2的比例进行训练集与测试集的随机划分,以避免信息泄漏,保证在测试集上进行预测的有效性。在训练集上训练Cox模型,并在测试集上进行拟合。接着对实证结果进行评估。不同于以往的机器学习模型,本文评估实证结果的第一个指标为一致性指数,也称为C_index,旨在度量评估预测时间排序的准确性。第二个评估指标为Brier分数,该评分旨在评价模型的总体表现,与时间相关的Brier分数是均方误差对右删失数据的扩展,给定一个时间点t,定义为:

最后运用不同集成学习模型进行预测。本文选择Lasso-cox模型、随机生存森林模型(RSF)、梯度提升樹模型(GBS)等模型进行对原数据进行进一步预测,除一致性指数外,还采用了ROC曲线及AUC面积作为评估指标。当ROC曲线扩展至连续结果时,尤其在生存分析中,传统的静态ROC曲线通常是失效的,故本文采用动态AUC值进行评估。

三、结果分析

(一)Cox模型估计

将共线性检验后筛选得到的数据作为协变量代入Cox回归模型,实证结果如表2所示。

表2中coef为变量的参数估计系数,其正负可以判别指标的风险属性,一般地,当coef = 0时,表示该变量对上市公司的股价崩盘发生没有影响;当coef >0时,表示该变量的增加会导致公司发生崩盘的可能性上升,对公司的生存率有负面影响,该指标为危险因素;当coef <0时,说明该变量增加会使发生崩盘的可能性下降,该指标为保护因素。此外,除独立董事比例、两职合一、管理费用率、是否为四大审计、总资产周转率、账面市值比、机构投资者持股比例外,其余指标的显著性sig值均小于0.1,说明这些指标对上市公司的股价崩盘具有显著影响,具体而言:

(1)公司规模、是否为国有企业、资产负债率、净资产收益率、现金流比率、年报篇幅的系数均小于0,表明上述因素能够在一定程度上降低股价崩盘发生的可能,属于保护因素。选择保护因素中系数绝对值最大的因素“现金流比率”进行具体分析,如图1估计曲线所示,上市五年左右,不同现金流比率水平下企业存活比率相差不大;上市十五年左右,现金流比率分别为0.224与0.258的情况下,企业存活比率相差20%左右,说明随着现金流比率的增加,公司股价崩盘发生的可能就越小。究其原因,现金流量是企业维持日常经营活动和生产活动的基础,现金流量短缺会直接影响企业生产经营,容易引发财务危机,造成企业股价崩盘的风险。

(2)董事人数、第一大股东持股比例、管理层持股比例、营业收入增长率、年报语调等指标的系数均大于0,表明上述因素能够在一定程度上增加股价崩盘发生的可能,属于危险因素。选择危险因素中系数绝对值最大的因素“管理层持股比例”进行具体分析,如图2所示,上市七年左右,管理层持股比例为20%的公司与管理层持股比例为70%左右的公司存活比率相差高达50%;管理层持股比例为70%左右的公司基本在上市15年后发生股价崩盘,管理层持股比例为20%左右的公司在上市15年内有40%未发生股价崩盘。可能的原因在于,管理层持股一定程度可以发挥“利益趋同效应”,提高管理层承担风险的主动性,提升工作效率,但随着管理层持股比例的增加,权力的过度集中又容易诱发权力滥用的现象,管理者自利行为以及管理者“捂盘”行为发生的可能性将大大增加,从而增加了上市公司的股价崩盘发生风险。

图3为累计风险函数曲线图,可以看到随着年限的增加,企业股价崩盘发生的累计风险就越高,具体表现为在上市后前中期风险累计较为缓慢,企业上市15年以后风险累计速度明显加快。

(二)进一步分析

在基础回归完成以后,本文继续利用Cox模型进行预测。与常规文献利用Cox模型确定一个阈值K进行风险预警的方法不同,本文将数据集进行训练集与测试集的随机划分,在训练集上训练Cox模型并在测试集上进行拟合。

1.一致性指数

生存模型最常用的评估指标是一致性指数,它估计了预测结果与实际观察到的结果相一致的概率。其取值具体解释为:(1)0.5是随机预测的预期结果;(2)1.0是完美的一致性;(3)0.0是完美的反一致性。因此,该指标取值介于0.5与1.0之间时表示模型的预测性能是可接受的。且该指标的值越接近于1.0,说明模型预测性能更优。

表3为利用Cox模型进行预测后的一致性指数结果。可以看出Cox模型评估结果在训练集和测试集上公司特征变量对股价崩盘的一致性指数分别为76.24%、74.59%,均大于70%且未出现过拟合问题,说明Cox模型的预测结果是可接受的。

2.变量的特征重要性

为进一步探究非财务层面、财务层面特征与股价崩盘风险之间的关联,本文采用特征重要性来进行考察,表4报告了Cox模型中各变量对于预测企业股价崩盘风险的特征重要性。

通过将表4与表2进行对比发现,年报篇幅、公司规模、是否为国有企业、年报语调等指标在预测过程中作用比Cox回归中影响作用更加明显,背后深层次的原因可能是:(1)通常情况下年报篇幅的增加意味着公司管理层披露的信息更丰富,其主要通过报表附注信息的增加与更多非财务信息的披露使得投资者面临的信息不对称程度降低,进而降低企业股价崩盘的可能性;(2)规模越大的企业在规模经济、风险分担和融资渠道等方面拥有相对优势,能够一定程度减少股价崩盘的发生,起到保护作用;(3)由于我国特殊的制度背景,国有企业在资源、政策、融资等方面较非国有企业具有更多的优势,同时国家作为大股东会对其管理层进行比较严格的监管,此外国有企业对会计信息进行盈余管理的动机较弱,因此,产权性质会在较大程度上影响企业股价崩盘;(4)我国股市中的大部分个人投资者存在较大的信息差,当拥有信息优势的管理层想要掩盖负面消息误导投资者时,操纵语调无疑是风险更低的方式。由于我国对文本信息的监管缺失以及现实中管理层普遍存在的自利动机,整体而言,越积极的年报语调,越有可能是管理层在掩盖负面消息或者在传递虚假正面消息,其真实程度越低,增加了企业股价崩盘发生的可能。

3.Brier分数

一致性指数是最常见的预测衡量标准,但这一指数忽略了预测风险评分的实际值,其只是一个排名指标,并且无法说明任何有关校准的信息,故本文进一步采用第二个评估指标Brier分数,其通常用于评估校准,对于一组预测值其数值越低,预测校准越好。校准性是模型获得概率随时间变化的倾向,从概率的角度看待公司股价崩盘事件时,检查校准性比检查准确性更重要。

图4是部分预测时间段下的Brier分数连线,可以看到,当截取预测时间段的一部分,模型在公司上市后的10到17年之间Brier分数连线呈下降趋势,说明校准效果随时间变化越来越好,由此可见Cox模型在进行前期预测时存在一定的局限性。

4.运用集成学习模型进行预测

为克服上述局限性,本文尝试运用集成学习模型进行预测。基于Python中的scikit-survival模块,本文选择Lasso-Cox模型、随机生存森林模型(RSF)、梯度提升树模型(GBS)等集成学习模型对原数据进行进一步预测,并继续选择一致性指数对预测结果进行评价,结果如表5所示。

从表5可以得出:Lasso-Cox模型预测准确度与初始Cox模型相差无几,而Cox随机森林模型、Cox梯度提升树模型的预测准确度有了较为显著的提升,在训练集与测试集上的提升幅度分别为11.77%与0.44%、6.95%与1.30%。由此可见,Cox随机森林模型较基准Cox模型训练效果更佳,即集成学习器较基学习器能够更好地捕捉特征变量的数据特征,更好地实现对响应变量的预测。

本文进一步利用ROC曲線及AUC面积对分类问题模型进行评价,ROC曲线的形状代表了预测结果的优劣。与普通的ROC曲线及AUC面积不同,进行生存分析时,每个时间点在瞬态下会产生一个对应的AUC值,图5为每个时间点在瞬态下AUC值的连线。

由图5可以得出:基准Cox模型与Lasso-Cox模型的AUC值几乎相同,Cox随机森林模型在前中期的AUC值高于基准Cox模型与Lasso-Cox模型,但在中后期效果会差一些,相比之下,Cox梯度提升树模型则更为稳定,不同时间点上均不劣于基准Cox模型与Lasso-Cox模型,进一步证明了梯度提升树模型对股价崩盘具有良好的预测效果。

四、结论与不足

本文选择A股上市公司为研究对象,采用Cox模型分析了上市公司发生股价崩盘的影响因素。从结果可以看出:董事人数、第一大股东持股比例、管理层持股比例、营业收入增长率、年报语调等指标增加了股价崩盘发生的可能性,属于危险因素。公司规模、是否为国有企业、资产负债率、净资产收益率、现金流比率、年报篇幅等指标降低了股价崩盘发生的可能性,属于保护因素。其中相较于其他保护因素,现金流比率对抑制公司发生股价崩盘的保护作用较为突出;而相较于其他危险因素,管理层持股比例对加剧公司发生股价崩盘的危险作用更为明显。另外,上市公司前中期股价崩盘累计风险较小,上市15年以后风险累计速度明显加快,更容易发生股价崩盘。

进一步预测证明,本文建立的预警模型精度较高,具有可接受的识别能力。预测过程中发现年报篇幅、公司规模、是否为国有企业、年报语调等指标在预测过程中的作用与重要性更加凸显,这些指标特征可以帮助投资者甄别那些尚未发生股价崩盘公司的未来经营情况,能在一定程度上保护投资者的利益。

本文存在以下不足:一方面,模型指标选取上只考虑了公司偿债能力、营运能力、盈利能力、发展能力等财务指标和公司治理、文本信息等非财务指标,没有考虑国家政策等宏观外部经济因素的影响。另一方面,在对上市公司发生股价崩盘进行预测时,机器学习中的集成学习模型展现出了很好的提升模型预测性能,因此在未来预测上市公司股价崩盘风险时,可以考虑更多前沿的机器学习方法与模型。

参考文献:

[1]  赵文耀,白霄,郑建明.研发投入是否存在“资源诅咒”效应?[J].科学学研究,2019,37(12):2176-2193+2304.

[2]  楚有為.去杠杆与股价崩盘风险——基于政策压力的检验[J].现代财经(天津财经大学学报),2021,41(08):34-50.

[3] 张丹妮,周泽将.商誉与股价崩盘风险——基于信号理论视角的研究[J].科研管理,2021,42(05):94-101.

[4]张新民,卿琛.商誉减值隐藏、内部控制与股价崩盘风险——来自我国A股上市公司的经验证据[J].吉林大学社会科学学报,2022,62(02):82-95+236-237.

[5] 马超群,田勇刚.股息率、机构投资者与股价崩盘风险[J].系统工程理论与实践,2020,40(12):3019-3033.

[6] 唐雪松,郑宇新,彭情.高送转与股价崩盘风险:抑制还是加重[J].经济理论与经济管理,2019(09):59-74.

[7] 权小锋,吴世农,尹洪英.企业社会责任与股价崩盘风险:“价值利器”或“自利工具”?[J].经济研究,2015,50(11):49-64.

[8]田利辉,王可第.社会责任信息披露的“掩饰效应”和上市公司崩盘风险——来自中国股票市场的DID-PSM分析[J].管理世界,2017(11):146-157.

[9]王嘉鑫,陈今,史亚雅.年报非财务信息的文本披露语言特征会影响股价崩盘风险吗?[J].北京工商大学学报(社会科学版),2022,37(03):98-112.

[10]谭建华,王雄元.上市公司违规与年报文本信息操纵[J].中国软科学,2022(03):99-111.

[11] 朱杰.年报市场风险信息披露与金融市场稳定——基于文本分析的经验证据[J].投资研究,2022,41(02):64-84.

[12]熊浩,钱润红.年报篇幅与股价崩盘风险:信息冗余还是信息传递[J].中南财经政法大学学报,2022(01):26-37.

[13]黄金波,陈伶茜,丁杰.企业社会责任、媒体报道与股价崩盘风险[J].中国管理科学,2022,30(03):1-12.

[14]LANE W R, LOONEY S W, WANSLEY J W. An application of the Cox proportional hazards model to bank failure[J]. Journal of Banking & Finance, 1986,10(04):511-531.

[15] HENEBRY K.Do cash fow variables improve the predictive accuracy of a Cox proportional hazards model for bank failure? [J].The Quarterly Review of Economics and Finance,1996,36:395-409.

[16]宋雪枫,杨朝军.财务危机预警模型在商业银行信贷风险管理中的应用[J].国际金融研究,2006(05):14-20.

[17] 周勇,谢尚宇,袁媛.信用违约风险模型中违约概率的统计推断[J].系统工程理论与实践,2008(08):206-214.

[18]王小燕,袁欣.基于惩罚组变量选择的COX财务危机预警模型[J].系统工程,2018,36(03):113-121.

[19]李鸿禧,宋宇.基于时间相依Cox回归的动态财务预警模型及实证[J].运筹与管理,2020,29(08):177-185.

[20]宋光磊,刘红霞.董事会治理风险预警研究——COX模型的构建[J].山西财经大学学报,2010,32(04):76-84.

[21]向实,曾银球,闫新国,等.基于支持向量机方法的债券违约风险监测预警研究[J].金融经济,2022,547(01):40-50.

[22]杨贵军,杜飞,贾晓磊.基于首末位质量因子的BP神经网络财务风险预警模型[J].统计与决策,2022,38(03):166-171.

[23]孙玲莉,杨贵军,王禹童.基于Benford律的随机森林模型及其在财务风险预警的应用[J].数量经济技术经济研究,2021,38(09):159-177.

[24]王小燕,张中艳.带网络结构的自适应Lasso财务风险预警模型[J].数理统计与管理,2021,40(05):888-900.

[25]雷振华,楚攀.基于Cox模型的财务风险预警实证研究——以1990—2012年信息技术类上市公司数据为例[J].湖南社会科学,2013(06):164-167.

[26]鲍新中,陶秋燕,傅宏宇.基于变量聚类和COX比例风险模型的企业财务预警研究[J].系统管理学报,2015,24(04):517-523+529.

[27]朱永明,邵庚云.基于Cox生存模型的上市公司财务困境预测研究[J].商业研究,2013(11):108-116.

[28]俞富坤.基于COX模型的财务困境风险的资本结构差异性研究[J].社会科学家,2021(11):85-91.

(责任编辑:张艳妮/校对:胡丕吉)

猜你喜欢
风险预警
以运营动态为载体,推动地市运监工作实用开展
高校财务风险预警指标的建立与应用研究
基于风险预警的高校财务管理问题研究
行政事业单位的内部控制问题以及解决策略思考
融资租赁企业风险预警与控制机制研究
基于全面风险管理框架下的商业银行风险预警机制研究
开放型经济体制下民营企业对外直接投资风险预警研究
信息化手段实现检验检疫工作风险管理的可行性探讨
电网企业财务管理
中小企业财务风险预警管理分析