基于随机森林与费希尔判别法的区块链企业财务预警模型研究

2022-10-13 02:54余欣然
梧州学院学报 2022年3期
关键词:财务危机预警区块

余欣然 ,郭 婷

1.厦门大学 管理学院,福建 厦门 361000;2.内蒙古工业大学 经济管理学院,内蒙古 呼和浩特 010000)

近年来由于国内外经济形势的变化,企业面临更为严峻的生存环境,部分企业深陷财务困境。企业的财务状况是一个持续积累的结果,财务危机的出现往往是有迹可循的。为避免企业陷入财务困境,企业管理者通常需要结合实际情况对企业的财务状况及风险进行评估。在评估过程中,较为常用的一种方法就是结合财务预警模型做出判断。财务预警模型是一种通过定性和定量分析相结合的方式对企业整体的财务状况进行判断的预测模型,企业管理者可以运用该模型对财务状况进行实时监控,帮助改善财务活动和消除潜在的财务隐患。该模型能为企业预判和防范财务风险提供理论依据,减轻和避免危机给企业带来的不利影响,对企业的经营发展具有重要意义。

陈月圆[1]以A股上市公司为研究对象,运用逐步判别分析法建立了上市公司的财务预警模型,采用非配对抽样的方法尽量剔除样本的主观性。但其检验过程并未使用交叉验证,只选用了原始数据回代的方法来检验模型的准确率,模型的预测结果缺乏稳健性。王小燕等[2]在logistics回归的基础上考虑了财务指标之间的关联性,采用带网络结构的自适应Lasso惩罚对参数进行平滑,模型指标的选取更加准确合理,检验结果表明基于Lasso的logistics回归模型具有较好的分类效果。孙玲莉等[3]以中国A股及美股上市公司为研究对象,通过构建基于Benford的随机森林模型,从评价财务数据质量的角度提升了财务预警模型的精确度,发现基于Benford律的随机森林相较于单一的随机森林预测结果更加准确。顾晓安等[4]考虑了企业盈余管理导致的财务信息失真,研究发现财务危机企业与正常经营企业的盈余管理行为存在显著差异,并将盈余管理变量引入Logistic 回归分析,显著提高了模型准确率。

近年来,随着数字经济发展,区块链技术成为热门,掀起了产业变革的浪潮。该项技术应用已延伸至金融、能源、供应链管理、网络安全等多个领域,通过与不同行业的整合实现了更为显著的经济效应,区块链行业展现出极大的市场潜力和发展空间。区块链技术对推动产业升级具有重要意义,通过实现更透明、更高效及更低成本的信息传输和数据处理,可以建立更加开放、健康、安全的信息传输环境。未来,区块链技术还将进一步与更多产业实现深度合作和生态互联,市场规模有望达到万亿级别。

由于该行业起步较晚,目前我国有关研究区块链行业财务预警模型的文献并不充分,企业难以基于较少的研究结论得到准确的财务风险预测结果。值得注意的是,目前财务预警领域的实证研究方法大致分为两种:一种是运用机器学习方法进行建模,如神经网络、决策树等;另一种是基于传统的统计方法,如logistics回归法等。2种方法都存在一定的优势和不足,仅仅依靠其中一种方法的模型是缺乏稳健性和合理性的。本研究将在费希尔判别法的基础上融合随机森林模型变量筛选的结果,吸取两种方法的优点,建立兼具准确性和可解释性的区块链财务预警模型。

1 研究对象及指标选取

本研究通过借鉴文献[3,5-6],结合区块链行业特性及实际情况,从目前较为认可的具有代表性的4个维度,即偿债能力、盈利能力、营运能力和发展能力,进行模型指标的选取。企业偿债能力通常用来衡量企业财务状况的好坏,反映企业的对到期债务偿还的能力,能有效考察企业的持续经营能力,本研究主要采用有形资产负债率X1、速动比率X2、权益乘数X3、现金比率X44个指标来衡量偿债能力;盈利能力是企业持续发展和生存的根本动力,体现了企业获取利润的投入产出比,本研究主要采用营业利润率X5、总资产净利率X6、净资产收益率X7、市盈率X8、营业收入现金净含量X95个指标来衡量盈利能力;营运能力指企业占用资产获取收益的能力,体现了资产使用的效率和效益,本研究采用应收账款周转率X10、存货周转率X11、流动资产周转率X123个指标来衡量营运能力;发展能力反映了企业未来的发展潜力,考察了企业未来持续增长及扩大经营的能力,本研究采用总资产同比增长率X13、营业利润同比增长率X14、基本每股收益同比增长率X153个指标来衡量企业的发展能力。

本研究根据2021年同花顺概念股及WIND数据库中区块链板块,按照配比原则,经过数据清洗后筛选出26家2020年沪深A股上市公司作为研究对象,其中区块链ST企业12家,非ST企业14家。

2 基于随机森林算法的区块链行业财务预警分析

2.1 研究思路及方法

机器学习方法在模型预测效果上具有显著的准确性,同时可解释性较低。为有效判断区块链企业未来是否可能面临财务危机,建立更加准确的区块链企业财务预警模型,考虑采用机器学习方法中的随机森林算法构建模型。随机森林算法是一种属于Bagging类型的决策树集成学习方法,它可以将数据集通过训练归纳得到模型并实现更加高效准确的结果预测。该方法相较于单棵决策树模型有更高的稳定性和精确性,并通过随机抽样的方式可有效解决过拟合问题。本研究采用机器学习方法中的随机森林模型对上述财务指标按其对模型的影响程度进行筛选,并综合考虑多棵决策树的集成结果,按照少数服从多数的原则进行特征指标的筛选。

2.2 结果分析

本研究运用Python程序对随机森林模型进行训练和检测。为避免偶然性对模型结果的影响,通过设置参数对1 000棵决策树进行训练,根据每棵决策树的不同输出结果进行数学统计,按照少数服从多数原则得到模型结果。考虑到决策树的过拟合情况,为保证模型的适用性及稳健性,本研究采用Python划分训练集和测试集,随机选取数据样本的70%作为训练集,剩余30%的样本作为模型的测试集进行检验。结果显示,训练集正确率为87.5%,测试集正确率为100%,表明随机森林算法对企业财务风险的预测具有较高的准确率。同时,采用提取特征指标的方法完成指标的筛选。随机森林算法根据决策树中指标的出现次数及层级等因素来判断指标的重要程度,计算不同特征指标对模型结果的影响。可视化结果显示,上述15个指标按照对模型结果影响程度排序前4位依次为营业利润率X5、净资产收益率X7、总资产净利率X6、总资产同比增长率X13(图1),本研究选取以上4个指标进一步构建模型。

Feature lmportance

3 基于费希尔判别法的区块链行业财务预警分析

3.1 研究思路及方法

机器学习方法虽然准确性较高,但也存在一定的缺陷。与传统的统计模型相比,由于涉及大量的数据处理,机器学习法模型通常较为复杂且可解释性较差,节点的判断和形成是算法自动选择而非人工设置的结果,其内在原理逻辑和推导过程具有不可知的特征。其次,该模型属于黑箱模型,读者不能直观地理解和应用模型得出结果。而传统的统计模型有较强的可解释性但准确性不高。为建立兼具可解释性和准确性的财务预警模型,本研究采用随机森林算法提取特征指标,在此基础上运用费希尔判别法构建区块链企业财务预警模型,在一定程度上吸取机器学习模型结果的同时保证模型的可解释性,并比较其与基于原始指标建立的模型的预测结果。

费希尔判别法是一种基于方差分析思想构造的区分变量的线性判别法,其本质是运用投影的方法,构造观测值和相对应的投影变量,将难以区分的样本通过投影区别开来,从而更好地将样本分类到不同总体中。该方法通过构造观测值的线性组合,然后根据线性组合的值构建判别函数,判别函数中的判别系数C1,C2…Cn应使得不同样本点群的离散程度最大,使同一样本点群离散程度尽量集中分布,从而达到较明显的分类效果。该方法对样本总体的分布无要求,是一种应用广泛的统计方法。

3.2 模型检验

研究采用SPSS对模型进行检验,选择上述随机森林法筛选出的特征值较大的4个指标建模。检验结果见表2。组均值同等性检验是为了检验指标在不同总体是否具有显著差别。经过T值检验,结果显示4个指标的T值均<0.05,则拒绝原假设,可以认为指标在正常企业和出现财务危机企业间差别较大。Box检验通常为了检验样本间的协方差矩阵是否齐次,经检验P值接近0,显示该协方差矩阵不是单位阵,总体间协方差存在显著差异,判别效果较好。Wilks′ Lambda检验可以检验模型整体的显著性,检验结果显示P值等于0.002,在α=0.01时具有统计学意义,表明该模型有效,能将较好地将区块链财务危机企业和正常运行企业区别开来。

表1 模型检验结果

3.3 结果分析

通过操作SPSS进行费希尔判别,得出以下非标准化的典则判别函数:

Y=0.007X5-0.013X6+0.002X7+0.040X13+0.440

(1)

区块链财务危机企业和正常企业的未标准化典则判别函数的聚类中心分别为-1.146和0.982。可以看到营业利润率、净资产收益率及总资产同比增长率3个指标与Y值呈正相关,而总资产净利率对质心Y的影响是负向的,即该指标越大质心Y越小,越有可能被判别为财务危机企业。由原始数据可知财务危机企业12家中有9家该指标为负且相较于其他指标较大,经验证可得结果符合模型的判断逻辑。

在具体运用模型时,可以取任意区块链行业企业将上述4个指标代入模型得到质心Y,若Y值与财务危机企业质心距离小于其与正常企业质心的距离,则将该企业判别为财务危机企业,企业应加强内部治理,改善其不利的财务状况;反之,则判别为正常企业,可以认为企业暂时处于较正常的经营状态,短期内大概率没有财务危机。例如,Y=-1.01时,该企业将被划分为财务危机企业。值得注意的是,当质心离两类聚类中心距离差距较小时,尽管该模型将企业判别为非财务危机企业,也并不意味着企业不存在财务危机,企业很可能存在着某些财务隐患,处于在被判别为财务危机企业边缘状态,若未及时解决该类隐患很可能导致企业经营陷入困境。

3.4 模型预测效果

本研究在原始检测的基础上使用交叉验证来检验模型的适用性和稳健性。交叉验证指在原始数据中保留部分数据不参与训练,使用训练集进行模型构建,并代入保留数据对训练模型进行检验,这种方法可以较为客观地反映模型的可靠性,并一定程度上保证模型对外部数据的适用程度。相比原始检验,交叉检验模型的预测结果更具有参考价值。由表2可知,基于随机森林算法的费希尔判别模型原始检验准确率为88.5%,交叉验证准确率为84.6%,准确率较为可观。为验证指标筛选的有效性,将使用随机森林模型筛选特征指标的模型与基于15个原始指标建立的全模型比较,将原始的费希尔判别法下的数据带入全模型判别,得到模型准确率为100%,交叉验证结果准确率仅为73.1%,表明该模型建模效果不佳。同时,也反映了随机森林指标的筛选对模型预测效果有着显著的改良作用,该方法的运用使模型基于更少指标的同时预测准确率得到了显著提升。

表2 区块链财务预警模型预测效果对比

4 结话及建议

本研究选取沪深A股区块链板块12家ST企业和14家非ST企业,基于偿债能力、盈利能力、营运能力和发展能力4个维度选取了15项财务指标数据为样本,首先运用随机森林算法按照指标对模型影响效果进行筛选,结果显示营业利润率、净资产收益率、总资产净利率、总资产增长率4个指标对模型的影响较为突出。其次,采用费希尔判别法基于以上4个指标构建区块链财务预警模型。经过组均值同等性检验、Box检验及Wilks′ Lambda显著性检验,结果显示各检验统计量均表现为显著差异,原始检测及交叉验证结果表明模型分类效果良好,准确率较高,能较好地反映企业的财务风险。分析模型结果可以得到如下结论:

(1)经统计分析验证,基于随机森林算法建立的费希尔判别财务预警模型准确率较高,可以应用于预判企业财务风险,通过模型可以了解企业目前财务状况及未来潜在的财务风险。

(2)经交叉验证发现,随机森林模型的引入对于提升费希尔判别模型的拟合程度及准确性具有显著作用。

(3)营业利润率、净资产收益率、总资产净利率、总资产增长率对财务风险的影响较大。为进行有效的经营管理,避免企业陷入财务困境,企业管理者应着重关注这4个指标。从事前控制的角度来看,管理者应及时进行财务分析,找出企业经营模式的缺陷,预防财务危机的形成。从事中控制的角度来看,应追溯导致财务危机出现的根本原因,从根源上提升企业的盈利能力,才能避免风险的进一步扩散。

分析以上结果可知,营业利润率、总资产净利率、净资产收益率三者属于盈利能力财务指标,说明区块链企业盈利能力指标对企业财务风险的影响起关键作用,持续监测区块链企业的盈利能力对企业的经营发展具有重要意义。其次,考虑到区块链行业作为新兴产业,还需着重考虑企业的发展能力,未来能否有能力实现大规模扩张和持续增长对该类企业尤为重要。因此,为避免陷入财务困境,应从这2个角度出发,实行企业内部严格的监督管控,企业决策者应着重关注企业的盈利情况,及时评价企业盈利质量,调整盈利模式及收入结构,确保企业经营持续性及稳定。同时,还应考虑未来长期的战略布局,制定长远的发展战略,进行科学决策,拓宽企业未来的发展前景。报表使用者在决策时则需重视此类指标,并以此为依据来判断企业的财务现状及未来发展趋势。

但模型仍然存在一定的局限性:

(1)模型未考虑非财务指标及外部因素对于企业财务风险的影响,仅以财务数据为样本进行建模,可能忽略了某些定性因素,如宏观政策、行业风险、公司治理、银企关系等,因此需建立更为完善的财务预警体系。

(2)尽管通过数据清洗剔除了样本中的部分异常数据,但财务数据仍可能存在一定的财务失真,财务信息的真实性有待进一步检测。

(3)为尽量保证数据的完整及真实性,本研究剔除了数据缺失样本,只选取了数据指标较为完备的2020年财务数据作为样本进行研究,样本数量受到限制,模型精确度可能有所局限。本研究检测了模型的可行性及预测准确程度,但对模型在财务预警过程中的检验欠缺考虑,因此在未来样本信息充足情况下,可以考虑进一步使用面板数据完善模型。

(4)为避免剔除重要变量,在考虑到财务指标的多重共线性时,本研究使用直接移除法,基于变量间的相关系数,手动剔除部分指标,剔除结果可能存在一定的偏差,因此以后可以考虑使用更加精确的处理方法来解决多重共线性问题。

猜你喜欢
财务危机预警区块
预警型智能包装在食品安全中的应用和设计
超级秀场 大风预警
《红楼梦》的数字化述评——兼及区块链的启示
一场区块链引发的全民狂欢
区块链助力企业创新
区块链投机者
35岁后,怎样应对财务危机
企业财务危机预警体系研究
企业财务危机预警模型的选择
预警个啥