胡传胜 周志国
摘要:目前对企业进行量化评估的研究主要基于企业特征维度进行分析。通过对企业财务、营运等特征进行建模,利用各种算法进行统计分析,从而达到对企业量化评估的目的。这些研究大都基于全量样本数据进行评估,但这种做法忽略了生命周期对企业的影响。在不同生命周期阶段,企业具有不同的财务、营运等特征数据,将这些企业进行无差别评估,会降低企业量化评估的准确性和科学性。基于此,文章推出一种基于生命周期的企业特征量化评估模型,首先对企业的生命周期进行分类,然后分别对不同生命周期阶段的企业进行特征量化评估的方法。这种方法解决了传统评估方法对不同生命周期阶段内企业由于实际业务数据差异而带来的影响和偏差。
关键词:企业生命周期;企业特征量化评估;XGBoost算法;TOPSIS算法
中图分类号:TP181 文献标识码:A
文章编号:1009-3044(2024)09-0086-03
开放科学(资源服务)标识码(OSID)
0 引言
企业生命周期理论广泛应用于企业管理和规划领域,它描述了企业在不同发展阶段所面临的挑战和机遇。在当今竞争激烈的市场环境中,正确评估企业现状、制定匹配决策方案,对企业的成功发展至关重要。然而,目前现有的企业评估模型大都忽视企业生命周期因素的影响,导致评估结果的科学性和准确性受到一定的限制[1]。
本研究旨在研发一种基于生命周期[2]的企业特征量化评估模型[3],该模型将通过结合生命周期理论和特征量化评估方法,首先对企业进行生命周期分类,然后利用特征量化评估模型对企业进行评估分类,实现精准、全面的分析企业现状,为企业管理者和决策者提供更具针对性的管理建议和决策支持。
本方案利用大数据AI算法,收集并分析企业全量数据,构建基于生命周期的企业特征量化评估模型。本方案采用XGBoost算法构建企业生命周期模型,结合熵权法和TOPSIS算法实现对企业的量化评估。此外,本文还结合实例,验证模型在实践中的准确性和有效性。
本研究的创新之处在于将企业生命周期理论与企业评估方法相结合,提供了一种更加全面、准确的企业评估模型。该模型不仅可以帮助企业管理者深入了解企业现状,还可以为决策者提供具有针对性的决策支持。此外,该模型还具有广泛的应用价值,如企业投融资管理、市场决策分析等。
1 基于生命周期的企业特征量化评估模型
生命周期理论认为,生命周期贯穿于企业生产经营全过程。研究表明企业生命周期主要由初创期、成长期、成熟期和衰退期四个阶段组成,每个阶段都有其独特的特征和需求。本文从模型特征筛选、生命周期分类、特征量化评估3个方面展开企业经营特征评估,提出了一种基于企业生命周期的特征量化评估模型,将企业先按生命周期分类,规避由特征数据全距过大而引起的差异,再利用特征量化评估模型对企业进行评估,以提升企业评估算法的准确性和科学性,为管理者制定精准决策服务方案,提供坚强数据支撑。
1.1 模型特征筛选
评估模型涉及生命周期分类与企业量化评估两部分,模型数据来源包括工商、司法、电力等多类数据源,根据当前主流的生命周期与特征量化评估研究成果,特征集选取主要从企业财务、信用等几个方面进行选取。模型特征经过数据探查处理后,最终形成模型特征集23个,如表1所示。
1.2 算法原理
分类模型中常用的算法有随机森林、SVM、逻辑回归、XGBoost等算法,本文中企业生命周期模型采用XGBoost算法进行分类预测,同时将随机森林、SVM两种算法与XGBoost算法的预测分类结果进行比较。XGBoost算法是一种基于Boosting的集成学习模型,由多个弱学习器集合而成一个强学习器,通过对目标函数进行二阶泰勒展开,使模型结果更加逼近真实情况,在分类与回归问题上较其他型模型具有更高的精度。
XGBoost模型表達式如公式(1)所示:
[yi=k=1Kfk(xi),fk∈F ] (1)
上式中[yi]表示预测值;K表示回归树数量;xi表示第i个输入的特征向量;F是回归树集合空间;fk是集合R上的一个函数,表示基学习器的输出。
对yi进行k次叠加计算后,得到XGBoost的目标函数如公式(2)所示:
[obj(t)=i=1nl(yi,yi(t)) + i=1tΩ(fi)]
[=i=1nl(yi,yi(t-1)+ft(xi))+Ω(ft)]+constant (2)
上式中[l(yi,yi(t-1)+ft(xi))]是损失函数,用来计算真实值与预测值之间的误差;[Ω(ft)]是正则化项,constant是常数项。
对上述公式进行二阶泰勒式展开并简化计算,最终得到如公式(3)所示:
[obj*=-12j=1TG2jHj+λ+γT] (3)
上式中T为 k 次迭代后树中叶子结点个数;Gj表示当前叶子结点所有样本一阶导数和;Hj表示当前样本所有二阶导数和;γ为惩罚函数系数;λ为正则化惩罚项系数。
1.3 企业生命周期分类
根据生命周期理论,虽然企业在不同生命周期表现出来不同的特征,但在相同周期内具有某些共性。因此利用这些共性可以实现企业生命周期分类。研究表明,初创期企业具有企业市场占比小、成本高、利润低、现金流转少、组织结构简单等特点;成长期企业具有融资能力和偿债能力较强、营收和利润增速快等特点;成熟期具有市场占有率稳定、营收和利润均稳定、现金流较为充裕、很强的偿债能力、组织结构复杂等特点;衰退期具有营收和利润均逐年下降、企业市场份额占比越来越小、组织结构混乱等特点。
企业生命周期模型采用XGBoost算法,模型特征集涉及财务、信用等几个方面。模型数据经过ETL处理,去除异常值与缺失值过多的企业。为了提高模型的训练效率和泛化能力,本文对数据进行标准化处理,使其近似满足0-1分布。XGBoost 模型训练时,采用gridsearch网格搜索法进行参数粗调,利用Stratified KFold进行10折交叉验证,减少模型评估误差,提高模型评估的准确性和泛化能力。经过粗调后,采用控制变量法精调模型,得到最佳模型参数。
XGBoost模型评估标准采用F1值,F1值由准确率(Precision) 和召回率(Recall) 调合平均组成。F1的公式如公式(4)所示:
[F1=2×Precision×RecalPrecision+Recal] (4)
为了验证模型的准确性,预测结果与SVM算法和随机森林算法进行实验对比,从表2实验结果可以看出本文提出的XGBoost预测模型F1值为0.9618,与SVM和随机森林相比,整体评估预测结果均有显著提升,表明XGBoost模型算法适用于本数据集。
1.4 企业特征量化评估
企业特征量化评估模型[4]通过量化企业特征对企业进行评估,能够全面、客观了解企业实际情况,指导管理者制定准确的决策分析方案,帮助决策者策划清晰可持续差异化服务决策。本文采用熵权法结合TOPSIS算法对企业进行评估。熵权法不需要对指标进行主观赋值,具有计算简单、易于实现等优点。TOPSIS算法能够充分利用原始数据信息,对企业经营现状进行全面评估,最大程度避免人为主观性,精准刻画特征指标。熵权法负责计算特征权重系数,TOPSIS算法负责计算企业特征量化综合评估得分。模型特征集涵盖财务、信用等几个方面。
由于企业特征数据存在分布、尺度方面的差异,所以模型数据需要进行同向归一化处理,本文采用最大最小归一化方法进行处理。根据数据特征,对于负向数据,如违法、失信、资产负债率等,采用如公式(5)方法进行处理:
[xi=max(xi) - ximax(xi)-min(xi)] (5)
对于正向数据,如销售利润率、总资产收益率、专利数量等,采用如公式(6)方法进行处理:
[xij=xij-min(xij)max(xij)-min(xij)] (6)
同向归一化后,利用熵权法计算模型中每个特征所占样本的比重[Pi],如公式(7)所示:
[Pij=Xiji=1mXij] (7)
然后利用比重[Pij]计算第j个特征的熵值[E][j]和特征差异系数[Gj],如公式(8)和(9)所示:
[Ej=1lnmi=1mPijlnPij] (8)
[Gj=1 - Ej ] (9)
上式中m为样本总数。
根据特征差异系数[Gj],最终得出每个特征的权重系数,如公式(10)所示:
[Wj=Gji=1nGj] (10)
TOPSIS算法中,同样需要对数据进行同向化与归一化处理,采用方法同上述熵权法中最大最小化公式。然后构造企业的n维特征空间正、负理想解(各指标的最优解(z+)和最劣解(z-)),如公式(11)和(12)所示:
[ z+ = max{z11,z21,...,zn1 },max{z12,z22,...,zn2 },...,]
[max{z1m,z2m,...,znm } =Z+1,Z+2,...,Z+m] (11)
[z- =min{z11,z21,...,zn1 },min{z12,z22,...,zn2 },...,]
[min{z1m,z2m,...,znm }=Z-1,Z-2,...,Z-m] (12)
在得到企業特征最优解和最劣解后,计算每个企业到正负理想解的距离,如公式(13)所示:
[D+i=j=1mωj(Z+j-zij)2, D-i=j=1mωj(Z-j-zij)2 ] (13)
到此可以结合[ D+i]和[D-i]计算每个企业的综合得分,利用公式(14)对企业进行评估,判定其综合优劣。
[Ci = D-iD+i+D-i] (14)
1.5 模型架构
基于生命周期的企业特征量化模型包括数据源、数据存储、模型计算和模型输出四个部分,逻辑架构如图1所示:
数据源提供模型所需的各种数据,如工商、税务、司法、电力等数据,通过数据接入层传输数据。数据存储层处理模型原始数据,生成入模特征数据。其中,ETL实现多数据融合、异常值处理等功能。模型计算层中,企业生命周期模型实现企业生命周期计算与分类;企业特征量化模型中,熵权法计算模型特征权重,TOPSIS算法负责实现量化、计算各个生命周期内的企业评估得分。模型输出包括企业生命周期分类、综合量化评估得分和排名、综合评估报告等相关内容组成。
2 应用案例
基于生命周期的企业特征量化评估模型在某大型国企集团内部进行应用。模型所需数据由企业内部数据和外部数据组成,形成基本条件、科研能力、信用情况、财务状况4个维度,共计23个模型特征。数据经过企业生命周期模型预测后,待评估企业中,初创期共有19家,成长期共有564家,成熟期共有606家,衰退期共有86家。分别对这四类企业进行评估预测,最终得出这四类企业的综合得分。企业综合评估后,需要对企业进行数据融合定位,由于预测企业属于同一个集团,数据来源一致,评估方法一致,所以可以直接利用企业综合得分进行统一排序,最终得到所有企业的综合评估排名。
本模型在集团内部对企业进行量化评估验证,评估结果得到集团业务人员的高度认可,一致表明基于生命周期的企业特征量化模型评估结果真实可靠,符合集团内部企业实际分布情况,模型评估准确度得到验证。
3 结论
本文提出一种基于生命周期的企业特征量化的评估模型,旨在减少由于生命周期不同而导致企业在财务、科研等方面特征数据差异而带来的评估误差,提高企业评估的准确性和科学性。通过模型的应用与实践,验证了模型的正确性和有效性,为企业评估模型方面的研究提出了一种切实可行的方案。
另外本文创新性地将电力数据融入企业特征量化评估模型中,增加新的特征维度,使模型预测准确度得到了提升。本模型可广泛应用于企业投融资管理、差异化服务定制、市场决策分析等业务场景,为提升企业整体竞争力提供底层数据支撑。
参考文献:
[1] 王士伟.中小型科技创新企业生命周期各阶段的特征及融资政策分析[J].科技进步与对策,2011,28(10):88-91.
[2] 陈志存.基于生命周期理论的企业财务战略[J].纳税,2023,17(23):79-81.
[3] 奚梦缘.中小企业信用指标体系构建及评估模型的最优化[D].南京:南京大学,2018.
[4] 朱宗元,苏为华,王秋霞.新三板融资环境下中小企业信用风险评估[J].统计与信息论坛,2018,33(10):107-113.
【通联编辑:王 力】