基于加权迭代聚类方法的云平台小微企业信用评价

2021-11-26 11:56牛艳芳毕秀玲
山东财政学院学报 2021年6期
关键词:记账聚类小微

孙 瑜,牛艳芳,毕秀玲

(山东财经大学 会计学院,山东 济南 250014)

一、引言

2018 年8 月,国家工业和信息化部关于印发《推动企业上云实施指南(2018-2020 年)》,特别指出“中小企业和创业型企业可依托公有云平台,按需租用存储、计算、网络等基础设施资源,应用设计、生产、营销、办公、财务等云服务或构建特色云服务,提高经营管理水平和效率。”随着应用云平台服务的小微企业数量的增多,存储在云平台公有云的数据逐步完善,不仅包括小微企业的财务信息,还包括小微企业使用云平台的记账行为数据。利用这些宝贵的数据资源在云平台单独设立信用评级板块,打通云平台与银行之间的连接,将评价结果直接传递给银行端与企业端,不仅有助于银行放贷业务的判定,有效减轻小微企业与银行间存在的信息不对称问题,也有助于小微企业查找自身问题,避免劣币驱逐良币现象,促进有潜质的小微企业长远健康发展。同时,利用云平台的财务数据与行为数据构建信用评价指标体系,能够积极响应2020 年工业和信息化部提出的“推广基于多维度大数据分析的新型征信模式”要求。

当前对小微企业信用评价体系中财务指标的研究较为成熟,Van 和Baesens[1]、Dainelli 等[2]主要从企业的盈利能力、偿付能力和流动性状况三方面进行考虑,范柏乃和朱文斌[3]、李菁苗等[4]以经营能力、盈利能力、清偿能力、发展能力为主进行评价体系构建,Zhang 等[5]基于企业的抗风险能力、经营能力、盈利能力以及成长能力四个方面对小微企业信用进行评估;对具体指标的研究,马晓青等[6]、迟国泰和陈洪海[7]通过流动比率、速动比率、现金比率、现金流量比率、资产负债率、销售净利润率等多项具体财务指标对小企业进行信贷评价。

对小微企业信用评价体系中非财务指标的研究主要集中于企业环境、企业特征和企业主特征三方面,而行为指标研究较为匮乏:在非行为指标的研究中,张玉明和段升森[8]从外部影响因素(政策法律、产业环境、社会服务等)和内部影响因素(企业家能力、融资能力、创新能力)两个视角进行探索,胡海青等[9]、匡海波等[10]使用行业状况和企业基本素质体现中小企业资信状况,肖斌卿等[11]和Zhang 等[12]将企业基本信息与企业主信息融入评价体系中;在行为指标的研究中,时晨[13]将中小企业在电商和社交平台的行为数据融入评价体系中,大大提高了指标体系的实用性。

对小微企业信用评价方法的研究集中于传统方法和数据挖掘方法两方面。传统评价方法中,迟国泰等[14]利用序关系法、离差最大化赋权法、最优组合权重法进行评价,高丽君[15]采用贝叶斯模型平均生存模型进行评价,陈晓红和杨志慧[16]构建AFF 改进模糊评价模型,Shi 等[17]采用逻辑回归的方法,赵志冲和迟国泰[18]构造似然函数对指标贡献率进行分析评价;数据挖掘方法中,Oreski 等[19]将遗传算法和人工神经网络方法结合应用,姚铮等[20]运用社会网络分析方法,刘纳新[21]引入小世界网络的方法,肖斌卿等[22]使用模糊神经网络方法,时晨[13]运用BP 神经网络方法,黄丹阳等[23]构建基于高斯谱聚类的风险商户聚类方法。

综上,当前对小微企业信用评价的研究主要存在两方面问题:其一,非财务指标的选取多属于间接影响因素而非直接影响因素,忽略了小微企业日常记账行为对企业经营活动和财务活动的直接反映,降低了评价体系的实用性;其二,评价方法大多以打分排名的方式推荐小微企业,可能致使少数小微企业存在个别方面表现不佳,却因总分排名靠前而获得贷款的现象。

针对上述问题,本文首先设计财务维度与行为维度并行的“双维度”小微企业信用评价指标体系,利用相关—主成分分析法[24]进行指标筛选,剔除信息重复和对结果影响不显著的指标,实现精简指标的目的;其次,构建基于熵权法的加权迭代聚类方法,以划分具有不同特征组别的方式代替单纯排名的方式对小微企业信用进行评价,实现评价过程重点指标突出、评价结果合理可靠的效果,避免发生以次充优的现象;最后,对云平台中批发和零售业的443 家小微企业进行综合评价,针对性地给出发展建议。

二、评价指标体系构建

(一)评价指标体系设计

综合前人的研究基础,结合云平台的数据优势,构建由财务维度和行为维度构成的“双维度”小微企业信用评价指标体系,具体指标设计依据如下:

财务维度,一级指标主要参考范柏乃和朱文斌[3]、李菁苗等[4]和Zhang 等[5]的研究,从偿债能力、盈利能力、营运能力和成长能力四个方面进行评价,旨在从企业的偿付债务水平、综合利润水平、生产经营情况以及未来发展潜力四方面对企业财务状况进行分析;二级指标在马晓青等[6]、迟国泰和陈洪海[7]研究基础上,融入反映小微企业固定资产增长的相关指标,旨在全面、科学地反映小微企业的成长状况。

行为维度,以企业行为理论[25-26]为依据,发现企业将根据实际绩效与经营期望之间的差距来确定后续企业行为。因此,企业实际绩效和贷款标准之间的差距可能影响企业的记账行为,包括虚增业务行为(导致凭证数量激增、凭证规模激增等现象)、突击记账行为(出现单次填制大量凭证、报税期填制上月凭证等现象)、异常使用会计科目行为(导致主营业务涉及科目使用频率低、其他科目使用频率高等现象)等异常记账行为,同时,小微企业主受自身管理能力所限,可能会有记账不及时、不规范等行为的发生。云平台后台记录每次登录平台的记账行为,通过对比分析能够发现异常记账行为,同时能够反映小微企业内部管理水平,因此,本文借鉴Sohn 和Kim[27]、时晨[13]将行为指标融入信用评价体系的做法,创新性地设计企业凭证填制情况、登录平台使用情况以及记账科目占比3 个一级指标以及13 个二级指标用以反映企业的行为状况。

和以往研究相比,本文所构建的“财务+行为”双维度信用风险评价体系具有以下优点:(1)将小微企业记账行为的指标考虑在内,反映企业记账行为的真实性与规范性,能够弥补小微企业经营行为信息缺失的问题,防止小微企业利用伪造的财务信息骗取银行贷款的行为。(2)通过记账凭证张数、记账平均规模、登录平台使用次数、记账科目占比等行为指标能够间接反映企业的业务量、企业记账科目使用与经营业务间的关系等问题,对财务维度指标起到二次验证的作用,实现以财务维度指标为主、行为维度指标为辅、两者相辅相成的效果,同时响应从多维度构建新型征信模式的政策号召。初步指标体系如表1 所示。

表1 云平台小微企业信用评价初步指标体系

(二)指标标准化

指标筛选前需对指标进行标准化处理,解决指标间量纲不一以及不可比的问题,保证后续分析结果的质量。本文主要运用适中区间标准化方法[28]对数据进行处理,该方法认为数据处于某一特定区间内即为合理。设i为评价对象的项数,j为指标的项数,uij和xij分别为标准化前和标准化后的数值,[q1,q2] 为第j个指标的适中区间,q1为适中区间的下边界,q2为适中区间的上边界,该标准化方法如公式(1)所示:

其中适中区间的具体设置规则如下:第一,对财务维度指标进行标准化时,适中区间主要参考国资委同年出版的《企业绩效评价标准值》一书中对应行业的指标标准值,以行业平均值作为区间下限,以行业优秀值作为区间上限。对于未列入该书的指标,通过计算统计年鉴中该指标的行业平均值上下浮动10%确定区间的上下限。第二,对行为维度进行标准化时,由于缺少适中区间的参考值,结合专家咨询意见与行为维度中的每个二级指标数值的密度曲线,选取企业集中分布的适当区间作为标准化的适中区间。

(三)相关—主成分分析法的指标筛选

为保证评价体系的科学性与合理性,采用迟国泰等[24]提出的相关—主成分分析法,剔除含重复信息和对结果影响不显著指标,进一步对指标体系进行精简。

1.相关性分析的指标筛选

相关系数反映两两指标间的相关程度,相关系数越大,表明两个指标存在信息重叠的可能性越大,设h、j都为指标的项数,则第h个和第j个指标的相关系数r的计算如公式(2)所示,为第h个和第j个指标的平均值。当相关性系数0.9[24]时,删除其中包含信息少的指标,以减少指标之间的重复信息。

2.主成分分析的指标筛选

通过计算主成分的贡献率与各指标的因子负载值,筛选出对评估结果有显著影响的原始指标,该方法既能保持指标本身的数值与意义,又能提高各指标对评估结果的显著影响。假设m为指标个数,k为主成分个数,Fg为第g个主成分(g =1,2,…,k),αgm为对应第g个特征值的特征向量的第m个分量。具体计算方法如下:

步骤1:经相关性分析删除含重复信息的指标后,重新计算相关系数矩阵R;

步骤2:计算方差贡献率vg。求矩阵R的特征值λg,λg表示第g个主成分Fg所解释的原始指标值的总方差,则方差贡献率vg的计算如公式(3)所示:

步骤3:计算因子负载djg。将特征值λg从大到小排列,按照累计方差贡献率≥85%的要求选取对应的主成分,第j个指标在第g个主成分上的因子负载djg的计算如公式(4)所示:

(四)样本选取及指标筛选结果

本文选取云平台中443 家批发和零售业的小微企业作为样本进行信用评价,原因有三:其一,行业不同,经营性质不同,经营重点不同,相互间可比性较弱,因此选择单行业进行信用评价;其二,对云平台用户的行业分布情况进行分析,发现批发和零售业用户注册量排名第二位,且行业特征较为突出,排名第一的金融业本身行业性质具有特殊性,与其他行业评价指标差异较大,不作为主要研究行业;其三,为保证行为维度分析结果的真实可靠,在样本选择时剔除了个人版和代理记账版所包含的数据,只保留企业版数据进行探索性分析。

对上述443 家小微企业的数据进行标准化处理后,运用相关—主成分分析法进行指标筛选,最终得到7个一级指标、23 个二级指标组成的指标体系,该指标体系即为后续运用加权迭代聚类方法进行小微企业信用评价的指标体系。指标筛选的具体结果如表2 所示。

表2 指标筛选结果

续表2

三、评价模型

为科学、合理地对小微企业的信用进行评价,本文构建基于熵权法的加权迭代聚类方法,以加权分组的方式代替排名的方式将小微企业划分为不同的等级,使其各组内企业特征尽可能相似,组间企业特征尽可能不同。该方法的原理是:首先,运用熵权法对二级指标加权综合得到一级指标的指标值,熵权法权重的融入可以区分各指标间不同的重要程度,使结果更具聚焦性;其次,采用K-means 算法对一级指标进行迭代聚类,相对于单次聚类结果而言,迭代聚类将其中数量较大的组别进行更为细致的划分,使聚类结果更准确;最后,根据迭代聚类划分结果判定小微企业的信用等级。该方法的具体原理如图1 所示。

图1 基于熵权法的加权迭代聚类方法构建原理

(一)运用熵权法进行加权

熵权法中,熵是对不确定性的度量,指标的熵值越小,该指标所提供的信息量越大,对评估的影响越大,熵权也就越高。假设评价体系中具有n个评价对象,m个评价指标,i为评价对象的项数(i =1,2,…,n),j为指标的项数(j =1,2,…,m),xij为标准化后的指标值。具体计算步骤如下所示:

步骤1:计算熵Hj,第j个指标的熵Hj如公式(5)所示:

步骤2:计算熵权Wj,第j个指标的熵权Wj如公式(6)所示:

Wj的值越高,表明指标j的权重越大,指标j的重要性越大。熵权法通过客观计算权重,避免了人为主观因素对权重的影响。

(二)通过迭代聚类方法完成企业分组

迭代聚类对符合特定条件的组别进行多次聚类分析,直至达到停止聚类条件为止,实现组内企业特征高度相似,组间企业特征不同的效果。迭代聚类方法具体步骤如下:

步骤1:随机选取k(k =2,3,4,…) 个企业作为初始聚类中心,即随机分为k个组别。为避免人为因素对划分组数的干预,对每次K-means 算法聚类分析,都采用F 检验的方法[29]选取F值最大的组数k。设B(k)为组间方差,W(k) 为组内方差,n是企业总数,F值的计算如公式(7)所示:

步骤2:计算每个企业数据到k个聚类中心的欧几里得距离d。并将该企业分配至离其最近的中心点所在的组别。

步骤3:重新计算每组中的中心点,根据新中心点,重新计算每个企业数据到新中心点的距离,并重新分配至距离其最近的中心点所在组别,直至中心点不再变化为止。

步骤4:分析组数为最优k值时的聚类结果,对组内企业数小于等于总体企业数10%[29]的组别进行编号,记录其各指标平均中心点,不再对其进行聚类分析;将组内企业数大于总体企业数10%的组别挑选出,重复进行步骤1 到步骤3,直至所有组别内的企业数量小于等于总体企业数10%时,停止聚类。

步骤5:将聚类分析结果进行汇总,根据每组各个一级指标的平均中心值Vi进行打分,便于后续信用等级的判定。通过咨询多位专家的意见,对平均中心值范围设置相应的分值,具体标准如表3 所示。

表3 平均中心值打分标准

(三)信用等级标准

为便于对分析结果进行统一的辨析,主要参考中国人民银行发布的《中国人民银行信用评级管理指导意见》对借款企业信用等级的划分,并咨询多位专家意见后,最终将评价结果分为7 个等级,由高到低分别是AAA 级、AA 级、A 级、BBB 级、BB 级、B 级、C 级,等级序号由7(AAA 级)逐渐降至1(C 级)。

由于行为维度尚在探索阶段,没有成型的评价体系及评价标准,只作为财务维度的信息辅助与补充维度。因此,在数据分析时,对财务维度与行为维度分开单独分析,最后,将两个评级结果按照公式(8)求出企业综合信用等级。在对每个等级制定具体标准时,除了考虑企业的综合得分外,还考虑了对A 级及以上信用等级设定单项要求限制。具体企业财务维度与行为维度信用等级评价标准如表4 所示。

综合信用等级在计算的过程中遵循谨慎性原则采用向下取整的运算方法()进行处理,计算得出的综合等级序号参照表4 中等级序号列查找对应的信用等级,具体计算如公式(8)所示:

表4 财务维度与行为维度评价标准

四、评价结果及分析

(一)基于熵权法的二级指标权重计算结果

根据筛选后的指标体系,利用公式(5)(6)计算得出各二级指标的权重,具体计算结果如表5 所示。

表5 基于熵权法的二级指标权重计算结果

(二)财务维度迭代聚类评价结果

使用K-means 算法对财务维度的数据迭代聚类4 次后,达到停止聚类的条件,即满足临界值的要求,将443 家小微企业分为17 组。将一级指标所得的平均中心点分别按照表3 的规则进行打分并加总得到财务维度总分,按照总分和各个一级指标得分参照表4 的规则判断企业所属的财务等级。具体结果如表6 所示,其中组别序号1~7 代表第一次聚类划分的组别,组别序号4-1 代表对第4 组进行第二次聚类划分的组别,以此类推。

表6 财务维度评价结果

续表6

从财务维度评价结果的总体分析,共有AAA 级企业197 家,AA 级企业120 家,A 级企业47 家,BBB 级企业69 家,BB 级企业10 家,大多数组别财务维度等级较高,处于A 级及以上,且一级指标平均中心点在0.8 以上,但是少数组别存在短板项目导致财务等级较低。其中,第3 组和第6 组营运能力表现欠佳,第2 组盈利能力一般,第5 组成长能力和偿债能力都存在一定的问题,导致这些组别的等级都处于A 级以下。值得注意的是,虽然第2 组与第3 组的财务等级都为BBB 级,但是第2 组和第3 组存在不同的短板项目,说明两组的内部数据含义不同,在日后经营过程中改进的方向不同。虽然获得AAA 级的组别有5 组,但是每组四个一级指标的表现也有细微的差距。由此可以看出,将小微企业按照其内部数据特征进行聚类划分具有较大的实际意义,相较于传统排名的方式,能够更精细地刻画出不同企业间的特征,为银行放贷决策提供更详细的信息,为小微企业的经营管理指明改进方向。

(三)行为维度迭代聚类评价结果

按照同样的方法对443 家批发和零售小微企业的行为维度进行分析,经3 次迭代聚类将企业分为19 个组别。具体结果如表7 所示。

表7 行为维度评价结果

在此次对行为维度的分析中,没有AAA 级企业也没有C 级企业,达到AA 级的企业也只有16 家,达到A级的企业132 家,主要集中于等级较低的BBB 级225 家和BB 级70 家,达到A 级及以上的企业数量与财务维度相比相差甚远,说明行为维度的整体风险偏高。

由表7 可以看出,相较于其他两项,记账科目占比指标总体表现较好,平均中心点除了第一组外都在0.8以上,说明企业在经营过程中对主营业务科目的使用较为频繁,从侧面也反映企业具备一定的经营能力。结合凭证填制情况来看,第一组企业存在凭证填制数量多、金额大但主营科目使用次数少的特点,可能存在操纵其他会计科目美化账簿的行为。

凭证填制情况指标在各组间浮动较大,甚至出现平均中心点低于0.4 的现象,得分低的主要原因是存在未及时记账、记账凭证张数与经营规模不匹配或突击记账的现象,说明小微企业普遍存在较为严重的记账不规范行为,也不排除企业做假账应付的情况发生。

登录平台使用情况同样差异较大,低分原因主要是存在报税期登录频繁、企业业务量较小、每次登录填制凭证数量较小等现象。该指标没有出现中心点极低的现象,表明所选取的443 家企业都在正常使用该平台,侧面说明对这443 家企业进行分析,结果较为可靠,具有大规模推广应用的意义。

综合上述分析,可以发现行为等级偏低的主要原因有二:其一,忽视记账行为的重要性,存在非规范化记账行为;其二,存在异常记账行为,包括突击记账或操纵账簿的行为。

(四)综合等级评价结果

综合财务等级结果与行为等级结果,根据公式(8)计算得出综合等级结果,在对企业进行综合评级时,不再以组别为单位进行评级,而是回归到以单个企业为单位进行评级。综合等级的评价情况如图2 所示。

图2 综合等级评价结果

由图2 可以看出,443 家批发与零售业小微企业综合等级中没有B 级与C 级,即没有信用恶劣的企业,可能由于样本选取时主要考虑企业版用户数据导致,因为其主要包括具有一定规模、有能力独立记账的小微企业。从总体进行分析,综合等级较高的小微企业较少,最高等级AA 级,只包含68 家企业,主要集中于A 级251 家企业,其次是103 家BBB 级企业,整体呈正态分布,相较于财务等级差之甚远,相较于行为等级整体偏好。加入行为维度考量后,企业的综合信用等级相较于财务等级呈现出三种不同的状态:等级降级(349 家,占比78.78%)、等级不变(88 家,占比19.86%)和等级升级(6 家,占比1.35%)。其中78.78%的小微企业综合等级呈现明显的下降状态,说明小微企业的记账行为与财务结果之间呈现严重的不匹配现象,可能由企业管理不善引发记账行为不规范所致,也可能由于采取异常记账行为粉饰账簿导致,也说明当前小微企业更注重最终的财务结果,尚未认识到记账行为的重要性。在信用评价体系中加入行为维度,能够一定程度上规范小微企业的记账规范性,提高企业治理水平,抑制财务造假行为。

(五)加权迭代聚类方法的特点

为体现加权迭代聚类方法的合理性与科学性,本文使用层次分析法(AHP)对上述443 家小微企业进行信用评价,从评价结果和评价过程两方面对比分析发现加权迭代聚类方法具有2 个相较于AHP 方法的突出特点:

第一,评价结果更严谨、更科学。在443 家小微企业的评级中,AHP 方法评定的等级普遍偏高,其中财务等级偏高213 家、行为等级偏高129 家、综合等级偏高220 家。以H234 小微企业为例进行原数据分析,该企业应收账款科目使用较为频繁,但是应收账款周转率只有0.67,应收账款周转天数大约在537 天,说明企业存在收账期长、收账速度慢的现象,可能导致坏账损失多、资金流动不畅的问题,且存在较为严重的本月填制上月凭证的非规范化记账行为,AHP 方法将其评定为综合AAA 级(其中财务等级AAA 级、行为AA 级),但是加权迭代聚类方法将其评定为综合BBB 级(其中财务等级BBB 级、行为BBB 级),说明加权迭代聚类方法能够更为真实地反映企业的状况,评价结果更为科学。

第二,评价过程更客观。AHP 方法需要专家对三个层次(两个维度、一级指标和二级指标)分别进行两两指标的重要性判断,因此权重中包含较大成分的主观因素,而加权迭代聚类方法评价全程根据数据特征进行赋权与聚类,减少人为的主观干扰,能够实现客观真实反映企业现实状况的目的。

五、结论与建议

(一)研究结论

本文以443 家批发和零售业小微企业为研究对象,基于企业行为理论设计了由财务维度与行为维度构成的信用评价指标体系,构建熵权法与迭代聚类方法融合的加权迭代聚类方法完成对小微企业的信用评价。研究结论主要有:

第一,将行为指标融入小微企业信用指标体系,实现记账行为反映实际经营活动的目的,能够对财务指标起到有效的辅助与验证作用,提高了整个指标体系的实用性;基于熵权法的加权迭代聚类方法相较于AHP 方法,具有评价结果更严谨、更科学和评价过程更客观的优势。

第二,在探索性研究的443 家批发和零售业小微企业中,整体综合信用等级呈正态分布,没有最高与最低级别,主要集中于中间级别,表明整体信用风险偏高;财务等级整体普遍高于行为等级,表明企业更为注重财务结果;行为等级表现较差,集中分布于中等偏下的等级,存在非规范化记账行为、为粉饰财务数据而发生的异常记账行为等。

(二)发展建议

当前,小微企业上云已成为发展的必然趋势,对小微企业、云平台和云平台下小微企业信用评价研究都提出了新的要求,为此完善与发展云平台下小微企业信用评价具有重要的战略意义。

第一,对小微企业而言,一方面,应积极响应国家号召,推进企业财务上云步伐,以提高企业经营管理效率,更大程度享受云服务及后续政策的便利与优惠;另一方面,财务上云后,意味着信息向透明化转变,以粉饰账簿获取贷款的方式成为过去式,小微企业主只有通过加强企业管理水平、创新企业经营方式、提高企业竞争力,才能实现小微企业的持续性发展。在经营过程中关注企业经营绩效的同时,应加强记账行为的规范性,以免降低信用等级导致银行不放贷的结果。

第二,对云平台而言,利用其优势向客户提供优质服务是其主要职责,因此在完成对小微企业的信用评价后,除了向小微企业提供评价结果外,应同时提供详细的信用评价报告,包括但不限于信贷等级、信贷等级影响因素(含财务维度、行为维度等)、发展优势、发展弱势、改进方向等内容,为小微企业的发展指明方向,促进小微企业快速发展。

第三,对社会而言,云平台、银行、税务、工商等部门应建立小微企业信用评价联动机制,形成信息共享、互促共荣的发展模式。一方面,对来自云平台、银行、税务、工商或其他机构的数据在确保数据安全和保护商业机密的前提下进行深度数据挖掘,从中提取行业、市场、企业相关的信息,进一步设计行为指标或其他特色指标,不断完善发展小微企业信用评价体系,构建多角度、全方位的信用评价体系。另一方面,信息挖掘与整合对爬虫技术、数据挖掘技术以及数据分析技术提出了更高的要求,需要从业人员做好迎接挑战的技能准备。

猜你喜欢
记账聚类小微
帮扶小微企业 山西成绩优异
一种傅里叶域海量数据高速谱聚类方法
小微课大应用
一种改进K-means聚类的近邻传播最大最小距离算法
财务自由第1步,从记账开始
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
记账类APP
记账理财的好处有哪些
小微企业借款人
让手机帮你记账吧!