上市公司财务舞弊识别模型研究

2016-12-01 13:13葛文荣
智富时代 2016年12期
关键词:因变量舞弊变量

葛文荣

【摘 要】论文在研究中选取了14个具有代表性的指标来对中国2000年-2015年间多达484家舞弊公司中的60家样本和1:1配比的60家非舞弊样本进行二分量的Logistic回归分析,分析得出上市公司财务舞弊的可能性识别模型,从而对舞弊公司的识别提出新的思路和角度。

【关键词】财务舞弊;识别研究;Logistic回归模型

一、识别模型的选择

国内外学者运用了多种模型对财务舞弊进行识别。本文认为单因素方差分析、多元判别分析和多元概率回归模型均要求样本服从正态分布,而舞弊公司不服从正态分布,人工神经网络模型的种类差异较大,而且精度也有待进一步考量。逻辑回归模型不要求样本服从正态分布和两组协方差矩阵相等,而且其适合于因变量为二分类的问题,模型建立后只需将具体的财务数据代入得到概率值P,即可得知该公司发生财务舞弊的概率,因此非常方便且应用广泛。综上所述,本文将结合逻辑回归(Logistic回归)模型来进行财务舞弊识别模型的研究。

二、样本选择与数据来源

(一)数据来源

本文中上市公司历年的财务舞弊信息数据来源于国泰安数据库《中国上市公司财务指标分析数据库》(CSMAR)自2000年到2015年间的所有舞弊公司,按照证券行业分类分为19个行业大类,并且结合了沪、深证券交易所、中国证监会网站所提供的上市公司的年度财务报告和和讯网、东方财富网等网站提供的数据信息。

(二)样本选择和说明

本文研究的样本包括舞弊样本和非舞弊样本,根据数据库发现2000年1月至2015年6月,由上海交易所、深圳交易所和中国证监会公告处罚的有484家。根据证监会2012年公布的《上市公司行业分类指引》,其中剔除金融服务行业,因为金融机构的会计处理与一般企业不同。

本文先根据行业对舞弊企业进行分类,再按每个行业的舞弊数量占总体舞弊企业的比例来分配每个行业要抽取的舞弊样本数量,最后通过简单随机抽样的方法抽取2000—2015年之间的舞弊公司并选取首次舞弊来作为样本。

本文按以下顺序来选择舞弊样本。

①本文选取从2000-2015年在深沪两市发行的A股,并且因为财务舞弊被证券交易所和监督委员会公开处罚的上市公司。

②本文选取上市公司的年报数据进行分析。

③采用简单随机抽样,如果该公司连续几年实施了财务舞弊,则以第一个舞弊年度来作为样本。

(三)非舞弊样本选择和说明

本文选取与舞弊样本同行业且资产规模相近并未被披露违规从未受到监督部门处罚的公司,其中行业分类按照中国证监会公布的《上市公司行业分类指引》为参照标准。资产规模以舞弊公司发生舞弊那年的年报中的资产总额来作为标准选取。

最后,本文选取了60组舞弊样本和60组非舞弊样本。

选好舞弊样本和非舞弊样本后,以资产规模为变量进行了配对样本的T检验。配对样本T检验过程主要用于样本均数的比较,检验配对样本差值的总体均数与总体均数0的差异有无统计意义,以及检验配对两样本是否相关。本文用SPSS17.0菜单中的Paired-Samples T Test过程执行t检验。

     表2 Paired Samples Statistics

表2显示,舞弊样本的:样本例数(N)=60,样本均数(Mean)=2.7188E9,标准差(Std.Deviation)=3.57351E9,标准误(Std. Error Mean)=4.61338E8。

配对样本:样本例数(N)=60,样本均数(Mean)=2.3610E9,标准差(Std.Deviation)=3.19120E9,标准误(Std. Error Mean)=4.11982E8。

                   表3  Paired Samples Correlations

表3显示配对变量间的相关性分析结果。配对数(N)=60,相关系数(Correlattion)=0.930,P(Sig)=0.000,P<0.05值可认为两配对变量有相关关系。

配对样本的t检验结果。配对样本的配对差(Paired Differences)结果:均数(Mean)=3.57819E8,标准差(Std.Deviation)=1.32306E9,标准误(Std.Error Mean)=1.70806E8,95%的可信区间(95% Confidence Interval of the Difference)为1.60369E7~6.99602E8。

配对T检验结果:配对T检验统计量t=2.095,自由度(df)=59,P值Sig.(two-tailed)=0.040。由t=2.095,df=59,P<0.05,故可认为舞弊样本和配对样本具有统计学意义。

三、变量的选择和识别模型的构建

(一)研究假设和变量的选择

假设一:企业财务状况不佳是财务舞弊的动因。

根据前文的舞弊三角理论的介绍,财务状况的恶化是公司舞弊的压力,但是非必然使公司发生财务舞弊。公司的财务状况的评价指标主要有:偿债能力、经营能力、盈利能力、发展能力等方面。本文选取了8个指标来作为解释变量,分别是:速动比率、资产负债率、应收账款周转率、存货周转率、资产报酬率、营业成本率、营业收入增长率、净利润增长率。

假设二:企业的非财务信息对公司财务舞弊的发生有影响。

企业的非财务信息主要包括了公司的治理结构和股权结构的特征。本文选取了较为代表性的4个指标,分别是独立董事所占比例、高管人员持股比例、国有股比例、流通股比例。

假设三:公司的外部审计对公司财务舞弊的识别具有一定作用。

审计报告是注册会计师基于职业操守和专业知识对企业财务报告的客观认定和评价。因此,本文选取了审计意见和审计费用来作为舞弊识别模型的变量。

(二)变量的财务舞弊涵义解释

首先,本文建立的财务舞弊识别模型主要是识别虚假财务报告的,因此本文选取的变量指标大多是针对财务报表舞弊后的识别。除此之外,本文结合了舞弊三角论的思想作为参考来选取指标。

财务指标中的速动比率用来衡量企业速动资产并且反映企业的短期偿债能力,资产负债率用来衡量长期偿债能力。应收账款周转率和存货周转率都是来反映企业运营能力的指标。营业成本率和资产报酬率是体现企业盈利能力的指标。

非财务指标主要针对了企业的治理机制和股权结构。董事会的外部成员,独立董事能加强企业的内部控制,防止企业进行财务舞弊,独立董事的比例越高企业舞弊的可能性越低。

外部审计意见也是企业财务状况的体现,而且对财务舞弊的公司进行审计需要很多的审计程序,审计费用也会增加。

本文选择了14个指标来进行分析,先对指标进行正态性检验、非参数Wilcoxon符号秩检验,然后进行多重线性检验,最后用经过分析筛选的变量来进行Logstic回归分析建立模型并进行模型检验。

四、模型的分析与检验

(一)logistic回归分析

1.变量的正态性检验

为了筛选出较好代表性的变量,并且剔除具有多重线性关系的变量,因此我们要选择显著性较好的变量来进行识别模型的建立。在进行显著性检验之前先对变量的正态性检验,如样本数据不符合正态分布则不能使用显著性T检验,只能使用对变量的分布无限制的Wilcoxon检验。

本文采取单样本K-S正态性检验来分析变量是否符合正态分布,具体在表6里。

      表5 变量正态性检验汇总

资料来源:SPSS

经过K-S检验,分析得出除了X1的其他变量的显著性水平(P<0.05)都接近于0,可以得出结论:这些变量总体上不服从正态分布。因此,对这些变量不能用T检验,只能用非参数Wilcoxon检验。

2.非参数Wilcoxon符号秩检验

Wilcoxon符号秩检验是分析两配对样本,并对样本来自的两总体的分布是否存在差异进行判断。通过对变量的显著性检验来剔除变量提高模型精度。

表6 描述性统计及显著性检验

检验结果表明,指标X4(存货周转率)、X7(营业收入增长率)、X9(独立董事所占比例)、X12(流通股比例)与原假设不符。因此,应该将这几个变量剔除。

3.变量的多重线性检验

Logistic回归对变量的多元共线问题很敏感,由于版面的问题不能将相关性分析的矩阵放进来,经过相关性分析,每个变量之间的相关系数都小于0.5,所以可以全部都进行Logistic回归分析。接着进行变量的共线性检验,如表7。

从表中我们可以看出,所有变量的方差膨胀因子都小于5,而且容忍度都大于0.2基本上可以认为变量间不存在多重共线性。

4.Logstics回归模型

因为本文的因变量为分类因变量,即因变量分为舞弊与非舞弊。逻辑回归(Logistic)分析是最常用于处理分类因变量的统计方法。逻辑回归可根据因变量的分类个数分为二元逻辑回归分析(Binary  Logistic)和多元逻辑回归分析(Multinomial Logistic),二元逻辑回归模型中因变量只能取两个值 1 和 0,即虚拟因变量。而多元回归模型中因变量可以取多个值,因此在本文模型构建中,可以采用二元逻辑回归模型,舞弊因变量可分为是否舞弊两类,取值 1 和 0,即“是”或“否”,自变量为筛选后的指标变量。

Logistic回归模型建立后用P=Prob(Y=1|X)表示发生舞弊的概率。本文以0.5来作为分割点,即P值大于0.5则为舞弊公司。

Logistic回归函数为:

5.识别模型建立

将筛选后的变量代入Binary Logistic回归模型中,采用Enter 法确定最终的模型。

表8中的“Wald”是检验Logistic回归系数的检验统计量,根据统计量P值,可知X2、X5、X10、X14回归系数不显著,因此得出上市公司财务舞弊识别模型为:

模型的指标的财务舞弊识别的系数解释:X1速动比率与财务舞弊的可能性呈负相关,这与假设相符,速动比率过低,企业的短期偿债风险较大,企业进行财务舞弊的可能性也越大;X3应收账款周转率与财务舞弊的可能性呈负相关,财务舞弊一般是为了虚增不存在的利润,只能以应收账款的形式反映,导致应收款项大幅增加,导致应收账款周转率下降,与假设相符。X6营业成本率和X8净利润增长率是来衡量企业获利能力和成长能力的指标。X11和X13是从治理结构上和外部审计上对企业是否舞弊的一个很好的体现。

根据建立的模型,将样本数据代入回归模型计算得到概率值P,并且与0.5做比较,若P值>0.5则判定为舞弊公司,反之为非舞弊公司。

(二)模型识别检测效果

根据前面实证分析的结果可知,采用Logistic回归建立上市公司财务舞弊识别模型具有一定的效果,识别上市公司财务舞弊的比率为78.2%。

五、结语

本文通过对2000年-2015年间多达484家舞弊公司中的60家样本和1:1配比的60家非舞弊样本进行二分量的Logistic回归分析,最终结果表明应收账款周转天数变动指数、流动比试变动指数和三个主成份建立的模型可以有效识别上市公司的财务报表舞弊。

【参考文献】

[1]洪荭, 胡华夏... 基于GONE 理论的上市公司财务报告舞弊识别研究[R]. 武汉:武汉理工大学管理学院, 2012: 84–91.

[2] 洪文洲, 王旭霞... 基于Logistic回归模型的上市公司财务报告舞弊识别研究[J]. 中国管理科学, 2011(22): 351–356.

[3] 金花妍, 刘永泽. 基于舞弊三角理论的财务舞弊识别模型研究——支持向量机与 Logistic回归的耦合实证分析[J]. 大连理工大学学报(社会科学版), 2014(33): 92–97.

[4] 于婷. 财务报告舞弊风险的识别与模型构建[D]. 中国海洋大学: 中国海洋大学, 2013年.

[5] 李欣, 康进军... 因子分析、Logistic回归在会计舞弊研究中的应用[J]. 统计与决策, 2015(6): 89–92.

[6] 李玲. 中小企业会计舞弊的环境分析——基于 Logistic 回归模型[J]. 当代经济, 2015(18): 120–123.

[7] 伊建杰. Logistic 回归模型分析综述及应用研究[D]. 黑龙江大学: 黑龙江大学, 2011年.

猜你喜欢
因变量舞弊变量
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
浅谈财务舞弊与防范
抓住不变量解题
也谈分离变量
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
会计电算化环境下会计舞弊的应对策略
偏最小二乘回归方法
我国上市公司财务舞弊识别模型初探
SL(3,3n)和SU(3,3n)的第一Cartan不变量
分离变量法:常见的通性通法