基于ECOC-SVM的多类别审计意见预测建模研究

2018-01-16 12:30孙洁郑玉娇艾文国

会计之友 2018年24期

孙洁郑玉娇艾文国

【摘要】审计意见的恰当性与公司利益相关者有着密切联系，投资者和监管者参考审计报告及审计意见做出决策，注册会计师出具公允客观的审计意见是其职责所在，构建科学合理的审计意见预测模型有利于辅助各方判断上市公司被出具审计意见的合理性。文章针对上市公司被出具审计意见的四种类型，采用多个财务指标作为建模数据的特征值，基于纠错输出编码和支持向量机算法建立了多类别审计意见预测模型。经过实证检验，审计意见预测模型整体准确率达到83.24%，各类审计意见的预测准确率也均达到80.00%以上，模型预测效果良好。

【关键词】审计意见类型; 支持向量机; 纠错输出编码; 预测模型

【中图分类号】 F239.1 【文献标识码】 A 【文章编号】 1004-5937（2018）24-0087-06

一、引言

随着经济快速发展以及逐渐被完善的市场机制，监督机制的重要性已经凸显出来，上市公司的财务报告以及审计报告愈来愈被监管者和投资者所关注，而审计报告也成为监管公司的有利工具，审计意见的公正性也越发重要。审计意见由独立于投资者和管理层的第三方——会计师事务所注册会计师所出具，但是审计过程中的控制风险、检查风险和固有风险等审计风险以及面临的市场风险，可能导致事务所出具有失公允的审计意见。不恰当的审计意见不仅使得投资者不能对公司的经营状况产生正确的认知，也会对注册会计师的个人职业发展产生不利的影响。建立科学有效的审计意见预测模型，能够为注册会计师提供重要的风险管理辅助工具，辅助判断其所出具审计意见的恰当性。此外，外界投资者或者监管者也可以借助审计意见预测模型的预测结果，提前衡量尚未完成审计过程的企业财务报告质量。因此，通过科学合理的方法建立有效的审计意见预测模型具有重要的理论意义和实践应用价值。

二、文献综述

当前的有关审计意见预测方面的研究，主要集中在探究对审计意见产生显著影响的因素和审计意见预测建模方法两个方面。所以，文献综述主要分为研究审计意见影响因素的文献综述和研究构建预测审计意见的模型的文献综述两部分展开。

（一）审计意见影响因素的文献综述

审计意见影响因素的早期研究中，学者们主要关注的因素是企业经营的各项财务指标，Mutchler[1]通过财务指标建立预测模型，检验得出净值报酬率的变化量、息税前利润/销售净额、流动资产/流动负债以及资产负债率等财务指标对企业持续经营性意见有显著关联关系。章永奎等[2]在研究审计意见影响因素中结合盈余管理的研究思路，发现公司的总资产收益率和资产负债率对审计报告的审计意见具有显著性影响。赵楚伊等[3]同样发现企业的盈利性和债务风险与审计意见也存在显著相关性。

许多研究表明企业被出具审计意见的类型与公司其他非财务因素存在一定的相关性。孙铮等[4]通过实证研究发现上市公司的股权结构会影响企业管理层对会计师事务所和注册会计师的选择。Chan et al.[5]经过研究发现当企业所有权为政府控股且处于特殊时期（如面临退市风险、发行新股等）时会更加倾向于得到有利审计意见。方军雄等[6]探究了公司风险程度与被出具非标准审计意见的相关性，结果表明股东占款比重高和亏损等风险因素导致被出具非标准审计意见的可能性比较高。周杨[7]利用Logit回归模型分析发现前期审计意见和企业内部管理的质量会对审计意见产生影响。刘霄仑等[8]采用多种方法实证检验得出企业治理质量与审计意见存在相关性，治理质量高企业的审计意见被审定为标准无保留类别的可能性更高。Krishnan et al.[9]研究结果显示企业管理的能力与审计报告中的持续经营审计意见存在关联性。Defond et al.[10]利用回归分析检验了审计费用中非审计费用所占比重与审计意见的关系，实证结果表明费用结构中不同的非审计费用占比并不会影响审计意见。吴腊[11]研究对审计意见产生影响的因素，实证发现审计费用对其存在显著影响而会计师事务所的变更和任期对其并无显著性的影响。

（二）审计意见预测模型的文献综述

审计意见预测建模研究的早期阶段，只是简单借助财务指标来预测审计意见类型。Kida [12]研究审计过程中审计师判断公司持续经营能力时财务指标的影响程度，请不同的审计师通过速动比率、现金总资产比、权益总负债、总资产周转率、总资产利润率5个财务指标来评判企业持续经营能力，结果显示审计师通过财务比率值判断审计意见类型的正确率达到83%。Kleinman et al.[13]利用债务违约、是否连续亏损、Z值、是否进入重组程序、有利事件和负面事件六个非财务因素，研究其与保留意见类型的审计意见之间的关系，研究表明此类指标与审计意见有密切关系。

随着研究的深入，一方面简单的关系判断方式并不十分科学准确，另一方面数理统计方法不断完善并拓展了应用范围，研究者逐渐将统计方法引入审计意见预测中。构建审计意见预测模型的较常用统计方法是Logistic或Probit，并且经过实证分析得到较为满意的预测正确率。张晓岚等[14]在研究分析上市公司被出具的有关持续经营的审计意见类型及其主要受到的影响因素后，利用Logistic回归方法建立三分类审计意见预测模型，实证表明模型的预测准确率高于80%。胡继榮等[15]分析中国上市企业因经营的持续性具有不确定性程度而被审计人员发表审计意见的类型情况及其合理性，进而采用Logistic回归方法建立用于判别审计意见类别的GCO模型，模型的实证结果得到高达92%以上的预测正确率。

虽然传统的统计模型得到了较好的预测结果，但是统计方法大多有其自身局限性，比如要求研究样本符合正态分布、协方差相等的假设条件限制等，另外建立的审计意见预测模型多为静态判别模型从而容错性较低。随着人工智能技术的发展，神经网络以及支持向量机（Support Vector Machine，SVM）等人工智能机器方法被引入到审计意见预测建模。Doumpos et al.[16]基于SVM建立审计意见预测模型，辅助使用者来判断、验证审计意见的恰当性。田金玉[17]建立基于BP神经网络的审计意见预测模型，将财务指标作为特征值，并通过我国沪深两市的上市公司数据实证检验了模型的有效性。王旭等[18]同样基于BP神经网络建立审计意见类型的预测模型，实证结果显示BP神经网络模型在预测公司经营持续性的正确性优于Logistic回归模型。Fernandez-Gamez et al.[19]应用神经网络对公司治理和财务指标变量建立模型，用于判断评价审计意见是否公正客观。建模方法的增多，有学者对各种建模方法的各方面性能进行了对比研究。Gaganis et al.[20]将最近邻判别分析方法与Logistic回归方法的审计意见预测性能进行比较，发现最近前者构建的模型预测正确率略好于后者。Pasiouras et al.[21]通过对英国审计报告进行案例研究发现，在审计意见决策支持效果方面，基于人工智能方法的模型比基于传统统计方法的模型表现更好。张志恒等[22]利用邻域粗糙集对财务指标和非财务指标进行简约处理得到关键指标，并用于BP神经网络建模，从而构建出预测审计意见的混合模型，并经过实证检验。

（三）文献评述

现有的有关预测审计意见的相关研究文献中，绝大多数研究仅仅将审计意见因变量划分为标准审计意见和非标准审计意见两类，或者仅仅研究某一种审计意见被出具的可能性，不符合实际中审计意见多类型的特点，不能够满足现实经济社会对审计意见的多类别预测需求。此外，审计意见的影响因素选择方面，虽然已经涉及财务因素和非财务因素，但是，财务因素仍然存在经营方面指标较少的缺点，且非财务因素存在指标缺少统一标准和数据可获得性较差的不足。所以，本文在研究构建模型用于审计意见类别的预测时，审计意见因变量将按照上市公司审计报告中实际存在的四种情况分为标准无保留意见、无保留意见加事项段、保留意见和无法表示意见四个类别，建模特征变量则采用涉及公司各个方面且具有客观标准的多项财务指标，并利用分类效果较好的人工智能方法——SVM，融合纠错输出编码（Error Correcting Output Codes，ECOC）思想，建立多类别审计意见类型预测模型。

三、多类别审计意见预测模型的构建

基于多类别审计意见预测模型的构建过程包括三个关键步骤：建模变量设计、数据处理设计、基于ECOC-SVM的多类别审计意见预测模型构建。

（一）建模变量设计

财务报表的审计意见被规定有五种主要类别：标准无保留、无保留意见加事项段、保留意见、否定意见、无法表示。但是，考虑上市公司被出具审计意见类别的实际数据情况，几乎不存在否定意见方面的企业数据。所以，本文将按照上市公司审计报告中实际存在较多的四种情况，将审计意见因变量划分为标准无保留意见、无保留意见加事项段、保留意见和无法表示意见四种类别。

建模特征变量由多项财务指标构成。首先，建立了涵盖企业经营各个方面且可能与审计意见存在一定联系的备选财务指标体系，涉及发展能力、风险水平、盈利能力、资产比率结构以及偿债能力。此备选财务指标体系中既囊括了已有研究中涉及过的财务指标，还增加了一些可能与审计意见有关联的财务指标。其次，为了进一步筛选与审计意见有关联的财务指标，以提高后续构建模型的效果，本文采用统计方法中的单因素方差分析（One-Way ANOVA）方法来选择具有显著影响的建模特征变量。利用ANOVA方法，选取出在四种类别审计意见样本中具有显著差异性的财务指标作为最终的建模特征变量。

（二）数据处理设计

样本公司的建模特征变量取值与审计意见因变量取值构成初始建模数据集T1，然而该数据集存在不同特征变量之间的量级差别大和不同审计意见类别之间的样本数量非平衡的问题，需要通过数据标准化处理和数据非平衡处理，进而得到建模数据集T2。

1.数据标准化处理

由于特征变量的性质不同，财务特征指标之间的量级差别较大，如果直接用于训练模型，会产生数值较高的财务指标被突出，数值较低的财务指标被削弱的问题。所以，本文将对数据采用Min-Max标准化（Min-Max normalization）方法进行归一化处理，从而保证不同财务指标数据间量级的平衡性，其公式如下：

公式中min v与max v分别代表某一类财务指标的最小值和最大值。经过标准化处理后，所有财务指标的数值都会分布在[0，1]区间内。

2.数据非平衡处理

本文将审计意见类型分为标准无保留意见、保留意见、无保留意见加事项段、无法表示意见四种。现实中这四类审计意见类型的样本公司数量有较大的差别，存在较为严重的类别间样本数量不平衡问题，所以本文将利用SMOTE（Synthetic Minority Over-Sampling Technique）技术[23]处理类别间样本数量不平衡的问题。

SMOTE是一种利用线性插值原理在原始样本之间对少数类样本进行过采样的技术，将针对每类少数类样本即保留意见、无保留意见加事项段、无法表示意见三类样本数据分别进行非平衡处理。假设需要SMOTE过采样的人工样本数是原来少数类样本数的W倍，则先使用K近邻方法找出某个少数类样本的K（K>W）个最邻近同类样本;然后，随机从K个邻近样本中选取W个，并在原始少数类样本本身与其某一邻近样本构成的线段上插值生成新的子代样本。通过SMOTE可以产生符合相应审计意见类别特征的新样本，从而增加保留意见、无保留意见加事项段、无法表示意见三类少数类样本的数量，使得这三类样本与标准无保留意见类别样本之间的不平衡性得到减弱。

（三）基于ECOC-SVM的多类别审计意见预测模型构建

1.SVM与ECOC的基本概念

SVM是一种应用广泛的人工智能分类方法，由Vapnik首先提出[24]。SVM方法的理论基础是结构风险最小原理和统计学习中的VC维（Vapnik-Chervonenkis Dimension）理论，具有监督学习性的分类模型，对两类样本训练SVM模型时将找到两类样本的最优分类超平面w·x+b=0，再利用训练好的SVM分类器辨别待测未知企业样本的审计类别。

传统SVM只能用于建立二分类模型，为了解决多类别审计意见预测建模问题，需要引入或结合其他方法。本文将采用ECOC方法[25]，即在多类别审计意见的俩俩类别之间进行二分类SVM建模时引入编码的思想，并在审计意见预测时充分利用具有容错性优势的代码解码过程。将SVM与ECOC相结合，从而构建出ECOC-SVM多类别审计意见预测模型。

2.ECOC-SVM多类别审计意见预测模型

ECOC-SVM多类别审计意见预测模型的基本思想是将多类别审计意见预测问题拆分为若干个二分类审计意见预测问题，框架如图1所示。

本文将利用三元ECOC原理，则多类别审计意见预测模型ECOC-SVM的工作过程分为两步：

（1）编码阶段：在ECOC-SVM审计意见预测模型的训练阶段，审计意见的四种类型分别被划分指定为积极类别、消极类别或者停用类别。每次划分中被指定为积极类别和消极类别的审计意见类型将被用于訓练二分类SVM单分类器。例如，标准无保留意见作为训练中的积极类别（编码为1），无保留意见加事项段则作为对立的消极类别（编码为-1），进而保留意见和无法表示意见将被作为停用类别（编码为0），在此标准下利用样本数据训练出一个二分类SVM单分类器;以此类推，每次以审计意见四种类型中的两两组合作为积极类别和消极类别，剩余两种类型作为停用类型，训练得到六个二分类SVM单分类器。见表1。

（2）解码阶段：在ECOC-SVM审计意见预测模型的预测阶段，待预测审计意见类型的公司样本通过六个二分类SVM单分类器分别对其进行预测，并将预测结果标记组成一个编码序列。这个预测结果编码序列与每个类别的原始编码序列进行比较并且计算两者之间的距离，最终返回其中距离最小的类别为ECOC-SVM模型预测的未知类别公司的审计类型。

四、模型验证

（一）样本选择与数据来源

从沪深A股中选取2013—2017年具有标准无保留审计意见、无保留审计意见加事项段、保留意见和无法表示意见的各类上市公司数据作为研究样本。样本公司总数为3 421，其中，标准无保留审计意见、无保留审计意见加事项段、保留意见和无法表示意见的样本公司数分别为2 912、351、109、49。本研究中所用的样本公司审计意见和财务指标数据来源于国泰安数据库。

（二）建模特征变量选择结果

备选财务指标体系由55个财务指标构成，利用IBM SPSS Statistics 21统计软件进行方差（ANOVA）分析，最终选择出15个适合用于建立模型的特征财务指标，结果如表2所示。收集所有样本公司被出具审计意见年份的特征财务指标数据和审计意见类型组成初始建模数据集T1。

（三）审计意见预测模型的实验结果及分析

初始数据集T1经过标准化处理和非平衡处理后得到建模数据集T2。利用Matlab软件构建ECOC-SVM多类别审计意见预测模型并进行模型效果测试，重复运行30次，每次运行时随机选取80%的样本数据用于训练模型，剩余的20%样本数据用于评价模型的预测性能。ECOC-SVM多类别审计意见预测模型对四类审计意见的平均预测准确率以及整体预测平均准确率结果如表3所示，同时根据30次模型测试结果绘制折线图如图2所示。

从表3中可以看出，ECOC-SVM多类别审计意见预测模型对于上市公司审计意见类型的预测性能达到较高水平。整体预测准确率达到83.24%，说明ECOC-SVM模型通过公司的财务数据对公司的审计意见类型预测情况整体性能良好。图2显示，ECOC-SVM模型的整体预测准确率曲线波动性较小，说明此模型预测时的运行性能较稳定。

同时，ECOC-SVM模型对四种审计意见类型的预测准确率均超过80%，其中，对保留意见样本公司的预测准确率达到86%，在四类中居最高准确率水平;对无法表示意见样本公司的预测准确率为次高，达到85.23%;但是ECOC-SVM模型对于保留意见类和无法表示意见两类样本公司的预测准确率较为不稳定，保留意见类的折线图波动性最大。模型对标准无保留意见和无保留意见加事项段两个类别的预测稳定性较好，对标准无保留意见类别的预测平均准确率高于无保留意见加事项段类别。

实证结果表明本文构建的ECOC-SVM多类别审计意见预测模型能够较为准确地预测上市公司的审计意见，预测性能达到满意水平。利用ECOC-SVM多类别审计意见预测模型能够辅助使用者预测上市公司可能被出具的审计意见。同时，实证结果也表明，上市公司的审计意见类型与建模特征值——财务指标之间存在一定的相关关系，将多个与审计意见具有相关性的财务指标信息通过ECOC-SVM模型进行综合建模，更能辅助预测审计意见类型，并达到满意的预测效果。

五、结论

企业的财务报告以及审计报告、审计意见等越来越被监管者和投资者所关注，审计报告也成为监管公司的有利工具，审计意见的作用也越发重要。投资者和监管者可以利用审计报告及审计意见类别来辅助其做出各项决策。本文将ECOC的编码解码思想和SVM分类预测方法相融合，建立了ECOC-SVM多类别审计意见预测模型。审计意见类别作为分类类别，采用实际上市公司被出具审计意见的常见四种类别，即标准无保留意见、無保留意见加事项段、保留意见和无法表示意见。通过单因素方差分析筛选出对审计意见有显著影响的建模特征财务指标体系，并对初始建模数据集进行数据标准化处理和数据非平衡处理。经过实证检验，ECOC-SVM多类别审计意见预测模型对审计意见整体预测准确率达到83.24%，对四种审计意见分类别的预测准确率也均达到80.00%以上，ECOC-SVM模型预测效果良好。投资者和监管者可以借助此模型的预测结果来辅助预测审计意见，注册会计师也可以运用模型的预测结果来检测出具的审计意见是否恰当，从而降低审计风险。●

【参考文献】

[1] MUTCHLER J F.A Multivariate analysis of the auditors going-concern opinion decision[J].Journal of Accounting Research，1985，23（2）：668-682.

[2] 章永奎，刘峰.盈余管理与审计意见相关性实证研究 [J].中国会计与财务研究，2002 （1）：1-14.

[3] 赵楚伊，刘艳萍，崔霁晗，等.我国上市公司审计意见类型影响因素研究[J].现代商业，2017（12）：161-162.

[4] 孙铮，曹宇.股权结构与审计需求[J].审计研究，2004 （3）：7-14.

[5] CHAN H K，LIN K Z，WANG R R.Government ownership，accounting-based regulations，and the pursuit of favorable audit opinions：evidence from China[J].Auditing：A Journal of Practice & Theory，2012，31 （4）：47-64.

[6] 方军雄，洪剑峭，李若山.我国上市公司审计质量影响因素研究发现和启示[J].审计研究，2004（6）：38-46.

[7] 周楊.我国上市公司审计意见影响因素的实证研究——基于2008年沪深A股年报数据的分析[J].会计之友，2011（4）：62-64.

[8] 刘霄仑，郝臣，褚玉萍.公司治理对上市公司审计意见类型影响的研究——基于2007—2011年中国民营上市公司的面板数据[J].审计研究，2012（5）：51-57.

[9] KRISHNAN G V，WANG C.The relation between managerial ability and audit fees and going concern opinions[J].Auditing：A Journal of Practice & Theory，2015，34（3）：139-160.

[10] DEFOND M L，RAGHUNANDAN K，SUBRAMANYAM K R.Do non-audit service fees impair auditor independence？ Evidence from going concern audit opinion[J].Journal of Accounting Research，2002，（40）4：1247-1274.

[11] 吴腊.我国上市公司年报审计意见影响因素研究 [J].财会通讯，2014（36）：28-33.

[12] KIDA T.An investigation into auditor' continuity and related qualification judgments[J].Journal of Accounting Research，1980，18（2）：506-523.

[13] KLEINMAN G，ANANDARAJAN A.The usefulness of off-balance sheet variables as predictors of auditors' going concern opinions：An empirical analysis [J].Managerial Auditing Journal，1999，14（6）：273-285.

[14] 张晓岚，张文杰，鲁晓岚.持续经营能力重大不确定性下审计意见的预测研究[J].统计与决策，2007 （8）：96-98.

[15] 胡继荣，王耀明.论CPA不确定性审计意见预测——基于重大疑虑事项的持续经营[J].会计研究，2009 （6）：81-87.

[16] DOUMPOS M， GAGANIS C， PASIOURAS F.Explaining qualifications in audit reports using a support vector machine methodology[J].Intelligent Systems in Accounting Finance & Management，2005，13（4）：197-215.

[17] 田金玉.基于BP神经网络的上市公司审计意见预测模型 [J].财会月刊，2010（3）：109-110.

[18] 王旭，孔玉生.基于BP神经网络模型的持续经营不确定性审计意见预测[J].财会月刊，2012（36）：62-64.

[19] FERNANDEZ-GAMEZ M A.GARCIA-LAGOS F，SANCHEZ-SERRANO J R.Integrating corporate governance and financial variables for the identification of qualified audit opinions with neural networks [J].Neural Computing & Applications，2016，27（5）：1427-1444.

[20] GAGANIS C， PASIOURAS F， SPATHIS C， ZOPOUNIDIS C.A comparison of nearest neighbours discriminant and logit models for auditing decision[J].Intelligent Systems in Accounting Finance & Management，2007，15（1/2）：23-40.

[21] PASIOURAS F， GAGANIS C， ZOPOUNIDIS C.Multicriteria decision support methodologies for auditing decisions：the case of qualified audit reports in the UK[J].European Journal of Operational Research，2007，180（3）：1317-1330.

[22] 张志恒，李丹，李瑜.基于邻域粗糙集神经网络的审计意见预测模型研究[J].重庆理工大学学报（社会科学），2017（8）：37-43.

[23] CHAWLA N V，BOWYER K W，HALL L O，et al.SMOTE：synthetic minority over-sampling technique[J].Journal of Artificial Intelligence Research，2002，16（1）：321-357.

[24] VAPNIK V N.Statistical learning theory[M]. John Wiley and Sons，1998.

[25] DIETTERICH T G，BAKIRI G.Solving multiclass learning problems via error-correcting output codes[J].Journal of Artificial Intelligence Research，1995，2（1）：263-286.