薛文艳
近期,我国资本市场频频爆发上市公司违法违规事件,如康得新、康美药业、獐子岛、辅仁药业财务舞弊案件,给投资者等利益相关方带来巨大损失,财务报表的真实性以及审计报告的恰当性再次成为人们关注的焦点,会计师事务所的审计质量更是学术界研究的热点问题。然而,由于受到审计收费、审计时间、审计成本、审计人员执业能力与职业道德等多重因素的影响,审计质量无法通过直接观察得出结论,更难以获取量化结果,因此,学者们通常会选用代理变量对审计质量进行实证研究。
在目前国内外已有的审计质量研究中,选用的代理变量主要有:审计 收 费(Lobo and Zhao,2013;Chakrabarty 等,2015)、事务所规 模 或 品 牌(Fang and Wong,2005)、可操控性应计利润(Booner等,2008;杨明增等,2018;张金丹等,2019)、非标审计意见(Lim and Tan,2008;陈运森等,2018)、财务报告重述(马晨等,2014;张宏亮等,2018)等。上述研究中,大多直接选用某个或某几个代理变量作为审计质量的代理变量,较少解释选用的依据与理由。那么,这些代理变量能在多大程度上解释审计质量?选用是否适当?针对这些问题,学者们对选用上述代理变量的依据和局限性进行了分析,并对有效性进行了检验。如DeFond和Zhang(2014)对现有研究中关于审计质量的代理变量进行了综述,并分析了各个代理变量在度量审计质量方面的优势和缺陷。张宏亮、文挺(2016)选用权益资本成本效应、违规可能性和财务报表重述概率作为过滤检验变量,逐一检验了各个审计质量替代指标的有效性。赵艳秉、张龙平(2017)以2001—2014 年深沪两市A 股上市公司为样本,检验了审计质量替代变量在我国的适用性。然而,上述研究并未从替代指标与审计质量相关性的角度研究各代理变量的适当性,因此本文从审计质量测度指标入手,对事务所规模、企业盈余质量、非标审计意见、财务报告重述替代指标的适当性逐一进行评析,并提出审计质量代理变量的应用策略。
要想厘清审计质量代理变量是否适当,首先应明确与审计质量相关的测度指标以及审计质量代理变量的选取要求。
审计质量指的是审计最终产品的质量,即审计报告实现审计目标的程度。审计质量的高低最终需要通过审计结果反映,而审计结果又受到审计投入、审计过程与审计环境等综合因素的影响。审计质量的衡量,从被研究对象的角度区分,分为对单项审计业务质量的度量和对会计师事务所总体审计执业质量的度量。对单项审计业务质量而言,审计投入、审计过程、审计环境及审计结果均与其高度相关,都构成了度量单项审计业务质量的替代指标。而会计师事务所总体执业审计质量取决于一定时期内单项审计业务质量的总和,因此,其替代指标在度量单项审计业务质量指标的基础上增加了反映会计师事务所总体执业质量的规模及声誉。本文借鉴了Knechel等(2013)提出的审计质量特征的一般框架,从审计投入、审计过程、审计结果、审计环境四个方面提出了测度审计质量的分级指标,如表1所示。
Deangelo(1981)将审计质量定义为审计人员发现和披露错报漏报情况的联合概率。审计投入与审计过程决定了审计人员是否能发现错报,而审计结果与审计环境又决定了审计人员报告财务报表重大错报的概率。因此,理论上,上述因素都与单个审计项目的质量密切相关,都可以作为代理变量衡量审计质量,但从实证研究的可行性上,只有上述可以直接观测、容易判断与计量的因素满足审计质量代理变量的前提条件。
按照审计准则的规定计划和执行审计工作是衡量审计质量的技术标准,审计计划与执行过程需要通过审计工作底稿呈现。依据保密性原则,审计工作底稿涉及委托方非公开的商业机密,其所有权归属于会计师事务所。因此,反映审计项目质量的整个审计程序、审计证据的收集、审计决策、审计复核信息都是不可观测的,即使可以观测也难以客观衡量,并作为变量数据加以获取。因此,在实证研究中,需要选取可直接观测的度量指标作为审计质量的代理变量以研究与审计质量相关的问题。
代理变量的基本特征需要符合:(1)代理变量与被代理变量高度相关,与随机误差项不相关;(2)代理变量容易判断与计量;(3)代理变量与其他解释变量无多重共线性;(4)如果审计质量为因变量,则其代理变量不宜使用外生变量。例如,外部监管与处罚力度,公众诉讼的便利性与诉讼成本。表1中所列示的影响审计质量的因素均与审计质量相关,但不可直接观测的因素不满足上述第(2)项特征。在进行审计质量实证研究时,如果审计质量为解释变量,则应检测与其他被解释变量是否存在多重共线性;如果审计质量为被解释变量,表1可直接观测的因素中,审计收费、行政处罚、收入依赖(客户重要性)及审计诉讼率均是受审计环境影响的因素,与审计活动本身无关,不受审计活动过程及结果控制,因此也不满足替代因变量的选取要求。
表1 审计质量的测度指标
表2 不同情形下可操纵性应计利润代理变量的适当性
表3 不同情形下财务报告重述代理变量的适当性
此处的适当性是指审计质量替代指标是否符合代理变量的选取要求,是否与审计质量高度相关且容易判断与计量,并能满足上述其他两项基本特征。由于本文并不研究计量模型中审计质量与其他变量的关系,因此,在评价审计质量替代指标适当性时,并不涉及上述第(3)项与第(4)项特征的分析。
表1反映审计投入的可直接观测指标中,审计人数、审计时间、审计范围、签字注册会计师年度审计项目数量只有在获得会计师事务所报备系统中的相关数据时,才可作为观测指标。但这些可观测指标作为审计质量的代理变量,是否适当呢?以审计人数为例,由于不同企业所处行业与业务性质存在差异,同等资产规模企业的交易量与审计范围并不相同,所需的审计人数也就不同。因此,审计人数的多寡并不能反映审计质量的高低,即使以审计人数除以总资产作为测度指标,也并不客观。同理,采用审计时间、审计范围、签字注册会计师年度审计项目数量作为审计质量的代理变量也存在上述问题,均不满足与审计质量高度相关的要求。在实证研究中,不宜采用其作为审计质量的代理变量。
表1中反映审计过程的因素属于不能直接观测因素,即使有机会查阅审计工作底稿,审计程序、证据、结论等也难以量化。即使较全面地将其构建为审计质量指标,分值、权重也难以科学地加以确定。因此,在可直接观测的因素中,排除表1中审计投入、审计过程以及受审计环境影响的变量,本文只对会计师事务所规模或声誉、企业盈余质量、审计意见和财务报告重述作进一步评价。
会计师事务所规模越大,越具有品牌效应,越注重维护其声誉价值。大规模的会计师事务所更加注重审计风险的控制,比如,通过招聘素质更高的审计人员,投入更多的人员薪酬、风险控制成本、培训成本与审计时间来保证审计质量。早期研究发现,大型事务所花费更多的审计时间和收取更高的审计费用,故认为大型事务所提供更高的审计质量(Palmrose,1986)。此外,大所对客户的经济依赖性低,独立性高,审计质量也越高。事务所规模越大,在股东与经理层的代理关系中越中立,审计质量就越高(Fang和 Wong,2005)。
我国学者也通过实证研究发现,事务所规模与审计质量正相关。例如,大所更能抑制公司的盈余管理(王良成和韩洪灵,2009);“四大”更可能出具非标审计意见(曾亚敏,2014;龙小海和张媛媛,2016)。但也有部分学者研究发现,会计师事务所规模与审计质量并不存在显著的相关关系(原红旗,2003;郭照蕊,2011)。可见,我国关于会计师事务所与审计质量相关性的实证研究结论并不一致。因此,我国关于审计质量的实证研究文献中,通常将会计师事务所规模作为审计质量的代理解释变量来研究与被解释变量的关系,极少运用会计师事务所规模作为被解释变量来替代审计质量。更重要的原因是,如采用事务所规模作为因变量的代理变量,无法解释与研究问题中自变量之间的因果关系,即使事务所规模与审计质量相关,但由于决定事务所规模的因素与影响审计质量的因素并不一致,因此,事务所规模并非是各解释变量的结果。例如,事务所合并与规模正相关,但事务所合并对审计质量的影响并不确定,运用事务所规模作为审计质量因变量的代理变量,会弱化与自变量之间的相关性,甚至丧失研究的经济意义。
通常,在无保留意见情形下,被审计单位对外公布的财务报告已经做了审计调整,调整后的财务报告盈余质量越高,表明审计质量越高。因此,在实证研究中,大量学者运用盈余质量作为审计质量的代理变量。最常用的盈余质量测度指标有盈余反应系数、盈余稳健性与盈余管理程度。
其中,盈余反应系数常被学者作为投资者感知的审计质量的代理变量加以使用,但由于影响股票回报的因素很多,模型存在的变量遗漏问题会影响盈余反应系数的准确度,此外,计算未预期盈余以及累计股票回报过程中的测量误差均会影响回归结果(Dechow等,2010)。更重要的是,我国资本市场尚处于弱式有效阶段,会计信息质量令人堪忧,会计信息的可信度影响利益相关方对股票投资的反应程度。因此,用盈余反应系数指标测度盈余质量存在局限性。
学者大多以Basu模型的回归系数衡量会计盈余的稳健性,回归系数越大,盈余越稳健,盈余质量越高。但确认坏消息期间的盈余持续性低于确认好消息期间的盈余持续性,虽然当年度盈余更稳健,但未来期间好消息的盈余持续性更强,盈余稳健性与持续性均会影响盈余的决策效用(Basu,1997)。此外,Dechow等(2010)指出,模型的回归系数主要基于长时窗的股票回报指标,而影响该指标的因素较多,因此,应用巴苏模型测度盈余质量同样存在较大的局限性。
企业盈余管理分为真实盈余管理与应计盈余管理。真实盈余管理虽涉及管理层操纵真实的交易活动,但财务信息如实反映了这种实质性交易活动的后果,会计处理也遵循了会计准则,因此,CPA无理由要求被审计单位调整该类交易的会计处理,更无法要求被审计单位逆转相关活动。鉴于此,CPA对真实盈余管理不作审计调整,真实盈余管理也就不能作为反映审计质量的度量指标。如果发现并证实存在此类操纵行为,一般认定为内部控制的重大缺陷。应计盈余管理是企业通过会计政策与会计估计变更等手段改变盈利水平,以此操纵利润的行为。应计盈余管理将总应计利润分为正常性的不可操纵应计利润和可操纵应计利润两部分,其值等于净利润减去经营活动现金流量。应计盈余管理的估计模型主要有业绩匹配的应计盈余管理估计,基本的Jones模型和修正的Jones模型,DD模型和修正的DD模型三种。
其中,业绩匹配的应计盈余管理估计方法是通过控制与不可操纵性应计利润相关的会计业绩因素,以业绩配对的控制组公司在随机或非随机样本中得出对超额经营业绩的无偏估计。国外关于可操纵性应计利润的实证研究大多采用业绩匹配样本。然而,在审计质量研究中,实验样本与配对样本的选择依据并未得到有效论证。例如,用非标意见的审计报告与标准意见的审计报告分别作为实验样本与配对样本进行配比研究,这是基于非标意见审计报告质量低于标准意见审计报告质量的假设,然而非标意见作为审计质量代理变量在以往文献中并未得到有效论证,因此,在此假设下计算出的可操纵性利润之差更不适宜作为审计质量的代理变量。
鉴于上述模型存在的缺陷,大多学者采用Jones模型或DD模型计算出可操纵性应计利润作为盈余质量的衡量指标。但运用可操纵性应计利润作为审计质量的代理变量是否适当呢?本文首先根据审计前与审计后可操纵性应计利润的大小,分析企业盈余质量,再依据被审计单位是否接受调整以及CPA出具审计意见的类型,分析审计质量,进而揭示不同情形下可操纵性应计利润与审计质量的相关性。可操纵性应计利润代理变量的适当性如表2所示。
表2将可操纵性应计利润代理变量的适当性分为四种情形:(1)如果审计前可操纵性应计利润较高,而审计后的可操纵性应计利润较低,则意味着审计调整较大,即错报更正较多,这意味着未审盈余质量较低,审后的盈余质量较高,审计质量较高,此时二者呈负相关;(2)如果审计前与审计后的可操纵性利润都较高,此时,分两种情况,一是CPA未建议较多的审计调整,审计调整较少,审后的盈余质量较低,审计质量也较低,此时二者仍呈负相关;(3)如果被审计单位拒不接受审计调整,CPA出具了保留或否定意见,虽然审后的盈余质量也较低,但审计质量较高。这是由于CPA发现了重大错报,并提出了调整建议,而并非是由于审计后可操纵性应计利润较高指示了审计质量较高,因此二者不具有相关性;(4)如果审计前财务报表的可操纵性应计利润较低,表明未审盈余质量本身较高,CPA无须实施更多的审计程序,收集更充分、适当的审计证据以降低可操纵性应计利润,审计调整也较少,审计后的可操纵性利润自然也低,但并不意味着CPA提供了高质量的审计。此时可操纵性利润不能指示审计质量,二者并不相关。因此,第3、4种情形下,选用可操纵性应计利润作为审计质量的代理变量明显是不适当的。
其次,即使在表2的第2种情形下,也存在着这样一种可能,即可操纵性应计利润所涉及会计政策或会计估计未受到准则的严格限制,CPA未获得确凿证据证明该操纵行为的不合法与不公允,因而未能提出调整建议,此时,较高的可操纵性应计利润并不意味着较低的盈余质量,也不代表较低的审计质量。故而,严格地讲,可操纵性应计利润对审计质量的指示意义进一步弱化了。综上,表2中的第1种情形下,审计前的可操纵性利润高,审计后的可操纵性利润低,意味着审计质量较高,此时,可操纵性应计利润作为审计质量的代理变量最为适当。但在实践中,由于财务报表未审数不公开披露,审计前可操纵性应计利润数据不易获取,只能从行业协会或相关监管部门数据库中观测,限制了样本的采集与研究。
最后,相较于真实盈余管理与交易型舞弊,可操纵性应计利润操纵了应计利润在不同期间的分布,长期来看,应计利润总额不变。而真实盈余管理却实质性地损害了相关方的长期利益,降低或平滑了未来期间盈余质量,但真实盈余管理活动并不影响可操纵性应计利润,不违反会计准则,且难以逆转,CPA不能提出审计调整,这种情形下,可操纵性应计利润指标不能测度企业全部盈余质量,也不适合作为代理变量度量审计质量,只能作为企业应计盈余质量的代理变量;交易型舞弊是企业通过与供货商、销售商或隐蔽的第三方等关联交易方伪造采购、生产、销售等资金流,进行系统化规模化的一条龙舞弊。该类舞弊手段以制造真实资金流为主,较少使用调节可操纵性应计利润的手段进行会计造假。此时,即使可操纵性应计利润较低,也不代表有较高的盈余质量和审计质量。因此,实施交易型舞弊的情形下,以可操纵性应计利润作为审计质量的代理变量便不适宜了。
衡量审计质量的好坏,最直观的是通过审计报告能否为信息使用者提供可供其进行正确决策的信息来进行甄别。对比标准意见的审计报告,非标意见报告中陈述了导致非标意见的事由,为利益相关者提供了明确的信息甄别价值,且保留意见与否定意见本身也表明CPA发现并报告了重大错报,意味着较高的审计质量,故有学者使用该指标作为审计质量的代理变量进行实证研究,但运用该指标存在着如下重要缺陷:
首先,非标意见审计报告的质量未必一定高。如,CPA与被审计单位合谋,对本应发表否定意见的审计报告,以无法取证为由,发表无法表示意见报告;又如,对本应是否定意见或无法表示意见的,发表保留意见;再如,对本应是保留意见的,发表带强调事项段的无保留意见。虽然均为非标意见,但却是审计意见的折衷与妥协,意味着较低的审计质量。
还有一种例外情形是由于细节抽样带来的误拒风险和控制抽样带来的信赖不足风险的影响,当推断误差不能代表总体特征时,可能会使推断的总体误差超过报表重要性水平。而真实错报可能小于根据样本推断的总体误差,低于报表重要性水平。此时,如果被审计单位拒绝调整,审计师可能会出具非标意见,而真实审计意见可能是无保留意见,这也是审计质量较低的一种情形,虽然这种情形比较少见,但也真实存在。
其次,标准意见审计报告的质量未必一定低。当被审计单位依据CPA建议对审计差异进行调整后,财务报表所有重大方面都符合报表的两性特征。在这种情况下,可操纵性应计利润较低,盈余质量较高,事务所出具了标准审计意见,其审计质量也是较高的(谭楚月、段宏,2014)。
最后,统一用非标意见作为与审计质量正相关的代理变量不能客观反映审计质量的层级。哪种审计意见质量更高?如果用非标意见代表审计的高质量,那么,最严重的否定意见是否代表最高审计质量?保留意见代表较高的审计质量?标准审计意见审计质量最低?尤其是在出具无法表示意见的情形下,CPA并不承担出具该意见的审计责任,也就不应以此种意见来代理CPA的审计质量,反映审计质量的高低。
综上,无论是非标意见还是标准意见,只能代表被审计单位对外公布的财务报告的会计信息质量,并不能客观反映CPA的审计质量。衡量审计质量的标准是CPA是否对被审计单位财务报表发表了恰当审计意见,而不是对财务报表发表的审计意见类型。此外,由于我国被出具非标意见的上市公司较少,如果以此作为审计质量的代理变量,会影响研究结论的可靠性。
1971年7月,《美国会计准则委员会第20号意见书——会计变更》中提出,财务报告重述是指被审计单位在发现并纠正前期财务报告的差错时,重新表述以前公布的财务报告。可见,财务报告重述意味着先前的会计信息质量较低,同时也可能表明CPA未发现前期财务报告存在的错报。因此,通常情况下,财务报告重述意味着较低的审计质量。故而有部分学者选用年度财务报告重述(因中期报告未经审计)作为与审计质量负相关的代理变量。
会计差错更正表明前期财务报告所提供的信息有误,会计信息质量低下。那么,财务报告重述前的审计报告质量究竟如何?还应根据下列三种不同的情形加以判断,具体如表3所示。
一是如果CPA未发现前期财务报告的重大错报,发表不恰当审计意见(如标准意见),之后管理层自愿或在监管部门敦促下重述了财务报告,此时,审计师虽根据重述后的财务报告,重述了恰当意见的审计报告,但前期审计报告质量仍较低。这种情形下,财务报告重述与审计质量负相关。
二是如果前期财务报告不存在重大错报,CPA发现的错报未超过重要性水平且性质也不重要,因此出具了标准意见审计报告,但之后管理层自愿对低于重要性水平的错报进行重述,此时,CPA虽对前期财务报告出具的是标准意见,但审计质量也较高。该情形下,财务报告重述与审计质量不相关。
三是如果CPA发现了前期财务报告的重大错报,被审计单位不同意调整,因此发表了非标意见的审计报告,期后由于媒体曝光,监管层迫于压力或考虑非标意见后果而自愿重述了财务报告,此时,由于CPA对前期财务报告发表的是恰当的非标意见,故审计质量较高。此情形下,财务报告重述与审计质量也不相关。
可见,财务报告重述不一定与审计质量负相关,只有前期财务报告存在重大错报且未被CPA发现或报告,进而出具了标准意见审计报告时,财务报告重述作为与审计质量负相关的代理变量才是适当的。
由于因审计质量受到行政处罚的会计师事务所较少,以行政处罚作为审计质量的代理变量限制了指标的应用范围,少量的研究数据会影响研究结论的可靠性,因此本文不对行政处罚作进一步分析。
鉴于会计师事务所声誉与审计质量相关性的研究结论并不一致,且其影响因素宽泛于审计质量的影响因素,因此,当审计质量为被解释变量时,不应选用事务所声誉作为其代理变量。此外,实证研究往往采用会计师事务所规模作为事务所声誉的代理变量,较大规模的事务所,如国际“四大或“本土“八大”,是否一定具有良好声誉?从2019年瑞华事务所被罚事件来看,事实并非如此。因此,本文建议用会计师事务所与签字注册会计师的诚信等级作为事务所声誉的替代指标,并以此作为审计质量充当解释变量时的代理变量。
前述表2所提及4种情形中,只有披露后的可操纵性应计利润大幅低于披露前的可操纵性应计利润时,表明CPA发现并建议调整了重大错报,审计质量较高。应注意的是,使用可操纵性应计利润作为代理变量,应剔除审计差异调整小于报表层重要性水平(非重大错报,无需建议调整)、被出具非无保留意见(可操纵性应计利润大,但CPA发现并对外报告了重大错报,审计质量较高,非负相关)、运用真实盈余管理以及被处罚的交易舞弊型(均与可操纵性利润无关)上市公司样本。
由于非标意见中可能存在意见错配与级差过大的问题,以此作为审计质量的代理变量会影响研究结论的可靠性;如将否定意见出具为保留意见或带强调事项段的无保留意见,虽均为非标意见,但意见并不恰当,不能指示高水平的审计质量。再如,无法表示意见并不能代表CPA实施了恰当的审计程序,提供了高水平的审计质量,因此,其不能作为审计质量的指示变量;加之,被出具非标意见的上市公司较少,少量样本限制了该变量的指示效力。综上,应谨慎使用非标意见作为审计质量的代理变量,一是应剔除被处罚且被出具了保留意见和带强调事项段的无保留意见的公司样本(因被处罚的事务所应出具的是否定意见的审计报告);二是剔除被出具无法表示意见的公司样本。
如前述表3所示,只有被审计单位前期年度财务报告存在重大错报,且CPA对其出具了标准审计意见时,财务报告重述指标与审计质量呈负相关,因此,选用财务报告重述作为审计质量的代理变量时,应剔除非标意见和对重述财务报告未重述审计意见(因前期报告不存在重大错报,CPA无需对重述的年报重新出具审计意见)的公司样本。
为增强研究结论的有效性,有部分学者分别采用几个审计质量代理变量来验证与解释变量的相关关系。如果检验结果一致,会增强研究结论的可靠性;但检验结果可能并不完全一致,且以往研究表明,即使只选用单个代理变量,不同学者的研究结论也并不一致。因此,在利用多变量进行分项或联合检验时,进一步加剧了研究结论的不稳定性,缩窄了研究结论的适用范围。
综上,不同指标作为审计质量代理变量的适当性不同,其应用范围也不尽相同。进行审计质量相关的实证研究,应在明确研究问题的前提下,界定所研究的对象与范围。为增强研究结论的可靠性,需合理评估各代理变量的局限性,对不同的代理变量谨慎使用。