曾亚敏,宋尧清
学术界从审计结果和审计投入视角提出了多个审计质量度量指标,例如财务报告重述(Chin & Chi,2009)、客户公司操纵性应计或微盈利(Gul et al., 2013)、审计意见类型(Chen et al., 2010)、会计师事务所规模(DeAngelo,1981)、审计师专长(Reichelt & Wang,2010)、审计时长(Cahan et al., 2022)以及审计费用(Engel et al., 2010)等等。但因为审计质量无法直接观测,这些指标在间接度量审计质量时存在各自的缺点①譬如,基于审计结果的指标(如操纵性应计、是否出具非标准审计意见等)很难区分公司的财务报告质量与审计师的审计质量;而基于审计投入的指标(如是否为行业专家、审计时长等),其计算高度依赖审计师的可观测数据,受到信息公开的限制(Aobdia,2019)。。为此,现有少量文献尝试对这些审计质量度量指标的有效性进行检验,譬如,Aobdia(2019)使用美国PCAOB 与会计师事务所内部的执业检查数据,检验审计质量度量指标与检查结果是否一致。但由于该文使用的检查结果为私有数据,其研究结论可复现性或推广性较低。Rajgopal et al.(2021)运用美国证监会对审计违规的处罚公告和私人针对审计违规的集体诉讼文件,通过从中提取违规事实的相关信息,以一般公认审计准则为框架判断审计违规的类型,进而检验审计质量度量指标与常见类型审计违规的相关性。该文的数据虽然可以公开获取,但对审计违规的分类依赖于作者的主观判断,缺乏客观性①主观判断是指处罚公告或诉讼文件并未明确指出审计师违反哪条审计准则,而是作者根据处罚公告或诉讼文件中的语言表述,对应查找相应的审计准则。譬如,如果处罚公告或诉讼文件中出现“现任审计师没有充分与前任审计师沟通”,则作者认为审计师违反了业务承接相关的准则(Rajgopal et al., 2021, p.569)。这样的主观联系,容易出现漏判或误判的情况,降低研究的可信度。相比之下,我国证监会的处罚公告明确指出审计师违背哪条审计准则,无需作者进行主观判断。。
中国证监会在对会计师事务所审计违规出具的行政处罚决定书中,明确列示了事务所违反的具体审计准则。例如,2018年7月31日中国证监会公告了《行政处罚决定书(大华会计师事务所、张晓义、高德惠、谭荣)》(证监罚字〔2018〕70 号)。在5000 余字的处罚书中,证监会认定大华会计师事务所审计佳电股份2013年度至2015年度财务报表时,未勤勉尽责,出具的审计报告存在虚假记载;未执行特定审计程序或审计程序执行不到位,违反了《审计准则第1301号——审计证据》第十三条、《审计准则第1211号——通过了解被审计单位及其环境识别和评估重大错报风险》第二十一条、《审计准则第1313号——分析程序》第五条和第七条等②完整内容请参见http://www.csrc.gov.cn/csrc/c101928/c1042565/content.shtml。。
这一制度背景为我们检验审计质量度量指标的有效性提供了一个绝好的实验环境。首先,证监会行政处罚数据可公开获取,提高了研究的可复现性。其次,处罚决定书中明确指出违反哪条审计准则,研究人员无需自行进行主观判断,提高了研究结论的可信性。最后,采用经证监会查处的审计违规作为检验审计质量度量指标有效性的“过滤器”同时符合审计实务人员、学术界以及审计监管机构对审计质量的定义。学术界对审计质量的定义普遍采用结果导向方式,例如DeAngelo(1981)将审计质量定义为“审计师发现客户会计系统存在违规行为以及报告违规行为的联合概率”,DeFond & Zhang(2014)将审计质量定义为“在公司的财务报告系统和固有特征一定的情况下,财务报告能够公允地反映公司基本经济状况的保证程度”。而实务中,审计实务人员不以结果为导向,而是将是否违反审计准则作为度量审计质量的主要依据(Christensen et al.,2016)。证监会的处罚公告一方面明确指出审计师违反的审计准则,另一方面对审计报告最终是否存在虚假记载做出裁定,即同时符合实务人员与学者对审计质量的界定。另外,处罚决定书内容显示,证监会高度关注事务所在审计过程中的勤勉尽责程度,这与美国公众公司会计监督委员会(PCAOB)和国际审计与鉴证准则理事会(IAASB)在审计结果之外更强调通过审计投入与审计过程来定义审计质量是一致的。如,PCAOB 的审计质量框架包括六项审计投入和六项审计过程变量;IAASB亦强调,高审计质量建立在项目团队获得充足、恰当审计证据的基础上。
为检验审计质量度量指标在中国市场的有效性,本文收集整理了2003年至2021年9月间中国证监会对会计师事务所和审计师个人的行政处罚决定,而后基于公告中的文本统计了事务所和审计师违反具体审计准则的情况。在剔除了仅提供违法事实、但未提供违反了某项具体审计准则的行政处罚决定书后③在实证分析中,我们的审计违规总样本包含了这部分无法识别被违反的具体审计准则的观测。,本文得到82 个涉及审计违规的公司—年观测值④基于研究数据的可得性,本文仅关注被审计单位为A股上市公司的审计违规。。其中,《中国注册会计师审计准则第1301 号——审计证据》(以下简称《1301 审计证据准则》)、《中国注册会计师审计准则第1101 号——注册会计师的总体目标和审计工作的基本要求》(以下简称《1101基本要求准则》)、《中国注册会计师审计准则第1312号——函证》(以下简称《1312函证准则》)和《中国注册会计师审计准则第1141号——财务报表审计中与舞弊相关的责任》(以下简称《1141 舞弊审计准则》)被违反的频次居于前列,占审计违规样本的比例分别为63.41%、54.88%、45.12%、40.24%。上述四项准则分别从审计证据的收集、执业态度等方面为审计工作提供了规范,反映了审计质量的不同维度。
本文选取的待检验的审计质量度量指标包括审计结果和审计投入两类,其中基于审计结果的度量指标为客户公司的操纵性应计、是否发生财务报告重述、是否发生微盈利以及审计意见类型,基于审计投入的度量指标包括事务所规模、任期、是否为首年审计、行业专长以及客户重要性。回归分析结果显示客户公司的财务重述与审计违规的相关程度最高,这表明在中国情境下,财务报告重述更有效地反映了审计质量。为了进一步说明各个指标分别从哪些维度度量审计质量,本文基于审计师违反频次最高的四项审计准则,即《1301 审计证据准则》《1101 基本要求准则》《1312 函证准则》和《1141 舞弊审计准则》,检验审计质量度量指标与不同类型审计违规的相关性。结果表明,财务报告重述与全部类型的审计违规都显著相关,这反映财务报告重述对审计质量的度量最为全面。另外,客户公司微盈利、事务所是否为首年审计和客户公司对于事务所的重要性等指标也与部分类型的审计违规显著相关,这说明上述指标也从部分维度度量了审计质量。譬如,客户公司微盈利与涉及违反《1301审计证据准则》的审计违规显著相关,说明该指标侧重于反映审计师是否获取了充分、适当的审计证据。在稳健性检验中,考虑到财务报告重述与证监会处罚可能存在反向因果关系,本文剔除了公告日期晚于证监会行政处罚决定书出具日期的财务报告重述观测,回归结果显示财务报告重述依旧与审计违规高度相关。
本文主要的贡献在于拓展了现有检验经典审计质量度量指标有效性的研究。本文根据证监会对会计师事务所违反的具体审计准则的裁定结果,对审计违规进行客观分类,通过检验经典审计质量度量指标与审计违规及其子类别的相关性,从而检验各指标的有效性。这样的研究方法和独特数据弥补了现有研究依赖私有数据或主观判断的不足(Aobdia,2019;Rajgopal et al.,2021),研究结论对未来审计质量领域的相关研究起到了基础性的支撑作用。其次,本文为监管部门的事后监管提供了借鉴。监管部门在开展事后监管时,由于面临执法资源的限制(Kedia & Rajgopal,2011),可基于风险导向的原则选择监管对象。本文通过检验审计质量度量指标与审计违规的相关性,侧面指出哪些指标反映审计项目可能存在合规问题,从而有助于监管部门有针对性地选择监管对象。
余文结构安排如下:第二部分为制度背景,第三部分为研究设计,第四部分为实证结果与分析,第五部分为稳健性检验,第六部分为结论与启示。
中国证监会行政处罚具有权威性和专业性的特征,其权威性在于《中华人民共和国证券法》从法律高度规定了证监会依法对全国证券市场实行集中统一监督管理,并明确了审计机构的法律责任;专业性则体现在证监会依据审计准则衡量审计工作的质量。证监会及其派出机构通过行使行政执法和处罚权,旨在提高受罚事务所和审计师的审计质量。一方面,行政处罚是证监会纠正受罚事务所和审计师的违法行为、督促其提高执业能力的手段。另一方面,行政处罚具有信号功能,受罚事务所和审计师的声誉受损,进而出现新增客户数量减少等不利后果(李晓慧等,2016)。现有文献发现事务所在受罚后将提高审计质量,以期重塑声誉、避免未来再次受到处罚(刘笑霞,2013)。
本文手工提取了中国证监会及其派出机构在2003 年至2021 年9 月期间针对审计违规出具的行政处罚决定书,共计76份。总体而言,证监会每年出具的行政处罚数量呈波浪式分布。但自2016年起,行政处罚数量较之前明显提升,这与同一时期监管部门提出从严监管的要求相吻合。本文根据证监会做出的行政处罚决定,统计了2003—2016年期间对A 股上市公司的审计违规情况,经统计,涉及审计违规的公司—年度共计96 个。在样本期内,各年度涉及审计违规的上市公司数量大致呈U 型分布,同时每年平均有5 家以上的上市公司涉及审计违规。根据违规情节的严重程度,对事务所及注册会计师的处罚措施包括警告、罚款、市场禁入和撤销证券服务业务许可。
我国审计准则体系的发展经历了独立审计准则和风险导向的新审计准则(以下简称“新审计准则”)两个阶段。新审计准则在原有的独立审计准则基础上进行了修订完善,全面引入了现代风险导向审计模式,于2006年2月15日出台,自2007年1月1日起正式施行。遵循审计准则是审计质量的重要组成部分(Christensen et al.,2016)。本文统计了证监会在行政处罚决定书中援引审计准则的情况。为保证结果的客观性和准确性,我们剔除了仅提供违法事实、但未提供违反了某项具体审计准则的行政处罚决定书。在2003—2016 年样本区间内,各项审计准则被违反的情况如表1 所示。其中,《1301 审计证据准则》《1101基本要求准则》《1312函证准则》和《1141舞弊审计准则》被违反的频次位居前4位。
表1 审计违规事件中审计准则被违反的情况
本文详细查看了上述四项审计准则被违反的具体条目,了解被违背具体准则的侧重点。《1301审计证据准则》强调应“获取充分、适当的审计证据”,要求审计师“根据具体情况设计和实施恰当的审计程序”(第十条);《1101 基本要求准则》主要关注审计师的执业态度,要求在审计工作中“保持职业怀疑”(第二十八条);《1312 函证准则》侧重于如何勤勉尽责地执行函证程序,例如“在未回函的情况下,应当实施替代程序”,“如果存在对询证函回函的可靠性产生疑虑的因素,应当进一步获取审计证据以消除这些疑虑”等(第十七条、第十九条);《1141舞弊审计准则》要求审计师充分考虑舞弊风险,“认识到存在由于舞弊导致的重大错报的可能性,而不应受到以前对管理层、治理层正直和诚信形成的判断的影响”(第十三条)。总体而言,这四项具体准则从不同方面为审计工作提供了规范,刻画了审计质量的不同维度。因此本文在后续实证分析中根据会计师事务所对上述四项审计准则的违反情况将审计违规进行分类,检验各项审计质量度量指标与不同类型审计违规的相关性是否存在差异。
本文采用如下的实证模型检验经典审计质量度量指标与审计违规的相关性:
模型中,i、t分别代表公司和年度①在回归样本中,部分行业的公司未发生审计违规,因此为避免回归结果出现完美预测,进而导致样本损失,本文在模型(1)中未控制行业固定效应。在稳健性检验中,本文在模型(1)基础上进一步控制了行业和年度固定效应,研究结论保持不变。。被解释变量Violation表示审计违规,解释变量Audit_Quality为本文参考现有文献选取的多个审计质量度量指标,包括基于审计结果和审计投入的两类。其中,基于审计结果的审计质量指标包括客户公司的操纵性应计(AbA)、财务报告重述(Restate)、微盈利(SmlProfit)以及事务所出具的审计意见类型(MAO)。现有文献认为,审计质量越高,则审计结果即客户公司财务报告的质量越高(Teoh & Wong,1993);客户公司被审计师出具非标审计意见,反映事务所更为稳健或更具独立性(Chan & Wu,2011;Firth et al.,2012)。在审计投入方面,本文选取的审计质量度量指标包括事务所规模(Big10)、客户重要性(CI)、客户关系程度(Tenure、New_Client)和事务所行业专长(Industry_Expertise)。现有文献认为大型事务所由于独立性更强,并且在技术、培训和设施上具有优势,能够提供更高质量的审计服务(DeAngelo,1981;Khurana & Raman,2004)。此外,事务所通过发展行业专长,也有利于促进审计质量提高和审计成本降低(Reichelt & Wang,2010)。而事务所在对重要客户提供审计服务时,将容易丧失独立性和做出妥协(DeAngelo,1981),从而导致审计质量降低。在事务所与客户的关系方面,本文选取了事务所任期(Tenure)和事务所是否为首年审计(New_Client)进行度量。根据Cahan &Zhang(2006)的观点,新聘用的事务所将在审计过程中投入更多的努力以降低潜在的诉讼风险,因此审计质量相对较高。事务所任期对审计质量的影响则是多方面的,长任期在对事务所独立性构成威胁的同时,也提高了事务所的专业胜任能力(曹强和葛晓舰,2009),故本文未对审计质量随事务所任期变化的方向做出预期。
借鉴Rajgopal et al.(2021)的做法,本文将发生审计违规的公司—年度作为处理组(Violation=1),将未发生审计违规、但发生公司违规的公司—年度作为对照组(Violation=0)②公司违规样本来源于被财政部门、证监部门或交易所查处的上市公司违规行为,包括虚构利润、虚列资产、虚假记载(误导性陈述)等具体违规类型。。这一做法的目的在于,发生审计违规的公司—年度往往同时涉及审计责任和会计责任,通过将公司违规样本作为对照组,可以剥离出审计责任,从而更纯净地检验指标是否度量审计质量。模型中变量的定义如表2所示。
表2 变量定义
本文以2003—2016 年中国A 股上市公司为样本,相关数据取自CSMAR 数据库。样本期截至2016的原因是审计违规从发生到被处罚存在时滞。我们收集了证监会截至2021 年9 月做出的行政处罚,并计算得出处罚决定书出具日期与审计报告出具日期的平均时间间隔约为4.15 年,因此能够确认截至2016 年年审是否存在审计违规。样本期始于2003 年是因为CSMAR 数据库从2003 年开始提供上市公司的股权性质、第一大股东持股比率和部门数量数据。在剔除控制变量存在缺失和由四大审计的观测值后,模型(1)的样本共计2821 个公司—年观测值。为控制异常值的影响,我们对连续型变量按照1%的标准进行缩尾处理。
表3 列示了描述性统计的结果。从审计质量度量指标来看,处理组样本发生财务重述和微盈利的比例相对较高,反映了财务报告质量相对较差;同时,处理组样本聘请的会计师事务所规模相对较小,占事务所在该地收入的比重相对较高,这反映了审计机构在胜任能力和独立性方面弱于对照组。从控制变量来看,处理组样本的资产负债率相对较高,总资产周转率相对较低,说明经营状况相对较差。
表3 描述性统计
本文检验各项审计质量度量指标与审计违规是否显著相关,表4和表5分别报告了基于审计结果和审计投入的审计质量度量指标与审计违规的相关性。回归结果显示,Restate、SmlProfit的回归系数显著为正,说明当客户公司发生财务报告重述或微盈利时,会计师事务所审计存在违规的可能性较大。这与Aobdia(2019)以美国数据为样本的研究结果是一致的,反映了这两项指标在被用于度量审计质量方面具有较强的普适性。从基于审计投入的度量指标来看,New_Client的回归系数显著为负,与预期一致,说明新聘用的事务所由于投入了更多的努力,将能够提供更高质量的审计服务。在上述与审计违规显著相关的审计质量度量指标中,只有Restate显著提高了模型的解释力(AUC变化的p值显著),说明客户公司的财务重述提供了有关审计违规的增量信息,因此对审计质量的度量结果相对更为准确。
表4 基于审计结果的审计质量度量指标与审计违规
表5 基于审计投入的审计质量度量指标与审计违规
为进一步评估审计质量度量指标在不同维度的有效性,本文选取了会计师事务所违反频次最高的四项具体审计准则,即《1301 审计证据准则》《1101 基本要求准则》《1312 函证准则》和《1141 舞弊审计准则》,根据这四项准则是否分别被违反对审计违规进行客观分类。上述准则对应了审计质量的不同维度,若审计质量度量指标与涉及违反某项具体审计准则的审计违规显著相关,则说明指标反映了该项具体审计准则对审计工作的要求。而当某项审计质量度量指标与不同类型的审计违规都显著相关时,表明该项指标对审计质量的度量结果较为全面。
本文先逐一将4 个审计结果指标与5 个审计投入指标分别对四项准则进行回归,共计36 个回归模型①为节省文章篇幅,本文未用表格报告这36 个单独回归模型的结果,仅采用文字描述;后文表5 报告了所有审计质量指标同时纳入回归的结果。。在与是否违反《1301 审计证据准则》回归的9 个模型中,Restate和SmlProfit的回归系数显著为正,说明客户公司发生财务报表重述或微盈利反映了审计师在收集审计证据方面未勤勉尽责。New_Client的回归系数显著为负,表明当事务所执行首年审计时,收集审计证据更加勤勉尽责,从而减少了相关审计违规发生的概率。在与是否违反《1101 基本要求准则》回归的9 个模型中,Restate和SmlProfit的回归系数显著为正,说明客户公司发生财务重述或微盈利反映了审计师缺乏应有的执业态度,未保持应有的职业怀疑。而事务所为重要客户提供审计服务时,由于难以保持独立性,发生审计违规的概率将会提升(CI的回归系数显著为正)。New_Client的回归系数显著为负,再次说明在事务所为客户公司提供审计服务的首年时其勤勉程度较高。在与是否违反《1312 函证准则》回归的9 个模型中,只有客户公司的财务重述与该类型审计违规显著相关(Restate的回归系数显著为正),客户公司的财务重述从“函证程序执行情况”的维度度量了审计质量。在与是否违反《1141舞弊审计准则》回归的模型中,Big10的回归系数显著为负,这可能是由于大型会计师事务所在技术、培训和设施方面具有比较优势(Khurana & Raman,2004),因此具备更强的胜任能力识别、评估和应对由于舞弊导致的重大错报风险。Restate的回归系数显著为正,客户公司发生财务重述可能表明审计师未能根据准则的要求来正确识别和评估舞弊导致的重大错报风险,以及设计和实施恰当的应对措施。
接着,本文将全部审计质量度量指标放入回归,检验其与审计违规及其子类别的整体相关性①根据未报告的方差膨胀因子(VIF)检验结果,当解释变量包含全部审计质量度量指标时,不会产生多重共线性问题。,结果如表6所示。除列(4)被解释变量为是否违反《1312函证准则》之外,审计质量度量指标均显著提高了模型的解释力,增幅最高达到16.1%,这表明现有文献常用的指标在整体上有效地反映了审计质量。从回归系数来看,Restate的回归系数始终保持显著为正,说明客户公司的财务重述是度量审计质量的强有效指标。同时,SmlProfit在列(1)—(3)中的回归系数显著为正,说明客户公司出现微盈利也是审计质量较差的表征之一,审计师违规的可能性相对较高。另外,New_Client、Tenure的回归系数在多数情况下均显著为负①当被解释变量为V_AS1312时,为避免回归结果出现完美预测,我们从解释变量中剔除了New_Client。,一方面,新任职的事务所在审计过程中付出了更多的努力,另一方面,随着任期的增长,事务所积累了更多特定客户知识,因此这两种情况下的审计质量均相对较高。
表6 审计质量度量指标与审计违规子类别
综上所述,客户公司的财务重述与各类型审计违规都显著相关,说明财务重述综合反映了审计师执业过程的各个具体方面,对审计质量的度量较为全面。另外,客户公司微盈利、事务所是否为首年审计、客户公司对于事务所的重要性和事务所规模也与部分类型的审计违规显著相关,表明这些指标分别从不同维度度量了审计质量,未来研究可视问题的需要将其作为审计质量的补充指标。
根据前述回归分析的结果,在中国情境下,客户公司的财务重述相对更有效地反映了审计质量。为进一步验证该结论,本文首先替换了财务重述变量的度量方法。不同于现有文献通常采用哑变量度量客户公司是否发生财务重述,我们采用连续型变量度量财务重述的严重程度(Restate_Degree)。Restate_Degree定义为在同一会计师事务所任期内,客户公司连续发生财务重述的年数,若未发生财务重述,则取值为0。未报告的表格结果显示,Restate_Degree的回归系数显著为正,同时模型的解释力显著提升,说明财务重述的严重程度与审计违规显著相关,结果支持财务重述是有效的审计质量度量指标。
其次,为避免财务重述与证监会处罚之间可能存在的反向因果关系导致回归结果产生偏误,本文剔除了公告日期晚于行政处罚决定书出具日期的财务重述。当证监会做出行政处罚决定后,客户公司可能会迫于压力进行财务重述,因此财务重述与审计违规可能存在反向因果关系。回归结果显示,在剔除了公告日期晚于处罚日期的财务重述观测后,客户公司的财务重述依旧与审计违规显著正相关,并且提高了模型的解释力,说明本文的结论依然成立,财务重述有效度量了审计质量。
再次,为解决可能存在的函数形式设定错误问题,本文采用了熵平衡法。熵平衡法的优势在于在减少对函数形式设定依赖的同时,不会造成显著的样本损失。使用熵平衡法的相关回归结果依旧支持客户公司的财务重述是度量审计质量的有效指标。
最后,本文还进行了如下稳健性检验:(1)参考现有研究的常规做法,本文控制了行业和年度固定效应;(2)在样本期内,我国的审计准则体系先后经历了独立审计准则和风险导向的新审计准则两个阶段,为避免准则的变迁对研究结果产生干扰,本文控制了时期固定效应,以2003—2005年为基期,对应独立审计准则阶段,2006—2016 年对应新审计准则阶段。未报告的回归结果显示,客户公司的财务重述依旧与审计违规显著正相关,并且显著提高了模型的解释力,本文的研究结论保持不变。
本文利用证监会在处罚决定书中明确列示会计师事务所违反的具体审计准则这一独特数据,检验了现有文献常用的审计质量度量指标的有效性。研究结果表明,在中国情境下,客户公司的财务重述综合反映了审计师在审计证据的收集、执业态度等方面是否符合具体审计准则的要求,对审计质量的度量结果较为准确和全面。另外,客户公司微盈利、事务所是否为首年审计、事务所规模等指标亦与部分类型的审计违规显著相关,即这些指标分别从不同维度度量了审计质量。
本文弥补了现有同类研究依赖私有数据或主观判断的不足(Aobdia,2019;Rajgopal et al.,2021)。本文选取的审计质量度量指标都来源于公开数据。尽管现有文献利用私有数据计算的指标(例如,审计调整)也较好地反映了审计质量(Lennox et al.,2014),但对于财务报告的外部使用者而言,如何有效利用公开数据判断审计质量具有更重要的意义。本文为以中国数据为样本的档案式研究如何选择审计质量的度量指标提供了参考,未来研究可视需要采用不同的指标。