■/ 张文秀 胡智超
近年来,中国上市公司数量与规模不断增大,截止2022 年末,已突破5000 家,总市值超79 万亿元,中国资本市场仍表现出增长趋势。上市公司的数量与市值的增长,给社会审计行业带来巨大的业务需求,与此同时,也给行业执业带来了很大挑战。近年,上市公司财务造假,会计师事务所审计失败的新闻层出不穷,例如九好集团虚构银行存款,华仪电气关联方资金占用等。这说明尽管上市公司对我国的GDP 和就业有着积极的影响,但由于其体量较大且占据更多社会资源,必须在获得债权人、投资人或其他利益相关者的信任方面承担更多责任。因此,上市公司需要更高水平的信息披露,以确保披露信息的及时性和公允性。而由于近年世界宏观经济增长势头疲软,为了增加净利润上市公司通过虚构收入以增加净利润,且手段层出不穷(李艺,2019)。当前,越来越多的上市公司为维持股价或企业形象,利用收入确认进行盈余管理,部分企业滥用盈余管理致使市场秩序被扰乱(叶冰歆,2022)。罗党论等(2022)研究表明“上市公司舞弊有三个层面:第一,粉饰利润表,恶意操纵会计在收入、成本、费用等存在时间及处理方法上的专业估计和政策选定;第二,滥用会计准则,诸如伪造销售单据伪造资产凭证等;第三,利用复杂的公司结构,通过资产重组或合并报表等调整利润”。因此,在上市公司的审计过程中,特别需要对营业收入科目进行重点审计,因为该科目具有相对较高的审计风险。加之《中国注册会计师审计准则第1141号》要求“注册会计师应当假定收入确认中存在舞弊风险”。所以,在现代风险导向审计模式中,营业收入科目审计的实际执行重要性水平较低,需要投入更多的审计资源来执行营业收入科目的审计。
然而,根据《中国注册会计师职业道德守则第4 号——审计和审阅业务对独立性的要求》(2020年12月17日修订)相关规定,审计审阅业务冷却期与独立性要求有了新的调整。中投顾问(北京)有限公司也在其编写的《中国注册会计师事务所行业市场分析报告》中指出:中国注册会计师人才缺口日益增大,审计资源紧张。由于审计人力资源紧张,不可避免地出现注册会计师出于各种原因在应用职业判断时流于形式,未秉持公正态度,导致上市公司审计质量下降甚至审计失败的可能性增大(景玲,2018),使得审计风险导向模型中“检查风险”超出可接受水平。随着信息披露监管要求的不断提升,在审计资源紧缺的背景下,可以运用计算机程序与机器学习的方法。,该方法被认为是一种有望保证审计职业判断客观性与审计质量的有效途径(陈伟,2021)。
因此,针对因审计人员应用职业判断时出现偏差而导致审计质量下降这一问题,参照以往关于贝叶斯分类器应用研究中对审计风险评估的方法(Balaniuk et al,2012)。本文以注册会计师实行审计程序所获取的审计证据作为先验证据,基于Python现有的朴素贝叶斯分类器,通过获取被审计单位营业收入审前数据,对营业收入报表数是否“可以接受”进行分类,并探究分类效果。
现代社会审计主要采用风险导向审计模式。作为社会经济权责结构的一部分,审计,特别是社会审计已被视为一种降低信息失真风险的活动,它以被审计单位的风险为导向,根据风险的评估测试,逐步形成对财务报表的预期,从而执行相应的审计程序。
本文基于贝叶斯分类器探讨其对营业收入科目审计的效果。杨可方(2022)在其研究中指出盈利机构的营业收入具有以下特点:第一,直接假定收入确认存在舞弊风险。第二,商业模式复杂,注册会计师需要了解企业的商业活动以及相关的会计政策,结合风险评估程序,判断审计程序的性质与范围。
因此,基于以上特点,参照过往盈利机构营业收入科目审计的步骤,注册会计师通常在对营业收入科目执行审计程序时采取综合性方案,即分析性程序与实质性程序相结合(杨可方,2022)。由于选取的样本涉及不同行业、不同业务的上市公司及其子公司,其收入模式不尽相同,参考审计人员对营业收入真实性、完整性、截止等认定的应对措施(陈文霞,2021)选取了三个一般且必要的审计程序——分析性程序、检查程序与截止性测试。
分析性程序是指注册会计师通过研究不同财务数据之间以及财务数据与非财务数据之间的内在关系,对财务信息做出评价。本文选取的分析性程序为月度毛利率的分析,设定标准以确定月度毛利率的波动程度。
检查程序的内容是将会计记录与原件(包括纸质、电子或其他介质)或实物(包括固定资产、存货、现金、应收票据等)进行比对与核实,用于评价被审计单位确认收入的金额是否正确,收入确认的时点是否计入正确的会计期间,所列报科目分类是否正确。该程序可以为营业收入的“存在性”“准确性”与“列报”的审计认定提供可靠的审计证据,其可靠程度取决于原件的性质与来源,本文将审计程序执行结果“是否满意”作为朴素贝叶斯分类器的先验证据。
截止性测试是针对营业收入的“截止”所进行的审计程序,需要比对的原件通常包括:出库单、客户签收单、海关提单等,注册会计师需要依据企业的商业模式与收入确认政策选择合适的原件作为判断标准。注册会计师通常在财务报表日前后选取一定规模的样本,将样本中的会计记录与已选择的原件进行对比,关注金额与时间是否与序时账中所记录的交易日期一致,以评判企业是否将某一时间区间内产生的收入计入正确的会计期间。本文同样将审计程序的执行结果“是否满意”作为朴素贝叶斯分类器的先验证据。
贝叶斯定理作为概率论的基本原理,由18世纪英国数学家托马斯·贝叶斯提出,是对真实世界考虑的一种描述,即人们可以使用有限的经验对未来要发生的事情进行估计。其核心思想是:当不能准确地了解一个事物的本质时,可以借助与该事物相关的事件去估计概率,事件发生得越多则出现的概率越大。贝叶斯定理由于其基于统计的特性,使得贝叶斯定理在包括医学、灾害预测、文本分类、语音识别等领域使用广泛。
贝叶斯的数学表达通过先验概率和全概率去计算得到对应的后验概率:
其中B和C为随机事件。P(Ci)与P(Cj)同为先验概率,根据先前的经验得到对应的概率。P(Ci|B)为后验概率。在已知B的条件之下,事件Ci出现对应的概率。
通过观察先验数据计算先验概率,通过计算出式(1)中的分子数值并加以比较,求出使得分子数值最大的情况Ci,称为分类结果Cmax。又因为P(B)保持不变,所以式(1)可转化为式(2):
财务审计中,对于营业收入科目的审计,在执行过程中,通常包括两类审计程序:分析性程序与实质性程序,其中毛利率波动分析、细节测试、截止性测试为必须执行审计程序,因此,本文选取这三种程序所获取的证据作为先验证据。
证据1:月度毛利率波动程度。本文将收集到的企业各个公司的月度毛利率数据与上年月度毛利率进行比较,有研究表明,企业的毛利率波动程度与其财务报表的可靠性和质量之间存在一定的相关性。例如,凌芳(2023)在其《新会计准则下上市公司盈余管理研究》中提到:企业的毛利率波动程度较大时,可能存在盈余管理行为,这可能导致财务报表不准确或存在误导性信息。这也说明,审计师在营业收入科目审计中应当密切关注企业毛利率的波动情况。本文统计一年中同比波动绝对值大于20%的月份数,月份数低于3 个月的,认定为月度毛利率波动程度低;月份数介于3 个月到5个月的,认定为波动程度中;月份数不低于6 个月的,认定为波动程度高。
证据2:细节测试是否满意。财务审计过程中,在对营业收入科目进行审计时,通常会执行细节测试程序。根据《企业会计准则第14 号——收入》(2018年修订)的规定,企业应当根据实际发生的交易和事项确认收入,确认收入的同时应当相应确认与收入相关的费用和成本,以反映收入的净额。在进行收入确认时,应当充分考虑与收入相关的条件和限制。因此,在审计过程中,审计师需要通过各种审计程序获取足够的审计证据,以评价企业收入的真实性、准确性和完整性。细节测试是其中的一种审计程序,主要用于评价营业收入科目的完整性、发生、准确性等。根据细节测试的结果,审计师可以评估企业的收入确认是否符合会计准则的规定,从而为审计意见的形成提供依据。相关的支持性文件包括出库单、发票、销售合同、会签单等,这些文件能够证明企业的交易行为和与之相关的收入确认依据。如果这些主要支持性文件原件能够支持交易行为,那么就可以认为通过细节测试获取的审计证据能够支持审计判断,因此认为细节测试满意,反之则认定为不满意。
证据3:截止性测试是否满意。截止性测试是对于营业收入科目的截止认定执行的审计程序。注册会计师根据《中国注册会计师审计准则第210号——截止日的责任》(2017 年修订),在截止性测试中会选择财务报表日前后一段时间,抽取样本检查入账时间是否与交易活动发生时间一致。通常涉及到的支持性文件有:出库单、回签单、发票等。若样本项目与支持性文件比对均一致,则认为截止性测试满意,反之则认定为不满意。
证据1、证据2 与证据3 的结果均可以认为是执行了相应审计程序所获得的审计证据。实验参数设置如表1所示。
表1 实验参数设置
实验使用模型:朴素贝叶斯分类器。
D={D1,D2,D3},表示三种审计程序。
P(H|D)作为后验概率,表示在执行三种审计程序后,观测到的审计证据条件下认为该科目的审计结论为可以接受的概率。
由式(2)得式(3)如下:
多种试验因素会影响朴素贝叶斯分类器的分类效果。在影响因素中,训练样本数量、证据的选取,证据的计量等,这些因素会单一地或综合地影响分类的最终结果。比如将“可以接受”的情况分类为“不可接受”,所以本文采用建立混淆矩阵的方法来构建相关指标,以评价最终的分类结果。
如表2 所示,TP(True Positive)意为该公司营业收入科目“可以接受”且被正确归类为“可以接受”的样本数量,FN(False Negative)代表实际为“可以接受”但是被错误地归类为“不可接受”的样本数量,FP(False Positive)代表实际为“不可接受”被错误地认为“可以接受”的样本数量,TN(True Negative)表示实际为“不可接受”被正确归类为“不可接受”的样本数量。
表2 混淆矩阵
机器学习常用的评价指标构建及其含义如下:
(1)识别准确率。计算过程如下(TP+TN)÷(TP+TN+FN+FP),其值越接近1,代表分类器的效果越好。
(2)精确率。计算公式为TP÷(TP+FP),能够衡量该分类器的查准率,数值越大表明查准率越高,数值越小则说明查准率越低。
(3)召回率。用来衡量模型对“可以接受”的查全率。计算公式为TP÷(TP+FN),召回率越接近1,则表明该模型越能够识别出所有“可以接受”公司的收入科目审计结论。
(4)F1 值。精确率与召回率两个指标存在矛盾关系,因此F1 值能够作为一个综合评价指标。计算公式为F1=2×召回率×精确率÷(精确率+召回率)。F1 数值与分类器的最终分类效果呈现正向关系,其数值越大,说明贝叶斯分类器越有效,在识别营业收入审计科目是否“可与接受”的效果越好。
(5)检查风险指标。计算公式为:FP÷(TP+TN+FN+FP),根据审计风险模型,“检查风险”是指某一认定存在错报,该错报单独或连同其他错报是重大的,但注册会计师未能发现这种错报的可能性。因此,检查风险指标数值越接近于0,代表该分类器做出错误判断导致“检查风险”超出可接受水平的可能性越低。
本文以36家上市公司及其部分子公司的营业收入科目的审计底稿为基础,从中获取并进行数据预处理并作为训练集。
部分数据预处理结果如表3所示:
表3 各公司营业收入科目审计证据与审计结论(部分)
由于人工收集的实验数据,样本容量与多样性均有限,在计算过程中无法避免零概率问题,将造成实验结果具有一定的不合理性,因此在分类器中引入拉普拉斯平滑再进行实验。
本部分包含两次分类实验,实验1为对总体测试集使用贝叶斯分类器,检验其在总体上的分类效果。在实验2中,为验证所选取的朴素贝叶斯分类器模型对呈现出不同收入毛利率波动程度的审计底稿的分类效果,设计进一步实验。具体实验如表4 所示。
表4 各实验组实验目的与测试集描述
根据上述实验步骤,对测试集进行了实验,并将每个实验组的结果进行汇总,分类结果汇总如表5所示,分类效果评价汇总如表6所示:
表5 分类结果统计汇总
表6 分类效果评价指标汇总
由实验结果指标汇总表可以得出以下结论:
结论1。根据表6中分类效果评价指标可以看出,三次实验的准确率、精确率和召回率均能达到90%以上,分类综合评价指标F1 值均达到0.95 以上。其中检查风险指标均低于5%,表明贝叶斯分类器能够显著降低审计检查风险。因此,可以认为朴素贝叶斯分类模型在三次实验中均能够取得理想的分类效果。审计人员在实际工作中,可以借助朴素贝叶斯分类器在营业收入科目审计实施阶段与复核阶段,降低在职业判断中的主观因素影响,以提高对营业收入科目提出审计结论的准确性以及审计质量复核的客观性。
结论2。在准确率与精确率方面,实验1 与实验2.2 的识别效果好于实验2.1,在召回率方面,实验2.1 中识别效果好于实验1 与实验2.2,若以综合评价指标F1值为标准,分类器在实验1的分类结果略优于其余两项实验。
以上结果的差异可能由以下原因造成:
第一,在对实验2.1 与2.2 训练集中,未对证据1,证据2与证据3在先验似然函数中所在的权重进行赋权。在营业收入科目审计中,注册会计师通过实施不同审计程序获得的审计证据,注册会计师通常会对证据对审计结论的影响程度进行考量。这种考量包括:审计程序的性质,所获取审计证据的性质等因素。
第二,在设计实验2时,由于客观原因,训练集与测试集样本规模较小,导致出现实验偶然性。
本文基于Python 将贝叶斯分类器融合进营业收入科目审计的过程,将相关证据定义并汇总进行数据预处理。实验中提取了三个主要影响审计结论的审计程序作为证据,分别是分析性程序、检查程序和截止性测试。在分析性程序中,关注各月度毛利率波动程度,作为风险评估手段;检查程序则关注营业收入的真实性、准确性和发生情况,主要包括细节测试中交易记录和支持性原件的符合情况;截止性测试则关注交易是否被计入正确的会计期间。在基于Python构建的朴素贝叶斯模型中,发现贝叶斯分类器能够实现良好的分类效果。因此,得出审计结论与朴素贝叶斯分类器相结合,能够对审计实践产生指导意义。
从狭义上来看,本文所探讨的是在营业收入科目审计中,审计人员在获取审计证据的基础上,基于贝叶斯分类器来得到审计结论。在传统风险导向审计模式中,审计人员将审计证据与审计标准进行对照,结合自身的职业判断,最终得出审计结论。但是在本文的实验中,贝叶斯分类器在这个过程中可以发挥类似的作用,它可以基于已知的数据,计算出每个分类的概率,并将新的数据分配到最可能的分类中。这样一来,审计人员就可以更快速、准确地发现可能存在的风险和异常情况,从而进行更加精细化的审计工作。并且实验结果表明,贝叶斯分类器在判断营业收入审计结果时能够取得理想的效果。
从广义上来看,贝叶斯分类器是一种基于统计学原理的分类算法,在人工智能领域中应用广泛。在智能审计中,贝叶斯分类器可以用于对审计对象的数据进行分类,以帮助审计人员判断是否存在潜在的风险或异常情况。具体来说,贝叶斯分类器是一种基于贝叶斯定理的分类算法,通过对已知类别的训练数据进行学习,建立一个概率模型,然后使用该模型来对新的数据进行分类。在智能审计中,贝叶斯分类器可以用于分类审计对象的各种数据,如财务报表、交易记录、客户信息等。
此外,该方法能够帮助企业内审更好地履行管理职责。贝叶斯分类器可以用来帮助审计员识别不合理的交易和风险。它可以基于先前的数据,识别出一些长期存在的问题或者预测新的交易是否存在风险。例如,审计员可以使用贝叶斯分类器识别经营活动中的异常交易,也可以使用贝叶斯分类器识别内部控制问题。
但是,从本文目前的实验程度来看,贝叶斯分类器只是一种辅助审计工具,仍然需要审计员对其结果进行评估和验证,需要同时结合其他审计技术和方法,以确保审计结果的准确性和可靠性。