深度学习模型应用：面向审计业务全流程的整合性框架

2023-01-09 10:42副教授朱卫东博士生导师博士

财会月刊 2023年1期

吴勇（副教授），陆艺，朱卫东（博士生导师），张超（博士）

一、引言

科技强审是21世纪以来审计发展最显著的特征之一。大数据时代，传统审计取证模式、审计流程和审计技术方法需要做出适应性变革。深度学习作为人工智能领域的前沿性技术，通过建立分层的人工神经网络（又称为深度神经网络），试图模拟人脑中的生物神经元网络，利用高效的学习模型自动从海量数据中提取数据特征，从而识别潜在的数据模式，洞悉规律，推动做出数据驱动下的管理决策（Ting，2019）。随着互联网、移动通讯、5G技术的兴起以及计算机处理速度和数据存储能力的提升，深度学习已被广泛应用于计算机视觉、语音识别、自然语言处理和其他数据分析等领域。深度学习方法能够将特定过程的结果与相关数据拟合，有效辨识出海量数据背后的模式特征和规律认知，以便发现异常、预测趋势，将对舞弊侦测、审计风险评估以及审计决策判断产生重要影响，这种数据驱动的决策也会引发会计和审计领域的研究范式实现由演绎推理向归纳分析的转变。

然而，目前深度学习在审计领域的应用仍处于起步阶段，究其原因主要有以下两个方面：一是审计工作的复杂性。高质量的审计决策有赖于审计计划、审计实施和审计报告的有效协同，如果缺乏一个系统性、全局性的框架来系统谋划和协调不同审计阶段的系统设计，新的数据分析技术就很难应用于审计实践并取得成效。二是技术的复杂性。深度学习所建立的深度神经网络是由复杂的算法所驱动，过程的可理解性和结果的可解释性较差。审计师和监管机构难以了解深度神经网络内部的输入是如何相互作用并产生最终的输出结果，深度学习的内部运作对其而言更像是一个“黑箱”，这严重制约了相关主体应用深度学习方法的动机和意愿。

为此，本文在明晰深度学习相关概念内涵的基础上，剖析深度学习模型的工作原理，针对深度学习是基于数据驱动的特点，以设计、开发和更新审计数据仓库为切入点，面向审计业务全过程将深度学习的机器智能和审计师的知识与经验有效融合，从而构建深度学习模型审计应用的集成性、整合性理论框架，以便更好地指导和推动深度学习模型和方法在审计方面的应用。

二、文献综述

深度学习具有强大的多结构类型数据分析处理能力，不仅可以分析传统的结构化财务数据，还可以分析半结构化或非结构化的数据，如社交媒体信息、电子邮件、新闻报道、电话和视频，通过机器自动提取的数据特征作为补充证据，可以丰富审计师对客户业务和行业的理解，帮助审计师更好地评估客户的审计风险，提升审计效率和质量。深度学习算法不再主要依靠重复性抽样技术，而是可以审查公司的整体数据，审计师能够以更加全域和科学的视角来组织实施更有针对性的测试，及时辨识公司各类异常情况和存在的风险。而且，深度学习算法从海量数据以及不同项目中习得的知识和规律，推广应用于具有类似特征的其他项目，有助于提升知识共享应用的效率。审计师可以从更宽广的数据覆盖面、更详细的数据分析和更深入的决策洞察中获益。

深度学习已广泛应用于审计领域的多项任务中，如审查源文件、分析业务交易和事项、评估风险等。学者们还探讨了利用深度学习来预测欺诈风险、破产风险、重大错报风险、识别异常情况以及公司未来的业绩表现等。深度学习的文本理解、语音识别、视觉识别和结构化数据分析能力，为提升审计证据的信息识别能力和审计决策判断能力提供了重要帮助。一方面，深度学习提升了审计证据的信息识别能力。因为深度学习能够从半结构化数据（如文本数据）或非结构化数据（如图像、音频和视频）中识别、提取有价值、有洞见的信息，极大地拓展了审计证据的信息来源，而且不同来源证据之间的相互佐证也能有效提升审计证据质量。另一方面，深度学习强大的信息识别功能为复杂审计决策提供了数据基础，当数据量大且输入变量众多时，深度学习所具有的高效精准预测性能的优势将进一步突显，能够提供准确度更高的分类和预测结果，从而为复杂审计判断提供有效的决策支持。因此，从算法和技术的视角出发，基于深度学习的方法能够丰富审计证据，改善审计决策机制，有助于提升审计效率和审计质量。

三、概念界定与关系辨析

（一）人工智能、机器学习与深度学习

在探讨深度学习的审计应用之前，有必要明晰人工智能、机器学习和深度学习的概念内涵以及这些概念之间的关系。

人工智能是研究如何使用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。智能行为包括观察和感知周围环境的能力、从语音或文本中提取信息的能力、从获得的信息中学习以及利用这些信息做出决策的能力等。人工智能作为一种自适应、自学习系统，可以通过计算机程序来模仿人类的判断和认知技能，感知外部的环境变化，能够从数据中自主学习和自我进化，以便做出决策、预测或采取最佳的适应性行动。例如，谷歌地图可以综合考虑事故、施工和天气情况等，给出最优的交通路线选择，从而减少通行时间。人工智能领域的研究主要包括机器学习、自然语言处理、计算机视觉、认知计算等。

机器学习这一概念于1959年被创造性地提出，其被界定为“一个研究领域，它赋予计算机不需要明确编程就能学习的能力”。M itchell（2006）则为机器学习提供了一个被广泛参考的定义：“机器学习领域关注的问题是如何构建随着知识和经验的积累而能够自动改进的计算机程序”。两类观点都坚持机器学习的目的是使计算机自动（而不是由人类明确编程）使用算法从历史数据中学习模式和趋势，通过不断迭代改进其学习性能（通常以预测精度来衡量），并应用所学到的数据模式或趋势来进行相应的预测。例如，银行利用机器学习算法来分析大量的历史数据，从而建立信用风险预测模型。人工智能可以被认为是自主机器智能的广泛目标，那么在这一意义上，机器学习是实现人工智能的具体科学方法（Hinton和Salakhutdinov，2006）。

人工神经网络是未来人工智能和机器学习的重要组成部分，由相互连接的人工神经元层组成，以大脑的结构和功能为模型，通过节点连接数据，系统可以被设置为简单或多层神经网络。深度学习是一种先进的机器学习技术，将机器的计算能力与神经网络中的连接模式相结合，通过构建分层的人工神经网络，从原始数据中抽象数据特征、提取模式和规律以理解复杂的关系，并归纳习得知识。深度学习的蓬勃发展主要归因于对图像处理能力的提升、计算机硬件成本的下降以及机器学习算法效能的进步。

（二）深度学习与传统机器学习的区别

传统的机器学习算法如逻辑回归和朴素贝叶斯在很大程度上依赖于领域专家事先给定的数据特征，而不是自主学习挖掘获取的特征。这些算法往往需要具有领域专业知识的专家来人工识别预选的数据特征。运用此类传统机器学习算法做预测时面临的一个重要问题是，一些尚未被人类专家预先识别的数据特征在模型学习过程中将不会被考虑到。相比之下，深度神经网络接收更多维度的原始输入，并通过模型训练自动学习特征。分层结构中的多个隐藏层使得深度神经网络能够自动识别更多的数据特征，而无需人工干预。这一事实的重要意义在于，当有大量的数据或任务较复杂时，机器学习基于海量数据挖掘以及复杂任务关联而识别出的数据特征，可能比人类专家基于知识和经验所总结出的数据特征更全面、更客观。

（三）深度学习的工作原理

深度神经网络是由输入层、若干隐藏层和输出层组成，其中输入层接收初始数据，输出层给出最终的数据标签（即确定的类别，例如舞弊或不舞弊、狗或猫等），输入层和输出层之间的层则被称为隐藏层。组成一个层的神经元与前（后）层的许多其他神经元相连，以接收（发送）数据。神经元之间的每个连接最初都被分配一个随机的数值权重，这个权重决定了输入值的重要性，随着学习程序对数据重要特征了解的加深，权重需要不断优化调整。下一层的神经元对输入数据的加权组合执行复杂的非线性转换，并将结果传递至后续层，通过这种方式，数据从一层流向另一层。与传统的“浅层”神经网络只有一个或两个隐藏层不同，深度神经网络有几十个隐藏层。凭借其大量的神经元，深度神经网络比传统神经网络具有更大的代表性，能够挖掘识别出数据背后隐藏的多个特征，可以有效地用于大数据分析。

为了训练深度神经网络，每次向系统输入新的数据实例时，都要将预测值与训练数据的实际观察值进行比较，并计算出所产生的误差。然后，对模型的超参数（如权重）进行微调以减少这些误差。经过几千甚至几百万次的优化调整，可以识别出隐藏在数据背后越来越多的抽象特征，实现最小误差，训练好的模型也就可以用来分析未来的数据。例如，利用深度神经网络来进行人脸识别的过程中，大量的人脸图片作为训练集，输入层识别最基本的特征是像素。隐藏层可以识别更抽象的特征，如由像素组成的边缘、部位（如眼睛、鼻子和嘴巴）以及物体模型。每一个提取的数据特征都是建立在前一层的较简单的特征之上的，而输出层最终识别出人脸。

四、深度学习的应用领域与审计功能应用

深度学习适合于分析理解文本、图像和视频等半结构化或非结构化类型的数据，以实现某些重复性任务的自动化。软件（如开源数据分析工具软件R语言、开源机器学习平台H 2O等）和硬件（图形处理单元GPU和云计算等）的发展，使得之前需要审计师手动完成的审计任务现在可以由机器和程序自动完成。Sun和Vasarhelyi（2017）从文本分析、语音识别、图像（视频解析）和判断支持等方面，提供了深度学习应用于审计实践的实例。相对于传统的机器学习技术，深度学习在机器学习的文本理解、语音识别、视觉识别和结构化数据分析等方面具有优势，可以很好地应用于新一代信息技术环境下的审计实践。

（一）深度学习的典型应用领域

1.文本理解。公司公开披露的财务报告、公告以及证券监管机构的问询函等均含有大量的文本信息，如何有效地挖掘分析这些文本数据中所包含的决策有用的信息显得尤为重要。文本挖掘方法包括文本结构分析（如词袋模型、词性标注、命名实体识别等），文本内容分析（如主题模型、情感分析、观点挖掘等）和智能语义理解（词嵌入模型、语义类比和因果推理等）。传统的文本挖掘方法采用词袋模型，通过辨识文本文件中每个类别（如反映积极和消极情绪的情绪特征）的单词比例计数来从文本中提取特征，依赖于完备、完整的词表预定义字典，而这需要具有丰富先验知识的人类工程师付出较大的时间精力，这种方法难以有效地分析冗长的文本文档，而且未考虑到文本内容中的语义、结构、顺序、附近词语的上下文以及其他附加信息等。而基于深度学习的文本理解具有自动从原始输入数据中识别抽象数据特征的能力，通过构建一个“浅层”神经网络，将文本文档转换为一组称为“词嵌入”的向量，这些向量在数字上代表了文档中每个词的上下文，然后根据向量的数学相似性，将具有相似含义的单词归为一组，再利用深度神经网络接收这些嵌入作为输入信号，通过多个隐藏层提取更高级的数据特征，最后根据训练数据集的预定义概念（如主题、实体、关系、情感）进行分类，以此实现文本文档的机器阅读和智能理解。

当前，诸多研究对比分析了深度学习和其他文本挖掘技术，为深度学习应用于审计文本分析提供了指导。在审计工作中，有大量的合同文本、租赁契约、协议书和其他文本文件需要审查，深度学习的文本理解能力可以帮助审计师从中自动审查和提取关键信息。例如，审计师可以使用深度学习来分析公司财务报告中管理层讨论与分析（MD&A）的内容，以提取管理层对其公司前期业绩、当前财务状况和未来盈利预测的信息，有助于审计师高效地了解公司的运营状况。此外，通过对比管理层预测与分析师预测以及公司目前的实际业绩，审计师可以了解管理层的保守程度。此外，深度学习还可以从MD&A的文本叙述中识别并衡量管理层的情绪，帮助审计师预测财务报表舞弊风险等。

2.语音识别。由深度学习驱动的语音识别已广泛应用于社会生产和生活的多个领域。智能语音交互设备可以理解各种方言，并以接近人类的精度消除背景噪音的干扰。亚马逊的Echo Dot，可以与人类对话并执行播放音乐、制订待办事项清单和提供实时天气信息等任务。谷歌提供了一个云语音应用编程接口，利用强大的深度神经网络允许用户将语音从声波转化为文本，输入计算机系统。百度的Deep Voice，则可以将书面文本转换成各种语言和声音。利用IBM W atson提供的深度学习工具，可识别财务报告电话会议和MD&A的情绪特征，为预测企业内部控制缺陷和财务报告误报提供了额外的信息。

在审计方面，深度学习的语音识别功能可以帮助解决审计过程中可能面临的音频数据分析。如可以用来分析公司财务报告电话会议，通过提取管理层和其他参与者讨论的主题、关键词、实体和关系，识别出说话者的情绪和情感，协助审计师洞察出电话会议中的欺骗性讨论。此外，还可以用于审计过程中对公司管理人员的访谈，通过关注交互过程中的泛泛而谈、是否使用第一人称代词或受访人员的声音变化等，辨识出带有欺诈性的语言线索，从而为审计师侦测管理层舞弊、识别内部控制缺陷等提供补充性证据。

3.视觉识别。视觉识别技术允许机器标记人脸、识别物体以及图片或视频中的内容和场景。在搜索和理解图像、绘图、医学诊断和汽车自动驾驶等方面，深度学习大大提升了最先进的视觉识别系统的性能。Sutton等（2016）将深度学习应用于审计师与客户人员的访谈过程，探讨面部识别和语气检测等深度学习系统在欺诈监测中的潜在用途。

深度学习通过自动检查扫描文件的图像如支票、收据、银行对账单和应收账款确认书等来识别选定的项目，从而提升了审计实质性测试的效率和效果。例如，在检查支票的扫描图像时，可以识别付款金额、收款人、路由器号码和银行背书。除了静止图像的识别，经过训练的深度神经网络还可以检查视频片段中的每一个场景，识别动态视频中的行为，如辨识个人面容、连续动作、GPS位置信息、物体数量和质量信息，以及印在物体标签上的数字或文字等信息。在内部控制测试时，审计师可以使用深度学习的视觉识别系统来检查经过员工清点或库存的网络摄像头记录，以便做出进一步的措施。在对管理层和员工访谈的过程中，利用深度学习系统可以通过洞察员工的身体语言和面部表情来检测潜在的欺骗行为。

4.结构化数据分析。尽管深度学习在半结构化和非结构化数据分析领域取得了显著的成效，但少有研究探究其在处理结构化数据尤其是不平衡数据方面的强大潜力。对于现实生活中的数据分析，数据不平衡性是一个常见但又极具挑战性的问题，例如，在数以万计的财务报告中，欺诈性报表可能仅有数百份；在所有信用卡持有者中，未能按时还款的可能只占极少数。在成本敏感的学习情境下，包含多个隐藏层的深度神经网络能够显著提高面向不平衡数据的总体预测准确性。深度神经网络的复杂性也有利于对高度变化的任务进行有效预测。在信用卡违约检测方面，相比于逻辑回归、朴素贝叶斯、传统的人工神经网络和决策树等模型，深度学习表现出更好的整体预测性能。

（二）深度学习的审计功能应用

深度学习在文本理解、语音识别、视觉识别等领域的优势，形成了其对半结构化和非结构化数据强大的信息识别能力，极大地丰富和拓展了审计证据的时空范围。与此同时，深度学习还拥有对海量数据高效精准的预测分析能力，这将为复杂审计决策提供良好的判断支持。

1.信息识别功能。基于前述的文本理解、语音识别和视觉识别能力，深度学习可以作为半结构化和非结构化数据的信息识别者，帮助审计师综合洞察文本、图像、音频和视频等多个来源的关键信息，拓展了审计证据的范围和数量，提升了审计证据之间的相互印证性及审计证据的洞察力。EMM“三角证据”认为，企业经营状况（EBS）、管理层经营陈述（MBR）、管理信息媒介（M II）三者之间是互为条件、互为制约、相互佐证的关系，三者之间的印证关系（见图1）可以支持甚至放大每一种证据的可信性和有用性，增加审计证据的证明力和说服力，从而提升审计质量。

图1 基于深度学习信息识别能力的EMM“三角证据”交叉验证

现有审计过程对于以财务数据为基础的企业经营状况关注较多，但对于管理层经营陈述以及管理信息媒介所提供的审计证据关注较少，而深度学习对于半结构化和非结构化数据强大的信息识别能力，为三种证据之间的交叉验证提供了重要基础。例如，对于管理层经营陈述信息的可靠性，可以利用深度学习工具，挖掘分析MD&A部分的情绪特征，洞察管理层电话会议、访谈记录视频中的管理层可能的舞弊性行为特征，有助于审计师高效地洞悉管理层的舞弊情况以及公司真实的运营状况。对于管理信息媒介的文本型数据，审计师可以利用深度学习的文本理解能力，将新闻报道和社交媒体评论等文本型数据自动转化为机器可读的定量数据，更深入地解读新闻媒介和社交媒体中与被审计单位相关的主题、关系、情感，为从外部信息媒介视角分析企业经营状况提供补充证据。对于企业经营状况，除了依据传统结构化的财务数据，还可以利用深度学习的文本理解和图像、视频和音频识别，深度解读与企业生产经营相关的各类合同文本信息，利用物联网设备以及企业生产经营过程中的各种视频监控录像，持续获取企业生产运营过程中的各类信息，以便更加客观、准确地理解企业的生产经营状况。例如，为了验证销售收入的真实性，可以建立涵盖采购合同的文本分析、产品销售出库的视频监控信息、产品销售物料配送的物联网信息等，通过系统整合上述信息，提供更加详实有效的审计证据。

2.决策支持功能。审计过程涉及复杂的专业判断，特别是在确定重要性水平、评估审计风险、沟通关键审计事项和确定审计意见类型时，要求审计师必须从不同的角度综合考虑大量的证据来做出最终的决定。

一方面，基于信息识别功能，机器学习允许整合文本数据、音频、视频、图像等多种类数据，并通过数据可视化技术较大地提升了审计师对被审计对象经营业务的理解。例如，零售商停车场的可视化数据可以为判定销售收入的真实性提供辅助。

另一方面，深度学习基于海量数据强大的预测分析功能，尤其是当数据量大、输入变量多时，深度学习的预测性能优于经典的机器学习方法，能够为复杂的审计判断提供很好的决策支持。例如，如果能够通过高效的数据预处理方法，将由自然语言、视觉信息组成的大数据清洗为合理干净的数据集，并具有较高的计算能力，那么机器学习算法就可以通过训练数据识别模式更好地理解数据，以便提取关键信息，且能最小化人为干预对结果偏见的影响，提高预测精度和预测能力，有助于审计师获得对被审计对象更好的洞察和理解，从而有助于相关审计决策判断。对于财务报告错报的预测，输入的数据特征可以包括之前理论研究成果中证实影响财务报告错报的相关影响因素、审计师基于经验判断认为重要的影响因素以及管理层电话会议、MD&A文本分析的情感和情绪得分等。

值得注意的是，不同于深度学习的信息识别功能主要处理半结构化或非结构化数据，深度学习的决策判断支持功能可以分析结构化数据，特别是处理不平衡的结构化数据。一些算法能够有效地处理不平衡的结构化数据（如生成对抗网络），而在财务危机预警、舞弊风险识别、审计意见预测等审计决策判断中常常涉及不平衡数据处理问题。

基于深度学习的审计应用能力如图2所示。

图2 基于深度学习的审计功能应用

五、面向审计业务全流程的深度学习模型审计应用的整合性框架

（一）深度学习模型应用于审计业务全流程的基本框架

深度学习模型是基于数据驱动的，为了形成面向审计全过程不同阶段各种审计任务的模型训练和测试数据，需要由审计师利用标记的财务和非财务数据来设计和开发审计数据仓库。特别是要利用深度学习的信息识别功能，从会计师事务所留存的审计档案、前任审计师的永久档案和审计工作文档以及大数据时代能反映被审计单位生产经营和财务状况的视频、音频、图像和文本等多种资料中提取机器可读的数据特征，并将其转换为定量变量。基于深度学习信息识别功能所构建的审计数据仓库涵盖了半结构化和非结构化数据，能够从更多维度刻画公司的潜在特征，极大地拓展了审计证据的时空范围，为复杂的审计决策提供辅助支持。

审计师需要根据不同审计阶段的具体审计目标来确定深度学习模型的预测目标，每个模型只服务于一个审计目标。服务于不同审计目标的深度学习模型，从数据仓库中选择相应的数据源输入，使用迭代方法从分析数据中进行自动化和持续化的学习，当训练学习的数据足够多时，通过反馈行动不断修正学习结果，可以洞察出隐藏在数据背后的模式特征和规律，并根据识别出的稳健模式对新输入数据进行预测。在做出最终决定之前，审计师基于自身的知识经验和专业判断，对模型预测结果进行调整和优化，以便决定最终的结果，并指导审计师采取最终行动，所有结果会更新至数据仓库中。通过这种方式，审计师将获得包含输入和输出（标签）的新数据集，并持续不断地将其反馈至深度学习模型中，通过调整模型参数来不断减少预测误差，提升模型的整体有效性。与此同时，伴随着数据仓库持续更新数据集，前一审计阶段更新的数据仓库可以传递至后续审计阶段，在最终的审计完成阶段，由最后一个深度神经网络输出关于重大错报风险的最终判断。如此可以将审计全流程的所有相关数据积累起来，添加到数据仓库中，以便在未来使用。数据仓库使用得越多，收集并添加到仓库的数据越多，深度学习模型的预测性能也就越好。

（二）面向审计业务全流程的深度学习模型集成应用

现代风险导向审计的整体流程分为审计计划、风险评估、风险应对和审计报告四个阶段，图3显示了审计全流程四个不同阶段间的协同关系，详细说明了每个阶段深度学习的应用。审计过程从基于历史数据的初始审计数据仓库开始。在审计计划阶段，随着审计师不断获得反映公司情况的新数据，审计数据仓库被持续更新，并从更新的数据仓库中选择数据特征来训练深度学习模型，训练好的模型可以应用于新输入的数据并产生预测结果，审计师基于知识和经验判断来决定是否对模型预测结果进行调整和优化，并将最终结果更新至数据仓库，同时传递至后续的风险评估阶段。类似地，此阶段采集被审计单位及其环境的最新数据，识别可能存在重大错报风险、舞弊风险、信息系统安全风险的事项和情况并更新数据仓库，从数据仓库中选择数据特征来训练深度学习模型，以执行不同的风险评估审计程序。最终的审计结果会进一步更新数据仓库，并将其传递到后续的风险应对阶段和审计完成阶段。类似的过程持续运行，最后一个阶段完成后，更新后的审计数据仓库将被保存和传递，并作为下一年度审计的新起点。表1系统描述了不同审计阶段的数据源、数据特征及其输出标签。

图3 面向审计业务全流程的深度学习模型审计应用的整合性框架

1.审计计划阶段。最初的审计数据仓库在审计计划之前就已经存在。审计计划阶段需要获取新的数据：文本数据包括企业披露的信息、新闻媒体和社会媒体中披露的信息，揭示了公司在财务业绩、商业运作和战略、管理层诚信、产品或服务质量、客户满意度等方面的业务情况和行业环境、音频数据通常包括电话会议、股东会议、电话和访谈录音等、视频和图像数据包括在实地的仓库、商店、办公室或工厂拍摄的视频、图像等文件。具体的如表1所示。

表1 面向审计业务全流程的审计数据仓库构建

在这一阶段，审计师在了解客户行业背景和业务经营情况的基础上，决定与客户的契约关系。一旦审计师考虑接受新客户或者保留老客户，就可以根据新的数据源收集新的数据输入，并添加到初始数据仓库。如果数据是半结构化（如文本）的或非结构化（如语音、图像和视频）的，则可利用深度学习的信息识别功能来提取关键特征，并将其转换为机器可读的格式。深度神经网络的开发是为了执行各项审计任务，审计计划阶段包括识别战略风险与经营风险、固有风险和控制风险、确定可接受的审计风险和重要性水平等。对于每项任务，深度神经网络的开发是通过使用初始数据仓库的历史数据来训练和验证模型，并使用新的输入数据来进行预测。例如，为了评估战略风险，可以开发一个深度神经网络来洞察重要的财经媒体、券商和机构投资者等对公司重要战略性投资带来收入增长的见解。上述过程中，每个深度神经网络的输出仅仅是对各项审计任务（目标）的建议结果，包括关于是否接受或拒绝客户的决定、可接受审计风险和重要性水平等。基于这些建议结果，审计师凭借自身的知识、经验做出相应调整并给出最终决定，实际结果将被记录下来，以便在下一阶段更新数据仓库。

2.风险评估阶段。审计模式经历了“账项基础审计—制度基础审计—风险导向审计”的演变。现代风险导向审计的实施以风险评估为切入点，对审计风险的识别、评估和应对贯穿于审计全过程，以便将审计风险降低至可接受的低水平。风险评估过程中，审计师应当首先了解被审计单位及其环境，询问被审计单位管理层和内部相关人员。基于对公司所处行业状况与外部环境、公司目标、战略及相关经营风险、公司性质、公司会计政策选择等的了解，审计师将收集新的半结构化和非结构化数据加入数据仓库。其中：文本数据包括公司所处行业的市场竞争与技术发展、公司应遵循的法律法规和政策监管等相关文件、公司内部控制手册、内部控制评价过程文件、内部控制执行过程相关记录；音频数据包括对于公司行业发展、战略目标及其经营状况，对管理层和工作人员进行询问的录音等；视频和图像数据包括捕捉业务流程的视频和图像剪辑，如库存检查和盘点活动的录像；结构化数据包括反映公司所处行业竞争状况、公司战略发展状况以及衡量内部控制有效性等的定量指标，如行业竞争度、公司战略目标、内部控制缺陷数等。

可以利用深度学习的方法获取上述多源异构的数据：根据信息识别功能，通过对管理层和执行人员的访谈，从受访者的肢体语言和声音变化等来洞察潜在的管理层诚信情况；根据决策判断功能，从受访者回答的内容中识别出潜在的数据特征，并预测出可能的欺诈行为。数据仓库输出的标签包含审计师对重大错报风险的评估、内部控制基本情况的了解、舞弊导致的重大错报风险等。

在审计风险识别过程中，一旦获得新的数据并扩充至审计数据仓库，就可以建立深度神经网络模型来执行重大错报风险的识别、评估与再评估以及后续行动等各项审计任务。对于重大错报风险评估，审计师将机器学习模型预测的重大错报风险视为建议结果，结合自身的知识和经验判断给出风险水平的最终结果，该结果将被用于调整神经网络模型并更新数据仓库。同样地，了解内部控制情况可建立一个深度神经网络，即先构建一个深度神经网络模型，检查所有商业文件的批准签名、印章等情况，同时建立另一个深度神经网络模型，审查各个部门确认设备的视频记录，两者相互印证来验证公司内部控制的基本情况，并将结果纳入数据仓库。随后，审计师应用深度神经网络，根据更新的数据对重大错报风险进行重新评估，重新评估的模型预测结果供审计师作为决策参考并最终确定重大错报风险水平，更新至数据仓库。最后，以更新后的数据仓库为基础，利用深度学习技术构建模型来预测后续额外的控制测试和实质性程序。

3.风险应对阶段。大数据环境对控制测试和实质性测试产生深刻影响。在控制测试方面，信息系统作为生产数据的“工厂”，为提高被审单位数据的真实性和可靠性，信息系统审计成为不可或缺的重要组成部分，控制测试甚至有可能会被信息系统审计所取代。在实质性测试方面，数据分析技术的快速发展促使审计数据分析能力大幅提升，驱使着抽样审计向全样本数据审计转变，而且，基于深度学习强大的信息识别功能，文本、图片、音频、视频等新型审计证据不断融入，传统的基于结构化财务数据的审计转向面向全域大数据的审计。如利用扫描和光学字符识别（OCR）技术来审核半结构化的合同文本，估计与预测公司营业收入；利用海量全域大数据分析，开展全样本审计；利用智能合同和持续性监控技术，实现合同执行监督和过程偏差自动监控；利用GPS卫星定位技术监控停车场数据或跟踪商品物流等数据，估计被审单位的销售收入；利用物联网和传感器技术，记录物联网设备使用情况，验证被审单位数据的真实性、可靠性。基于深度学习模型构建的审计数据仓库包含了审计实质性程序所需的全面证据，包括文本文件（应收账款余额的客户函证、采购订单、销售发票、运输文件、董事会会议记录和电子邮件、内部控制自我评估报告、内部控制缺陷披露）、音频文件（电话会议、董事会会议、对管理人员和内部其他人员的询问等）、视频文件（库存盘点和固定资产检查）和图像文件（支票、收据、银行对账单以及生产运营过程的监控图像）。此外，还有结构化数据，ERP系统中各类日记账、明细账、总账等的会计记录、试算表和其他文件。输出（标签）包括内部控制测试和实质性程序的建议、实质性测试结果、审计证据充分性和适当性的评估结果以及审计师后续行动的建议等。

通过深度学习的信息识别和判断支持功能，一些实质性测试可以自动进行。如要求供应商书面确认截至资产负债表日的应付账款的细节，审查确认函作为应付账款负债证据，以确保负债总额与客户的会计记录相符；还可通过无人机拍摄客户存货情况来评估存货资产的状况。实质性测试阶段还有一项重要任务就是评估审计证据的充分性和适当性。基于审计数据仓库中的海量历史数据所训练出来的深度神经网络，能够帮助审计师确定当前审计证据对特定审计目标是否充分，并提供是否要获得更多的证据、收集哪些类型的证据以及是否进行额外的实质性测试以获得新证据等后续建议。审计师据此采取实际行动用来调整优化神经网络，相关结果也会再次更新至数据仓库，所有工作最终都可以通过深度学习实现自动化。

4.审计完成阶段。审计的最后阶段是完成审计和报告结果。该阶段的初始数据仓库输入的数据源包括律师函、代理函、资产负债表日期后发布的内部声明，或与管理层就未记录的或有事项进行访谈的视频和音频记录，输出的标签是公司是否存在重大错报。

在这一阶段，可以利用深度学习技术自动执行一些额外的审计程序，为审计提供新的证据。如为了实现财务报告的列报和披露是否充分的审计目标，可以训练深度神经网络来审查债务合同，以确定应收账款是否被抵押，评估与债务的发生和权利相关的管理层认定；可以用其来阅读财务报表附注，以确定资产的分类是否正确；可以用其审查资产负债表日期之后编制的内部报表，以提供资产负债表日后事项的审计证据；可以提取律师函中的重要信息，以获取有关或有负债的证据。至此，审计数据仓库保存了整个审计过程中除最终审计意见之外的所有数据，并构建最终的深度神经网络模型来预测重大错报风险，审计师对重大错报风险水平做出最终决定，将模型预测值和审计师最终确定的重大错报风险进行对比测试，实现预测模型的自我学习和自我优化，相关学习的输出结果反馈更新至数据仓库。最终，审计师将根据最后确定的重大错报风险独立发表审计意见，出具审计报告。

六、研究结论与启示

深度学习在文本理解、语音识别、视觉识别等领域的优势使其具有对半结构化和非结构化数据的信息识别能力，拓展了审计证据的时空范围。同时，其对海量数据强大的预测分析能力也使其能够为复杂审计决策提供良好的判断支持。这两大能力极大地拓展了审计证据的范围，改善了审计决策机制，有助于提升审计效率和审计质量。文章基于深度学习模型的信息识别功能和判断支持功能，将深度学习的智能分析与审计师的经验修正有效融合，不断扩充、更新、迭代审计数据仓库，为基于数据驱动的深度神经网络提供更好的预测性能。面向审计业务全流程，构建深度学习模型应用于审计业务不同阶段的集成性、整合性框架，以便更好地指导和推动深度学习模型在审计方面的实际应用。为了进一步推动在不同审计阶段、不同审计目标下深度学习模型的审计应用，本文认为下列问题值得进一步探索：

一是如何及时、高效地收集全面完整的内外部全域审计大数据，并建立深度学习模型所需的数据仓库。深度学习模型是基于数据驱动的，为了提升模型训练效果，需要在传统审计文件的基础上，通过深度学习的文本理解、语音识别和视觉识别等技术，吸纳更多的源自射频识别传感器、视频和音频文件等的非结构化数据，确保审计数据仓库的完整性，并在会计师事务所内部建立高效且兼顾成本效益的信息共享机制，关注数据安全和隐私保护。

二是如何破解缺少标签化数据的应用瓶颈。深度学习模型训练是由大量带有标签的数据集推动的，现实情境下很难使所有的数据都有预定义的特征来标记。例如，为了构建一个深度学习模型，识别电话会议中管理者语言的情感特征，需要审计师或专业领域人员花费大量的时间精力来辨识管理者陈述的语气特征，并标识出相应的情感分类标签。此时，如何利用有限的带有标签的审计数据，来训练高性能的深度学习模型显得尤为重要。无监督、半监督和一次性学习技术能够用大量的无标签数据来补充少量的标签数据，从而为破解深度学习模型应用缺少标签化数据这一难题提供了解决思路和技术方案。

三是如何制定指导新兴技术审计应用的标准。大数据、云计算、人工智能等新一代信息技术驱动下的数字化转型，使得审计过程越来越多地使用深度学习和其他数据分析技术，这将改变审计证据的数量和类型、审计程序和方法以及专业判断的性质和依据，要求相关准则制定机构必须重新考虑审计标准，以便能科学指导和有效应用这些技术。早在2016年国际审计与鉴证准则理事会（IAASB）的数据分析工作组就已经起草了新的国际审计准则，并向相关方征求意见。

四是如何拓展审计师的知识和能力结构以适应数字化转型。尽管新技术为审计师提供了大量有用的数据，但也带来了巨大的应用挑战，改变了审计团队的知识结构和互动方式，需要审计师掌握数据分析的相关知识和技能，在海量数据中“去伪存真、去粗取精”，以洞察海量数据背后隐藏的特征和规律。虽然审计师不必成为数据科学家或机器学习专家，但需要掌握统计学、机器学习、数据分析和编程方面的基础知识和技能，以便能够与机器学习和人工智能领域的专业人士进行有效的沟通交流和分工合作，为深度学习模型审计应用的优化提供专业建议和知识支持。