基于生成式人工智能的审计报告自动生成研究

2024-12-06 00:00:00单文涛王永青
财会月刊·下半月 2024年12期
关键词:生成式人工智能审计报告

【摘要】审计报告是审计工作的最终成果, 传统的审计报告主要依赖审计人员手动整理和编写, 报告可靠性和准确性受到一定制约。利用生成式人工智能技术, 审计系统可以自动从审计文件中提取关键信息并生成审计报告, 进而提高审计报告的生成效率与质量。本文系统探究了生成式人工智能在审计报告自动生成中的实现机理, 构建了基于生成式人工智能的审计报告自动生成模型, 从数据准备、 模型设计、 模型训练和模型部署等环节探讨了该模型的实现过程。进一步地, 从数据安全、 文本偏差、 语义识别以及技术限制等方面探讨了生成式人工智能技术应用于审计报告自动生成可能面临的风险, 并提出了相应的解决思路。本文为推动生成式人工智能技术广泛应用于审计领域提供了一定的理论和实践参考。

【关键词】生成式人工智能;GPT模型;审计报告;自动生成

【中图分类号】F275" " " 【文献标识码】A" " " 【文章编号】1004-0994(2024)24-0016-6

一、 引言

随着新一代信息技术的迅猛发展, 人工智能(AI)作为一种强大的技术手段, 已经在各个领域展现出惊人的应用潜力。审计作为一个信息密集型行业且涉及财务、 法律和风险管理等多个领域, 对人工智能技术的需求也在急速增长。2021年, 中央审计委员会办公室、 审计署发布《“十四五”国家审计工作发展规划》, 强调要加强审计信息化建设和审计技术方法创新, 增强大数据审计能力, 充分运用现代信息技术开展审计, 提高审计质量和效率。审计报告作为审计人员根据审计结论发表明确意见的书面文件, 不仅承载着审计人员对审计项目进行分析、 评价和形成结论的最终成果, 也是向外部投资者、 监管机构等利益相关者传递信息的主要途径。然而, 传统的审计报告撰写过程中存在着诸多挑战, 包括庞大的数据量、 复杂的业务流程以及繁多的法规要求等。审计人员在面对这些挑战时, 往往需要耗费大量的时间和精力来收集、 整理与分析信息, 且极易受到主观意识和个人经验的影响, 导致审计报告的可靠性和准确性受到制约。随着传统审计工作的智能化转型, 将以人工智能为代表的新一代信息技术引入审计工作中势在必行(易冰心等,2023)。生成式人工智能(Artificial Intelligence Generated Content,AIGC)是一项利用算法、 模型和规则, 从大规模数据集中学习, 以创造新的原创内容的人工智能技术, 具备在复杂环境中自动处理信息的卓越能力(郑世林等,2023)。其中, GPT(Generative Pre-trained Transformer)模型就是一种基于Transformer架构的生成式人工智能模型, 它的关键技术是在大量非标记的文本数据上进行预训练, 使模型能够理解语言的语法、 语义和上下文, 并生成具有一定逻辑、 连贯性的文本(郁建兴等,2023;王俊秀,2023)。基于此, 借助生成式人工智能技术, 通过训练模型学习审计报告的语言模式, 实现自动生成审计报告的目标具有重要的现实意义和应用价值。

在当前研究中, 一些学者已经开始探讨人工智能技术在审计领域的潜在应用。毕秀玲和陈帅(2019)指出, 科技新时代下的“审计智能+”可以实现数据采集、 分析到报告生成全过程自动化, 进而推动智能审计的全面升级。陈伟(2020)深入探讨了基于RPA技术的审计机器人面临的机遇与挑战, 并提出了基于RPA技术的审计机器人实现方法。郑石桥(2021)认为, 人工智能对审计取证具有重大影响, 积极应对这一影响有助于提高审计工作的效率和效果。程平和毛俊力(2021)、 程平和聂琦(2021)以及郭红建和吴素萱(2023)等系统研究了RPA技术在审计抽样、 实质性程序和内部审计中的具体应用。随着研究的深入, 以ChatGPT为代表的生成式人工智能技术在审计领域的应用开始引起关注。吴花平和汤麒胭(2023)解构了ChatGPT应用于智慧审计的技术逻辑, 并提出了基于ChatGPT的智慧审计系统构建思路。程平等(2023)构建了基于ChatGPT的内部审计框架模型, 探讨了生成式人工智能技术在企业内部审计领域的智能化应用。上述研究为人工智能技术在审计领域的应用打下了深厚的基础, 但生成式人工智能在审计领域应用的相关研究尚不充分, 仅集中在内部审计、 注册会计师审计等方面, 探讨生成式人工智能应用于审计报告的实践研究尚未展开。基于此, 本文将生成式人工智能技术引入审计领域, 旨在探究如何充分利用生成式人工智能技术改进审计报告的生成过程, 以解决在传统审计报告编写过程中存在的效率和质量等方面的问题。

二、 生成式人工智能应用于审计报告自动生成的机理分析

生成式人工智能的引入为审计报告的自动生成注入了全新的可能性, 其独特的语言生成和数据处理能力为审计流程赋予了智能化元素。本部分将分析生成式人工智能在审计报告自动生成中的关键机理(见图1), 以更全面、 深刻地理解生成式人工智能在提升审计报告生成效率和质量方面所发挥的实质性作用。

1. 利用大数据处理和模式识别提供数据支持。大数据处理是对大规模、 复杂和多样化的数据进行采集、 存储、 处理、 分析和应用的过程, 旨在从海量数据中提取有价值的信息。利用大数据处理技术, 生成式人工智能能够以高度并行的方式同时且高效地处理审计证据中财务报表、 交易记录等大规模多个数据源, 从中挖掘出潜在的异常、 模式和趋势, 发现隐藏在数据中的关键信息, 为审计报告提供更为全面和准确的数据依据。例如, 利用ETL(Extract,Transform,Load)工具可以从多个数据源中对审计证据进行数据提取、 清洗和转换, 并加载到数据仓库中; 通过Hadoop和Spark等大数据平台对数据进行分布式处理, 快速提取关键信息, 提高数据处理效率。

模式识别是一种通过自动或半自动的方式从数据中寻找、 识别和描述规律、 趋势或特定结构的方法。利用模式识别技术, 生成式人工智能能够学习和理解审计数据中的模式和趋势, 从而自动发现财务报表中规律性、 重复性的模式, 以及潜在的异常情况(陈锐和江奕辉,2024)。模式识别技术让生成式人工智能不仅能够被动地对数据进行处理, 更能够识别出不同数据要素之间的相互影响, 发现隐藏在数据背后的潜在关联, 从而主动抽象出有价值的信息, 为后续的审计报告生成提供有力的支持。例如, 时间序列分析可以用于识别财务数据中的趋势和周期性变化, 异常检测算法可以发现财务报表中的异常模式。此外, 可以利用生成式人工智能自动生成数据预处理、 模型训练和模型评估等代码, 并使用自动化超参数优化技术找到最佳模型参数组合, 提高审计报告生成的准确性和可靠性。综合来看, 大数据处理和模式识别使得生成式人工智能在审计报告生成过程中能够对庞大的数据进行全面深入的分析与挖掘, 对提高审计报告的全面性和准确性起到至关重要的作用, 为自动生成符合专业标准的审计报告奠定了良好基础。

2. 利用NLP和知识图谱技术理解信息并生成文本。自然语言处理(Natural Language Processing,NLP)由自然语言理解和自然语言生成两个部分组成。其中, 自然语言理解可以使计算机在大规模文本数据上进行预训练并捕捉丰富的语言结构、 语法规则以及理解审计领域的专业术语和相关法律规范要求(马晓华,2021)。例如, Transformer就是一种用于执行自然语言理解任务的主流模型架构, 它通过自注意力(Self-Attention)机制, 使得模型在处理序列中的每个元素时都能参考整个序列的上下文信息, 而不仅仅是当前元素的局部信息, 使模型更好地捕捉词语之间的依赖关系和长距离依赖。通过自然语言理解, 可以抽取审计任务中涉及的文本数据, 通过构建语法树或依存树对其进行语义解析, 并进一步转化为结构化信息, 为自动生成审计报告提供信息基础。自然语言生成能够生成清晰而流畅的语言文本, 使计算机能够基于已有的审计数据和模板以及审计任务要求自动生成符合逻辑和规范的审计报告内容。自然语言生成使用较为一致的语言模型, 无论在何时何地所生成的审计报告都具有一致的语言风格和表达方式, 有助于消除人为因素对审计报告一致性的影响, 提高报告信息的可靠性。

知识图谱是一种用于表示和管理知识的技术, 通常以图形结构的形式展示实体及其相互关系, 其核心目标是以一种结构化和语义化的方式组织信息, 使得计算机能够理解和推理复杂的信息。审计报告涉及众多知识领域并具有复杂的信息网络, 利用知识图谱技术, 可以对审计标准、 法规、 业务流程和财务数据等多领域的复杂信息进行结构化表示, 并融合到一个统一的知识库中。这一知识库能够对文本中的实体和关系进行图形化映射, 为自然语言处理(NLP)系统提供更丰富的语义信息, 从而推断实体之间的关系并解决歧义性问题。由于知识图谱通常以RDF或XML文件格式表示, 而当前执行NLP任务的主流模型LLM(Large Language Model)无法直接读取以上类型文件, 这就需要进行一定的预处理和转换来完成数据衔接。比如, 可以通过Python工具的rdflib库、 xml.etree.ElementTree库读取RDF或XML格式数据, 然后将读取到的数据转换为LLM可以读取的结构化文本或JSON格式文本。综合来看, 生成式人工智能通过NLP和知识图谱技术的有效结合, 可以更好地理解审计领域的专业术语、 逻辑关系和业务规则, 从而生成更准确、 更符合要求的审计报告内容。

3. 利用迁移学习和领域自适应实现语境匹配。迁移学习(Transfer Learning)和领域自适应(Domain Adaptation)主要解决在一个任务或领域中训练的模型在另一个相关任务或领域中的应用问题。迁移学习的目标是将一个源领域或任务的知识迁移到另一个目标领域或任务中, 以改善另一个领域或任务的学习效果。通常情况下, 源领域(Source Domain)和目标领域(Target Domain)的数据分布是不同的, 这就需要在迁移学习中解决领域之间的差异问题。领域自适应则是迁移学习的一种特定形式, 它关注的是在源领域中学到的知识如何应用到目标领域中, 帮助系统在面对新的环境、 情境或变化时, 能够调整自身行为、 策略和结构, 以适应新的要求或挑战。

在审计工作实践中, 审计报告的生成通常需要大量高质量的数据来训练生成模型, 但实际上审计数据可能是稀缺的, 且质量不一。通过迁移学习, 可以利用其他领域或任务中的大型数据集, 在这些数据集上预训练模型, 然后将模型迁移到审计领域进行微调, 以提高模型在审计数据上的性能。与此同时, 审计领域有其特定的术语、 准则和规范, 与其他领域可能存在较大差异。通过领域自适应, 可以借助对抗性训练对齐源领域和目标领域的特征分布, 进而帮助生成模型更好地理解审计领域的背景知识、 行业标准和特定术语。这意味着生成式人工智能可以根据具体的审计需求, 调整其模型参数, 以更专业地适应不同企业、 行业和审计标准的特定审计场景。综合来看, 这种适应性机制提高了模型生成审计报告的灵活性和贴近实际需求的能力, 使其成为可持续发展的智能工具。

三、 基于生成式人工智能的审计报告自动生成模型设计与应用

1. 基于生成式人工智能的审计报告自动生成模型设计。将生成式人工智能应用于审计报告自动生成的关键在于综合运用自然语言处理、 大数据处理、 模式识别、 迁移学习和领域自适应等智能化技术, 使得生成式人工智能自动、 智能地处理审计信息, 并将其转化为符合专业标准和规范的审计报告。基于以上思路, 本文分阶段设计了基于生成式人工智能的审计报告自动生成模型, 如图2所示。

首先是准备阶段, 这一阶段主要是针对审计报告的源数据进行获取和处理。审计报告的源数据通常由多种途径获得, 如内部审计部门、 会计师事务所、 公开披露的审计报告以及专业数据库等, 涵盖了各种类型和行业的审计报告源数据。不同来源的审计报告源数据可能存在着格式、 结构和质量上的差异, 因此需要针对这些数据进行清洗、 标记以及相关的预处理。

其次是起始阶段, 这一阶段主要是选择恰当的生成式人工智能模型架构, 并对其进行参数设定。例如, 循环神经网络(RNN)和长短期记忆网络(LSTM)是一类经典的序列模型, 它们在处理文本生成任务时获得了良好的效果。但这些传统的序列模型存在着梯度消失和梯度爆炸等问题, 导致在处理较长文本时性能下降。为了解决这些问题, Transformer模型完全摒弃了传统的RNN结构, 引入了自注意力机制, 能够在不依赖序列顺序的情况下对序列进行建模, 在处理长文本任务时表现尤为出色, 更加适合完成审计报告自动生成任务。

再次是进阶阶段, 这一阶段主要是对生成式人工智能模型进行训练与调优。在损失函数方面, 通常采用的损失函数是交叉熵损失函数, 因为它能够衡量模型生成结果与真实标签之间的差异, 并指导模型不断优化; 在优化算法方面, 需要考虑不同算法在模型训练中的收敛速度和稳定性。这里通常会选择更加高效和稳定的优化算法, 如Adam优化器, 因为它结合了动量法和自适应学习率的特性, 能够更快地收敛并避免陷入局部最优解。同时, 在模型训练过程中, 还需要进行超参数的选择和调优, 包括学习率(Learning Rate)、 批次大小(Batch Size)、 隐藏层大小(Hidden Size)等, 它们对模型的性能和泛化能力有着重要影响。

最后是应用阶段, 这一阶段主要是将模型部署与应用至实际场景。第一, 选择适宜的部署环境。云计算平台可根据需求动态调整资源规模, 具有灵活的计算资源和服务, 成为人工智能应用领域的主流选择。第二, 对模型进行优化和封装。这里包括模型参数的压缩、 量化和模型文件的格式转换, 以确保模型在部署环境中高效运行。第三, 设计和开发良好的接口。应用程序之间需要无缝对接的接口, 通过编写相应的代码来实现数据的输入和输出, 并充分考虑与其他系统组件的协同工作。第四, 性能测试和负载测试。通过模拟真实场景和不同负载条件, 评估系统在各种压力下的稳定性和性能表现, 及时发现并解决潜在的性能问题, 以确保系统的稳定运行。第五, 持续地监控和维护。通过监控系统运行状态和性能指标, 及时发现和解决可能出现的问题, 确保系统的稳定性和可靠性。第六, 定期对模型进行更新和优化。适应业务需求和环境变化, 提高系统的适应性和效率。第七, 用户培训与支持。为用户提供详尽的文档和培训资料, 并提供及时的技术支持和问题解决服务。

2. 基于生成式人工智能的审计报告自动生成案例应用。根据以上的模型设计, 某大型会计师事务所(简称“事务所”)决定采用生成式人工智能技术, 实现审计报告的自动生成, 以提升审计工作的效率。本文将详细介绍该事务所基于生成式人工智能的审计报告自动生成项目的具体实施步骤。

(1) 审计报告源数据处理与准备(准备阶段)。事务所收集并整理了大量审计报告源数据, 数据来源包括内部审计部门的历史审计报告、 各类审计工作底稿、 其他事务所的审计报告以及专业数据库中的财务数据等。由于这些数据格式和结构各异, 事务所采用了一系列数据预处理技术, 具体包括: 首先, 数据清洗。通过哈希算法、 主键检查、 规则校验和K近邻法等多种数据处理技术对重复数据、 错误数据和缺失数据等进行清洗和消除。其次, 数据标注。为数据集中的每个样本添加标签或注释, 如财务数据、 合规性审计信息、 建议措施、 审核结果等标注, 确保每个数据条目都有明确的标签, 以便模型更好地理解和学习审计报告的结构和内容, 提高模型的生成质量和准确性。再次, 数据的预处理。预处理内容包括文本分词、 去除停用词、 词干化或词形还原等, 从而有助于模型更好地理解语言的结构和语义。最后, 将数据转换成模型可以处理的文件格式, 以备后续模型训练和应用之需。

(2) 审计报告自动生成模型选择与设定(起始阶段)。首先, 选择模型类型。事务所对比了几种常见的生成式人工智能模型, 包括RNN、 LSTM和Transformer模型。经过详细的分析, 最终选择了Transformer模型。主要基于两点考虑: 一是Transformer模型引入了自注意力机制, 能够在不依赖序列顺序的情况下对序列进行建模, 特别适合处理长文本任务, 能够更好地生成高质量的审计报告; 二是Transformer模型可以利用并行计算加速训练过程, 适合大规模数据集。其次, 选择模型架构。事务所选择了BERT(Bidirectional Encoder Representations from Transformers)作为基础模型用于理解和生成文本, 并进一步结合GPT技术以增强文本生成能力。再次, 设定模型参数。模型层数(Layers)设定为12层, 保证模型具有足够的深度来学习复杂的文本模式; 隐藏层大小设定为768, 以平衡模型的表达能力和计算复杂度; 注意力头数(Attention Heads)设定为12个, 以捕捉不同的语义信息; 学习率初始设定为1e-4, 并通过学习率调度器(Learning Rate Scheduler)在训练过程中逐步降低, 以平衡模型收敛速度和稳定性; 将批次大小设定为32, 以确保每个训练步骤都有足够的数据进行梯度更新, 同时避免内存溢出。最后, 选择Adam优化器, 使其自适应学习率和动量特性能够加速模型收敛, 避免陷入局部最优解。

(3) 审计报告自动生成模型训练与调优(进阶阶段)。首先, 将预处理后的审计报告数据集分割为训练集、 验证集和测试集。通常采用80%的数据作为训练集, 10%的数据作为验证集, 10%的数据作为测试集, 以确保数据分布的均匀性。其次, 利用预先设定的参数, 初始化Transformer模型, 并加载预训练的词嵌入(如GloVe、Word2Vec)。再次, 输入审计报告相关数据, 计算预测结果和损失值, 根据损失值计算梯度并更新模型参数。在每轮训练结束后, 使用验证集评估模型性能, 记录损失值和评估指标(如BLEU分数、ROUGE分数)。最后, 模型调优。利用网格搜索(Grid Search)法在预设范围内对学习率、 批次大小、 隐藏层大小等超参数进行组合实验, 寻找最优参数组合; 或是训练多个不同的模型, 并对其预测结果进行加权平均或投票, 以提升模型的稳定性和性能; 还可以使用交叉验证方法, 将训练集分为多个子集, 进行多次训练和验证, 并根据验证结果不断调整模型参数和训练配置, 优化模型性能。

(4) 审计报告自动生成模型部署与应用(应用阶段)。首先, 选择部署环境。事务所选择了AWS云平台进行模型部署, 利用其提供的高性能计算实例, 确保模型的高效运行。其次, 接口开发。可以选择基于RESTful API的接口, 支持批量数据输入和生成结果的输出, 并在接口中集成JWT(JSON Web Token)认证机制, 确保数据传输的安全性和用户身份的验证。再次, 部署与测试。使用Docker将模型打包成容器, 通过Kubernetes进行管理和部署, 并进行功能测试和负载测试, 确保系统在高并发条件下稳定运行, 响应时间控制在200ms以内。此外, 可以通过部署Prometheus和Grafana, 对系统运行状态和性能指标进行实时监控, 确保系统的稳定性, 并定期更新审计报告数据集, 通过CI/CD管道自动化模型的更新和部署, 保持模型的最佳性能。最后, 编写详细的使用文档和培训手册, 组织定期的用户培训会议, 帮助用户快速上手系统。

四、 生成式人工智能应用于审计报告自动生成的风险

1. 数据隐私和安全风险。在构建基于生成式人工智能的审计报告自动生成模型时, 数据隐私和安全风险是至关重要的考虑因素。这些风险涉及审计报告所使用的敏感数据的安全性和机密性, 以及在处理和传输过程中可能遭受到的各种威胁。数据隐私风险包括数据的非授权访问和泄露。审计报告所涉及的数据通常包含企业的财务信息、 客户资料以及其他敏感数据。如果这些数据在处理过程中被未经授权的人员访问, 就可能引发严重的隐私泄露问题。例如, 未经授权的访问者可能会获取敏感数据, 导致客户信任受损, 甚至引发法律诉讼。数据安全风险涉及各种网络威胁和恶意行为。网络攻击者可能会利用漏洞入侵系统, 以获取敏感数据或篡改审计报告。恶意软件也是一项严重的威胁, 它可能通过恶意代码感染系统, 导致数据被窃取、 破坏或勒索。此外, 内部威胁也不能忽视, 模型使用者可能会滥用权限, 有意或无意地泄露敏感信息, 导致数据泄露。

2. 文本偏差和失真风险。基于生成式人工智能技术的审计报告自动生成模型可能会受到审计报告数据中的“噪声”、 错误和不一致性的影响, 导致模型生成文本产生偏差和失真。第一, 审计报告数据本身可能受到多种“噪声”的影响。这些“噪声”可能源自数据采集过程中的错误、 系统性偏差以及主观判断的差异等多个方面。这些包含“噪声”的数据可能会对生成式人工智能模型的学习产生不利影响, 进而影响报告生成的准确性和可信度。第二, 模型所使用的审计报告训练数据集存在选择偏差, 如仅包含特定类型或行业的审计数据, 生成的报告可能对于不同类型企业的适应性和准确性偏低。第三, 审计报告数据中可能存在不一致性问题, 即存在相互矛盾的信息或数据。这可能是不同数据来源之间的差异、 业务操作的复杂性不同以及不同审计期间的变化等原因造成的, 这种不一致性可能会导致模型在学习和生成文本时产生混淆或错误。第四, 模型对新兴领域或涉及最新发展的审计任务未能有效识别和应对。审计领域的不断演变和创新可能使得模型无法及时捕捉到最新的业务趋势和法规变化, 导致模型在面对非常规的审计任务时可能未能全面掌握有效的处理方式, 导致生成报告文本存在偏差与不足。

3. 语义识别与理解不足风险。由于生成式人工智能模型可能无法完全理解文本的语义和上下文, 生成的审计报告可能存在逻辑不清晰、 信息不连贯的问题。这主要是根源于自然语言的复杂性和生成式人工智能模型的局限性。自然语言中存在着词语的多义性和歧义性, 句子结构和逻辑关系纷繁复杂, 而生成式人工智能模型往往缺乏足够的实际经验和背景知识来准确理解特定领域或行业的术语和惯用语, 以及可能无法理解复杂的句子结构或上下文信息, 从而产生不恰当或混淆的内容。例如, 当审计报告涉及复杂的财务交易或法律条款时, 生成式人工智能模型可能会因为对专业术语的理解不准确而生成错误的解释。此外, 生成式人工智能模型可能无法理解文档中的隐含信息或非字面意义, 导致生成的报告与实际情况不符。

4. 技术限制和不确定性风险。基于生成式人工智能的审计报告自动生成模型在算法、 数据和技术等方面仍然存在限制和不确定性。在算法设计方面, 尽管模型所采用的Transformer等算法在自然语言处理领域取得了巨大成功, 但其在审计报告自动生成任务上的适用性和性能仍存在不确定性, 可能受到生成过程中的梯度消失或梯度爆炸等问题的影响, 导致生成的报告质量不稳定或偏离预期。在数据质量方面, 审计报告的生成需要大量的数据输入, 这些数据应当具有代表性、 准确性和多样性。然而, 在实际应用中, 获取高质量的审计数据可能会面临挑战。数据可能存在缺失、 错误或不一致性, 这些问题都可能对模型的训练和生成结果产生负面影响。在技术应用方面, 尽管生成式人工智能技术已经取得了显著进展, 但这些技术仍然存在局限性和待解决的问题。例如, 模型可能无法很好地处理复杂的语义理解和逻辑推理, 导致生成的审计报告缺乏连贯性或逻辑性。此外, 新兴的技术和方法可能还未经过充分验证和实践, 存在一定的风险和不确定性。

五、 生成式人工智能应用于审计报告自动生成的风险应对

1. 建立数据安全和监督机制。首先, 数据加密是确保数据安全的基础, 可以采用先进的加密算法对敏感数据进行加密, 以确保即使数据被未经授权的人获取, 也无法解密和读取其内容。针对敏感数据的传输可以采用SSL/TLS等安全传输协议, 以防止数据在传输过程中被窃取或篡改。其次, 采用数据脱敏和数据泛化等方法, 对身份信息和其他敏感信息进行匿名化处理, 以降低数据关联性和识别风险。再次, 建立严格的访问控制和权限管理机制也是确保数据安全的重要举措。通过身份验证、 访问授权和审计跟踪等技术手段, 限制对数据的访问和使用, 只有经过授权的人员才能获取和操作相关数据。对不同级别的用户设置不同的权限, 确保其仅能够访问其工作职责所需的数据, 以最大限度地降低数据泄露的风险。最后, 建立健全的监督和审核机制也是数据安全的重要保障。定期对系统进行安全审计和漏洞扫描, 发现潜在的安全问题并及时解决。

2. 建立数据质量控制体系。在审计报告自动生成过程中, 文本偏差和失真风险是不可忽视的挑战, 但可以通过一系列专业且技术化的数据质量控制体系有效应对。首先, 建立完善的数据预处理流程, 包括数据清洗、 标准化和规范化, 以消除潜在的数据偏差。其次, 采用先进的自然语言处理技术, 如词向量模型、 语义分析和实体识别, 对文本进行深度理解和分析, 以减少文本理解上的偏差。同时, 引入多模型融合和集成学习技术, 结合不同模型的优势, 提高生成报告的准确性和稳健性。此外, 建立专家评审团队, 利用专业知识和经验对生成的报告进行审核和修正, 确保其符合审计准则和行业规范。最后, 持续监测和评估系统性能, 定期更新模型和算法, 以适应不断变化的审计需求和文本特征, 进一步降低文本偏差和失真风险。通过数据质量控制体系, 可以有效提升生成式人工智能技术在审计报告自动生成领域的应用效果, 确保生成报告的客观性、 准确性和可信度。

3. 持续调整算法与系统优化。针对语义识别与理解不足以及技术限制和不确定性等其他风险, 可以采取一系列综合性的整体措施进行应对。首先, 通过最新的深度学习和自然语言处理技术不断优化系统, 提高其对语义的识别与理解能力, 包括语境分析、 关系抽取和概念建模等方面的技术应用, 以确保生成报告的准确性和完整性。其次, 建立灵活、 可扩展的技术架构, 包括模型融合、 多模态数据处理和自适应学习算法等, 以应对技术限制和数据不确定性带来的挑战, 提高系统的稳健性和适应性。加强与审计专业人员的合作与交流, 充分利用其专业知识和经验, 提供数据标注和领域知识补充, 以补充技术无法覆盖的领域知识和细节, 从而降低不确定性风险。最后, 持续监测和评估系统性能, 及时调整和优化算法模型, 以适应不断变化的审计需求和数据特征, 从而进一步提高生成报告的质量和可信度。通过这些综合性的整体应对措施, 提高系统的稳定性和可靠性, 为审计工作提供更有效的支持和保障。

六、 结语

本文通过相关文献综述和技术机制分析, 发现生成式人工智能技术在审计报告自动生成方面具有巨大潜力。基于此, 构建了基于生成式人工智能的审计报告自动生成模型, 并对数据准备、 模型设计、 模型训练与模型部署等环节进行了深入探讨。然而, 该模型在实际应用中仍然面临一些挑战, 包括数据隐私与安全、 文本偏差与失真、 语义识别与理解不足及技术限制与不确定性等。为了应对这些挑战, 本文提出了一系列针对性的措施, 包括建立数据安全与监督机制、 建立数据质量控制体系及持续调整算法与系统优化等。随着数字技术的不断发展, 可以预见生成式人工智能技术在提高审计报告自动生成效率、 准确性和灵活性等方面将发挥愈发重要的作用。未来研究可以进一步探索该技术在不同审计领域的适用性, 以及与其他前沿技术的巧妙结合, 进而推动审计领域的数字化转型。

【 主 要 参 考 文 献 】

毕秀玲,陈帅.科技新时代下的“审计智能+”建设[ J].审计研究,2019(6):13 ~ 21.

陈锐,江奕辉.生成式AI的治理研究:以ChatGPT为例[ J].科学学研究,2024(1):21 ~ 30.

陈伟.基于RPA的审计机器人:机遇、挑战与方法[ J].中国注册会计师,2020(10):112 ~ 115.

程平,毛俊力.基于RPA的审计抽样软件机器人研究[ J].财会月刊,2021(21):100 ~ 106.

程平,聂琦.基于RPA技术的主营业务收入实质性程序审计机器人的设计与应用[ J].财务与会计,2021(5):61 ~ 64.

程平,喻畅,龚悦.基于ChatGPT的智能内部审计研究[ J].会计之友,2023(20):7 ~ 12.

郭红建,吴素萱.基于RPA技术的企业内部审计数字化转型研究[ J].会计之友,2023(20):13 ~ 19.

马晓华.基于自然语言处理技术的IT治理审计方法研究[ J].财会通讯,2021(1):144 ~ 148.

王俊秀.ChatGPT与人工智能时代:突破、风险与治理[ J].东北师大学报(哲学社会科学版),2023(4):19 ~ 28.

吴花平,汤麒胭.ChatGPT对智慧审计的机遇与挑战[ J].中国注册会计师,2023(7):67 ~ 72+3.

易冰心,刘思琦,王志勇.AIGC在审计领域的运用[ J].中国注册会计师,2023(11):69 ~ 73.

郁建兴,刘宇轩,吴超.人工智能大模型的变革与治理[ J].中国行政管理,2023(4):6 ~ 13.

郑石桥.人工智能对审计取证的影响:一个理论框架[ J].财会通讯,2021(7):17 ~ 20+110.

郑世林,姚守宇,王春峰.ChatGPT新一代人工智能技术发展的经济和社会影响[ J].产业经济评论,2023(3):5 ~ 21.

DOI:10.19641/j.cnki.42-1290/f.2024.24.003

【基金项目】国家社会科学基金一般项目“数字赋能平台供应链实现价值共创的机制与路径研究”(项目编号:23BGL042);江苏高校优势学科

建设工程资助项目(PAPD)

【作者单位】南京审计大学会计学院, 南京 211815。 王永青为通讯作者

猜你喜欢
生成式人工智能审计报告
生成式人工智能的教育启示:让每个人成为他自己
挑战·融合·变革:“ChatGPT与未来教育”会议综述
生成式人工智能时代的政治传播走向
党政研究(2023年3期)2023-05-29 01:10:39
生成式人工智能重塑教育及教师应对之道
人机共生时代国际传播的理念升维与自主叙事体系构建
对外传播(2023年4期)2023-05-21 20:52:16
生成式人工智能的教育应用与展望
长文式(军队)审计报告改进探索
提升审计报告质量的创新对话
中注协秘书长陈毓圭就新审计报告准则全面实施答记者问
中国注册会计师协会印发新审计报告准则应用指南