吴花平 汤麒胭
审计在维护国家的财政经济秩序、改善财务报表质量和内涵等方面发挥着重要的作用。伴随数字经济的迅猛发展,传统的审计技术已经无法适应现有审计工作的要求。因此,新兴技术ChatGPT的出现成为推动审计工作发展的强心剂。
2 0 2 2 年1 1 月3 0 日 发 布 的ChatGPT(Chat Generative Pretrained Transformer),是由美国人工智能公司OpenAI所研发的一个聊天机器人程序,它是一种基于文本输入形式的生成式人工智能对话交互系统,可以从网络上收集大量文本数据,并通过采用深度学习算法和使用人类反馈的强化学习进行相应的训练,ChatGPT可以从中深度学习和理解人类语言沟通交流过程中所使用的语法规则和语言知识,进而能够生成符合人类日常习惯的对话结果,使其能流畅的与用户进行交互对话,同时还能根据聊天的上下文进行多轮互动。ChatGPT不仅具有强大的对话与文本生成能力,而且还会主动承认其在问题回答过程中的错误、敢于质疑用户提问的不恰当地方,同时也会拒绝回答一些带有敏感因素的问题。
ChatGPT作为一种具有强大对话能力和生成能力的人工智能技术,其强大功能主要依靠三种关键技术来实现,包括AI语言大模型、Transformer模型、预训练模型。ChatGPT的出现使人工智能技术在功能维度方面达到一个新的高度。越来越受到各行各业的关注,其出现必然会对审计工作产生深远的影响,同时也会给智慧审计带来一定的机遇与挑战,因此,研究ChatGPT对智慧审计的机遇与挑战具有一定的理论与现实意义。
智慧审计是数据化审计、传统审计的高级阶段,主要是运用人工智能、大数据、云计算等新兴技术,对传统审计工作流程与价值输出模式进行再造,并对其进行升级。同时智慧审计是基于全覆盖的数据采集、强大的运算能力、丰富的数据分析模型上的智能化审计模式。
随着互联网新兴技术的发展和企业数字化转型步伐的加快,内部审计必然要面对更多纷繁复杂的异构多源数据。在此背景下,传统的内部审计技术已无法满足现有模式的要求。通过综合运用数据采集与处理技术、自然语言处理技术、可视化分析技术、深度学习算法、人类反馈的强化学习等技术,构建智慧审计系统,可以打破审计人员与被审计单位以及其他相关企业之间存在的数据壁垒,审计过程所需采集的海量数据可以直接通过ChatGPT、大数据等新兴技术,使审计单位能够直接与被审计单位数据系统或者其他相关企业数据系统相连,从而可以随时随地捕获大量被审计单位与其他相关企业的数据,节约数据采集过程所需耗费的大量时间,很大程度上解决了数据采集困难的问题。并且审计人员能够通过借助各种新兴技术如ChatGPT、大数据、人工智能等,对被审计单位的各种数据进行智能数据分析,使审计人员能对被审计单位存在的各种审计问题进行准确定位和分析,快速、精准地捕捉被审计单位存在的审计风险疑点,对其进行提前风险识别与预警。同时智慧审计系统的构建能够使其自动完成审计人员在审计工作中的大部分基础性工作,如审计计划、审计报告等的自动生成,使审计人员能够去处理更多具有价值的审计工作,提升审计工作的处理速度与效率,减少大量的审计人工成本。
ChatGPT的强大功能主要由三种关键技术支持,包括AI语言大模型、Transformer模型、预训练模型,其拥有的这三种关键技术可以使ChatGPT生成更高质量水平模型,从而帮助ChatGPT更好的赋能智慧审计。ChatGPT技术的整体架构如图1所示。
图1 ChatGPT技术整体框架
ChatGPT作为一个超大规模的语言模型,其拥有将近8000亿个单词的语料库训练数据,同时其在训练过程中学习、沉淀下来了1750亿个参数。其拥有的海量参数规模,让ChatGPT能够捕获更复杂更庞大的语言模式和关系,能有效提升其解决问题的精确度。同时ChatGPT通过大语言模型与大规模的语料训练包能够支持用户在对话框里以文本的形式输入各种语言种类的问题,随即ChatGPT能够根据用户所输入的语言种类(中文、英文等)相对应地生成该种语言的答案,用户在ChatGPT回答对应问题之后还可以继续询问递进问题,ChatGPT可根据用户的特征不断适应新的需求,由于ChatGPT在与用户的对话过程中会记忆先前的对话信息,进行上下文语义理解,与用户进行多轮迭代对话,极大提升了对话交互模式下的用户体验。
C h a t G P T 使用了基于Transformer的神经网络架构,支持自然语言处理(Natural Language Processing,NLP),可以理解和生成自然语言文本。其拥有的自然语言处理能力可以完成文本的自动生成、对话交互、语言翻译等任务,并且Transformer架构中引入了“自注意力”机制,这种机制使ChatGPT可以根据用户输入的词语,捕获其与其他词之间的相关性,从而输出最有可能与其存在关联的信息,具有一定的用户意图理解能力,不管是审计领域、财会领域、还是金融领域等的问题,ChatGPT都能够快捷地以文本形式进行回答,为各行业存在的问题提供高效的解决方案。
ChatGPT主要应用人类反馈的强化学习来训练该模型。其预训练模型的训练过程主要分为三个阶段,包括第一阶段训练监督策略模型、第二阶段训练奖励模型、第三阶段PPO强化学习优化战略模型,通过这三阶段各种模型策略的相互迭代与优化,由此生成更高质量水平的ChatGPT模型。
1.训练监督策略模型。由于ChatGPT在初始阶段自身较难理解人类用户不同类型指令要求中所具有的不同意图,同时其自身也难以判断生成的问答结果是否具备高质量、高准确度的要求,为了使ChatGPT能够充分理解用户的需求与意图,在其技术中融入了第一阶段的训练监督策略模型。首先ChatGPT会在其预训练数据集中随机抽取一些问题并向模型解释强化学习的工作机制,借助人类标注人员,从而给出这些问题的高质量、高准确度答案,通过人类标注的训练数据来微调ChatGPT模型。
2.训练奖励模型。第二阶段的训练奖励模型,主要是通过人类标注的训练数据来训练出满意的奖励模型,为第一阶段的训练监督策略模型建立一个评价标准。ChatGPT会在其预训练数据集中随机抽取一些问题,并使用第一阶段所生成的训练监督策略模型,针对于这些问题生成多个不同的答案,而人类标注人员对于这些答案在经过综合思考与抉择后给出答案的优先排名顺序,之后按照给出的答案优先排序结果来训练ChatGPT的奖励模型,对于存在多个排序结果的问答,采取两两组合的方式形成多个训练数据对,训练奖励模型在接收了问答答案后,就会对其回答结果的质量进行打分,从而通过调节ChatGPT的相关参数来保证高质量回答结果的分数高于低质量回答结果。
3.P P O 强化学习优化战略模型。PPO(Proximal Policy Optimization,近端策略优化)的核心思路在于将ChatGPT的在线学习状态转为离线学习状态,这一阶段主要是利用第二阶段已经训练好的奖励模型,依据奖励质量打分来更新ChatGPT中预训练模型的相关参数,在其预训练数据集中随机抽取一些问题,使用PPO强化学习优化战略模型来生成相应的回答,并利用第二阶段已经训练好的奖励模型给出相对应的质量分数,将质量分数依次进行传递与迭代,在此过程中产生相应的策略梯度,从而通过强化学习战略来更新PPO模型中的相关参数,最终使ChatGPT模型能更好的满足用户的需求。
ChatGPT强大的功能应用于智慧审计工作领域势不可挡,因此,构建基于ChatGPT下的智慧审计系统具有一定的必要性。ChatGPT应用于智慧审计主要包括五个功能模块,即智能数据采集系统功能模块、智能数据处理系统功能模块、智能数据分析系统功能模块、智能审计报告系统功能模块、智能数据共享系统功能模块。智慧审计系统中的各个系统功能模块是相辅相成的,各系统功能相互作用共同促进了智慧审计系统的全面发展以及智慧审计工作高效顺利进行。首先,智能数据采集系统中采集到的被审计单位与其他相关企业的结构化数据与非结构化数据共同构成智能数据共享系统里数据的基本内容;其次,智能数据处理系统能够对非结构化数据进行数据预处理,使得智能数据分析系统的数据分析成为可能,从而保证分析的准确性与可靠性;最后,智能审计报告系统在智能数据分析系统提供被审计单位的可靠数据分析报告与可视化图表呈现的基础上,能够自动生成与被审计单位实际情况相关的审计报告。其基本框架如图2所示。
图2 基于ChatGPT下智慧审计系统框架
在智慧审计过程中,审计数据采集占据着十分重要的地位,其数据采集速度的快慢直接影响着审计工作效率高低及审计成本高低,同时数据采集质量好坏也会直接影响审计结果的有效性。ChatGPT是一个可以为审计人员提供被审计单位以及其他相关联企业相关数据的智能化工具,借助ChatGPT所拥有的强大上下文语义理解能力与数据获取能力,通过和智慧审计系统中的智能数据采集系统直接相接,ChatGPT可以帮助智能数据采集系统更准确快速地获得更多、更充分、更准确的被审计单位和其他相关企业的内外部数据资源。审计人员可以根据自己的需要向ChatGPT询问各种与被审计单位或其他与被审计单位相关企业的数据,ChatGPT随即就可将审计人员所需要的这些数据快速导出。此外,ChatGPT在允许的情况下还可以与被审计单位或其他相关企业的数据系统直接相连,智能收集到审计人员所需的被审计单位以及其他相关企业的各种结构化与非结构化数据,使审计人员无需亲自前往被审计单位或其他相关单位等待他们提供所需数据,从而可避免人工采集数据的繁杂与漫长过程,打破之前审计人员与被审计单位以及其他相关单位之间存在的数据壁垒,提高数据采集效率与数据采集质量,为审计分析结果有效性的呈现提供一定的基础保证,从而提高审计效率。
真实性与标准化数据是数据分析有效进行的前提和必要条件。在智慧审计过程中,智能数据处理也起着至关重要的作用。对于审计人员从被审计单位或其他相关企业处所收集到的一些非结构化、非标准数据,需要对其进行数据预处理,将其变为结构化、标准化的数据。ChatGPT是一种自然语言处理工具,能够处理一些非结构化、非标准的数据,可对收集到的各种数据进行快速识别与分类,同时将采集到的不符合规范的数据进行一系列数据预处理操作,包括智能数据清洗(通过填补采集数据过程中丢失的数据与空缺值)、智能数据集成(解决从多个数据源获取数据的冗余问题)、智能数据变换、智能数据规约等操作,使采集到的各种非标准、非结构化数据变得更加的规范与统一,从而提高ChatGPT训练数据集中数据的可用性以及数据分析的质量和准确性,为之后审计工作的顺利开展做好充分准备,以保证审计结果的可靠性与可依赖性。
在被审计单位以及其他相关企业审计数据的智能采集与智能清洗完成后,对于处理后的结构化数据进行智能分析至关重要。这可使审计人员充分了解被审计单位当前具体真实的经营状况与财务状况,以及被审计单位财务报表是否存在一定的可疑风险。ChatGPT是一种基于自然语言处理的人工智能技术,其可通过构建一个智能数据分析系统实现自动化的智能数据分析。审计人员可以将经过ChatGPT的智能数据清理系统清理后的被审计单位及其他相关企业的各种标准、结构化数据导入ChatGPT中,利用ChatGPT的智能数据分析系统自动分析各式各样类型的数据,包括被审计单位的销售数据、财务数据、客户数据、采购数据、市场数据以及业务数据等。ChatGPT可以自动识别分析被审计单位财务报表中的财务数据是否可疑,如采购数据、销售数据是否存在异常、客户交易是否以正常的交易规则进行、是否存在虚假与虚构交易,并且ChatGPT能实现数据的快速分析和可视化图表呈现,同时还可与可视化平台对接,为审计人员充分了解被审计单位具体情况提供不同层次、不同角度等更为丰富多样的可视化图表与智能分析报告。智能数据分析不仅可以提高审计人员的工作效率,减少人工分析条件下的误差,还可以提高其数据分析的准确性和精度,使审计人员能够更直观、更清晰易懂的知晓被审计单位的相关财务状况与经营情况。
生成审计报告是智慧审计工作中不可缺少的环节。审计报告能够让被审计单位管理层、治理层以及利益相关者等了解到被审计单位财务报表的真实情况,包括是否不存在重大错报,以及目前可能存在的一些可疑风险点。ChatGPT可以通过构建智能审计报告系统,利用其拥有的庞大语言文字生成系统实现审计计划、审计报告等的自动生成。审计人员只需向ChatGPT提供诸如被审计单位名称、审计工作底稿、审计目标、审计结果等基础信息,ChatGPT即可据此以及智能分析系统功能模块所提供的被审计单位相关财务数据等的可视化图表和智能分析报告等自动匹配出各种标准审计报告模板,审计人员可以从中选择一款与被审计单位更契合的审计报告模版或直接由ChatGPT自动抉择,在选取审计报告模板之后,ChatGPT会参照审计报告编制流程模块中的具体信息,自动生成相对应的被审计单位审计报告。ChatGPT还可以自动将审计报告结果直接反馈给审计人员、被审计单位管理层、治理层、债权人、投资者等想要知晓被审计单位具体情况的利益相关者,并及时根据利益相关者的角色有针对性地给出符合其身份的建议,供其参考和借鉴,极大地降低了各相关利益者的风险。
通过ChatGPT可以构建一个智能数据共享系统。被审计单位及其他相关企业可将其之前已经发生的相关数据以及现在发生的数据同步存储至ChatGPT的智能数据共享系统中,这不仅可以节约数据存储成本,还可提升审计人员的数据采集效率,减少审计人员与其之间信息数据沟通成本,实现实时的共享相关数据。在被审计单位以及其他相关企业的各种数据上传至ChatGPT的数据共享系统后,审计人员可随时获取大量全面的数据,无需考虑时间特殊性的限制对于被审计单位以及其他相关企业数据的采集,在此条件下审计人员可以进行实时审计以及全面审计。在经过智慧审计系统中智能数据采集系统、智能数据处理系统、智能数据分析系统、智能审计报告系统这四个系统功能模块后,其收集到的各种结构化数据以及生成的相关数据分析报告、可视化图表等相关信息都会被传入到智能数据共享系统中,以便审计人员能够掌握被审计单位和其他相关企业更加全面的数据信息,从而做出对被审计单位更加科学的审计决策与审计建议。
1.作为智能问答工具,提供快速高效问答服务。审计人员在智慧审计工作开展过程中遇到审计相关问题时,可直接将其需要了解的审计问题范围输入进ChatGPT。ChatGPT作为一个智能问答工具,可以提供快速高效问答服务,能快速、准确定位到审计人员需要了解的相关问题,并从训练数据集中的上百亿数据参数中聚焦与问题相联系的部分,快速捕获相关问题答案,最后将问题结果以文本的形式输出给审计人员,同时审计人员也可以向ChatGPT提供与问题相关的训练数据,让其存储在ChatGPT的训练数据集中,使ChatGPT可以更好更充分的理解审计人员的问题所在,以提供更充分、更完整、更正确的问题解答回复,帮助审计人员快速解决相关审计问题,确保智慧审计工作的顺利开展。
2.作为智能辅助工具,提供数据分析与可视化分析服务。审计人员在收集到被审计单位相关的业务、财务等数据时,可以直接将相关数据导入到ChatGPT中。ChatGPT作为一个智能辅助工具,可以给审计人员提供被审计单位相关数据的数据分析与可视化分析服务,ChatGPT通过其拥有的自然语言处理技术能自动的对数据进行预处理与智能分析操作,并能将被审计单位相应的数据分析结果直接提供给审计人员,同时ChatGPT还可以与Tableau、PowerBI、ExcelBI等可视化平台直接进行对接,将其生成的被审计单位数据分析结果转化为可视化图表与分析报告形式进行呈现,帮助审计人员更直观、更充分、更好地理解被审计单位的数据以及数据分析结果,让审计人员能够更为准确的了解到被审计单位的具体真实情况,为审计结果的真实性与准确性提供充分保障。
3.作为智能预测工具,提供风险识别和预测服务。审计人员将收集到的被审计单位的相关财务数据、业务数据、交易记录等信息导入到ChatGPT中,ChatGPT作为一个智能预测工具,可以提供风险识别与预测服务。ChatGPT利用其所具有的预训练模型,根据被审计单位历年来审计人员所出具的相关审计报告结果、审计过程中发现的重难点、被审计单位相关历史业财数据、各财务指标的行业平均值、风险指标临界值、业务发生规则等评判标准对被审计单位的现有情况进行分析,从而能够帮助审计人员快速识别出被审计单位财务数据中可能存在的潜在风险点,如财务报表中相关财务数据与以前年度和行业平均水平相差太多,数据变化波动剧烈,财务指标数据临近风险值,这些现象就存在可疑。同时ChatGPT还可以对被审计单位的销售收入、利润、成本等相关数据进行趋势预测与分析,从而使审计人员能够发现被审计单位相关数据的变化趋势,对可能存在的问题进行提前预警,帮助审计人员制定出更好的审计计划与方案策略并进行风险管理建设,降低被审计单位的财务风险。
4.作为智能编写工具,提供审计报告与审计计划自动生成服务。审计人员依靠ChatGPT所拥有的强大语言文字生成能力,可以不用再手动撰写被审计单位审计报告与审计计划。ChatGPT作为一个智能编写工具,能够提供被审计单位审计报告以及审计计划等的自动生成服务,审计人员可以直接在ChatGPT的聊天输入框里输入生成审计报告或制定审计计划等信息,ChatGPT即可自动生成被审计单位相应的审计报告以及审计计划的执行方案,并且审计人员可以将审计报告模板的选择权交由ChatGPT来处理,也可自己选择,ChatGPT再根据审计人员选择的审计报告模板进行后续审计报告的撰写工作。这种标准的审计报告模板可以提高审计报告撰写的标准与规范化程度,ChatGPT的这一强大功能可大大减少审计人员在智慧审计工作过程中的人工成本,将审计人员的精力倾斜于决策与咨询,发挥更大的审计价值。
1.数据安全与隐私保护问题。ChatGPT这一程序的开发商OpenAI在用户的使用条款上明确规定了其有权对用户输入输出的相关内容进行使用,并会将用户输入输出的相关内容纳入ChatGPT的训练数据集里。虽然OpenAI保证了其会删除用户输入输出相关内容中所包含的用户个人隐私信息,但OpenAI至今尚未明确说明其删除用户相关个人隐私信息的具体运行机制。故当审计人员在输入被审计单位信息、其他相关企业信息、被审计单位相关业财数据、涉及到被审计单位一些商业机密信息时,这些信息有极大可能均会被OpenAI公司纳入ChatGPT的训练数据集里,并且其中所涉及到的被审计单位以及其他相关企业的隐私信息很可能不会被彻底删除。当其他用户询问被审计单位以及其相关联企业的相关隐私信息时,ChatGPT很可能会直接输出给其他的用户或被审计单位的同行竞争公司,让其他用户或竞争公司掌握了被审计单位的相关隐私信息,可能造成不必要的损失。同时ChatGPT还可能面临被黑客以及病毒攻击致使系统崩塌。这些情况都可能会增加被审计单位相关机密、隐私信息被泄露的风险,数据的安全性受到一定的威胁。
2.数据来源、真实性、可靠性的偏差风险。到目前为止,OpenAI尚未公布ChatGPT训练数据集的数据详细来源,我们只能根据其前代已经存在的模型GPT-1、GPT-2、GPT-3等大致猜测一下。这些数据集来源可能包括期刊、维基百科、书籍、Reddit、Common Crawl和其他数据集六大类,并且ChatGPT训练数据集里的数据很多还是经过智能数据清洗、智能数据集成、智能数据变换、智能数据规约等数据预处理操作之后的,这些操作可能会影响训练数据集里数据原本的状态,数据的来源、真实性与可靠性存疑,使这些数据存在一定的偏差风险。同时,ChatGPT训练数据集里的数据具有滞后性,如现在训练数据集里面的数据只截止到2021年,审计人员无法从中获得2022年和2023年被审计单位及其相关企业的数据与信息,数据获得的完整性受限。而且ChatGPT还可能为了满足审计人员的需求自己编制一些2022年和2023年的虚假数据与信息。故其数据的滞后性对解决审计人员的相关问题存在一定的局限性。
3.系统误差与偏见风险。由于ChatGPT训练数据集中的数据可能存在数据采集不完整、数据预处理操作不彻底、数据来源不真实、不可靠等原因,导致ChatGPT在预训练过程中可能一直存在一定的训练偏差,使其最终与审计人员之间的交互回答可能不正确、不完整,存在一定的系统偏差。同时由于ChatGPT训练数据集中的数据内容大多都是来自于人类的作品,故其有很大可能把人类认知交流中存在的一些对被审计单位或者其他相关联企业带有偏见、歧视性因素的数据与信息保存下来,并带着这些具有偏见和歧视性因素的数据信息对他们进行了一段时间的预训练,导致ChatGPT在与审计人员的交互回答过程中可能也会生成一些对被审计单位或者是其他相关企业带有偏见或歧视的不当言论,存在一定的偏见风险。
4.审计知识结构体系受限。由于ChatGPT是通过其所具有的大量预训练模型来完成大量文本数据的生成与学习,因此,其训练数据集里的数据知识有可能没有完全涵盖与审计工作相关的专业知识与实操技能,从而使ChatGPT所具有的审计知识结构体系受到一定的限制。故很可能当审计人员遇到相关审计问题询问ChatGPT时,触及到ChatGPT没有涵盖的审计内容,这时由于其审计知识结构受到限制,ChatGPT就不能提供给审计人员较为客观的答案,此时审计人员可能就需要借助于其他渠道才能解决所遇到的专业审计问题。
随着ChatGPT的热潮,其与审计工作的融合也将成为可能,ChatGPT在智慧审计领域中的应用既会带来机遇也会带来一定的挑战。(1)ChatGPT作为智能问答工具,能为审计人员提供快速高效的问答服务,提高审计效率;(2)ChatGPT作为智能辅助工具,能为审计人员提供数据分析与可视化分析服务;(3)ChatGPT作为智能预测工具,能帮助审计人员识别出被审计单位的可能存在风险点并进行预测与分析;(4)ChatGPT作为智能写作工具,能帮助审计人员自动撰写审计报告与审计计划等,减少审计工作中的审计人工成本。但其同时也可能存在数据不安全、隐私易泄露、数据来源可靠性真实性不足、系统误差与偏见风险、审计知识结构受限等方面的挑战。
综上,审计人员在借助ChatGPT进行智慧审计时不能完全依赖于ChatGPT的回答,只能将其作为一定的参考,毕竟ChatGPT各方面还有待完善,审计人员还是需要具有自己独立的思考与判断,对ChatGPT的引入和使用程度都需审慎与恰当。同时,审计人员应不断提高自己的专业知识素养与能力,确保人机协同模式下审计工作的高效交互,最终使ChatGPT能更好的发挥其在智慧审计工作中的强大作用。