■/ 陈 进 李庭燎
党的二十大报告提出当前国家数字化转型和信息化建设的重要性,将数字化审计作为推进国家治理体系和治理能力现代化的关键措施之一。自2022 年11 月底ChatGPT 发布以来,人工智能对于各行各业又产生了新的影响,ChatGPT对于促进审计数字化,构建数字化审计体系有着重大意义。国家网信办于2023 年7 月15 日发布的《生成式人工智能服务管理暂行办法》也将ChatGPT这种生成式人工智能的热度推向了新的高度。作为自然语言处理方面的新兴产物,ChatGPT 在辅助写作和编辑、自动摘要与分类等领域具有处理优势,在一定程度上能够促进审计的发展。然而ChatGPT 本身也存在着一定的缺陷,对审计从业人员的能力提出了新的要求。本文从模型的起源以及技术原理开始,分析该模型在审计方面应用以及存在的相应问题,最后分析了ChatGPT的出现带来的挑战。
自2006 年深度学习算法被提出之后,深度学习、神经网络等模型被广泛运用于语言模型的构建。目前基于神经网络的语言模型主要包括静态语言模型和动态语言模型,静态语言模型通过给定的语料得到固定的表示,并不会随着上下文相关内容的变化而变化,而动态语言模型则考虑了上下文内容,会随着上下文内容的变化而变化,而ChatGPT 就是比较有代表性的动态语言模型。GPT(Generative Pre-trained Transformer)是由OpenAI团队开发的一系列大型文本生成类深度学习模型,具体可用于对话AI、机器翻译、代码生成、摘要生成等复杂的自然语言处理任务。GPT 系列模型使用了不断堆叠Transformer的思想,通过不断提升训练语料的规模和质量以及不断增加参数实现了GPT的迭代,可以说Transformer的提出为GPT的提出奠定了基础。
在提出ChatGPT 之前,分别经过了GPT-1、GPT-2 和GPT-3 三个阶段:GPT-1 于2018 年推出,是基于Transformer架构的自然语言处理模型,通过在大规模语料库上进行预训练,可以生成高质量的文本;GPT-2于2019年推出,在GPT-1的基础上进行了技术思想上的优化,GPT-2的核心出发点是在语言模型领域,所有监督学习都可以看作是无监督学习的子集,当模型的容量非常大且数据量足够丰富时,无监督学习的语言模型就可以覆盖所有监督学习的任务,在这样的指导思想下,增加了更多的训练数据和更多的参数,从而大幅度提高了模型的性能和效果;GPT-3 于2020 年推出,基本沿用了GPT-2 的结构,在GPT-2 的基础上进行改进和扩展,增加了更多的训练数据和更多的参数,进一步采用了如交叉语言训练、零样本学习等前沿领域算法,从而进一步提高了模型的性能和效果;GPT-3.5在GPT-3的基础上进一步改进和优化,采用了模型压缩、稀疏注意力等算法,进一步提高了模型的性能和效率。
2022 年11 月底发布的ChatGPT 是基于GPT-3.5 架构训练的大型语言模型(刘勤,2023)。与前几代对话模型相比,ChatGPT能够生成更加自然流畅的对话,并且能够处理更复杂的对话场景。GPT-3.5 的训练数据来自于互联网上的大量对话文本,通过预训练和微调等技术,模型能够学习到自然语言的规律和语义,从而能够生成高质量、自然流畅的对话。ChatGPT可以应用于多种场景,如智能客服、虚拟助手、聊天机器人等。通过与用户进行自然流畅的对话,能够提高用户的满意度和体验,并帮助企业提高效率和降低成本。总之,Chat-GPT 是一种具有强大智能对话能力的自然语言处理模型,能够为人们的生活和工作带来便利和效率提升。随着ChatGPT的热度不断攀升,大众意识到人工智能将对各行各业产生冲击,同时对审计行业产生深远影响。
GPT-4于2023年3月提出,是目前最大的GPT模型之一,具有极高的生成能力和智能对话能力,相比较ChatGPT而言,GPT-4在多个方面做了进一步改进,具有支持更长的上下文、支持图片输入、具有更丰富的常识以及更强的问题理解以及解决能力、更具创造性和协作性等优势。
作为辅助审计人员审计的工具,ChatGPT 对于提高审计质量,提升审计效率和提升审计体验等方面均能起到重要作用。由于审计的对象本质上是数据,所以本文按照对审计数据处理方式的不同,将ChatGPT 在审计方面的应用分为对于结构化数据处理方法(审计数据分析、审计数据挖掘)以及非结构化数据处理方法(审计文本分析),从而探讨ChatGPT 如何助力IT 审计与财务审计一道为企业发现财务风险,从而提高审计分析效率,实现数字化审计的自动化和智能化。
按照ChatGPT 对于结构化数据处理方式的不同,ChatGPT在结构化数据方面的应用可分为在数据分析方面的应用和在数据挖掘方面的应用,并就结构化数据整体而言存在的问题进行具体分析。
1.ChatGPT 在数据分析方面的应用。ChatGPT作为生成式人工智能,并没有在审计方面得到广泛运用,而人工智能技术目前主要在数据采集、数据分析方面对审计工作起到促进作用。在数据采集方面:OCR(光学字符识别)图片识别技术可被用于识别并提取图像中的文字信息,识别发票和财务报表,提高非现场审计效率和精准度,降低审计风险(黄妙红等,2020);语音识别技术则可被应用于智能审计,将传统计算机审计中无法涉及的语音资料纳入了审计范围(何若云等,2020)。
ChatGPT 作为人工智能的前沿技术,可以帮助提供数据处理和清洗,审计人员在对数据进行具体分析之前,通常需要对被审计单位相关数据进行处理和清洗,以确保其质量和准确性。ChatGPT可以基于审计人员输入的问题和数据集的特点,提供有关如何处理和清洗数据的建议和指导;针对清洗完成的数据,审计人员可以将自身的诉求提供给ChatGPT,进而让ChatGPT 做一些如生成图表等相对简单的数据分析工作。
同时数据分析涉及多种工具和技术,包括Python、SQL等,而ChatGPT可以给审计人员提供如何利用数据分析工具和技术辅助审计工作的相关建议,具体而言可以帮助审计人员选择适合的数据分析工具和技术,辅助审计人员进行数据分析。在审计执行阶段,由于审计人员缺乏数据分析的相关知识,无法对同类型的数据进行批处理,大量重复操作或复杂计算消耗了大量时间,单凭审计人员手动整理效率很低,而通过数据分析将会提高审计效率和审计质量。对于缺乏数据分析能力的审计人员,ChatGPT 将会提供给审计人员相应的数据分析策略和相关的数据分析代码,从而辅助审计人员进行数据分析,提高审计效率。审计人员可通过Chat-GPT分析财务报表识别出异常的财务数据,从而控制财务风险;同时可以借助ChatGPT强大的数据收集能力和强大的算力对海量审计数据进行采集和分析处理。
在进行数据分析之后,审计人员可以利用ChatGPT较强的归纳能力解释数据分析结果,帮助审计人员和被审计单位更好地理解数据。审计人员也可借助ChatGPT 得到相关的审计分析案例及实践建议。ChatGPT 可以基于审计人员的问题和需求,提供相关的案例和建议,从而帮助审计人员更好地应用数据分析。
2.ChatGPT在数据挖掘方面的应用。对于审计人员而言,虽然数据分析和数据挖掘都是在和审计数据打交道,但是又存在着区别:数据分析侧重于已知问题的解决,例如业财数据的核对分析,都是在已知核对模式、分析维度的前提下,去分析异常情况;而数据挖掘对于审计人员而言更加侧重于对未知问题的探索,审计人员可以通过机器学习、深度学习等技术,找到审计数据背后潜在的逻辑关系,并进行预测,这也从侧面要求审计人员掌握数据挖掘的相关知识。迭代的K-means 算法可对上市公司的财务数据进行聚类分析,从大量的财务数据中找到审计疑点,避免了大量的重复劳动(杨蕴毅等,2015)。Logistic 模型则可被运用在预测企业债务违约风险上,为事前审计提供了数据挖掘案例(潘泽清,2018)。
ChatGPT 作为强大的自然语言处理模型,可以通过对大量审计数据集的训练和学习,提高自身对于相关审计案例的理解和分析能力,从而辅助审计人员对被审计单位的财务状况进行数据挖掘,进行异常检测和相关性分析等工作,发现被审计单位隐藏的财务问题。审计人员也可通过数据挖掘算法对海量的审计数据进行分类、回归和预测,预测未来可能发生的情况。
同时在数据挖掘中,模型评估和优化是非常重要的一步。审计人员可以根据相关知识和经验构建模型,并借助ChatGPT对数据挖掘算法的结果进行分析和评估,以帮助优化算法,提高数据挖掘的准确性和效率。
审计人员在此基础上可以借助ChatGPT 使得数据挖掘的结果转化为易于理解和分析的图表和报告,以帮助审计人员更好地理解数据挖掘的结果和发现隐藏在审计数据中的模式和规律。在审计工作当中,数据挖掘可以更好地助力风险评估:风险评估是财务审计一项重要的工作,风险导向审计过程中,风险评估决定了审计计划、审计程序的范围和深度。通过数据挖掘技术可以减少大量重复操作或复杂计算带来的大量时间消耗,辅助审计人员进行风险评估。ChatGPT 可以通过数据挖掘技术,按照舞弊分析模型对日志进行多维度分析,判断是否存在舞弊迹象,从而进行风险评估,提高审计工作的效率和准确性。ChatGPT 可以在数据分析和数据挖掘的结果之上自动化生成审计报告、分析财务数据、检查合规性等工作,从而减少审计员的工作量,减少误差,辅助风险评估。
3.ChatGPT 在结构化数据应用层面存在的问题。尽管ChatGPT是一个强大的人工智能,能够辅助审计人员完成数据分析、数据挖掘等相关任务,但并非完美,它在审计领域的运用会存在一些问题和障碍。目前ChatGPT 存在的最大的缺陷是对于问题生成的答案可能存在着质量隐患,可能会给出不准确甚至不正确的回答。例如在数学和物理等需要进行数字推理的任务中仍然会出现一些错误,审计人员如果想通过ChatGPT进行数据分析,可能需要面对一定的风险。这是ChatGPT 模型本身所具备的问题,需要在算法层面进一步改进,从而满足审计人员对于数据分析准确性的要求。
1.ChatGPT在审计文本分析方面的应用。在文本分析方面,基于LDA 主题模型的上市公司违规识别方法可对财务报表年报的主题内容进行分析,提取年报的潜在主题(张熠等,2022)。ChatGPT 在此基础上可以更进一步,可以通过智能问答技术,回答审计人员的问题,帮助他们快速查找潜在信息并解决问题。例如,审计人员可以向ChatGPT询问某个业务实体的财务数据、风险评估等问题,Chat-GPT可以自动回答这些问题,提高审计人员的工作效率。审计人员也可以向ChatGPT 提出审计政策或者法律法规相关的问题,ChatGPT可根据审计问题自动匹配最适合的审计政策或法律法规,助力审计咨询,从而减少查询政策所带来的时间消耗。ChatGPT 也可以通过智能对话技术与被审计对象进行交互,了解被审计对象的业务以及财务状况,从而更好地识别潜在的风险点。
ChatGPT 也可以对审计咨询中文本等非结构化数据进行整合和分析,对财务报表、会计凭证、审计报告等文本进行语义分析,提取主题、关键词和风险点,结合RPA(Robotic Process Automation,机器人流程自动化)对文本进行自动化处理,从而辅助审计人员做出更为准确的决策。例如,ChatGPT可以自动化生成审计报告、发出审计通知等工作,从而节省审计师的时间和精力,提高工作效率。
2.ChatGPT 在审计文本分析应用层面存在的问题。ChatGPT在回答审计人员的相关问题时,回答通常过于冗长并过度使用某些词语,这对于审计信息的质量提出了挑战;对于模棱两可的问题,模型通常会猜测用户的意图,而非让用户澄清问题,这可能会影响审计人员对于ChatGPT的使用;同时由于ChatGPT 的训练数据主要来自于互联网上的大量文本,在审计等相关专业领域的深度挖掘并不够,在回答审计人员的相关问题时会发生回答不准确的现象。为了应对此类问题的发生,我们可以采用更多的审计相关数据进行相应的训练,建立一个审计领域的ChatGPT,减少审计信息不准确情况的发生。当ChatGPT给出错误或者不准确的回答时,审计人员可以通过问答的方式对ChatGPT 给出的答案进行修正,从而给出更为高质量的答案。
同时不同地区、不同行业甚至同行业的个体之间对会计政策的选择和运用情况存在着较大的差异,这对ChatGPT 理解业务场景,给出符合实际业务场景的判断都提出了挑战。由于ChatGPT 对于会计政策的理解是同一的,而实际会计政策的运用千变万化,ChatGPT 只能给出一些简单浅显的建议,但碰到专业性较强的问题还缺乏解决的能力,因此在一些专业要求较高的领域ChatGPT 还需要进一步进行训练,从而让ChatGPT满足审计工作的相关需求。
尽管ChatGPT通过大量的训练,对于法律和道德都具备一定的了解,但ChatGPT本身对于识别人类的诈骗行为依然存在着诸多问题,不法分子依旧可以通过各种手段绕过ChatGPT 的道德判断从而达到自身的目的,这也为审计数据的安全问题提出了挑战。当把ChatGPT广泛运用于审计领域,将会对被审计单位的相关信息造成严重威胁,对被审计单位的发展造成影响。
最后,训练一个审计领域的ChatGPT还存在着数据成本问题,训练ChatGPT 本身需要巨大的成本。据国内券商国盛证券估算,GPT-3训练一次的成本约为140万美元(焦瑞进,2023)。若要训练审计领域的ChatGPT,则需要投入大量成本,而且由于ChatGPT本身语料库并不是实时更新的,每次相关行业会计政策发生变动时,都需要对语料库进行一次重新训练,维护和更新的成本也相应提高。
随着人工智能的高速发展,各行各业需要机械重复劳动的工作都被人工智能所取代,从事机械重复劳动工作的人员被迫下岗或失业,ChatGPT的出现可能会取代传统脑力劳动者的职业,从而造成失业,在审计行业中从事重复性劳动工作的审计人员面临着被替代的风险(孙伟平,2023)。而由于ChatGPT本身更多的是通过大量文本进行训练,对已有的知识进行整合和再生成,因此需要复杂且有创造力的高端的审计业务很难被ChatGPT 这种自然语言处理模型完全替代。这对于审计人员而言提出了新的要求,审计人员需要加强自身的综合素质,一方面加强对于本专业知识的学习,另一方面加强学习与数据分析、数据挖掘和自然语言处理等计算机专业知识的学习,在此基础上可以利用ChatGPT辅助审计人员进行综合分析形成判断,从而在人工智能淘汰传统职业的浪潮中保持自身的职业竞争力。作为新一代的人工智能,ChatGPT将间接促使审计人员提升自身的综合素质,促进审计与人工智能相结合。
另一方面,ChatGPT 的出现对于审计行业也产生了相应的冲击,2016年3月德勤咨询公司将机器学习引入会计、审计等工作流程中,并在中国率先推出RPA 应用咨询服务,之后有学者提出将Chat-GPT引用进RPA技术中,在此基础上重构银企对账流程,从而加强企业的内部控制。各大事务所在ChatGPT 的冲击下都应该将该模型运用到日常的审计工作当中。事务所领导层必须支持建立一个人工智能组织,加强事务所员工对人工智能的普遍认识(陈福萍等,2018),ChatGPT 这一人工智能的出现也要求事务所加强人工智能等相关组织的建设,促进审计数字化。
ChatGPT 的出现给审计行业以及审计从业人员带来机遇的同时,也带来了诸多挑战,尽管Chat-GPT目前在审计方面运用还存在着诸多问题,但这些问题整体而言并不是不能克服,自然语言处理等人工智能技术的飞速发展将会对ChatGPT 存在的漏洞进行修正;审计人员虽然面临着失业的风险,但只要加强对审计专业知识以及计算机相关专业知识的学习就不会轻易的被ChatGPT淘汰,甚至成为高端的审计从业人员,因此总体而言ChatGPT对于审计的影响利大于弊,应该支持ChatGPT在审计方面的运用及发展。目前ChatGPT 在审计方面的运用仅仅停留在理论分析层面,具体到内部审计、政府审计以及社会审计并没有得到相关的运用,因此ChatGPT 在审计方面的大规模部署运用还有很长的一段路要走。