王颖(副教授/高级审计师)苟勇汤小莉(副教授/博士)郭赛赛
(1 西京学院会计学院2西北大学 陕西 西安 710123)
审计在维护国家财政经济秩序、提高财政资金使用效益、促进廉政建设、保障经济社会健康发展等方面发挥了重要作用。随着数字经济的发展,传统的审计技术已经无法适应新时代审计工作的要求,特别是“大智移云”的来临,审计领域出现了数据的海量化、分析的专业化、技术的智能化等特征;全样本审计对数据的安全性、审计结果的可靠性、审计的效率性等问题提出了更高的要求。因此,我国审计事业的发展亟需新技术和新理念融入与提升。区块链、云存储、大数据以及人工智能等新兴技术正是推动我国审计发展的强心剂,智能审计因此而产生。何为智能审计?许汉友(2020)认为,智能审计,即智能技术与财务审计的有机结合。智能审计融入了人工智能信息技术,能帮助审计人员在更好地完成审计工作的同时,提高审计效率并使审计结果更加客观公正,使审计独立性更强。
云存储技术对于审计工作影响颇大。云存储技术具有整合存储资源、提高存储效率、降低存储成本等优势。同时云存储技术也有其无法避免的缺陷,例如云存储中数据的安全性难以得到有效保证,数据易被他人恶意篡改并无法追踪溯源其篡改地址,这也是云存储技术应用到审计领域亟需解决的重要问题之一。
“审计+”各种新兴技术是目前审计领域探索的重点,区块链与审计可以实现良性融合,带来审计行业的创新与变革。目前区块链技术应用到审计领域仍有不少的障碍,区块链存储应用系统要求每个节点存储完整的数据,这既造成存储资源的浪费,同时也没有充分利用网络资源存储数据。
基于区块链与云存储的分布式云存储系统(以下简称分布式云存储系统)由区块链技术和云存储技术共同建构。分布式云存储系统的原理是将区块链技术与云存储技术相结合,云存储技术提供存储空间并存储真实文件,由此解决了区块链网络存储资源浪费和大数据的问题;区块链技术提供存储证明、存储文件摘要等基础属性信息,并利用哈希函数的唯一性和不可逆性来实现对数据的验证区,由此解决了云存储数据安全性的问题。分布式云存储系统的设计架构如图1所示,主要分为云存储层、区块链层、协议层、管理层、接口层,核心部分是协议层和管理层。
图1 分布式云存储系统基本架构图
云存储层是分布式云存储系统的底层网络,是用于存储数据的底层系统。目前应用较广泛的是Amazon Simple Storage Service(Amazon S3),Amazon S3是一种对象存储服务,拥有良好的性能、可扩展性、安全性和数据可用性,大量的数据将被分散存储至附近AWS区域的多个服务器上,既提升数据的安全性,又便于读取数据。因此云存储层将选择Amazon S3作为底层网络系统,存储真实数据。
区块链层是认证层,为真实数据提供背书,并利用哈希函数来实现数据的唯一性和可验证性。超级账本(Hy⁃perledger)是一个区块链的商用平台,突出的特点是可插拔式设计,用户可以灵活地插入各个功能模块来实现自己想要的区块链网络架构,超级账本良好的可扩展性为嵌入云存储系统提供了基础。
协议层是核心部分,主要是安全算法、共识机制等。包括管理文件传输的传输协议、管理文件分发的分发协议、共识机制是拜占庭容错算法(PBFT)和提供访问控制的DCPABE。
管理层是对存储至分布式云存储系统中的数据进行数据管理。包括自动触发合约条件的智能合约、公钥与密钥形成的隐私保护管理等,这些管理功能需要用户去定义。
接口层是为接入智能审计系统而设计的接入端口。
分布式云存储系统是基于区块链与云存储的智能审计系统的底层系统架构,功能是提供数据存储、保障数据安全性、数据基本分类以及数据基本分析,为搭建智能审计系统提供基础平台。
传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,可靠性和安全性难以保证,也不能满足大规模存储应用的需要,同时还不利于审计工作的展开,被审计单位的财务数据、业务数据、管理数据以及视频影像数据等可能存在获取不完整的问题,由于无法获得充分、适当的审计证据可能导致审计工作无法开展、审计目的无法达到,从而影响审计结果。云存储技术通过虚拟化技术解决了网络存储空间的浪费问题,为被审计单位提供超大容量、超大规模的网络存储空间,提高了存储效率,改善了网络存储空间的利用率。数据的易获取、大容量为审计工作的顺利开展提供了基础条件,同时也降低了企业的存储成本。
区块链是由各个分布式网络节点组成的共享数据库,具有高度开放、公开透明等特征。这为审计单位实施实时审计提供了条件,被审计单位实时的财务数据、业务数据等都可以轻松获取,获取审计证据的方式较为容易,如此既能提高审计效率,又可减少审计成本。
区块链的不可篡改、追本溯源、共识验证等特征可以保障被审计单位审计数据的真实完整,减少由于错误上传或舞弊造假形成的企业风险。另外,分布式云存储系统并非简单直接地将数据存储到区块中,而是存储到网络节点本地存储空间,在节约网络存储空间的同时,也提高了区块链的效率。
人工智能从本质上说就是按照人类的思维方式对系统进行编程和设计,从而替代人工完成各种任务。人工智能按照人类的思维方式对系统进行编程和设计的过程,就是人工智能模拟人类思维的过程。
人工智能会将不同审计对象单位的审计信息传输到信息网络中,使审计人员更方便、更高效地处理审计工作,可以极大地改善传统的审计方法,也可以极大地提高审计工作的效率。同时精湛的技术、高额的成本投入以及海量数据的支持是构建基于人工智能的智能审计系统所必需的因素。要达到实时审计和审计全覆盖的目的,应保证审计数据的实时传输与信息共享,分布式云存储系统上的智能审计系统包括以下几个层级:(1)审计数据的智能采集与上链系统。区块链技术应用于云存储,将保障审计数据上传的安全性。(2)审计数据的信息共享系统。智能审计系统在保障数据安全性的同时又能实现各个主体之间的信息共享。(3)数据智能分析系统。利用深度学习算法解构审计数据,形成可视化的数据网络链条。(4)可视化报告系统。按需按主体出具审计报告,建构基于图表影音的可视化审计报告。图2展示了智能审计系统的工作原理。
图2 智能审计系统工作原理
审计数据是审计工作的基础。无法获取充分、适当的审计数据将直接导致审计工作无法开展,进而影响企业的安全和经济效益。审计数据主要包括文字数据、图像数据及影音数据等,这些数据具有规模化、分类化、无纸化、电子存储等特点,是审计人员进行审计工作的重要载体。要对此类数据实施审计,首先是对此类数据的采集与汇总。在分布式云存储系统中搭建人工智能审计系统,利用物联网中的各类传感器进行数据智能采集,再由区块链上传到分布式云存储系统中,分布式云存储系统内置智能分析,将对数据的规模、种类、性质进行智能分析,整理汇总形成分类云存储数据库,在此基础上智能审计系统便可以进行智能审计工作。审计数据的智能采集与云存储数据的上链过程如下:
1.审计数据的智能采集。美国麻省理工学院的温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”传统的现场审计是通过现场观察、检查企业的审计数据,对于审计单位和被审计单位而言,审计效率低下、审计成本高昂,并且在大数据审计时代,传统审计范式已经无法满足审计工作需求。智能审计系统的数据采集系统主要利用物联网中的各类信息传感器,例如北斗卫星导航系统(BDS)、激光扫描器、红外传感器、射频识别技术(RFID),各类信息传感器实时采集任何需要监控、连接、互动的物体或过程,采集其声、图像、位置等各种需要的信息,通过云存储系统网络接入,实现对各类信息的智能化感知、识别和管理。通过各类传感器采集被审计单位的审计数据,可以实现对被审计单位的实时监控,采集的数据通过将区块链共识验证到分布式云存储系统中,在保障数据安全性的同时也能实现实时审计。
2.云存储数据的上链过程。云存储数据的上链过程分为以下几个步骤:步骤一,被审计单位的审计数据经过物联网传感器的采集,通过被审计单位的网络设备将其传输到分布式云存储系统;步骤二,基于区块链的分布式云存储系统会将交易信息与其他数据打包形成一个区块,等待其他网络节点的共识验证;步骤三,区块被广播到区块链网络中等待各个网络节点共识验证,由于共识机制的存在,被审计单位的审计数据变得公开透明,任何网络节点都可以查看验证,避免了传统审计存在的信息不对称情况;步骤四,部分网络节点遵循共识机制验证区块,验证成功说明大部分网络节点是认可区块内的信息,审计数据被网络节点验证后,将会保留验证节点的签名信息,由此审计数据的安全性和可靠性能得到有效保障;步骤五,区块被哈希函数计算并链接到区块链最长链末端,链接成功后审计数据无法篡改,保证了真实完整性;步骤六,此交易被记录到区块链上,交易信息、审计数据将会对全网公开透明,并且将上链数据存储至本地存储空间,由此可以提升区块链整体的上链效率和运行效率。
审计数据经区块链上链至分布式云存储系统,由此可以实现上链审计数据的实时共享,在节约被审计单位存储成本、提升存储空间效率的同时,也可以节约审计单位的审计成本、减少沟通成本及提高审计效率。审计数据上链之后,可以实现实时审计和审计全覆盖,并且任何网络节点都可以成为“审计人员”。网络节点验证审计数据后,将上链数据存储至本地存储空间,由此可以提升区块链整体的上链效率和运行效率。存储管理服务定期将上传的审计数据同步至网络中的其他相邻节点,以此保证审计数据的安全和可信任。分布式云存储系统内置数据检索服务,可以基于审计数据的任何属性执行查询。如果审计单位、监管层、上下游企业以及与企业利益相关者等需要企业私密数据,那么区块链技术的非对称加密技术能实现点对点传输的安全、私密。
在实现审计数据的采集、上链、共享之后,对于数据的智能分析才是智能审计系统的关键。智能审计系统的智能分析将采用人工智能深度学习算法。深度学习起源于人工神经网络的研究,是当前人工智能研究的一个新领域,主要研究从非结构化和半结构化数据(如文本、图像、影音数据等)中提取特征,建构以信息表示的计算模型。从审计数据智能采集系统采集的数据来看,主要以文本、图像、影音数据为主。文本数据即审计所需的各类合同、单据、表所承载的文字信息,如采购合同、入库单、固定资产明细表等;图像数据即审计所需具有证明性的图像信息,如签章扫描件、库存实物照片等;影音数据即以往审计使用较少的数据,主要为智能审计数据采集系统采集到的视频信息、定位信息、语音信息等,如产品出入库监控录像、产品运行轨迹和合同谈判录音等。
审计需要大量的数据,而审计数据之间也有相应的勾稽关系,传统审计模式下,审计人员依靠账、表、单等文字信息与实物进行勾稽,智能分析系统利用深度学习算法解决如何代替审计人员从众多审计数据中对应数据的勾稽关系,以文字信息勾稽文字信息、以图像信息勾稽文字信息、以影音信息勾稽文字信息,三者相互勾稽、相互验证,从而使得审计结果更为可靠。
深度学习算法运用于智能分析大致思路为:先对深度学习算法进行模拟分析,输入规则和模型让算法按照审计人员的指令去学习;在其学习该如何勾稽数据的关系之后,利用大数据对算法进行大量训练,提升深度学习算法的分析能力;最后深度学习算法独自承担分析工作。要想达到智能分析还有待进一步挖掘。本文选取了目前深度学习的两类基本模型深度信念网络(Deep Belief Network,DBN)和卷积神经网络(Convolution Neural Networks,CNN),对其进行简单介绍。
深度信念网络(DBN)是一个概率生成模型,由若干层受限玻尔兹曼机(RBM)组成的多隐含层神经网络,通过RBM的逐层堆叠,DBN模型可从原始数据中逐层提取特征,获得高层次表达。RBM具有强大的特征提取能力,对审计文本数据进行分层次深度学习可以帮助审计人员找出数据的异常点和风险点。基本思路是:当把账、表、单等文本数据输入RBM时,RBM1会对输入的文本数据进行逐层无监督训练,寻找基本勾稽关系勾稽数据,如对库存现金日记账和银行对账单,DBN会自动勾稽基本数据关系,核对金额;在经过初次训练后得到数据h1,将作为RBM2的初始数据,再次进行深层训练,此时将提取库存现金日记账和银行对账单重大或微小的金额进行分析,结合金额数量、性质、用途、来源与去向等,判断是否有异常;RBM2之后是进行RBM3,再次提取库存现金日记账和银行对账单频繁或偶发的金额进行分析,结合金额数量、发生频率、来源、性质等,判断是否属实;最后综合关联数据进行整体剖析,得出分析结果。深度学习算法以此不断摘取数据特征,降低数据分析的难度,从而找出隐藏在数据中的风险点。
卷积神经网络(CNN)是具有深度结构的前馈神经网络,本质上是一种输入到输出的映射,但需要大量的参数进行学习,审计大数据为此提供了良好的平台。卷积神经网络已成为当前语音分析和图像识别领域的研究热点。如对连续拍摄的库存物品实物图进行智能分析时,CNN首先会对图像区域进行卷积运算,即提取该区域特征,区域特征被提取意味着该区域与其他区域的位置关系确定,如此伪造的审计数据将无所遁形;然后进一步识别该区域特征,比如数量、分类、质量等,由此可识别出其工作效率、工作质量和相关工作情况等;最后识别出的特征将会与文本数据进行勾稽,再次勾稽数据与数据间的关系,确保数据的可靠性。越多图像与影音数据与文本数据的勾稽,才能保证审计结果的可靠性。
通过深度信念网络和卷积神经网络对审计数据的智能分析,能发现账表的异常点和可疑点,帮助审计人员提取关键特征,找出隐藏性的关联交易等。对于图像和视频数据的分析,通过特征的提取识别出原始数据的相关信息,这会带来质的改变,现场审计将大幅度减少。通过深度学习能够帮助审计人员实现实时审计和审计全覆盖,提升审计效率并增强审计结果的可靠性。
在传统审计范式下,被审计单位财务报表和审计报告是决策者做出决策的重要依据,财务报表和审计报告的真伪程度决定了投资决策是否正确。在智能审计时代,不仅审计人员可以出具审计报告,智能审计系统依据智能分析所得出的结论,也能出具智能审计报告。智能审计报告主要依靠人工智能的深度学习算法。智能审计系统内置审计报告模块,包含审计报告模板、审计报告编制流程、审计报告智能分析程序及智能审计报告结论等。深度学习算法在内置的审计报告模块不断训练和模拟,对审计报告流程不断“逐层初始化”,相当于审计人员不断重复编写审计报告的经验,对于审计意见经过智能审计系统的判断,给出最优的审计意见和审计报告。
在智能审计分析阶段,可视化技术已内置智能审计系统中,对于财务报表的编制,智能审计系统会自动生成可视化报表,直观而形象地呈现报表项目,便于横向与纵向的对比。管彦庆(2014)等基于Excel中的Microsoft Research Treemapper控件,将传统的数字型报表变成了图形报表。报表中每一个方框的大小代表相应报表项目的金额,颜色代表增长率。与传统的数字型报表相比,可视化报表更加直观清晰。
在智能审计报告阶段,可视化报告系统将对历年审计结果、审计重点、审计难点、审计风险进行可视化呈现。可视化呈现告别了传统简单的文字与数字的叠加,而是多维度的、立体的、动态的展示。未来的报告将不仅仅局限于形状与颜色的图形报表,而将展示更非富的细节与特征。如动态立体审计报告,将报告与3D影像技术结合,实现全息投影审计报告,当然这是未来智能审计报告的趋势,目前还无法实现。
智能审计系统将自动出具可视化审计报告,报告将会直接在智能审计系统中反馈给公司管理层、公司股东、债权人及其他利益相关节点,并按需、按主体出具可视化报告。
本文在分布式云存储系统上搭建智能审计系统,将其应用于审计领域,促成审计方式的变革和审计技术的创新,进而实现大数据审计、智能审计。
区块链应用于审计实务领域正在积极探索,但区块链应用于审计理论邻域成果颇丰。数据安全和可信是审计工作开展的基础,区块链技术具有公开透明、不可篡改等特征,能够保障审计数据的安全可靠,云存储技术提供超大规模的数据存储和数据共享,建构的分布式云存储系统能为大数据提供安全存储与安全共享。审计是企业的安全防线,是企业风险的屏障,在维护企业经济效益的同时,也保障着企业的长远生存问题。在审计数据安全可靠得以保障的前提下,审计工作将会变得更加重要,无论是国家审计、社会审计还是内部审计,所能发挥的作用也将日渐凸显,三者融合形成的审计合力尤为突出。
传统审计模式下财务造假情况频繁发生,屡禁不止且愈演愈烈,造假手法之多样、造假金额之巨大,损害了无数中小投资者的利益。传统审计模式下的“事后审计”可能是经过修饰或篡改的审计数据,此外审计数据不公开透明、审计人员仅限于专业人员、审计双方可能存在利益往来等都是事后审计所存在的问题。“实时审计”是理想的审计模式,它可以带来更为可靠、更低风险、更高质量的审计工作。基于区块链技术的分布式云存储系统所搭建的智能审计系统,网络中的任何节点都可成为实时审计的“审计人员”,并不需要任何其他网络节点的授权,通过区块链实现数据的实时检索,智能审计系统能对审计数据进行实时智能分析并出具可视化报告报告。
传统审计模式下由于审计数据的大量性与规模性,审计人员无法对全部数据实施审计,因此会实行抽样审计,但随着企业规模的扩大,数据的增加,抽样审计已无法满足审计单位的需求。区块链技术具有公开透明、无法篡改等特征,上链的审计数据会永久存档,永久保留在分布式云存储系统中,由此可以实现对企业的全样本审计、全覆盖审计。智能审计系统会对被审计单位上链的每项数据实施跟踪审计,通过对上链数据智能分析,挖掘出数据之间的联系,从而实现审计数据之间的相互支持,使得企业的舞弊与差错难以遁形。
传统审计模式存在着审计效率低下、审计成本高昂、审计证据缺乏安全性及审计结果不准确等问题,摒弃传统审计模式,大力融合发展以区块链、云计算、云存储、人工智能及大数据等为主的新兴技术,是审计发展的当前要务。在新兴技术的支持下,审计数据将实现智能采集、智能处理、智能分析,审计报告将实现智能生成、按主体生成可视化报告,审计结果能实现智能送达至不同利益主体,审计一整套流程将实现智能控制,这是实现智能审计、大数据审计的必由之路。