基于深度学习的智慧审计系统

2020-01-08 16:26李云香周成轩张铖怡余建波杨林
中国内部审计 2020年12期
关键词:深度学习大数据

李云香 周成轩 张铖怡 余建波 杨林

[摘要]本文针对审计信息化、智能化提升的要求,基于数据挖掘技术和深度学习算法设计智慧审计框架,开发智慧审计平台,阐述如何将创新的深度学习方法运用于审计过程,解决项目审计过程的数据集合与整理、多源异构数据特征提取、项目异常识别及项目异常分析等关键性问题。

[关键词]智慧审计    大数据    深度学习    多源异构数据

内部审计在企业中承担着监督管理的重要职责,其高效开展与企业健康发展紧密相连。随着互联网信息技术的发展和企业数字化转型步伐的加快,内部审计必然要面对更多纷繁复杂的异构多源数据。在此背景下,传统审计模式已无法满足要求。综合运用网络爬虫、可视化分析、循环神经网络、自然语言处理、卷积神经网络图像处理等深度学习技术,构建智慧审计系统,打通管理、资产、业务等不同领域的信息壁垒和数据壁垒,快速、准确地对审计发现问题进行定位和描述,完成审计业务的大部分基础性工作,提升业务流程速度,同时减少审计人员的机械劳动时间,已成大势所趋。

一、文献综述

(一)大数据环境下的智慧审计

大数据、云计算是新时代的一种崭新的计算模式,它集计算机技术与网络技术为一体,运用网络存储、网络计算、负载平衡、分布式处理等技术将大量虚拟化计算机技术运用到计算机系统中,实现计算机资源的远程配置,供远程用户获取信息资源。大数据是传统数据库软件在数据采集、管理和分析能力之外的数据集合,数据量较大,数据流动较快,且包含多种类型数据。云计算与大数据关系密不可分,如图1所示。

随着国家大数据战略的实施,基于大数据的智慧企业快速发展。在大数据环境下,企业的数据管理模式也随之改变。有了云计算的支撑,企业就能从海量动态、多元化数据中快速获取有用信息,从而提高决策能力。大数据具有价值高的特性,海量数据可以通过新型数据处理模式进行高效转换与利用。大数据主要技术涵盖采集、预处理、存储与管理、分析与挖掘、展现与应用五大技术层面。

为适应审计工作新要求,智慧审计的概念被相关学者提出。将大数据运用于审计工作,可以为审计过程提供多样化的数据分析,审计人员可以从复杂数据中获取深层信息,迅速发现异常数据和审计疑点,为审计工作带来不可估量的增值。智慧审计以被审计单位计算机信息系统和底层数据库原始数据为切入点,首先对信息系统进行检查测评,再通过对底层数据的采集、转换、清理、验证,运用查询分析、多维分析、数据挖掘等多种技术方法构建模型并进行数据分析,发现趋势、异常和错误,把握总体、突出重点、精确延伸,从而收集审计证据,实现审计目标。

大数据环境下的智慧审计,关键在于数据获取,数据的质量和数量最为重要。多方数据采集是从数据中挖掘隐藏信息的有效前提,由于大数据技术的进步,大数据的数据来源已经得到一定程度的优化,如何进一步实现跨专业、跨地域、跨类型的全量数据采集、分析与应用,是审计工作的重大创新点。目前,国内对智慧审计的研究还处于起步阶段,大数据在审计中的应用包括审计取证模式研究、全流程风险防范、证据获取和检验等。孙玥璠和宋迪(2015)以政府审计中的高校基建工程结算审计为例,在大数据环境下构建了基于孤立点分析的审计抽样模型。吕劲松和王忠针(2014)对国家审计中的金融审计构建数据分析平台,从整个平台的建设过程、主要功能、主要特点进行了详细说明。张玉岭(2019)基于深度学习构建了智能审计模型,采用自动编码原理提取内部审计非结构化数据的深层特征,并开展审计数据与比较基准数据之间的对比分析。马志娟和梁思源(2018)通过对大数据给政府责任审计监督全覆盖带来的影响及现有的发展困境进行分析,提出了大数据背景下政府环境责任审计的实施路径。基于大数据的智慧审计在财政、金融、电信、保险等具有海量数据的行业展现出极强的生命力和效能,并逐步在财政审计、工程审计、民生专项资金和社保资金审计等方面获得了较高的关注度。

(二)深度学习的演变与发展

随着互联网的发展,大数据、云计算等技术被广泛应用于各个领域,其背后的“大脑”——人工智能技术的普及,引发了一系列颠覆性的科技革命和产业变革,推动了经济和新兴产业的发展。当前,人工智能的作用主要在于信息收集、分析与开展决策。大数据为人工智能的发展带来了难得的契机,人工智能的核心思想是在海量数据的基础上不断更新参数以优化决策,大数据技术能为人工智能开展学习带来丰富的素材。云计算技术是人工智能的另一个重要支撑,云计算相关技术的发展使人工智能成为一个能独立思考的“大脑”。

人工智能的分支学科包括机器学习、深度学习、认知分析和自动机器人程序等。深度学习(Deep Learning)的概念由Hinton等人于2006年提出,其已经成为人工智能的研究热点之一,并在许多应用中取得了巨大成功。深度学习不仅比浅层神经网络拥有更复杂的网络结构,而且在特征学习、模型构建和模型训练等方面也明显优于浅层神经网络。基于深度学习的人工智能技术能够吸收环境中的知识和经验,并从中学习隐藏的信息,从而提高决策能力。经典的深度神经网络包括卷积神经网络(Convolutional Neural Network,简称CNN)、深度置信网络(Deep Belief Betwork,简称DBN)、堆栈自编码器(Stacked AutoEncoder,简称SAE)、循环神经网络(Recurrent Neural Network,简称RNN)等,此外还有深度残差学习、长短期记忆网络(Long Short-Term Memory,简称LSTM)等已经应用在知识发现、模式识别、信息生成、趋势预测、异常探测等领域。这些网络呈现多层级联的结构,可以从复杂的数据中提取有助于判断的特征信息。

目前,國内外学者已经对深度学习及其应用有了相当客观的研究成果。国内方面,赵旻昊(2013)将深度学习算法与数据融合技术相结合,构建了可应用于浮式储油卸油装置(Floating Production Storage and Offloading,简称FPSO)系统的深度学习网络模型,验证了该技术在FPSO预警功能方面具有很高的效率和准确性,可以应用到风险预警领域。江舒宇分阶段讨论了人工智能在审计工作中的应用前景、应用流程等问题,并且指出人工智能在审计中面临的困难。国外方面,Lee和Kwon(2017)采用一种新的CNN网络,它比现有的用于高光谱图像分类的深度网络更深更广,可以通过联合利用相邻单个像素矢量的局部空间光谱关系最佳地探索局部信息。Tang(2018)等人提出了一种数据驱动的故障检测方法,该方法将DBN与多元静态相结合,以应对非线性问题。Park和Yun(2018)提出了一种基于RNN的编码—解码器的快速自适应异常检测模型。综上所述,国内外对于深度学习网络的研究已从多个方向有所发展,深度学习网络的实际应用也取得不错效果。

二、基于深度学习的智慧审计体系结构

(一)基于深度学习的智慧审计框架构建

审计工作是一项系统工程,在企业信息化广泛应用的背景下,传统审计正逐渐向智能审计转变,深度学习的发展为这一转变提供了一种新思路,即本文提出的基于深度学习的智慧审计实现框架,如图2所示。首先将审计数据从源数据库中提取出来,然后运用优先队列算法、排序邻居算法及基于粗糙集、聚类分析与遗传神经网络的清洗技术等进行清洗。数据清洗能有效提高审计数据的质量,是进行下一步审计的关键。预处理后的数据进入审计流程,通过一系列深度学习方法从审计数据中挖掘隐藏其中的有用信息。将深度学习应用于审计流程,可实现从审计数据中获取项目疑点、帮助审计人员寻找线索及项目异常识别等功能。

(二)基于深度学习的智慧审计平台

基于深度学习的智慧审计平台如图3所示,该平台依托云服务器和云端数据库,录入存储企业历史财务数据和行业经济数据,采集互联网平台、审计机关等API端口包括图像、政策法规、财务经济指标在内的结构化或非结构化数据并在云端存储。基于海量大数据,以深度学习算法模型作为基础,从分类分析、关联分析、聚类分析、预测分析和知识发现五个角度进行集成建模,实现对审计管理、审计作业过程中的数据挖掘和数据处理,全方位、多角度提取并应用财务数据。针对日常票据等非结构化数据采集、数据预处理和异常检测开发了基于深度学习的图像审计系统;针对部分审计作业开发了基于深度学习的存货监盘智慧审计系统;针对财务证据验证、财务欺诈和财务指标预测构建了基于深度学习和数据挖掘技术的财务分析预测系统。

(三)智慧审计任务分析

在传统的审计抽样中,审计人员依靠审计经验及专业能力进行人工抽样,样本选择的数量及质量都无法体现客观性、科学性,样本选择过少,将导致审计抽样工作无效;样本选择过多,将增加审计人员的工作量。同时,审计人员往往只能以样本结果为基础预估结论。如何扩大审计范围,提升审计精度,减轻审计人员负担,是当前智慧审计的重要任务。此外,许多企业都面临较高的经营风险,包括财务造假、治理结构不合理、违规担保等。这些长期积累的问题使企业财务状况不断恶化,最终陷入财务困境。研究结果表明,企业陷入财务困境有先兆且可预测。因此,通过审计分析和预测为企业经营管理保驾护航,同样成为智慧审计的任务之一。

(四)基于深度学习的智慧审计流程

依托智慧审计平台设计深度学习智慧审计流程,如图4所示。通过企业数据库,采集多渠道、全方位财务相关信息,对数据进行预处理,之后利用数据挖掘技术和深度学习算法实时审计企业当前财务状态,对异常指标以及可能导致的财务欺诈行为进行预警,从分类分析、关联分析、聚类分析、预测分析和知识发现五个方面,给出问题诊断及处置方案建议,并利用深度学习算法挖掘大数据隐含信息,对发现的问题进行问题成因分析,完成风险控制。同时,对于诊断结果进行跟踪验证,采用远程审计、数据采集实现审计期中的取证,从而进一步降低期末审计舞弊及相关风险。

因此构建智慧审计平台,可根据审计人员的需求,通过数据库和资料库实时提取历史财务数据、动态经营数据。此外,基于会计资源和会计信息高度共享,智慧审计平台可通过证监会、银行、生产部门、人事部门、客户的会计系统记录和业务活动与外部机构的联系,通过数据获取端口API或爬虫技术,获取公开数据集信息,包括同行业的年报、季报以及运营数据信息等。基于获取的海量大数据,进行横向同业间与纵向历史发展状况的对比,制订审计方案计划。

通过数据挖掘技术和深度学习算法,对被审计单位的全部财务数据进行核查,自动形成核查文件中的异常项,包括数据错漏、伪造、数据过大或过小以及被审计企业的其他差异情况,并将所有异常项内容以预警的形式体现出来,帮助审计人员形成第一阶段的审计意见,筛选相关的细分财务项、证、账、簿进行识别,辅助审计人员快速发现原因。该审计平台可以迅速进行财务信息的核查并形成评判意见,在提升工作效率的同时,避免人工操作造成的各类风险。

三、关键审计技术

(一)基于深度学习的异构多源数据融合集成

如何快速、准确地录入日常往来业务纸质单据数据并调用,是企业信息化审计在效率方面追求的方向,特别是近几年,随着数据挖掘技术和深度学习算法的快速发展,诸如卷积神经网络的图像识别、关联算法和循环神经网络的数据挖掘技术正不断创新并大规模尝试将异构财务数据审计应用于企业发展的各个方面,从而提升业务处理的效率,如图5所示。

异构多源数据一般包括图像、纸质凭证、纸质会议纪要、决议规章等。以增值税专用发票为例,增值税发票是最常见的纸质原始业务凭证和企业经济活动缴税依据,也是销项税和进项税的合法证明。依托纸质票据进行的合规审计也是审计人员较多接触的异构数据审计业务。

异构多源数据的录入和识别多基于OCR图文识别和深度学习图像处理技术,通过扫描仪、相机等设备对图像审计信息进行采集。对于拟录入的图像数据,传统审计模式下需要人工进行预处理,包括图像矫正、灰度化处理、图像去噪、提高对比度、锐化等处理步骤,而采用OCR图文识别技术对图像中的自然文本语言进行提取,借助深度学习算法,基于卷积神经、LSTM神经网络对自然语言进行分类,从而完成自动化异构多源数据的录入,省去了人工预处理的步骤,精确度也更高。

(二)基于深度学习的业务审计

按照审计计划,整体审计任务被拆解成小的审计单元模块并根据业务流进行分類审计,如图6所示。基于智慧审计系统的审计业务主要由线下内控审计和线上内控审计两部分组成。

以审计业务中的存货内控审计为例。在使用智慧审计系统前,审计人员需完成线上内控审计的相关布置,针对信息系统的控制审计,对信息系统的运行和维护情况进行审查,查看信息系统的管理制度是否健全,系统操作是否规范,系统运转是否正常,不相容职务是否建立了分离制度等。对存货业务相关应用的内控审计,首先要重点关注内控设计是否合理、内控系统运行是否正常、是否能够与智慧审计系统连接、信息输入及反馈是否匹配。其次要对岗位设置合理性进行审计。审计人员应对库存相关业务进行梳理,掌握相关岗位的职责和权限,了解各岗位之间的相容性,并查证被审计单位是否对不相容职务进行分离,在数据库管理的重点环节要纳入密码管理,通过特定权限确保系统操作安全,同时将重要审核岗位成员的管理范围、变动情况、手写签名等信息通过ERP系统录入智慧审计系统。针对业务环节进行审核,尤其对业务环节核准签字的流程情况进行调查,查看审核批准环节是否合理。

线上内控审计完成后,基于智慧审计系统,需搭配调试智能监盘设备从而辅助开展存货基本情况审计。传统人工盘点方法是由盘点人员手工记录盘点的设备信息,再与之前的记录进行比对和更新,而智慧审计系统则依靠硬件设施,按照存货的分类和存放,进行大规模图像录入和信息读取,然后与ERP或企业内网系统数据进行比对,上传盘点结果。

对于存货、设备的固定信息,如设备类型、客户信息、设备序列号等,可放到二维码中,通过带有摄像头功能或者FID读写功能的盘点设备读取存货或设备的标签信息,还可通过互联网获取GPS地理定位信息,基于录入图像使用卷积神经网络、循环神经网络自动识别货物大小、数量、质量,對于出库入库的图像再搭配数据挖掘算法,对于不同地点分布的存货监盘可依托分布式审计子系统进行审计,监盘后智慧审计平台汇总至实时动态数据库。审计人员仅需确认监盘过程中是否全部货物都已盘点,是否存在不列入盘点范围内的货物,同时询问原因并进行记录。盘点结束后,对于盘点差异的部分,监督盘点人与货物保管人的核对过程,相关的支持依据如出入库单等,可作为数据信息录入智慧审计平台,进行集成建模,基于以往数据可通过Apriori算法和FP-Tree算法关联企业营业收入、营业支出等账户,实现关联规则的挖掘,确认是否存在货物挪用,也可利用基于SDAE-LSTM的深度学习神经网络,对企业的经营业绩进行预测,以辅助出具审计意见。

除上述关于存货业务的审计,智慧审计平台还可分析线下审计录入数据间的关联性,如通过贝叶斯和决策树分类算法比对入库货物清单上的品名、规格、数量等与ERP系统中的入库信息是否一致,发票上的品名、价格、金额、编号等和入库信息比对是否一致,领料单信息与存货变动信息是否一致,库存盘点信息是否和录入数据一致,业务发生信息是否属于正确会计科目,应收账款信息是否与回函信息一致等。

四、总结

本文深入讨论了大数据环境下智慧审计体系的构建。在大数据时代,未来审计将依托智慧审计平台,基于神经网络等新型智能算法模型,对从各种接口汇入的各类数据进行全样本大数据分析,从海量审计数据中获取深层特征信息,帮助审计人员快速锁定疑点,找寻线索,把握总体,精准定位,实现对关键环节和风险点的全面排查。在审计过程中,深度学习能解决项目审计过程中的数据集合与整理、多源异构数据特征提取、项目异常识别及项目异常分析等关键性问题。深度学习快速、高效的提取能力使审计系统更具灵活性,能针对不同审计目标选择有针对性的审计方法,在传统审计方法的基础上融入先进技术,提高审计效率和效果。

(作者单位:国网山东省电力公司济宁供电公司  同济大学  国网山东省电力公司,邮政编码:201804,电子邮箱:jbyu@tongji.edu.cn)

主要参考文献

高丽阳,冯均科.大数据环境下的社会审计取证模式研究[J].中国内部审计, 2018(3):80-83

蒋凤芹,陈松,吴洵,汪波,阚海湄,巩浩.大数据审计在银行的应用[J].中国内部审计, 2018(3):46-51

刘国城,王会金.大数据审计平台构建研究[J].审计研究, 2017(6):36-41

王凤领.大数据云计算环境下的数据安全分析与对策研究[J].网络安全技术与应用, 2020(6):88-91

张玉岭.智能审计在企业内部审计中的运用分析[J].财会通讯, 2019(4):87-91

猜你喜欢
深度学习大数据
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索