基于数据挖掘技术的持续审计探讨

2021-06-02 03:57谢路阳武晓璐陈绪武雷苯珈李颖
现代商贸工业 2021年17期
关键词:数据挖掘技术

谢路阳 武晓璐 陈绪武 雷苯珈 李颖

摘 要:随着信息技术的迅速发展,企业信息化程度在不断加深,加之ERP系统的不断成熟,带来了电子商务等全新的商业模式,伴随电子化和无纸化的普及,在线办公成为常态,持续审计应时而生。同时,面对大数据时代的信息获取需求,利用信息挖掘技术提取目标数据成为发展趋势,如何将计算机、网络、审计、大数据等元素进行有机结合成为信息系统审计领域的研究热点。据此,本文基于数据挖掘技术的持续审计进行探讨。

关键词:数据挖掘;技术;審计

中图分类号:F23     文献标识码:A      doi:10.19311/j.cnki.1672-3198.2021.17.045

0 引言

1 持续审计的概念及特点

1.1 持续审计的概念

早在2006年之前,一些学者就提出:持续审计的过程是在收集电子审计证据的基础上提出审计结果,并在无纸化的情况下客观真实地评判数据是否合理。国际会计协会机构ACCA(国际特许会计师协会)、AICPA(美国注册会计师协会)等权威组织也大力推行持续审计模式(continuous auditing,简称CA),通过使用信息技术并结合审计方法,对被审计单位在线监督,并及时提供审计结果以供决策者使用一种新型审计模式。

1.2 持续审计的特点

随着信息化技术的飞速发展,持续审计是审计发展的必然结果,在结合运用数据挖掘技术后,持续审计兼具传统审计特点及信息技术优势,对比传统审计,主要优点表现在以下五个方面。

(1)持续性。传统审计主要分为计划、调研、实施、报告及整改五个阶段,以项目为单个对象开展实施。而持续审计则贯穿整个审计周期,实时监控和审核信息化系统全流程,审计程序不因项目情况而受限制,不因单个项目完结而结束,更加具备持续性。

(2)及时性。传统审计模式多属于事后审计,从审计的调研、实施到报告发文一般需要数月,与企业管理层“管理实时监控、问题实时披露、风险及时化解”的要求相违背。如今,企业多面多业务形态及复杂多变的市场环境,传统审计局限性不利于及时改进管理,而持续审计正是利用时效性的优势为管理层实时提供真实、可靠的信息,便于企业高层及时作出管理决策。

(3)自动性。目前,传统的审计对象基本还停留在利用纸质账簿凭证进行手工核验,大量因人为是失误导致数据结果失真,审计结果难以为企业管理层提供有效信息。为适应标准化、流程化、信息化的业务需要,企业致力于开发和建立信息管理平台,但单独得信息系统无法在日常经营业务中寻找管理漏洞,而持续审计可利用信息和网络技术,结合审计方法自动查找管理漏洞,具有自动化的特点。

(4)集成性。持续审计需要不仅要对企业的经济行为进行持续审计和监控,还包括对企业管控、战略规划、公司治理、投资管理等各方面进行实时监控,将审计提升到一个可持续发展的宏观层面,全面服务于企业各个方面,达成审计的最终目标。

(5)全面性。传统审计普遍使用抽样方法,在选取一定百分比的财务关联交易数据样本中进行验证,审计结果较为片面,而持续审计通过企业自身信息系统,提取及分析大量梳理进行分析,审计结果精确全面。

2 数据挖掘技术的概念及基本流程

数据挖掘起源于统计学,它与传统的统计理论一致,即“从数据中发现潜在价值的信息”,从大量杂乱数据中提取隐藏、可信和能被理解的信息,是一种复杂处理模式。随着人工智能的深入推广,数据挖掘技术已经拥有良好的孕育条件。

按照处理流程可以将其划分为以下六个阶段:

(1)原始数据集采程序。审计部门根据审计项目类别,制定审计目标及审计方案,审计人员根据审计方案,结合财务报表、企业经营指标等开展数据集采工作,着重检索制度文件及经营数据。集采过程中,审计人员不仅要对涉及的制度文件及原始数据做到收集全覆盖,还需对数据进行初加工,辨别数据真假、剔除无用信息,从而提升审计结果的准确性。

(2)集采资料加工程序。通过初步整理集采阶段,审计人员进一步探究集采数据的特征,然后选择与数据属性对应的方法,如聚类分析、孤立点分析、关联分析等。通过数据持续挖掘,使审计关键点以数据库语言方式呈现,并利用统一的数据库系统对所需的数据进行提炼。概而论之,通过数据库系统提炼的信息相对错综复杂,因此需要对数据进行清理、过滤,筛除错杂无用的数据,并将其转化为统一的计算机语言,以便后续分析应用。

(3)加工数据分类程序。挖掘数据进行分类的目的是通过对问题进行区分和归类,以精准确定审计方向。主要可分为三类:一是隐藏风险的数据,审计人员需完善审前调研分析,将该类资料作为未来的重点审查事项,列明应该关注的问题及可能存在的风险;二是嫌疑风险的资料,受数据表象反映的影响,审计人员需对审计数据进行二次加工分析,深入数据挖掘,对已知信息进行验证,做深做实疑似风险点;三是准确无误的信息。这类数据通常来自各种数据库系统,它们可以真正反映相关问题及风险,这是数据库系统中极为少见的现象,因此审计人员可以直接利用这些数据,而不必加工处理。

(4)分类数据挖掘程序。该程序是根据数据分类的特征,经过调研分析厘清问题及风险的相关逻辑关系,并确定深度挖掘的方向。根据挖掘方向分为点状和线性两大类别,针对某个事项的问题风险运用点状挖掘,并形成点状分析清单库,针对某类事项的问题风险运用线性挖掘,并形成线性由来及发展的底稿集。如果挖掘方向无法对数据进行归类分析,审计人员需要根据数据特点确定挖掘的主要方向,利用其它挖掘方向对数据进行辅助分析,从而使数据更加全面准确。

(5)挖掘资料评价程序。审计人员利用挖掘技术对数据进行处理和分析,以求数据的成果符合精确性、一致性和真实性。如果挖掘数据的成果符合审计要求,则审查人员还需对结果进行分析,以查找不正常数据;如果数据挖掘结果不能符合审计的要求,则审查人员需要修改数据挖掘模式,并对其参数设置、分类标准等相应改进,直到审查结果符合要求。

(6)评价信息发布程序。完成上述操作步骤,审计人员对本次数据分析挖掘的有效审计结果数据进行了分析整理,并将其进行归纳作为本次数据挖掘的有效审计结果,执行对评价信息相关数据的发布程序。审计人员在此基础上收集了相关数据,并开展了现场审计。审计结果经现场复核后,将最终检查结果上交相关部门。与此同时,审计操作人员对整套挖掘数据体系流程进行总结评价,优化完善过程中发现该体系流程存在的相关缺陷,总结现场审计实施中相关的经验教训,优化审计流程。

3 基于数据挖掘技术的持续审计实现路径

根据现有研究成果和实践验证,持续审计实施的技术途径一般分为三种:嵌入式、分离式与混合式。嵌入式是将多个审计模块嵌入被审计系统中,作为子系统在被审计客户端运行;分离式是将审计系统从被审计单位信息系统中独立出来,由审计人员发送指令及操作取样;混合式则是嵌入式与分离式的结合使用。

3.1 嵌入式

嵌入式审计模块的技术是指将相应的程序模块置于被测信息系统之内,不断地采集被审计信息系统中的数据并传输至审计中心,审计人员通过进行对比分析,实现持续监控。

嵌入式审计模块技术能够自动收集和归纳审计证据,当系统在执行指令过程中与审计人员事先制定的规则存在较大差异时,系统将识别为例外事件并向审计人员发送报告,因此具有较好的技术同步性。但嵌入式审计模块的缺点也显而易见,审计工作平台依附于被审计单位的信息系统,可能会对被审计单位自身的信息系统产生干扰,且占用较多的系统资源和存储空间,降低且也自身信息系统的运行速度,并且需要投入较高的成本用于测试,费用成本较高。

3.2 分离式

分离式审计模块技术是在被审计信息系统之外建立独立的程序模块,在被审计信息系统外完成对其实时监控。审计人员通过模块对被审计担心信息系统的数据持续进行收集,并将这些数据实时传送反馈到审计中心,供审计人员对其进行数理分析。

分离式技术是相对独立于被审计单位信息系统的一种技术途径,通过网络传输各类数据,在相对独立的审计服务器上完成数据分析,并将数据与事先预设值进行比较,一旦有异常情况,系统将会立即向审计人员发出预警信息。它需要将被审计单位信息系统的交错集成,因此对被审计系统本身运行影响较小,而且通过网络进行的审计不需要太多地占用被审计单位的系统资源,企业可接受程度较高。

3.3 混合式

混合式审计模块技术是结合嵌入式及分离式审计模块技术的一种综合技术手段,可根据审计人员需求通过嵌入式或分离式采集被审计信息系统中的数据,将嵌入式技术与分离式技术混合使用,長短互补,深入分析。

4 基于数据挖掘技术的持续审计模型构建

基于数据挖掘技术的持续审计模型基本依照审计全流程进行设定,将审计的全链条流程嵌入持续审计模型,通过基础设施层-数据层-服务层-应用层-用户层的递进模式,以安全性、联动性、及时性、效用性为基本原则,主要可以分为数据采集、数据挖掘、审计分析和审计报告四个阶段。

(1)数据采集。根据既定的审计目标,定义审计数据需求模板及路径,通过桥接财务系统、招采系统、办公系统等企业原有数据库系统,根据审计定义信息语句,采集并规整企业数据库存储的内部经济数据,收集并对比行业数据、标杆企业数据、政府披露经济数据等外部数据。现有的数据采集技术可以充分利用成熟的数据库工具,如数据库访问技术、同步复制技术、联邦技术、数据加载技术等,利用SQL语句连接企业数据库,统一外部数据与内部数据的链接格式、源格式及错差控制格式,实现电子数据的标准化采集。

(2)数据挖掘。建立企业数据仓库,以采集存储数据为基础,综合利用数据处理工具完成重要信息的提取,根据审计目标的实际需要,对采集到的数据进行深层挖掘及可视化呈现,在此阶段,由于海量数据的复杂性,采集的业务系统数据必然存在与审计目标相关度低、数据本身错误、数据明显异常等问题,即存在“数字噪声”现象,为降低“数字噪声”对于审计偏差的影响,降低审计风险,可采用半监督学习方法降低数掂维度,提升数据的精准度与颗粒度,为审计数据分析创造良好的数据环境。

(3)审计分析。在整个持续审计的过程中,对采集、挖掘后的原始数据进行审计分析是核心环节。综合运用财务分析、数理统计、联机复核等分析技术,在避免“数据孤岛”的前提下,从海量数据中发现数据的关联规则,以便于审计人员进行疑点定位并得出审计结论。具体的分析方式可以主要划分为三类:一是对数据进行有效分类。按照审计定义数据规则,将数据集分解为若干子项,每一子项中包含多种定义属性,根据审计目标需求,通过对属性的直接检索,实现数据的精准分析。二是发现审计疑点。在“大数据”时代,伴随数据仓库、数据档案的有效建立,一旦某一数据与数据存储中的一般数据存在重大偏差,也即发现数据孤立点,审计人员从孤立点出发,顺藤摸瓜,即可精准定位审计疑点,发现潜在风险或舞弊行为。三是描述数据趋势。通过对长时间、全产业的数据进行有效分析,可以对企业各业务系统的发展趋势进行有效预测,从而对企业运行规律进行有效预警,防范运营风险。

(4)审计报告。审计报告是审计的最终成果,在新常态下,以数据挖掘技术为抓手,以持续审计模块为依托,以数据可视化呈现为手段,以防范企业风险为宗旨,是审计高质量发展的新趋势和新选择。

参考文献

[1]但雨昕.基于数据挖掘技术的W大型连锁企业持续审计研究[D].重庆:重庆理工大学,2019.

[2]秦刚.数据挖掘技术在公司内部审计中的应用[J].财会通讯,2019,(25),114-118.

[3]梁秀根,黄邓秋.持续审计结合数据挖掘技术在内部审计中的应用[J].内部审计信息化,2015,(12),66-72.

作者简介:谢路阳(1977-),男,汉族,湖北公安人,硕士研究生,高级经济师,中建三局集团有限公司,研究方向:法学、经济学。

猜你喜欢
数据挖掘技术
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究