基于大数据技术构建嵌入式智能持续审计系统研究

2020-03-23 06:14陈祺琳李云强黄红邱锦
中国内部审计 2020年3期
关键词:嵌入式预警模块

陈祺琳 李云强 黄红 邱锦

[摘要]本文结合四川长虹建设嵌入式智能持续审计系统的实践,探讨在大数据、云计算背景下实施关键风险领域嵌入式智能持续审计的重要性和可行性,介绍建设过程中形成的实施方法、主要效果及智能嵌入模型的数据挖掘流程。

[关键词]大数据   嵌入式   持續审计   风险导向   实施框架虹智能审计平台分为审计管理、风险预警、

长嵌入式审计和大数据分析四个相对独立的部分,采用搭积木的方式建设,2018年完成嵌入式审计系统(Embedded Audit System,简称EAS)建设并试运行,未来计划建设大数据分析系统、审计云,使审计工具向智能化、云服务转型。

一、嵌入式持续审计

长虹现有风险预警系统定期或不定期地从业务系统和会计系统取数,通过运行模型发现和评估风险。与传统审计相比,具有审计成本低、效率高的优势,但只能在业务发生后进行审计,不能实时监控及时中断高风险业务,不能进行事中审计,所以持续审计(Continuous Auditing,简称CA)被提上日程,其根本优势在于报告时隔短、追踪事件及时和风险控制强。

(一)嵌入式持续审计的定义

1.长虹嵌入式持续审计的定义。在审计对象IT系统的关键控制环节或领域嵌入控制监控模块,通过该模块持续对审计对象的业务数据实时监控。当系统处理与审计设定的界限和参数不一致时,监控程序按预定义的风险处置方式实时干预业务流程。嵌入式持续审计框架如图1所示。

2.创新风险处置方式。长虹嵌入模块的风险处置方式是设定风险级别,实行红黄两级风险处置。对低中风险,在业务系统中实时提示业务,预警数据推送到EAS备查;对高风险,直接在业务系统中冻结业务,审计在EAS审核通过后解冻或进入专项审计。

(二)实施嵌入式持续审计的意义

在交易界面频发风险点和业务管控能力不足的控制点嵌入使用两级风险处置方式的审计模块,一方面可强制业务主动自查、整改以保证业务开展;另一方面可分析业务熔断或预警原因,跟踪解冻情况,边听取业务单位意见、边提出报告、边督促整改,提高业务整改的及时性和有效性。通过嵌入式审计,审计监督既融合又分离,实现了由事后审计向事中与事后审计相结合的转变,由静态审计向动态与静态审计相结合的转变,最终在审计能力、层次和水平上实现有效提升,审计监督效能得以充分发挥。

(三)实施嵌入式持续审计的可行性分析

1.文献概述。在中国知网搜索关键字“持续审计”“连续审计”或“嵌入式审计”,发现相关文献较少,尚未发现嵌入式持续审计实务方面的文献。侯佳利等在《新常态下嵌入式审计的创新研究》(2017)中,以审计局对行政事业单位的审计为出发点,提出信息化嵌入式审计的建设思路,同时也指出“目前关于嵌入式审计的文献很少,有些只是提出在审计工作中运用嵌入的思想,至于怎么运用、如何实施都没有具体的思路和方案”。在政府审计方面的嵌入式审计文献相对较多,姜江华(2016)总结提出嵌入式审计具有更强的时效性、持续性和更高的参与性。其特征是审计监督既独立又融合,既事中又事后,既静态又动态。胡镇鑫(2017)结合近年来在东莞农村集体经济审计运用嵌入式审计理念的实践,分析嵌入式审计新模式的理论和实践,为内部审计部门践行嵌入式审计提供借鉴。《高级审计技术方法》(2013)指出持续审计技术实现模式分为三种类型:嵌入式、分离式、混合式。嵌入式持续审计适合内部审计,具有实时审计、时间同步性好的优点,但存在通用性不足、降低系统性能、设计不合理产生垃圾信息等缺点以及影响审计独立性的风险。

2. IT技术的快速发展使嵌入式持续审计变得可

行。(1)系统性能和通用性方面。与Groomer & Murthy在2003年提出系统性能问题相比,现在计算机的软件技术和硬件性能已有了很大提升,合理的设计可以把影响降低到可接受的水平。在长虹云架构下,借助微服务技术和云计算,通过把嵌入模型的控制逻辑和计算逻辑分离,从而减少与业务系统的耦合度来提高通用性。计算逻辑在EAS统一建立和管理,通过修改计算逻辑适应常规业务变化。控制逻辑放在业务系统,根据EAS发送的风险阈值判断业务流程正常通过、预警或中断。(2)审计嵌入模块设计合理性方面。若嵌入模块设计不合理,会给审计和业务产生大量误报信息,影响审计效果。但大数据和人工智能的产生和发展,采用基于统计学、机器学习的数据挖掘技术构建审计嵌入模型,可以提高审计分析的广度和深度,提高模型预测的准确度和精准度。

3. 嵌入式持续审计不影响审计实质上的独立性。审计独立性包括实质上的独立性与形式上的独立性。长虹嵌入式持续审计要求内部审计人员冻结或解冻高风险业务,由于程度深、时间长,使得审计行为的独立性在形式上受到影响,但因审计在组织、人员、薪酬等方面独立于业务单位,从而保证内部审计的客观性。

(四)智能审计云平台的架构

1. 建设策略。维系现有审计系统(已完成的审计管理模块、风险预警模块)技术架构不变,并对其进行优化开发、完善功能,之后逐步择机迁移到云架构。2018年开发的嵌入式审计、未来建设的审计大数据分析系统均基于云架构设计及开发。

2. 系统架构。基于分布式互联网IT架构,能够快速构建审计业务,满足审计中长期需求;能够利用大数据、云计算及数据挖掘技术,实现底层数据颗粒化、平台功能及分析模型的动态扩展,如图2所示。其中,LaaS为基础设施;DaaS基于大数据平台构建审计数据中心,利用大数据丰富的算法库,搭建审计挖掘模型;PaaS基于长虹云平台搭建审计云,采用Docker容器、Spring Cloud微服务等技术实现审计应用的容器化、微服务化,提供数据可视、能力输出、数据分析等服务能力;SaaS可实现审计管理、风险预警、嵌入式审计和大数据分析等智能审计云平台应用功能。

(五)影响制约因素

1.信息系统建设管理水平的影响和制约。若信息系统一般控制和应用控制不足、信息化流程不完善、业务流程不规范,会降低嵌入模块的可靠性和持续性;若信息系统存在孤岛或无有效关联、业务数据不完整,会降低模型的通用性,甚至导致不能成功建立模型;若系统数据质量差,则不仅增加数据清洗工作量,还会直接影响模型的准确度和精准度,产生大量异常的垃圾信息。

2.对审计人员的胜任能力提出更高要求。审计不仅参与业务时间长、介入程度深,而且需熟悉数字化审计,同时还需通过内部审计咨询服务实现审计增值功能,这对内部审计人员的素质、能力和作风必然提出更高要求和标准。

二、长虹嵌入式持续审计的实施方法

EAS实施方法有五大步骤,具体包括:风险识别与评估、选择嵌入点、开发审计嵌入模型、异常数据管理和处置、风险闭环管理,如图3所示。

(一)风险识别和评估

参考2017版COSO-ERM (企业风险管理框架)的5个风险要素,结合历年审计案例识别公司交易界面日常经营活动的风险控制水平,发现采购和销售业务子流程存在的高风险点或薄弱环节。

(二)选择嵌入点

选择合适的嵌入点是实现嵌入式审计有效的关键因素之一,业务单位因自身原因控制不力的高风险点是首选嵌入目标,而数据质量不高、业务流程未信息化的关键控制风险点及事后检查性控制都不适合作为嵌入点。在确定嵌入点时,应对该业务流程的信息系统控制进行应用控制审计,对存在的控制缺陷进行完善或建立补偿性控制,防止因IT控制缺陷影响嵌入审计模块效果。

(三)开发审计嵌入模型

审计嵌入模型主要由EAS的计算逻辑和嵌入业务系统的控制逻辑组成,两者通过数据接口实时交互。计算逻辑的核心功能是测算业务的预警和熔断阈值,并据此计算每笔业务的风险等级;控制逻辑根据计算逻辑传送的风险等级执行红黄两级风险控制。嵌入模型由两种方法构建,如图4所示。一种是利用审计经验建立规则;另一种是通过大数据技术创建和训练模型。数据源除业务数据外,还应拓展其他渠道的数据源。

(四)异常数据管理和处置

异常数据是指审计嵌入模块实时将预警和熔断数据发送到EAS的数据,审计和业务人员对熔断和预警数据分析后进行处置。对于误报异常,审计需要完善模型以提高精准度和准确度;对于真实异常,除因内外部经营环境发生变化产生的熔断数据由业务发起解冻申请、审计审核同意后解冻外,其他事项则由业务自查整改或进入专项审计,如图5所示。

(五)风险闭环管理

EAS自动逐笔建立审计熔断和预警台账,并根据后续处理结果逐一销账:申请解冻成功的数据通过解冻流程自动销账;业务熔断后,业务人员主动完成整改后通过EAS销账;审计人员判断需要启动专项审计的,转入审计项目管理后销账;对于未按期完成解冻或整改的,将自动生成审计整改未完成报表。同时,审计人员还需对熔断数据和预警数据进一步分析,持续完善模型,以提高审计模型的精准度;结合现场审计,对业务流程提出优化或整改建议,对相关人员提出问责建议。

三、嵌入式持续审计系统指标构建和运行

(一)搭建嵌入式持续审计指标体系

以采购指标为例,根据风险矩阵、风险频繁程度,结合长虹已建的预警系统指标体系和功能,选择降价不同步、价格涨幅异常和超配额下单三个风险点作为嵌入审计指标,如表1所示。

(二)基本算法和运行流程

在机器学习的众多算法中,统计分析是最基本的算法,包含许多重要模型,并为其他机器学习算法提供训练样本等,其中概率分布模型是统计分析中最重要的组成部分。正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。有的统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。基于以上依据,将采购价格的绝对值波动转化为价差比后,可通过正态分布模型设计降价不同步、价格涨幅异常指标模型,给出合理的预警值和熔断值。需要说明的是:

差价比=(时间区间模型内价格-时间区间模型内最小价格)/最小价

1.机器学习算法运行流程。首先,对采购信息记录进行数据预处理和清洗,引入格拉布斯检验法进行异常值剔除。其次,使用正态分布模型计算得到预警值和熔断值。实际过程中,引入偏度和峰度模型修正正态分布模型,降价不同步指标引入时间区间模型,从而更加准确计算预警值和熔断值。最后,进行模型验证,办法是引入实时接口,使用智能化模型调参界面供EAS审计人员进行验证,减少人为出现的失误等,如图6所示。

2.数据分析工具框架。使用Python作为数据分析框架核心工具,实现离线与实时接口轻量级化,满足不同的业务场景,如图7所示。

(三)采用格拉布斯检验法处理异常值

对采购信息记录数据进行清洗、基础分析后,发现部分物料存在不同程度数据异常,其中异常情况有:货币代码不一致、计量单位不一致等。对此,为不影响后续数据分析结果,采取格拉布斯检验法剔除异常值。具体步骤如下:第一步,从小到大顺序排列数据。第二步,计算平均值和标准差。第三步,使用双边测试方法计算G值:G=。对于双边

测试,异常值的假设在显著级别α级被拒绝的

值为G大于                                 ,

表示上臨界值的t分布与N-2自由度和显著水平α/(2N),其中t分布可用于构建真实均值的置信区间。第四步,定检出水平α, 判定数据值是否为异常。多次样本数据选择发现,有95%的概率模型计算的区间包含真实参数值,即大概有95个置信区间包含真实值。可见,格拉布斯检验法能精准找到数据中的异常值,且经过数据验证准确率可达97%以上。为确保所有的异常值都能被找出,可按数据不同属性类别进行多元格拉布斯检验。

猜你喜欢
嵌入式预警模块
超级秀场 大风预警
Module 2 Highlights of My Senior Year
Module 4 Music Born in America
金融系统中的早期预警信号及其统计物理性质
必修模块相关知识过关训练
卷烟工业企业产品质量预警机制的建立
嵌入式LINUX操作系统的研究
嵌入式组件技术的研究及应用
“嵌入式系统概论”课程设计
AItera推出Nios II系列软核处理器