大数据视角下人民银行内部审计研究

2014-12-17 03:31杨淑慧潘德宝徐芬李磊
审计与理财 2014年11期
关键词:人民银行数据挖掘数据库

杨淑慧+潘德宝+徐芬+李磊

随着中国人民银行信息化水平的不断提升,先后引入和升级了许多业务系统,记录和处理各项业务的经营状况、处理活动,形成了各类业务数据库,储存了海量业务数据,大踏步迈入了大数据时代。面对大数据时代的到来,各级人民银行内部审计部门要保持高度的危机意识、未雨绸缪,正确认识大数据分析的理论核心数据挖掘技术,逐步将数据挖掘技术引入人民银行内部审计工作。通过数据的全面掌握、挖掘技术的广泛运用,实现对风险的前瞻、全面、深入和持续的审计覆盖,提高审计质量,规避审计风险,从更高层面为人民银行业务发展提供更具战略性、系统性和前瞻性的审计建议,改善组织运营,增加组织价值。

一、基本概念

(一)大数据

大数据又称巨量数据,所涉及的数据量规模巨大到无法使用传统工具,在合理时间内达到撷取、管理、处理并整理成有价值的信息。大数据具有数据容量巨大、数据类型纷繁、数据价值密度低和处理速度要求快的特点。

大数据对内部审计工作具有重要影响:一是促使审计方式向连续审计转变。随着信息技术迅速发展,连续审计的重要性日益凸显,大数据技术及大数据基础使连续审计成为可能,连续审计可以降低传统审计过程中的时滞问题,降低审计错误和风险,为组织提供咨询增值服务;二是促进审计抽样向系统化、智能化和模块化发展。数据量的爆炸式增长使审计人员无法使用现行的抽样审计方法揭示舞弊行为和技术性错误。大数据时代的审计抽样算法可以对审计数据进行分析,进行数据挖掘,找出特征数据,缩小抽取样本的数量,降低审计成本、提高审计效率;利用关联规则,预测被审计单位运营风险的高低,帮助审计人员确定审计重点,实现精确打击;三是促进审计成果的转化与应用。促进对以往审计中获取的大量信息资料的汇总、归纳,从中找出内在规律、共性问题和发展趋势,通过汇总归纳宏观性和综合性较强的审计信息,为领导决策提供依据;通过对带有共性、普遍性、倾向性的问题进行挖掘,提炼出问题与数据中的关联性,可以将所有问题通过IT手段检查出来;将审计成果进行知识化留存;通过大数据技术,将问题规则化并固化到系统中,以便于计算或判断问题发展趋势、对问题进行预警等。

(二)数据挖掘技术

数据挖掘(Data Mining,DM)是一种计算机辅助技术,用于从海量的、不完全的、有噪声的、模糊的、随机的数据中抽取出潜在的、有效的、新颖的、有用的和最终可以理解的知识的过程,又称数据库知识发现(Knowledge Discover of Database,KDD)。数据挖掘即能针对特定7876数据库进行简单的检索和查询,又能进行多层次、全方位的统计、分析、综合和推理,越来越多的组织开始对记录交易活动、经营状况和市场信息的海量数据进行数据挖掘,从而获得有价值的信息,提高组织的盈利水平和竞争能力。审计人员可将具有相似性的会计数据进行聚类分组,从而发现异常账目。

二、大数据视角下的人民银行内部审计模型

根据人民银行业务实际和大数据处理要求,构建了由数据获取、数据整理、数据挖掘和审计应用四阶段构成的人民银行大数据审计模型,模型流程如图1。

图1 人民银行大数据审计模型

(一)数据获取。人民银行内审部门应结合辖区业务实际,积极开展风险评估工作,确定各业务风险排序,拟定审计主题,针对特定的审计目标和审计内容进行广泛而深入的审前调查,掌握审计的范围、审计的内容、审计所需的信息。根据审前调查情况,审计人员有目的性的收集和整理与审计相关的数据,服务于审计项目。该阶段审计人员在保证不影响被审计单位业务系统的平稳、持续运行前提下,采取诸如Microsoft SQL Server 2000等数据转换工具,获取、更新和维护审计相关数据。

(二)数据整理。该阶段审计人员在充分分析数据质量的情况下,运用数据库各表之间的勾稽关系,剔除垃圾数据,清理、转换、载入和验证提取的数据,建立审计数据库××,数据库中的审计数据是集成的、一致的、高质量的,便于后续审计工作的开展。数据库是面向特定审计主题的,不同被审计单位的审计主题不同,因此审计人员要为不同审计对象设计不同的数据库××,设计数据库××包括数据库××模型设计及数据处理设计,是一个循环往复、不断优化的过程,需要不断地反馈和不断地完善。该阶段审计人员主要任务是为采集到的审计数据建立一个独立与被审计单位数据库的数据库××,提供适合联机分析处理和数据挖掘的数据存储环境。

(三)数据挖掘。该阶段审计人员可以使用简单分析和多维分析工具对数据库××进行数据分析,如:采用联机分析处理的切块、切片、旋转和钻取等技术,对审计数据进行比较分析、比率分析、趋势分析等。但在海量数据情况下,审计人员必须采用诸如统计分析、决策树、人工神经网络和关联规则等数据挖掘算法,对数据库××进行数据挖掘。

1.选择数据挖掘算法。不同数据挖掘算法的思路、步骤、功能和应用领域不尽相同,审计人员应根据审计主题选择挖掘方法,以得到对审计有指导意义的知识。

2.建立数据挖掘模型。选择数据挖掘算法后,从分析数据入手,从数据库××中提取主要变量,剔除无关变量,建立适合该算法的数据挖掘模型。

3.验证数据挖掘模型。从数据库××中选取多个样本数据,对挖掘模型进行验证,确保数据挖掘模型实现既定审计目的。

4.运行数据挖掘模型。挖掘模型的运行由专业计算机工具完成,审计人员要认真评估挖掘结果,判定挖掘结果的准确性和有效性,保证挖掘结果得出正确审计结论。评估结果可能导致退回到之前的阶段,重新选择数据集合、数据挖掘算法或调整挖掘算法参数。

5.构造审计知识库。数据挖掘模型运行后,会呈现隐藏在数据库××中的一些规律或者展示异常审计数据,这些规律或者异常称之为审计知识,不同的审计知识存储在一起即构成了审计知识库,审计人员利用审计知识提取审计线索或违规及风险情况。

猜你喜欢
人民银行数据挖掘数据库
数据挖掘综述
数据库
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
数据库
数据库
数据库
一本面向中高级读者的数据挖掘好书