陈雄智,徐世鑫
(陆军勤务学院,重庆 400041)
数据挖掘(Data Mining,DM)的概念最早是在1995年的美国计算机年会(ACM)上提出的,其是从海量的、不完全的、有噪音的、模糊的、随机的数据中,提取隐藏的、不为人知的却潜在有用的信息和知识的过程。利用数据挖掘技术的可伸缩性、隐含性、价值性、预测性等特点,将其应用于经济责任审计中,是传统审计方法无法取代的。经济责任审计数据挖掘平台建设将大数据技术与审计业务深度融合,是贯彻新时代国家审计工作、坚定科技强审战略、运用现代化信息技术和方法手段的实际举措,可实现经济责任审计由账本式向大数据转变,大幅提高审计的效率和质量,增强经济责任审计的精准度和穿透力。
经济责任审计文件资料庞杂,如财务数据、会议记录数据、多媒体数据等各种结构化、非结构化数据,如何从这些泛在的数据中找出疑点线索或审计证据,是经济责任审计的难点。随着国家审计全覆盖要求的实施,人少事多的矛盾更加突出,依靠传统审计手段难以完成审计任务。数据挖掘技术能够运用不同的算法,快速地从海量数据中获取有价值的数据,加快数据挖掘技术应用于经济责任审计中的应用研究,将两者有机融合,是克服经济责任审计数据内容泛在性的影响、提高经济责任审计效率的重要途径。
经济责任审计对象特殊,很多数据资料难以定量分析,面临的人为影响因素较多,审计证据隐蔽性强,审计线索发现困难。运用数据挖掘技术,可对被审计单位的会议记录、财务数据及其他各种性质的数据资料进行深层次的分析和研究,将有缺陷的数据补全并剔除无用的数据,提高数据的完整性、可靠性,通过分析各数据间的隐藏钩稽关系和关联情况,揭示数据原来的特征和内在联系,找出通过传统手段很难发现的问题,提高审计质量效益。
随着国家信息化、智能化发展的不断推进,大量先进信息技术被应用于日常经济活动,信息化程度越来越高,仅仅依靠传统手段显然已无法满足新时代审计的要求,亦无法完成相应审计任务。针对经济责任审计的特殊性,要适应审计对象的需求,积极运用新的信息技术有着更为迫切的需要,只有这样才能有效应对各种基于新的信息技术的新型舞弊手段,推动经济责任审计技术升级,降低审计风险。
数据挖掘技术在经济责任审计中的应用,可部分实现大数据审计中总体分析和发现疑点的步骤,促进经济责任审计由账本式向大数据转变。同时,经济责任审计要求对财政收支、国有资产管理、政府投资、预算执行等经济活动的管理和监督情况做出评价,都带有一定的主观性,通过运用数据挖掘技术的算法,可以将部分审计结果定量化,推动经济责任审计由合规向绩效转变。
在目前联网审计基础上,融入经济责任审计数据挖掘平台,以大数据技术为手段构建一个数字化审计专业平台。该平台具有审计数据采集、数据预处理、数据挖掘的实现、疑点线索管理、权限管理、业务协同等功能。总体上构建一个结构合理、快速高效、安全稳定的经济责任审计数据挖掘平台,增强经济责任审计的质量和效率。
(1)系统性。在构建经济责任审计数据挖掘平台过程中,应加强顶层设计,充分考虑各层级审计机构、被审计单位及其他相关社会机构组织的关系,按照各层级审计机构与被审计单位相对应为主线,加强与属地相关社会机构组织联系为辅助,合理布局平台各模块功能,统筹设计,预留社会审计数据接口,充分利用社会资源,形成整体审计力量合力。
(2)可扩展性和兼容性。随着社会的高速发展,会不断涌现出新技术新方法,只有与时俱进,在平台设计构建时充分考虑可扩展性,不断融入新技术,才能以尽量少的代价适应这种变化。注重平台功能模块设计,确保可源源不断地添加各种审计模型,同时设置好标准接口,注重平台的兼容性建设,尽量多地兼容不同条件下的作业。
(3)可靠性和安全性。可靠性需求就是要确保平台运行稳定,对输入有提示,数据有检查,防止数据异常,能够处理系统运行过程中出现的各种异常情况,防止误操作和非法使用,针对出现的问题能正确的处理,恰当的回避。安全性需要确保程序安全、系统安全、数据安全,主要是确保程序上没有安全漏洞,权限访问控制严格,数据不被非法访问和篡改。
(1)数据资源层。数据源主要包括被审计单位原始数据、财务管理数据、资源配置数据、审计业务数据和地方商业数据等,这些数据主要通过网络和接口两种方式采集,并分别将数据存储于基础信息库和分布式文件系统,形成平台的数据资源层。
(2)作业支撑层。主要包括共用核心服务、共用支撑服务和审计支撑服务,以服务和构件形式为经济责任审计数据挖掘平台数据采集、预处理、挖掘的实现及疑点线索管理等提供支撑。
(3)功能构件层。主要包括审计通用构件、数据采集构件、数据预处理构件、数据挖掘的实现构件、疑点线索管理构件、权限管理构件和业务协同构件,这些构件可根据需要添加不同类型的挖掘模型,在每个审计流程中均可重复使用。
(4)审计应用层。审计应用层是审计人员可以直接接触的层面,按照经济责任审计人员需求,将该平台整合到审计管理系统、现场审计系统或联网审计系统之中,便于审计人员操作使用。
经济责任审计数据挖掘平台具备多种数据挖掘功能,主要可实现数据采集、数据预处理、数据挖掘的实现、疑点线索管理、权限管理和业务协同六大功能,其功能设计如图1所示。
图1 经济责任审计数据挖掘平台功能设计示意
(1)数据采集功能。数据采集功能包括服务器自动采集、被审计单位通过网络上传和审计人员手工采集三部分,在进行数据采集前,审计人员可结合审计工作方案中明确的审计目的、范围、内容及重点,结合审计前调查了解的被审计单位数据的来源和形式,设定本次数据采集的范围、内容及重点,实现数据采集功能。
(2)数据预处理功能。数据预处理功能按照数据挖掘的流程,设计了数据清理、数据集成、数据变换和数据规约四个部分。主要是按照此流程将原始数据进行初步清理、转换,排除遗漏、冗余和明显错误的数据,并将清理之后的原始数据转换成适合数据挖掘平台可用的数据,进一步剔除数据结构中的干扰项目,以便控制数据挖掘的准确性。
(3)数据挖掘的实现功能。数据挖掘的实现功能主要是运用适用于经济责任审计的数据挖掘算法,也可固化为相应的数据挖掘模型,针对准备好的数据,利用关联规则、聚类分析、异常点检测等数据挖掘技术方法,发现数据中隐藏的事项,确定挖掘操作模型并加以实现。
(4)疑点线索管理功能。挖掘发现的疑点线索将转入疑点线索管理构件,审计人员可根据疑点线索进行核查,确定进一步审计内容。疑点线索分类管理主要是通过数据挖掘的实现生成的疑点线索,平台根据经济责任审计五大内容进行分类管理。疑点线索数据确认是审计人员根据经验判断或现场审计调查结果,对疑点线索库中的数据进行确认或延伸处理。
(5)权限管理功能。权限管理功能包括部门、职务和功能管理。根据经济责任审计规定的权限设置相应权限管理,确保平台数据安全。
(6)业务协同功能。业务协同功能包括平台与现场审计实施系统(AO)业务协同、平台与审计管理信息系统(OA)业务协同,审计人员可利用金审工程资源,与经济责任审计数据挖掘平台实现资源共享。
拥有大量、真实的数据积累是数据挖掘技术应用的一个必要条件。一是要加强数据归集的全面性,针对经济责任审计内容和范围,研究制定数据资源目录体系和电子数据归集运用办法,全面整合各类数据,形成覆盖面广、内容丰富、分类合理的审计资源库;二是要畅通数据来源渠道,积极拓展审计联网系统,探索采取设立审计前置服务器和单向网关等方式,实现各级联网数据自动进入数据中心,实时提供数据资源;三是扩展完善数据接口,适应各业务部门数据管理模式,以便于将分散的、不明来源的经济责任审计业务数据进行整合。
法律法规和审计准则的建设往往滞后于信息技术的发展,数据挖掘技术的应用范围、程序和标准缺乏足够的法规依据。一是加强总体规划设计。2013年,国家审计署办公厅印发了《开展审计数据综合利用的试行意见的通知》,并将数据挖掘技术融入当前审计模式中,需要尽快制定相应规章制度,为应用数据挖掘技术提供法规遵循。二是制定具体操作指引。明确数据采集、预处理、挖掘实现、结果评价等方面的通用标准和要求,为数据挖掘技术在经济责任审计中应用提供指导。三是完善运行机制。建立各行业类别电子数据报送、管理、利用等规范化流程,促进各环节运行通畅有序,确保数据挖掘的实现。
一是严格访问权限,经济责任审计涉及的数据面广、内容敏感性强,要建立用户身份、使用权限的验证体系,控制用户的安全操作,确保数据不被非法访问和篡改;二是建立数据安全威胁扫描机制,创设保护服务器,定期对数据安全情况进行检查,查找漏洞隐患,并及时预警修补;三是加强数据安全管理,实时更新和升级数据库,加强数据调取或更新的审核,及时进行数据安全保护调整,保障数据安全。
完成经济责任审计数据挖掘工作,需要培养一批既具备审计知识和业务能力,又具备数据挖掘思维的复合型人才。一要树立新观念。面对信息技术的飞速发展,必须变被动为主动,从传统的仅依靠经验和查询式数据分析技术的审计观念中走出来,努力培养利用数据挖掘等新技术发掘隐藏疑点线索的习惯,突破惯性思维,提高解决新问题的思维能力。二要重视人才培养。加强审计人员继续教育,对审计人员进行专业培训,优化知识结构,使其掌握数据挖掘的基本原理和方法,灵活运用数据处理与统计分析工具,搭建数据分析模型,实现数据挖掘方法的有效运用。三要合理使用人才。在实施经济责任审计项目时,将熟悉数据挖掘技术人员与其他人员搭配,科学合理配置审计组人员,实现取长补短,克服相关人才不足的问题。