陈 伟
审计监督作为国家监督体系的重要组成部分,传统手工审计是通过对纸质账簿的检查来实现这一职责的。20世纪80年代,以查账为主要手段的审计职业遇到了信息技术的挑战。随着被审计单位信息化普及,审计对象的信息化使得审计信息化成为必然,审计人员必需借助信息技术帮助他们开展审计工作,计算机辅助审计技术(Computer Assisted Audit Technologies,简称CAATs)成为审计领域研究与应用的重点(国家863 计划审计署课题组,2006;Lambrechts 等,2011;陈伟等,2012)。根据相关文献的研究(Harold,2003 ;INTOSAI,2004 ;Lambrechts 等,2011),CAATs 可以概括为:为了满足信息化环境下审计的需要,基于计算机的应用来对信息系统,或被信息系统处理的数据进行审计的技术,其分类可总结为如图1 所示(陈伟等,2007;陈伟,2012;Chen 等,2012)。概括来说,常用的计算机辅助审计技术可以分成两类:一类是用于验证程序/系统的计算机辅助审计技术,即面向系统的计算机辅助审计技术;另一类是用于分析电子数据的计算机辅助审计技术,即面向数据的计算机辅助审计技术,也可以称之为电子数据审计技术。
我国高度重视审计信息化工作,对我国来说,信息化环境下如何审计被审计单位的电子数据,发现大案、要案是一项最重要任务,特别是政府审计的一项重要任务(国家863 计划审计署课题组,2006)。因此,电子数据审计是目前我国开展审计信息化的重点。2014年12月,国家审计署机构调整,增设了电子数据审计司充分说明电子数据审计在目前我国审计工作中的重要性。国际上也高度关注电子数据审计问题,国际内部审计师协会(Institute of Internal Auditors,IIA)2011年发 布的全球技术审计指南——《数据分析技术》中重点分析了面向数据的CAATs在审计数据分析中的应用(Lambrechts等,2011)。可见,电子数据审计是目前国内外审计领域关注的重点。
随着信息技术的发展,为了适应信息化环境下审计事业发展的需要,国内外政府、高校、培训机构高度重视计算机辅助审计技术的教育与培训工作,众多高校、政府培训机构开设了IT(信息技术)审计的相关课程。作为一门交叉、新兴课程,如何开设好这一课程成为困扰大家的难题。目前,实践教学成为教学与培训方式改革的发展方向和趋势,在开设IT 审计课程时,国外在实验软件上一般采用国际上两大著名审计软件IDEA 或ACL。对国内来说,在实验软件的选择上,一些是直接选用实际的审计软件,例如现场审计实施系统(AO)、用友审易、IDEA 和ACL等,一些则是选用SQL Server、MS Access 等比较实用的通用软件作为实验教学的实验软件,甚至一些软件公司专门开发了一些用于审计教学的审计实验软件(陈伟,2009;陈伟等,2013)。为了能更好地适应审计实践教学的需要,审计模拟实验室建设已成为一项重要工作。
SQL查询是目前最常用的审计数据分析方法。SQL查询是指审计人员针对实际的被审计对象,根据自己的经验,按照一定的审计分析模型,在通用软件(如MS Access)中采用SQL语句来分析采集来的电子数据。或采用一些审计软件通过运行各种各样的查询命令以某些预定义的格式来检测被审计单位的电子数据。这种方法既提高了审计的正确性与准确性,也使审计人员从冗长乏味的计算工作中解放出来,告别以前手工翻账的作业模式。
综上所述,电子数据审计在目前我国审计工作中越来越重要,审计人员掌握电子数据审计技术成为必然,为了能更好地适应电子数据审计实践教学的需要,电子数据审计模拟实验室的建设成为一项重要工作。本文结合目前电子数据审计,以及审计模拟实验室的研究与应用现状,设计了一个为用户学习和掌握电子数据审计方法的模拟实验平台,称之为电子数据审计模拟实验室软件。
为了便于理解电子数据审计模拟实验室,首先需要掌握电子数据审计的原理。对于电子数据审计,目前还没有给出明确的定义,根据目前对该术语的使用情况,电子数据审计一般可以理解为“对被审计单位的电子数据进行采集、预处理以及分析,从而发现审计线索,获得审计证据的过程。”在实际的审计工作中,为了避免影响被审计单位信息系统的正常运行,并保持审计的独立性,规避审计风险,审计人员在开展电子数据审计时,一般不直接使用被审计单位的信息系统进行查询分析和检查,而是将所需的被审计单位的电子数据采集到审计人员的计算机中,利用相关软件进行分析,其原理如图2 所示。
“电子数据审计模拟实验室”是一个形象的比喻,用户可用这个软件来练习电子数据审计方法,就好比是一个虚拟实验室。通过本软件,用户可以练习掌握以下电子数据审计方法:(1)数据采集(数据准备)。(2)数据查询,包括SQL模拟查询器、正负快速查询、条件快速查询。(3)数值分析,包括重号分析、断号分析、Benford 定律。(4)统计分析,包括一般统计和分层分析。(5)审计抽样,包括间隔抽样和随机抽样。(6)数据匹配,包括一般匹配和长度过滤匹配。(7)数据相似查询:SQL相似查询和SQL长度过滤相似查询。概括来说,电子数据审计模拟实验室软件目前已有的主要功能如图3 所示。
该功能主要是实现把要分析的电子 数据采集到电子数据审计模拟实验室软件中来,为后面的审计数据分析练习打下基础。
SQL查询是目前最常用的审计数据分析方法。SQL查询是指审计人员针对实际的被审计对象,根据自己的经验,按照一定的审计分析模型,在通用软件(如MS Access)中采用SQL语句来分析采集来的电子数据。或采用一些审计软件通过运行各种各样的查询命令以某些预定义的格式来检测被审计单位的电子数据。这种方法既提高了审计的正确性与准确性,也使审计人员从冗长乏味的计算工作中解放出来,告别以前手工翻账的作业模式。另外,运用SQL语句的强大查询功能,通过构建一些复杂的SQL语句,可以完成模糊查询以及多表之间的交叉查询等功能,从而可以完成复杂的审计数据分析功能(陈伟,2012)。
本系统根据用户练习数据查询方法的需要,主要实现了SQL模拟查询器、条件查询、自定义查询等功能。
1.SQL模拟查询器功能。SQL模拟查询器主要是提供一个供用户练习如何采用SQL语句分析电子数据的模拟环境。
2.正负快速查询功能。正负快速查询功能主要对电子数据中的某个查询字段所包括的正值或负值提供快速查询功能,这样可以避免用户在一些最基本、最简单的查询问题上去写一些SQL语句。
3.条件快速查询功能。条件快速查询功能主要是根据给定的查询范围和查询值,来对电子数据中的某个查询字段提供快速查询功能,这样可以避免用户在一些最基本、最简单的查询问题上去写一些SQL语句。
数值分析是根据被审计数据中某一字段具体的数据值的分布情况、出现频率等指标,对该字段进行分析,从而发现审计线索的一种审计数据分析方法。这种方法是从“微观”的角度对电子数据进行分析,审计人员在使用时不用考虑具体的被审计对象和具体的业务。在完成数值分析之后,针对分析出的可疑数据,再结合具体的业务进行审计判断,从而发现审计线索,获得审计证据。相对于其它方法,这种审计数据分析方法易于发现被审计数据中的隐藏信息(陈伟,2012)。
本系统根据用户练习数值分析方法的需要,主要实现了重号分析、断号分析、Benford 定律等功能。
1.重号分析功能
重号分析用来查找被审计数据某个字段(或某些字段)中重复的数据。例如,检查一个数据表中是否存在相同的发票被重复多次记账。本系统中,重号分析功能是为了满足用户练习重号分析方法的需要。
2.断号分析功能
断号分析主要是分析被审计数据中的某字段在数据记录中是否连续。本系统中,断号分析功能是为了满足用户练习断号分析方法的需要。
3.Benford 定律功能
概括来说,Benford 定律是指数字及数字序列在一个数据集中遵循一个可预测的规律。因此,如果被分析的审计数据不符合Benford 定律的标准概率分布曲线,则表明在被分析的审计数据中可能含有“异常”的数据。本系统中,Benford 定律功能功能是为了满足用户练习Benford 定律方法的需要。
统计分析的目的是探索被审计数据内在的数量规律性,以发现异常现象,快速寻找审计突破口(陈伟,2012)。本系统根据用户练习统计分析方法的需要,主要实现了一般统计和分层分析功能。
1.一般统计功能
一般统计常用于具体分析之前,以对数据有一个大致的了解,它能够快速地发现异常现象,为后续的分析工作确定目标。一般统计对数值字段提供下列统计信息:全部字段以及正值字段、负值字段和零值字段的个数,某类数据的平均值,绝对值以及最大或最小的若干个值等。本系统中,一般统计功能是为了满足用户练习一般统计方法的需要。
2.分层分析功能
分层分析是通过数据分布来发现异常的一种常用方法。其原理一般为:首先选取一个数值类型的字段作为分层字段,然后,根据其值域将这一字段划分为若干个相等或不等的区间,通过观察对应的其它字段在分层字段的各个区间上的分布情况来确定需要重点考察的范围。本系统中,分层分析功能是为了满足用户练习分层分析方法的需要。
审计抽样是指审计人员在实施审计程序时,从被审计对象总体中选取一定数量的样本进行测试,并根据样本测试结果,推断总体特征的一种方法。本系统根据用户练习审计抽样方法的需要,主要实现了间隔抽样和随机抽样等功能。
1.间隔抽样功能
间隔抽样是从被审计数据中按相等的间隔提取一些记录。有两种方法确定抽样:一种是输入要抽取的记录个数,系统将计算抽样间隔量;另一种是输入抽样间隔,系统将计算要抽取的记录个数。本系统中,间隔抽样功能是为了满足用户练习间隔抽样方法的需要。
2.随机抽样功能
随机抽样是通过输入抽样量以及要从抽样中提取的记录范围,然后,使用一个随机数种子,系统将生成一系列随机数并选取同这些数相关的适当记录。本系统中,随机抽样功能是为了满足用户练习随机抽样方法的需要。
在多个被审计数据源中可能含有相似重复实体,这些相似重复实体可能就是审计过程中要查找的可疑数据。例如,联网审计环境下从不同地方采集来的被审计数据中,被审计数据A 中出现的数据不应该出现在被审计数据B 中。通过数据匹配技术可以有效地发现舞弊案件。国内外对数据匹配技术的研究多用来检测数据源中的相似重复数据,达到提高数据质量的目的,直接把数据匹配技术应用于审计中的研究还不常见(陈伟,2012)。
基于这一需要,本系统实现了一种基于数据匹配技术的审计证据获取方法,满足用户练习数据匹配方法的需要。该方法主要包括一般匹配和长度过滤匹配两种方法。
1.一般匹配功能
本系统中,一般匹配功能是为了满足用户练习基本的数据匹配方法的需要。
2.长度过滤匹配功能
大数据环境下,由于被审计数据是海量的,因此,必须提高数据相似检测效率。由数据匹配方法中数据相似检测算法的流程可以知:数据间的相似检测依赖于数据中每个字段的相似检测,因此字段的相似检测是一个相当重要的原子操作,其效率直接影响整个算法的效率。对于字符型数据的相似性检测,一般采用编辑距离算法。由于编辑距离算法的复杂度为,当数据量很大时,如不采用一种高效的过滤方法来减少不必要的编辑距离计算,则会导致相似检测时间过长。因此,为提高数据检测效率,提出了一种基于长度过滤方法优化的相似检测算法(陈伟,2012)。长度过滤方法基于以下定理:
定理1: 长度过滤。任给两个字符串x,y,其长度分别为|x|,|y|。如果x和y的编辑距离最大为,则两个字符串的长度之差最多不能超过,即:||x|-|y||≤k。
从定理1 可以看出,在计算字段的编辑距离之前,如能利用此定理对所要比较的记录字段进行过滤,则可大大减少不必要的编辑距离计算,从而提高相似重复记录的检测效率。
本系统中,长度过滤匹配功能就是为了满足用户练习以上长度过滤匹配功能。
为了实现对被审计数据的相似查询功能,解决数据查询(包括SQL模拟查询器、正负快速查询、条件快速查询)功能的不足,笔者提出了一种基于编辑距离算法的SQL相似查询方法。本系统实现了这种方法,从而满足用户练习数据相似查询功能的需要。
1.SQL相似查询功能
SQL相似查询方法主要是在SQL查询功能中嵌入基本的编辑距离算法,本系统中,SQL相似查询功能满足用户练习SQL相似查询方法的需要。
2.SQL长度过滤相似查询功能
SQL长度过滤相似查询方法主要是针对SQL相似查询功能,在SQL查询功能中的编辑距离算法中嵌入长度过滤算法,从而提高SQL相似查询的速度。本系统中,SQL长度过滤相似查询功能满足用户练习SQL长度过滤相似查询的需要。
基于以上功能分析,采用Visual C#实现了“电子数据审计模拟实验室软件”,其主界面如图4 所示。
以SQL模拟查询器功能的使用为例,采用本软件练习数据查询方法在税收征收数据分析中的应用,其过程简述如下:
现有某税收征收电子数据(文件名为“税收征收.mdb”,数据表名为“征收表”),现对提供的税收征收电子数据进行分析处理,检查征收表中有无“负纳税”数据。
通过分析,检查税收征收数据中有无“负纳税”数据,其SQL语句如下:
假设税收征收数据已被采集到电子数据审计模拟实验室软件中,打开“SQL模拟查询器”,如图5 所示。
在图5 中输入以上SQL语句,或借助SQL模拟查询器中的SQL语句关键词生成以上SQL语句,然后在图5 中点击“执行SQL语句”命令,运行以上SQL语句,可以很容易地查找出税收征收数据中的“负纳税”数据。其查询结果如图6 所示。
总之,通过以上功能,用户可以方便地练习并掌握数据查询方法的应用。
本文根据目前开展计算机辅助审计的需要,研究并设计了电子数据审计模拟实验室软件,实现了目前常用的以及一些最新的电子数据审计数据分析方法,从而满足了电子数据审计实践教学的需要。本软件安装方法简单,占用空间小,便于实验操作。本软件除了具有目前流行的电子数据审计数据分析方法外,还增加了一些笔者关于电子数据审计最新的研究成果,如数据匹配、数据相似查询等。另外,笔者将根据电子数据审计的发展,在电子数据审计模拟实验室软件不断增添新的电子数据审计方法,从而更好地满足用户学习电子数据审计的需要。
1.陈伟.计算机辅助审计实验教学探析.中国管理信息化.2009(1)
2.陈伟.计算机辅助审计原理及应用(第二版).清华大学出版社2012
3.陈伟, 牛艳芳, Wally Smieliauskas.国内外IT 审计教育比较及其对我国的启示.中国注册会计师2013(11)
4.陈伟, Smieliauskas W.云计算环境下的联网审计实现方法探析.审计研究.2012(3)
5.陈伟, 张金城, Qiu R.计算机辅助审计技术(CAATs)研究综述.计算机科学.2007(10)
6.王晓峥, 马施.审计模拟实验室建设探讨.审计研究.2013(6)
7.国家863 计划审计署课题组.计算机审计数据采集与处理技术研究报告.清华大学出版社.2006
8.国家审计署.2014.http://www.audit.gov.cn
9.Alali A F,Pan F.2011.Use of audit software: review and survey[J].Internal Auditing, 26(5): 29-36
10.Chen W, Liu S F, Smieliauskas W, etc.2012.Influence factors analysis of online auditing performance assessment: a combined use between AHP and GIA[J].Kybernetes:The International Journal of Cybernetics, Systems and Management Sciences, 41(5/6): 587-598
11.INTOSAI audit committee.2004.Principles of computer assisted audit techniques - student notes
12.James P A, Bruce H, Gabrielle L, etc.2011.Data-intensive science in the us doe: case studies and future challenges[J].Computing in Science and Engineering, 13(6): 14-24
13.Lambrechts A J, Lourens J E, Millar P B,etc.2011.Global technology audit guide(GTAG):Data analysis technologies[M].The Institute of Internal Auditors
14.Robert L B, Harold E D.2003.Computer-assisted audit tools and techniques: analysis and perspectives[J].Managerial Auditing Journal, 18(9):725-731
15.The 6th ASOSAI Research Project.2003.IT Audit Guidelines[EB/OL].http://www.asosai.org