■ 李海龙 张宇 孙蕾 熊磊 宋丽平(哈尔滨石油学院)
信息技术随着近几年的快速发展,社会信息总量发展趋势呈现出爆发式。被创造出来的大量信息,将成为巨大动力,带动了社会生产方式转变。进而促进了“大数据”概念应运而生。一方面,大数据(Big data)是IT行业的一个专业术语,指的是传统软件工具在特定时间内无法处理、捕获和管理的数据集。它是一个巨大的、快增长的、多元化的信息资产,需要新的处理方式,具有更快流程优化能力和更强的决策权、洞察力、发现力。另一方面,大数据是移动互联网应用、云计算、互联网的新焦点,并且融合了信息技术,将导致各领域业务模式、管理模式和生产模式都相应发生了变化和创新,人们的生活和生产方式也发生巨大变化。同时,大数据时代的到来也为电子数据审计提供的机遇和挑战[1]。*
目前国内,大数据被视为重要的战略资源,并将对大数据研究与开发作为新的国家战略。与其他国家相比,中国的大数据研究起步较晚,但发展势头良好。这标志着新一轮信息技术革命浪潮已经开始席卷中国,中国对大数据的研发、开放、共享的时代已经到来。
大数据环境下,各国审计模式已然发生改变。正如我国副审计长孙宝厚于会议中所指出的:大数据战略与诸多国家提高国家治理水平、实现社会可持续发展的实践密不可分,各国最高审计机关的目标是促进国家良治、全球良治和全球可持续发展。大数据审计不仅是技术方法层面的创新,更是审计理念、审计制度、人才培养方面的变革,应进一步解放思想,充分树立责任观、系统观、数据观、创新观、人才观,不断推进和完善大数据审计工作。
在大数据环境下,以ERP为代表的各种信息系统开始出现。经济组织信息系统已经从单一的会计信息系统扩展到业务、日常管理、决策支持等多维综合信息系统。由于各种信息系统的使用,原有的审计方法和系统在审计风险评估、业务流程介入、审计证据对象等方面发生了变化。审计疑点的发现还必须依靠对数据的分析和处理,而仅对会计账簿的审查已经难以满足审计目标的需要。因此,有必要将大数据与审计方法联系起来。
总体分析技术,重要针对被审计单位提取关键信息用于来处理大量的信息数据的审计方法,该方法可以提高数据的可理解性,加强数据显示效果,能够促进审计人员更好地掌握被审计单位有关事项的整体操作,基本特征,更好地切入关键环节,并扩大宏观审计结果的趋势。代表性的技术有回归分析、多维分析(OLAP)。
1.回归分析
回归分析是通常是指一种处理变量与变量之间关系的数学方法,它比较重视评估变量之间的数量关系,并通过数学表达式来体现变量之间的关系,最终确定一个或几个变量的变化(独立变量)到另一个特定变量(因变量)的影响。回归分析方法与传统的分析方法不同之处在于,回归分析方法具有可量化风险和准确量化审计人员预期值的突出优点,即能准确估计预期数据值,准确判断严重偏差的波动。更重要的是,回归分析并不严重依赖于审计师的经验,而一般的审计师可以执行准确的分析。在大数据的时代背景下,回归分析参数的值,包括一系列的计算,最是统计软件的应用程序,甚至一些审计软件现在有一个简单的回归分析,历史数据输入,可以完整的分析和预测,说,回归分析的原因之一在审计逐渐受到重视。
2.多维分析(OLAP)
基于OLAP的审计信息系统主要包括审计数据仓库、审计联机分析处理、审计业务管理、审计告警和专家经验库等5个子系统。
多维分析审计最重要的业务特征是需要从多个不同的角度去观察被审计的具体数据集,发现数据集中的可疑点,相当于“从鸡蛋里的骨头”。OLAP从多维角度分析数据的核心特性与审计最重要的本质特征是相吻合。
3.聚类分析
聚类分析是指将一组个体根据其相似度进行分类,使同一类别的个体之间的距离尽可能小,而不同类别的个体之间的距离尽可能大。通常这种方法可以为不同的信息用户提供不同类别的信息集。比如,审计人员可以利用聚类分析识别稠密区域和稀疏区域,通过确定关键审计区域,从而发现被审计数据的分布模式和数据属性之间的关系。一般来说,被审计单位财务报表数据与被审计单位业务数据的变化在会计报表主要项目是有一些规律的,如果不正常,数据异常的变化可能表明隐藏了重要的信息,也说明审计报告项目数据可能是错误的。
疑点发现技术,主要用于对数据的分析处理,发现数据中隐含的异常信息,形成审计疑点。包括数据相似度检测、业务模型、审计经验模型、专业性处理软件与审计方法的组合创新技术(如Google earth、GIS在审计中的应用)等。
1.数据相似度检测
针对来自不同来源的数据可能重复性,获得的审计证据通过数据匹配技术可以检测重复的数据,从而避免导致财务欺诈和不准确,相似性检测方法针对检测的数据给出了不同类型的字段的汉字的相似性检测算法研究领域,并验证算法。
2.专业性处理软件与审计方法的组合创新技术
以GIS在审计中的应用为例,地理信息系统(GIS)是一门以计算机为基础的新兴学科,是一种管理和研究空间数据的技术系统。使用计算机建立地理数据库,各种元素的地理环境,包括他们的地理空间分布的属性数据,数字存储,发展各种各样的分析和处理功能,建立一个有效的数据管理系统,通过多种因素的综合分析,快速方便的访问信息和满足应用程序或研究的需要,并可以以图形和数字的形式表现出来。
基础支撑技术,主要用于整体分析技术,为疑点发现技术提供基础支撑,提高信息技术效率的功能。包括:收集各种数据和清洁数据仓库技术,为其他数据分析提供数据基础,云计算和云平台来解决问题的计算效率和资源的分布数据分析;网络审计技术提供了一个技术平台进行动态实时审计监督和及时的警告。移动办公平台为审计地点与审计机构之间的安全远程数据交互提供无线网络支持。
1.云审计
云审计是利用互联网的云计算的概念,通过云存储的数据,做出各种各样的审计资源(人员参与审计、过程及相关硬件设备)通过云来协调,为审计人员提供更高效,科学的审计过程。
2.联网审计技术
联网审计的含义是指被审计单位的审计部门使网络相互联系,通过对被审计单位财务管理状况,具体的信息内容是否科学合理进行衡量和评估,快速高效地收集相关的信息和数据,进行归纳和分析,并在此基础上对被审计单位的财务收支,是否真实,合法进行全面、及时、远程监督和检查。
大数据的使用,有一个很重要的未来,就是希望它能够让计算机完成一些过去只能人类才能做到的事情。这里就不得不提“机器智能”(也可以说是“人工智能”)了,按吴军博士的话说,就是“任何可以让计算机通过图灵测试的方法”,其中也包括我们先前提到的“数据驱动”。其实,人工智能不算一个新鲜词,早在1956年,“人工智能”这个词就在“达特茅斯夏季人工智能的研究会议”上被提出,但是在现在这个大数据时代,我们再谈人工智能,希望机器能做到只有人才能做到的事情,想要强调的是机器能像人一样去思考,以人脑的思维方式去解读问题,然后自主解决问题,而不再在于它是否用了人类给予它的方法。
在这个科学技术带领着人们奔跑的时代,知识和信息都呈爆炸式增长和传播,同时,人们也迅速反应,以“智能”的手段去捕获它们。家庭水电门窗,开始可以依靠手机远程遥控;搜索引擎不仅扩展了我们获取知识的领域范围,还大大提高了我们吸收知识的效率;机器翻译,让人们省去了重新掌握一门新语言的大量学习时间,而能够瞬间如虎添翼,赋予强大的语言能力,快速投入到原本不适应语言的工作中去;通过对大数据的处理和应用,审计也开始伸长触角,涉及传统审计所不覆盖的方面,扩大了审计范围,让审计变得“面面俱到”。
“智能架构”可以说是,将整个社会连成网络。通过各种设备、数据和服务的形式,让人们随时“有数可查”和“有据可依”。它包括整个IoT[2](Internet of Things,物联网),也就是说机器智能开始能让我们解决过去人类凭借自身智能所不能完成的事情。我们都知道审计工作中有一项操作起来耗时耗力的环节——盘点,虽然审计人员只是监盘,但是盘点的工作人员所耗费的时间中也有审计人员的一份。不过,现在如果能利用网联网相关技术参与盘点,将大大提高盘点以及监盘的效率。
大数据时代是信息化建设发展到一定阶段、大量复杂数据积累到一定程度的结果。现在,大数据已广泛应用于制造业、商业和服务业中。大数据的时代,审计信息化建设需要站在更高的战略高度,以大量的数据和信息进行有效的分析和处理,快速、准确地提取有价值的信息,提高审计工作的效率,促进审计工作的发展,同时也帮助审计机关做出科学的决策。审计方法将实现从抽样到全部数量,从映射到预测,从线性到网络表面,以及风险识别和评估的重大变化。大数据审计方法的创新也引起了我们对审计未来发展方向的深度思考。