徐京平 张秦
大数据审计的内涵演进
上世纪90年代会计电算化逐渐普及,随之产生了计算机辅助审计,目的是提高审计效率和准确性。新世纪以后,计算机辅助审计逐步跨入“计算机审计”这一新模式。计算机的加入提高了审计数据的储存效率,解决了数据储存的问题。
在大数据技术产生后,就有学者开始研究大数据审计的可能。T.M.Persons(2013)在2013年提出要考虑大数据对审计发展的影响。秦荣生(2014)研究认为大数据审计需要结合云计算等技术对大数据进行分析和预测,释放出更大的价值。大数据技术为审计数据的广泛搜集和深度分析提供了手段,解决了数据深入挖掘的问题。但随着近年来大数据审计实践不断开展,发现了一系列问题。王会金(2018)研究发现在大数据时代,政务云面临着严重的安全问题,大数据泄露等风险因素严重威胁了电子政务的运行。谢琳(2019)研究发现,大数据背景下个人信息边界呈现逐步泛化的趋势,需要清晰界定个人信息的边界从而构建相关风险保护路径。田欣(2019)从法律角度研究发现大数据跨主体的数据抓取已经产生了多起法律纠纷,需要对数据分享与抓取的竞争法边界进行规制。数据抓取突破了法律和实体的边界概念,必然产生各种边界问题。大数据审计的数据边界问题也被逐渐重视。
从数据储存、数据挖掘再到数据边界,可见对理论研究中对审计数据的认识不断深入。在数据储存和挖掘的技术问题已经得到解决后,现阶段理论和实务界面临的最大问题,就是审计数据的边界问题。
大数据审计的数据边界
网络数据依赖互联网的广泛联通,可以无损的迅速跨越国界,跨越主体,呈现明显的边界模糊特性。大数据作为一种技术手段,存在着潜在的短板和可能的缺陷,必须明确其边界问题。
(一)大数据审计的技术边界。Kranzberg(1986)认为,技术总是在特定的社会生态下使用的,这会使技术发展常受到特定社会环境和人为因素的干扰,可能会造成结果超出技术和实践的目的。这一研究结论在大数据审计上表现的尤为明显。首先,审计作为一种监督方式,是为了发现被审计单位存在的问题,从而提出审计意见。非标准意见总是对被审计单位不利的,因此个别被审计单位设法粉饰太平,制造假数据混淆视听。其次,大数据审计依赖大数据程序,这些计算机的算法程序很容易被人为的修改和攻击,造成数据损失和改变。这种人为干预大数据的行为使得审计数据真实性和完整性在网络环境下被扭曲,大数据技术无法准确判断数据的真实性。
同时大数据技术有着严格的技术逻辑和算法逻辑,对数据有着极高的敏感度,大数据审计的整个过程中会遇到非数据化的信息,那些无法量化的信息是大数据技术当前阶段难以准确把握的。
大数据不能精确计算主观因素的影响,也不能对数据真实性负责,是由其技术本身的发展水平所决定的,这种技术上的边界就决定了大数据技术只能作为一种参考利用的工具,结果不具有完全的可信度。
(二)大数据审计的应用边界。大数据审计不仅受技术边界的限制,也受制于现实情况的人和机制因素。大数据审计正处于发展的起步阶段,相关的配套机制缺失。首先是顶层设计不清晰、业务系统分散,在数据规范方面缺乏一致性。由于全国各地都在建设审计大数据平台,平台建设中使用的软件和算法都不尽相同,这种不统一反应在数据格式和技术规范上,导致各个平台的数据整合必然存在技术障碍。其次在于大数据审计的管理机制有待完善,大数据技术辅助审计治理的体制机制尚不成熟,还没有建立起与大数据审计发展相配套的数据资源管理机制,缺乏足够的经费保障。
大数据审计的人才也存在巨大缺口。目前的大数据审计更多将目标放在常规的统计分析上,海量的数据集聚没能发挥其在数据质量改进、深度分析等方面的作用。从信息利用流向来看,目前的审计数据需求主要是应基层工作人员的需要而提出,这不可避免的导致数据缺乏整体规划。大数据凝聚的海量数据除统计分析外,更重要的是可以通过详细的研究和总结后提炼出数据背后所存在的系统性问题,而这种分析和解读需要更加專业的人才。就现状看,大数据审计的人才培养机制显然还不够健全,审计部门难以组织专业的大数据审计人才团队,审计人员受制于日常工作也难以接受系统化的大数据技术的专业培训。同时在第三方培训机构或是高校也将大数据与审计作为相互割裂的专业来培养人才。专业人才不足、培训机制不健全也是大数据审计的主要制约因素之一。
(三)大数据审计的法律边界。法律本身就是一种边界的规定,它以国家强制力为保证对行为框定了范围,法律禁止不可为。不同的法律规定了不同内容和对象的行为边界,为社会良性运行提供了制度保障。网络技术的发展使社会矛盾在虚拟领域迅速放大,网络空间的法律治理成为社会各界共同关注的问题。在大数据时代,网络产生的数据经济价值迅速提高,数据使用者的行为边界和数据使用的行为尺度以及数据控制者的行为边界就需要进行和合法性规制。
大数据审计的法律问题涉及面广,既有私法的内容,也有公法的内容,明确法律边界才能更好的解决大数据审计面临的法律制约。大数据审计中对数据的处理包括数据搜集、储存、处理、使用分析等各个阶段。在任何一个阶段,数据都有可能泄露或被篡改,而数据泄露存在着潜在的法律风险。大数据审计本身的合法性规定也为大数据审计限定了法律边界,在审计法没有明确将大数据审计规定为一项审计模式的情况下,审计人员在进行大数据审计时缺乏必要的法律依据。
大数据审计的实践逻辑
大数据审计不仅需要遵循审计的治理理念和治理方法,更需要遵循技术和宏观环境的要求,在大数据审计的发展过程中,有着多重逻辑介入。
(一)技术发展逻辑。大数据审计包括审计大数据的采集、预处理、分析、可视化等模块,根据每个模块的功能不同分别处理。大数据审计实践过程是对复杂多样的审计数据进行重构。首先要将海量的、结构性与非结构性混合的数据类型转化为可识别的数据形式。在大数据审计的背景之下,审计对象成为了海量数据的集合。全国各省市都在研究探索建立审计大数据平台,制定大数据审计的数据标准和流程规则。大数据审计首先要进行数据的采集和挖掘,大数据技术使审计数据的采集渠道广泛增加、涵盖范围广泛扩展。从被审计单位的内部可视化数据及组织环境、经营战略等非可视化数据到互联网中的媒体资讯、搜索引擎等碎片化数据都可以被大数据技术抓取。当数据采集工作完成后,就需要对采集到的数据进行预处理,清洗掉噪声数据以缩减数据分析的时间并提高分析质量。在审计大数据分析阶段,主要是通过模型对数据进行维度分析,实现科学审计取证。最后通过大数据的可视化平台将审计大数据的分析结果转化为可视化的结果,最终得到审计结论并提出审计建议。大数据审计的整个实践过程就是大数据技术的应用过程,遵循着大数据技术的基本技术逻辑。
(二)行政推动逻辑。构建服务型政府是目前政务实践的发展方向,服务型政府要求政府运行必须提高治理效率和水平。审计是经济监督和社会治理的重要组成部分,计算机技术的发展为大数据审计营造了技术环境,而在技术环境的背后总是包含着政治经济与社会的多重影响。国务院2014年印发的《关于加强审计工作的意见》明确指出要加快推进审计信息化,加大数据集中力度,构建国家审计数据系统,探索在审计实践中运用大数据技术的途径。2015年国务院出台了《关于印发促进大数据发展行动纲要的通知》要求“实施国家大数据战略,推进数据资源开放共享”、“充分运用大数据等新一代信息技术,增强大数据运用能力”。同年,两办印发了《关于实行审计全覆盖的实施意见》,要求政府审计部门要构建大数据审计工作模式,构建国家审计数据系统和审计数据平台。
(三)创新驱动逻辑。审计是一个不断完善和发展的系统,其组织形式和技术方法等都在不断创新。审计的创新是审计发展到一定阶段的必然,目的是适应审计环境的发展,审计的创新也产生了不同的审计组织形式和审计方法,产生了新的价值,符合创新理论的基本观点。
大数据审计的创新驱动主要存在于两个方向,一方面受到审计效率与质量的需求驱动,另一方面受到社会需求的驱动。2015年两办印发的《关于实行审计全覆盖的实施意见》确定了审计发展的方向,标志着审计已经完全超越了传统的审计范畴。审计范围的扩大带来审计业务的剧增,传统的审计方法已经无法处理这样海量的业务数据。大数据审计凭借其高效率正好解决了大量审计业务与有限审计资源之间的矛盾。事实上这样的需求驱动一直是审计技术方法更新的重要动因,最初的审计由于被审计单位的经济业务小,手工审计完全能满足审计任务的需要。随着社会的经济发展,被审计单位的体量越来越大,为适应经济发展情况,审计需要不断借助科学技术方法创新审计模式。大数据审计正是在这一驱动逻辑下产生。
大数据审计的行动框架
为进一步推進大数据审计发展,强化审计监督效果,大数据审计需要遵循科学的行动框架:
(一)建立统一的审计大数据平台。大数据和云计算等技术手段在审计领域的应用是技术发展的内在要求,大数据审计涉及到审计的治理思维和计算机技术的发展逻辑,是一项复杂的系统工程,必须有长远的发展战略指导。首先要建设高水平的大数据审计平台,不断提高审计大数据平台的利用效率。其次要切实制定审计大数据资源共享的管理办法,促成全国各地审计大数据平台的互联互通,不断整合审计大数据资源,构建完整的审计大数据体系。
(二)完善大数据审计法律保障体系。大数据技术在审计中应用的合法性问题是一项重要的课题。一方面要加快大数据审计的立法工作,使审计人员在大数据审计中能够有法可依。另一方面也要以法律的形式确保审计数据的使用安全。同时强化审计人员的法律意识和法治思维,增强工作流程和审计数据使用的合法性。
(三)加强大数据与云计算等技术融合发展。“云计算”产生于大量数据的处理实践。大数据重点关注数据,提供数据采集到数据分析的技术方法,强调储存量;而“云计算”则是关注数据的处理能力。大数据和云计算相互补充,共为一体,依托大数据的海量存储,云计算能更好的将数据带入实践并产生价值。
(作者单位:西北政法大学商学院)