王雪荣 侯伟龙 虎祎笑
【摘要】大数据作为新一代信息技术创新融合的最新产物, 对许多领域产生了巨大影响。 通过分析传统审计方式存在的缺陷和不足以及国家对大数据审计技术的需求, 结合国内外大数据审计研究现状, 提出基于“点—线—面”思维的数据式审计模式, 并以此为基础构建大数据工程审计平台。 从大数据工程审计平台的设计思路、所利用的技术以及实现方法出发, 进一步论述该平台实现的可能性以及其对于工程审计的重大意义, 为大数据环境下数据式审计模式的研究和实践提供思路。
【关键词】大数据;“点—线—面”思维;数据式审计模式;工程审计
【中图分类号】 F239 【文献标识码】A 【文章编号】1004-0994(2021)17-0092-6
一、引言
2014年10月, 党的十八届四中全会对全面推进依法治国作出部署, 并强调和巩固了审计监督在党和国家监督中的地位, 同时提出对公共资金、国有资产、国有资源和领导干部履行经济责任情况实行审计“全覆盖”。 2018年3月中共中央印发《深化党和国家机构改革方案》, 提出为更好地发挥审计的监督作用, 建立中央审计委员会。 在国家治理能力和治理体系现代化的大背景下, 探讨如何实现国家审计制度体系和国家审计能力现代化, 特别是如何实现审计技术方法的创新, 以满足党和国家对审计监督作用的要求, 提高审计质量、增强审计效率、实现审计全覆盖, 具有十分重要的现实意义。
近年来, 信息化环境持续发生变化, 审计对象已经转向大数据方向[1] 。 面对党和国家对审计工作的新要求, 审计实践出现了一些问题, 如: 大数据环境下数据复杂程度高, 传统审计方法难以处理海量数据, 数据中隐含的关键有用信息更难被发现; 审计资源与审计任务冲突, 大数据环境下审计人员要花费数倍于以往的精力进行数据分析, 这与增长缓慢的审计资源存在冲突, 审计资源明显不足于处理审计任务; 审计方法落后且对新审计方法开发使用程度不深, 新环境下消极进行方式方法改革创新, 对审计效率收获甚微。 为适应大数据环境, 审计技术方法要随之变化。 为了更好地推进大数据技术在审计领域的应用, 本文尝试分析大数据审计平台的构建和实现路径, 以解决部分审计难题, 提升审计能力, 更好地帮助审计人员开展工作。
二、大数据审计相关文献回顾
随着审计项目的日益复杂和对审计要求的提高, 需要新的技术手段来辅助审计工作的开展。 针对大数据审计的研究虽然刚刚起步, 但研究工作正在蓬勃开展, 发文数量逐渐增多。 有学者通过分析大数据背景下传统审计模式的弊端, 如审计机关的审计成本高[2] , 审计在数据一致性、完整性、识别性、聚合性和机密性方面存在问题[3] , 认为大数据的特点与审计的契合度非常高, 将是传统审计模式强有力的替代[4] 。 然而, Adrian Gepp等[5] 通过分析大数据技术在审计领域的使用情况, 发现其并不像在其他相关领域那样被普遍使用, 审计领域在使用有价值的大数据技术方面落后于其他研究领域。 因此, 对于大数据技术在审计领域的使用应当提高关注度。
此外, 徐鹤田[6] 基于传统的SWOT分析, 对国家治理视角下的大数据审计工作模式展开研究, 肯定了大数据审计对国家治理的作用。 鲍朔望[7] 认为可以将大数据审计引入政府采购系统, 提升对政府采购系统审计的便利程度, 并大幅提高审计效率。 还有学者尝试构建大数据审计平台, 希望将理论成果向实务进行初步转化和尝试。 如: 陈伟和Qiu Robin[8] 、林俊[9] 提出可以采取模糊匹配的审计证据获取方法以及数据匹配方法, 找到数据的重复点和存疑点, 并基于此原理构建了大数据分析平台; 刘国城、王会金[10] 提出可以将大数据审计平台分拆为采集、预处理、分析和可视化四个子平台, 为大数据审计实践提供了思路; 鲁清仿等[11] 从审计法律法规出发, 同时结合审计人员的审计经验、思路、判断依据, 构建了由计算机系统自动实施的“智慧”大数据审计平台; 陈大峰、陈海勇[12] 提出构建趋势审计实施框架, 利用大数据集中处理技术和统计技术代替传统的数据抽样处理, 以控制误差。
由此可见, 学者们基本上肯定了大数据之于审计的重要性, 并且两者是十分契合的。 目前, 对于大数据审计的研究正由理论向实务过度, 从论证大数据审计的可行性转向大数据审计平台的搭建。 但是, 大数据审计平台的搭建大多仍停留在设想层面, 并且较为宏观, 技术层面涉及较少, 实践意义不大。 因此, 本文从工程审计这一微观角度出发, 利用工程审计数据来源、种类以及工程审计本身的特点, 提出基于“点—线—面”思维的数据式审计模式, 并据此构建大数据工程审计平台, 以期增加该领域研究的边际价值。
三、“点—线—面”数据式审计模式设计思路
审计模式, 又称审计取证的模式, 到目前为止经历了以账项为基础的账项基础审计模式、制度基础审计模式、传统风险导向审计模式、现代风险导向审计模式四个发展阶段。 审计模式的改变受到审计内部因素、审计环境及审计对象的影响。 外部信息环境的变化会造成审计环境的变化, 最终影响审计方法和模式, 与此同时, 审计人员为提高审计效率也会变革审计方式和模式[13,14] 。 石爱中、孙俭[15] 认为, 审计对象的信息化程度改变了审计模式, 并基于不同的審计环境对审计模式进行了区分: 手工背景下的审计模式包括账目基础审计和制度基础审计, 信息化背景下的审计模式包括账套式审计和数据式审计。 随着社会的进一步发展, 电子数据成为主要的审计载体, 审计模式得到进一步发展, 数据式审计模式应运而生。 郑伟等[1] 认为, 在信息环境下, 相应的审计取证模式发展为数据式系统基础审计模式。 本文基于数据式审计模式, 结合工程审计的特点, 提出了“点—线—面”数据式审计模式。
“点—线—面”思维是指审计人员从单个项目细微之处入手, 通过专业知识和技能, 发现独立项目审计疑点, 之后串联同类项目进行横向比对, 最终从宏观层面对整个被审计项目进行审视、分析和预测, 达到“治已病、防未病”审计全覆盖要求。
“点”是指审计人员从单个项目出发, 对项目的每一个数据都进行审查, 在审计业务的单个环节之中发现数据异常点, 寻找数据之间的勾稽关系, 作为形成审计结果的依据。 “点—线—面”思维的实现要借助基于数据挖掘的大数据技术, 通过将数据挖掘与审计目标相结合, 充分挖掘海量数据中的隐藏信息, 发现数据之间的内在逻辑关联关系, 并对数据进行可视化分析, 结合审计人员的职业判断着重分析异常点。
“线”是指审计人员对同一业务的数据进行纵向对比分析, 或者对不同业务的相似环节产生的数据进行横向对比, 对从大数据中挖掘得到的数据进行离群点分析、偏离度分析以及关联度分析, 发现单个项目核查时未发现的审计疑点或者排除具有合理性的偏离, 利用专业知识、技术挖掘信息。 针对工程审计, 不同项目中所有的相同分部分项数据具有可比性与可挖掘性, 这些数据可以形成一条线。 对同一类型数据的分析可以从波动情况、离群点、异常点、孤立点等方面进行, 以此作为寻找审计疑点(风险点)的依据。 以工程变更问题为例, “点”的分析思维是, 发现项目出现异常变更, 审计人员将其设为审计疑点, 初步可以将其归为某个施工单位为取得私利而进行的变更, 或者因设计单位在初设时深度不够而造成实际情况下必要的变更; “线”的分析思维便是, 将所有变更数据進行汇总, 利用大数据技术进行分析, 综合所有变更数据, 得到一个变更区间, 联系变更数据分布设置变更上下浮动比例, 超过此浮动比例的则将其作为审计疑点进行进一步的审计。
“面”是指审计人员完成全部数据分析之后, 从宏观角度对整个业务或项目进行再次审视。 在宏观形势下, 基于重要性原则, 对疑点发生的性质和金额以及其他审计问题做出最终的判断。 通过项目已知问题和问题状况, 评判整个审计生态的态势, 并做出相应的预测性判断, 作为将来投资决策的可靠依据, 充分利用数据资源价值提高审计判断的准确性。 在实际运用中必须结合审计项目的具体情况, 实现一般性和特殊性的衔接, 并根据实际情况的变化随时调整审计要素与审计结构, 最终实现在“点”的分析处发挥审计“显微镜”的作用, 发现审计疑点, 在“面”的分析处发挥审计“望远镜”的作用, 实现总体分析预测性功能。 简略的“点—线—面”思维如图1所示。
四、“点—线—面”数据式审计模式下大数据审计逻辑流程与平台构建
“点—线—面”思维指导下的数据式审计模式, 需要数据之间的横向、纵向比较, 并基于此深入挖掘数据中的离群点、偏离度和关联规则, 作为审计人员发现审计疑点的指导和依据。 利用该审计模式由小及大、由微观到宏观的特点, 帮助实现工程审计全覆盖。 在此模式下, 结合大数据技术是十分必要的, 并且使用大数据技术能更好地发挥审计在大数据环境下的职能。 对于简单数据的处理, 可以通过建立数据算法模型来进行, 以减少人工机械性重复的工作量, 提高审计效率。 结合审计目标, 基于数据挖掘规律, 揭示数据中潜在的关联关系与逻辑属性, 利用数据资源价值有效提高审计判断的准确性与效益性, 是对传统审计模式的完善与优化, 即采取文本挖掘、知识图谱、机器学习与智能推断等大数据技术, 形成智能审计判断、智能预警的模式。 本文结合工程审计环节的特点以及大数据技术的应用现状, 基于关系型管理系统(RDBMS)设计了“点—线—面”数据式审计模式下的大数据审计平台, 平台构建逻辑如图2所示。
大数据审计平台的构建逻辑大致可分为六个部分: 工程审计目标分解, 审计数据采集与整理, 数据特征分析与关联分析, 审计判断与知识推送, 审计判断与预警分析, 智能审计管理平台。 图2左侧为实现上述六个系统流程的基层技术支撑, 所使用的大数据技术以及人工智能技术, 可确保大数据工程审计具有技术上的可行性。 其中全程贯穿机器学习与人工智能技术, 利用机器学习不断优化审计逻辑, 使其更加智慧。 图2右侧为平台的展现层面, 即将逻辑流程中的结果通过可视化技术进行呈现, 将数据文本信息转化为更直观的图像信息, 有利于审计人员发掘审计疑点, 进行审计预警与审计判断。 其中以图书情报学的知识图谱作为基层技术, 根据审计目标利用可视化技术描述数据, 挖掘、分析、构建、绘制和显示它们之间的相互关系。 图2中间的系统流程具体说明如下:
1. 工程审计目标分解。 将传统审计目标与大数据背景相结合, 实现审计目标扩展与流程再造; 将审计目标进行转换, 使之符合大数据分析, 然后将其导入审计平台, 建立审计标准化体系, 规范审计作业流程, 借助大数据平台精细化审计目标。
2. 审计数据采集与整理。 其包括进行数据清理、内容集成和数据融合, 目的是提高数据置信度、减少模糊性、提高可靠性。 数据类型分为结构化数据和非结构化数据, 结构化数据可以通过Excel输入, 非结构化数据可使用OCR(Optical Character Recognition, 光学字符识别)技术和NLP(Natural Language Processing, 自然语言处理)技术进行结构化处理。 之后数据可以上传到云存储中, 使用时直接下载, 节约本地存储空间。
3. 数据特征分析与关联分析。 即根据审计工作任务和要求, 对目标数据集进行分析。 数据分析部分在后台建立数据处理模型, 使用分箱处理方法, 利用聚类算法、关联挖掘算法、KNN(K-Nearest Neighbor)分类算法以及统计算法等对数据进行处理, 计算数据的偏离度、离群点、关联度, 并在下一步进行审计判断的过程中以可视化方式展现。
4. 审计判断与知识推送。 借鉴可视化分析结果进行分析, 可以更加直观地进行审计判断。 在此过程中, 大数据审计平台引入审计证据链判断, 对常规、常见的情况进行判断, 并根据不同情形给出处理结果, 以减少人力资源投入和提高判断的准确性。 同时, 构建审计案例库、方法库等, 加深对审计成果的挖掘应用。 证据链就是“证据+链条”, 是指在证明客观事实与物件的过程中所涉及的证据组成的证明体系, 构成某一证明体系的证据能够直接通过合理推断进行相互印证从而相互关联, 作为证据链中的一节, 证据必须具备可采集性, 证据链之中的证据必须能够相互印证。 审计证据是在证明审计结论的过程中, 为了形成并支撑审计意见而获取并利用的审计数据, 其通常由一定的载体承载, 能够表达出审计对象在经济活动中留下的痕迹。
工程审计证据链就是在根据工程审计目标确立审计要素与要素标准, 对应工程建设生命周期, 沿着“工程数据→审计疑点→审计证据→审计证据链→审计判断”的路径, 判断工程建设业务是否遵循合法合规性、真实性与效益性审计目标的过程中, 所形成的关联关系链条。 通过图谱方式展示工程审计证据链以及与审计判断和审计证据相关的整体知识结构、可视化分析检索结果, 有助于整体把握审计判断依据, 把握审计证据链的变化与进展, 很适合审计知识需求特征与证据链的展示需要。 以是否按规定给予征地补偿为例, 其审计证据链与审计判断具体如图3所示。
5.审计判断与预警分析。 构建持续审计智能化模型, 基于该模型, 按照合规验证和统计分析, 通过人机互动, 结合可视化分析结果与审计人员的专业判断, 挖掘疑点和实时进行风险预警。
6. 智能审计管理平台。 该模块应用机器学习技术, 通过总结利用数据, 训练出模型并不断优化, 最终实现针对输入数据, 结合项目分类, 自动出具审计报告的目标。
基于上述逻辑搭建的智能审计平台与企业或单位的内部控制及风险控制机制相结合, 构建大数据审计平台的总体架构, 如图4所示。
该平台具有如下优势: ①监督管理可视化。 基于审计标准化体系实现审计过程规范管理、审计取证过程可追溯、问题整改过程可视化。 ②风险管控立体化。 通过内部控制、风险管理和内部审计作业协同及信息共享, 实现企业全面风险管控。 ③持续智能审计。 基于审计模型构建, 按照合规验证和统计分析, 实现疑点挖掘和风险实时预警。 ④业务流程自动化。 通过审计工具自动化、流程标准化, 实现过程作业、底稿生成以及数据的高效处理。
五、“点—线—面”数据式审计模式下大数据审计的意义
1. 提高审计效率。 大数据审计下, 审计过程中所需的被审计单位数据、资料等全部提前录入平台, 减少了基层审计人员的机械式、重复式工作, 节约了审计时间。 基于大数据审计平台强大的运算、汇总功能, 审计人员可以有选择性地调取数据, 初步筛选审计疑点。 大数据审计可以减少甚至解决传统审计模式下存在的各种弊端, 如无效等待、审计延迟, 以及审计流程过多、不连续或无效率等一系列审计浪费问题。 大数据审计将审计人员从重复、繁杂的工作中解放出来, 使其有更多的时间和精力进行专业的审计判断, 更多地发现被审计单位的问题, 进一步提高整体审计效率。
2. 提高审计疑点挖掘精准度。 在大数据审计构建过程中, 受“点—线—面”思维中“点”思维的指导, 利用大数据审计平台对单个项目进行审查核算, 可以发现单个项目中存在的问题。 受“线”思维的指导, 根据审计人员提前设置的具有科学性和专业性的工程审计指标(如合同综合单价变化率、变更综合单价变化率等), 可以对相似项目或同类项目实施横向对比, 进行数据串联, 将指标进行汇总, 设置合理变动区间。 基于该合理区间, 可以对单个项目审核中发现的疑点进行进一步区分, 同时对未发现的疑点进行进一步挖掘。 由此细化区分审计疑点, 实现提高审计疑点挖掘精准度的目标。
3. 突显工程治理宏觀评价能力。 传统工程项目由于施工过程资料属于非结构化数据以及施工材料价格时效性强, 或是仅注重项目建设过程造价而忽略对后续运维成本的计量等原因, 对工程项目全生命周期的重视程度不够, 从而无法对工程治理进行宏观而全面的评价[16,17] 。 大数据审计平台可以很好地处理结构化数据与非结构化数据, 并且上传的数据都将在服务器内进行存储, 能够完整保存整个项目全生命周期的数据, 为工程治理宏观评价提供良好的数据基础。 此外, “点—线—面”思维指导下的大数据审计平台, 是“点”与“面”的结合, 能够对于全体数据进行横向、纵向对比, 揭示整个工程治理生态, 起到宏观评价的作用。
4. 发挥工程项目风险预警功能。 在大数据工程审计平台上实时录入工程项目产生的数据, 利用该平台强大的分析功能对数据进行分析, 实现数据分析与工程项目建设同步进行, 分析工程建设期间利益冲突的变化, 定位风险源泉, 对工程建设所在地社会稳定性风险进行持续审计与风险预警。 利用专家团队或者专业审计人员提前建立风险监测指标体系, 构建审计分析模型, 并导入大数据平台以进行数据挖掘分析, 持续监督业务风险, 实现事后审计向事中审计、事前预警的转变, 防患于未然, 降低项目事后监管成本, 控制项目预算。
六、结论及建议
本文基于习近平总书记“审计就像体检, 不仅要查病, 更要治已病、防未病”的指示, 以及新时代国家治理和审计全覆盖的要求, 分析了目前大数据审计平台构建的可行性, 提出了通过构建基于数据挖掘并结合“点—线—面”审计思维的工程审计平台, 落实大数据技术在工程审计中的应用, 实现审计资源的优化配置, 促进工程审计在技术层面实现“现代化”转变, 最终实现转型发展。
“点—线—面”审计模式作为一种审计与工程专业的融合性探索、尝试性研究, 在该领域尚有许多工作需要完成。 本文搭建的大数据审计平台及其各子模块均基于工程审计数据环境以及数据特点而建立, 下一步可以进一步提升该平台的普适性, 将其应用于政府审计的其他方面, 以及民间审计、内部审计等所有审计领域。 此外, “点—线—面”审计模式并没有在实践中进行大范围的试验和检验, 未来应加强此方面的实证研究, 在实践中不断丰富和调整该审计模式。
【 主 要 参 考 文 献 】
[1] 郑伟,张立民,杨莉.试析大数据环境下的数据式审计模式[ J].审计研究,2016(4):20 ~ 27.
[2] Xiang Jian Wei. Building the Audit Information System in Cloud Computing Environment[ J].Applied Mechanics and Materials,2014(509):170 ~ 174.
[3] Juan Zhang, Xiongsheng Yang, Deniz Appelbaum. Toward Effective Big Data Analysis in Continuous Auditing[ J].Accounting Horizons,2015(2):469 ~ 476.
[4] Kyunghee Yoon, Lucas Hoogduin, Li Zhang. Big Data as Complementary Audit Evidence[ J].Accounting Horizons,2015(2): 431 ~ 438.
[5] Adrian Gepp, Linnenluecke M. K., O'Neill T. J., et al.. Big Data Techniques in Auditing Research and Practice:Current Trends and Future Opportunities[ J].Journal of Accounting Literature,2018(40):102 ~ 115.
[6] 徐鶴田.国家治理视野下的大数据审计工作模式研究——基于SWOT分析[ J].中国内部审计,2017(1):77 ~ 82.
[7] 鲍朔望.大数据环境下政府采购审计思路和技术方法探讨[ J].审计研究,2016(6):13 ~ 18.
[8] 陈伟,Qiu Robin.面向大型数据库的审计数据采集方法[ J].计算机应用,2008(8):2144 ~ 2146+2149.
[9] 林俊.企业内部控制信息化实施相关问题探讨[ J].企业改革与管理,2016(21):50 ~ 51.
[10] 刘国城,王会金.大数据审计平台构建研究[ J].审计研究,2017(6):36 ~ 41.
[11] 鲁清仿,燕万年,王开一等.智慧审计构想与实践探索——基于解构法律法规条款[ J].审计研究,2018(1):28 ~ 34.
[12] 陈大峰,陈海勇.大数据环境下信息系统趋势审计分析[ J].财会月刊,2019(17):116 ~ 123.
[13] 陈毓圭.对风险导向审计方法的由来及其发展的认识[ J].会计研究,2004(2):58 ~ 63.
[14] 谢荣,吴建友.现代风险导向审计理论研究与实务发展[ J].会计研究,2004(4):47 ~ 51.
[15] 石爱中,孙俭.初释数据式审计模式[ J].审计研究,2005(4):3 ~ 6.
[16] 李茜,李莹.基于BIM的公路工程全生命周期综合造价精细化管理研究[ J].公路工程,2019(3):264 ~ 269.
[17] 刘尚科,丁向阳,俱鑫等.某地区变电站全生命周期造价管理工程应用研究[ J].西安理工大学学报,2019(4):518 ~ 523.