【摘要】在对22篇典型案例进行调查研究的基础上, 归纳近年来国家审计视角下企业审计数据分析技术方法在应用重点、数据维度和技术手段等方面呈现出的一些新特点, 以案例分析的方式提出企业报表数据总体分析、多维数据关联分析和大数据挖掘分析等三种企业审计典型数据分析思路和方法, 并对健全企业审计数据分析技术方法创新应用机制提出相应的政策建议。
【关键词】企业审计;数据分析;技术方法;创新应用
【中图分类号】 F239.1 【文献标识码】A 【文章编号】1004-0994(2021)07-0082-7
一、引言
企业审计数据分析技术方法的应用伴随着国家审计信息化的整体发展进程不断推进。 近年来, 在企业审计实践应用层面, 各级审计机关坚持科技强审理念, 适应国有企业信息化建设逐步加快、信息系统日趋复杂、数据规模急剧增长等环境变化, 积极利用新技术、新方法开展企业重大经济政策跟踪审计、企业领导人员经济责任审计、企业财务收支审计和企业专项审计调查, 充分运用大数据分析手段加大对违纪违法问题和风险隐患的揭示力度, 进一步提升了企业审计工作的质量和效率。
在企业审计理论研究层面, 逐步总结企业审计数据分析应用的理念与内容, 梳理企业审计数据采集渠道, 探索拓展企业审计数据分析方法, 为企业审计数据分析应用提供理论指导。 企业大数据审计的目标是运用大数据技术、方法和工具, 利用数量巨大、来源分散、格式多样的各类财务、业务等数据, 深度开展数据关联分析, 把握企业总体情况, 锁定疑点重点, 引领支撑审计方案。 楚磊[1] 分析了大数据对传统的企业审计组织模式、思维革新和成果应用产生的影响并提出对策。 李晓亮[2] 认为, 企业的大部分核心业务系统天然不适应审计数据分析需求, 实现企业审计数据分析常态化需要相应的基础设施和数据分析集成环境。 刘东喜等[3] 提出了企业信息系统调查、财务数据共性分析、业务循环重点分析和企业信息系统审计等分析方法。 曹华[4] 认为, 在企业审计中应用关联规则分析、聚类分析、孤立点分析等数据挖掘技术, 可以获取有效的审计证据。 崔竹[5] 提出, 要全面整合与企业审计密切相关的数据资源, 构建全覆盖的企业审计大数据资源体系和分析平台。
综上, 对企业审计数据分析应用的理论研究相对滞后于企业审计实践, 对企业审计数据分析技术方法的研究尚缺乏系统性, 少见企业审计数据分析案例研究, 对于企业审计信息化平台的研究还存在不足。 鉴于此, 本文根据审计署审计科研所組织的“数据分析技术方法在审计工作中的创新应用专题调研”征集的典型案例, 对2016年以来数据分析技术方法在企业审计中的创新应用情况进行系统研究。 此次调研, 共有17个审计机关推荐了22篇企业审计典型案例, 案例数量在各审计业务领域居中, 但整体技术应用水平较高。 这与企业审计涉及的业务领域众多、利用的数据关联关系复杂、挖掘的疑点线索隐蔽、揭示的问题风险多变等特征密切相关。 本文通过对22篇案例的梳理和提炼, 总结近年来企业审计数据分析技术方法的应用特点, 分析企业审计典型的数据分析思路和方法, 并建议在国有企业改革三年行动的关键阶段, 建立以检查资金为主线的企业审计常态化经济体检机制、大数据分析技术方法共享机制和大数据智能分析平台。
二、企业审计数据分析技术方法应用特点
1. 应用重点从数据采集预处理为主向数据综合分析利用转变。 企业财务数据的高效快速采集和转换是企业审计数据分析的首要工作。 由于财务软件版本众多且更新换代较快, 企业财务数据的采集转换成为企业审计数据应用的难点。 各级审计机关为此开发了多种类型的财务数据抽取转换加载工具。 “金审工程”二期现场审计实施系统(AO)被应用后, 审计人员一般通过财务软件的数据导出备份功能, 将财务软件备份数据导入AO, 并通过AO的采集转换模板进行数据的转换, 在一定程度上解决了上述问题, 但也面临着采集转换模板需及时更新等新问题。 从本文案例分析来看, 当前企业审计数据应用重点主要围绕数据综合分析利用展开。 在22篇案例中, 数据综合分析技术案例有19篇, 综合分析平台技术案例仅1篇, 数据采集技术案例仅2篇。 数据采集技术案例主要是个别地方审计机关(北京市审计局、山东省潍坊市审计局)规划财务账标准表存储内容和数据结构, 将财务账后台数据库备份文件恢复到相应数据库中, 并利用KETTLE等开源的ETL工具, 进行全库数据的分析、清理并抽取, 生成相应标准表, 最终将不同软件类型和版本、不同类型后台数据库、不同数据结构的财务账源数据采集为统一数据库类型、统一数据结构的财务账标准表, 为集中高效分析打下基础。
2. 数据维度从财务数据分析为主向企业内外部多维数据关联分析转变。 财务收支情况审计是企业审计的主要职责之一, 企业财务数据的分析历来也是企业审计数据分析的重要内容。 由于财务分析的理论相对成熟, 企业审计围绕财务数据分析积累的审计分析模型也相对稳定。 近年来, 受企业审计目标和内容多元化动态调整的影响, 企业审计分析的数据类型呈逐步拓展趋势。 从案例分析来看, 除3篇涉及数据采集的案例外, 19篇数据综合分析技术案例以企业内外部数据的多维分析为主, 其中仅有8篇使用了财务数据。 从数据维度来看, 主要包括企业内部的销售、采购、合同、运营、人员信息等数据, 以及企业外部的税务、工商、社保、用水用电、信贷等数据。 企业财务数据的分析主要围绕资产、负债、损益等方面展开, 对财务报表内各个科目的真实性、完整性进行审查, 进而对企业财务状况、偿债风险、资产质量、盈利状况等进行评价, 对合并财务报表合并范围、关联交易抵销、相关科目的列报及重大事项的披露情况进行审计。 通过对关联企业内部业务数据进行分析, 可发现在企业资金、采购、生产、销售、薪酬等内部控制管理方面的重大问题和重大风险隐患;对关联企业外部数据进行分析, 则更容易深入揭示企业利益输送、虚增收支、违规投融资、违规担保借款等重大决策问题。
3. 技术手段从数据查询分析和验证分析为主向挖掘分析转变。 企业审计最常用的数据分析技术手段是SQL查询分析。 19篇数据综合分析技术案例中, 运用SQL分析技术的案例有12篇, 其中利用Python、SPSS、图数据库技术开展的数据挖掘分析案例有9篇。 随着大数据挖掘技术在企业审计的深入应用, 企业审计数据分析思路经历了从以“因果分析”为主向“关联分析”和“因果分析”相结合的转变。 例如: 郑州特派办利用决策树算法发掘追踪部分中央企業的参股企业存在“明股实债”方式融资行为;长沙特派办使用计算机图论技术挖掘企业关联关系, 发现循环贸易虚增收入问题;天津市审计局使用图数据库技术查找国有企业违规担保疑点等。
三、企业审计典型数据分析思路及方法
数据分析是数字化审计的核心。 企业审计常用的数据分析思路, 是从企业财务数据的分析性复核入手, 引入企业内部业务数据和管理数据, 以及与企业经营密切相关的外部数据, 通过多维数据关联分析发现问题疑点。 由于企业审计数据分析体系相对庞大复杂, 本文仅结合案例反映的典型数据分析类型进行研究, 主要包括以下三种分析方法。
1. 企业报表数据总体分析。 企业报表数据总体分析, 是从企业的财务报表出发揭示问题疑点, 通过“表—账—证—单”的勾稽关系, 层层穿透发现问题的根源, 逐项验证审计判断的合理性, 为总体评价企业改革发展情况, 确定企业审计重点, 以及评价企业财务状况和经营情况提供财务数据支撑。 主要包括:一是集团总体经营状况分析。 从财务状况、运营结构、运营效率、科技创新、价值创造、会计信息可信度、集团与所属行业主指标、行业特色指标等维度进行趋势统计, 总览集团各业务板块结构及其绩效指标对比, 并依据主指标警示连续亏损、低效、微利、造血严重不足的子公司。 二是企业报表结构差异性分析。 运用数理统计方法对企业集团所属单位的资产负债表科目和损益表成本费用科目进行方差、标准差和系数调整计算。 以方差指标揭示各企业的资产负债结构、成本费用结构与所在行业类别的平均资产负债结构、成本费用结构的偏离程度, 据此对企业进行排序确定重点审计企业。 三是会计信息真实性诊断。 分析企业合并报表完整性, 从集团与子企业的决策关系、关联关系和交易关系等方面分析发现异常情况, 并进行揭示; 选取企业重要财务指标作为考察经营管理者能力、企业经营状况和财务状况的评价和预警指标体系, 利用上述指标从企业盈利能力、资产质量、偿债能力和发展潜力等四个方面进行评价和预警, 判断企业会计信息的真实性。 四是重点事项分析。 主要对集团及子企业对外投资、资本运作、薪酬与费用、物资服务采购、收入合规性、往来款、非经常性损益、科技创新能力、专项储备等重点审计事项进行疑点线索分析和梳理, 厘清数据关联路径, 进一步追溯问题指向的具体会计科目, 提高审计疑点线索的针对性。
以中央企业重点审计子企业分析[6] 为例。 主要分析思路是, 通过“中央企业预警和分析系统”对某集团有限公司的财务报表进行分析, 生成财务线索重点提示报告, 精确锁定重点审计的二级子企业。
第一, 分析重点警示企业, 包括连续或巨额亏损企业、低效或微利企业等。 某集团有限公司连续或巨额亏损子企业为A有限公司, 如表1所示。
第二, 分析资产负债结构差异性。 如表2所示, A有限公司的资产负债结构差异偏离度高达0.25, 说明该企业资产负债结构与行业平均水平差异较大。
第三, 分析成本费用结构差异性。 如表3所示, A有限公司的成本费用结构差异偏离度高达0.32, 说明该企业成本费用结构与行业平均水平差异较大。
通过以上综合分析, 发现某集团有限公司及其所属骨干企业A有限公司存在多处交叉疑点, 说明该企业可能存在会计信息造假的情况。 经审计核实发现, 该公司通过开展无交易实质的“空转”贸易、把委托加工业务全额计收入等方式虚增收入数亿元;同时还存在通过违规计提工资总额来人为调节利润近亿元等粉饰财务报表存在的问题。
2. 企业多维数据关联分析。 企业多维数据关联分析, 是指在企业财务数据分析的基础上, 进一步关联企业内部业务数据和外部数据, 通过多维度数据的关联关系和因果关系的分析, 快速筛选出审计疑点的过程。 该方法是验证企业已知经营风险的重要方法, 也是目前企业审计中使用较多的方法。
以企业循环交易大数据分析为例。 近年来, 部分企业出于虚增收支规模、获取资金借贷利息、偷逃税款等目的, 在上下游企业的配合下, 存在循环贸易、融资性贸易、虚开增值税发票等虚构贸易行为。 这类经营行为虽然具备形式上的法律要件, 但是并无实质上的货物流转, 是以正常货物交易为外部形式从事无实物货物流转的违规贸易行为, 涉及金额往往巨大。 这类以企业法人间贸易关系等合作经营为基础的违规行为, 由于涉及外部交易环节多、隐蔽性强, 且交易手续表面合规, 因此难以通过企业内部数据的常规关联分析发现, 需要利用企业外部税务、工商等数据进行大数据分析。 从数据分析的角度看, 这类业务中的增值税发票、购销合同、收付款等信息都呈现出闭环特征, 可以通过增值税专用发票进销项抵扣信息, 将交易链条上的各个交易主体串联成交易闭环。 主要分析思路如表4所示。
表4中的融资性贸易形成国有资产损失风险的业务特点包括: 一是以融资为目的, 对大宗货物交易收取资金利息(或称购销权益), 利息以货物销售加价的方式收回, 因此业务流水金额大但利润率低; 二是没有实际货权流转; 三是在特定的供应商和客户之间进行闭环交易, 交易对手对国有企业的业务依存度极高; 四是部分供应商与客户之间存在关联关系。 数据分析主要是利用企业财务系统数据, 企业的采购、销售及库存管理等业务数据, 全国增值税发票抵扣认证数据、全国工商数据等。
融资性贸易造成国有资产损失风险分析[7] 的主要分析思路是依托增值税发票数据, 锁定上下游重点关注企业, 再通过全国工商数据追查上下游企业之间的关联关系, 锁定虚构贸易交易对象。 具体而言: 一是根据企业增值税进销项发票记录, 筛查出业务依存度较高的供应商和客户。 二是筛选出前五大供应商的增值税进项开票记录和前五大客户的增值税销项开票记录, 进一步将贸易业务链向上下游业务对手推进, 锁定各自金额位居前三的上游和下游单位。 三是以全国工商数据为依托, 纵向构建股权网图, 挖掘贸易交易对手关系。 四是纵横交叠分析, 锁定可疑虚构贸易交易。 通过以上关联分析, 经审计延伸核查, 确定了某国有贸易公司虚构贸易且变相对外提供资金、造成数十亿元国有资产存在敞口风险的违规事实。
3. 企业大数据挖掘分析。 企业大数据挖掘分析, 是对企业海量的非结构化数据和结构化数据进行挖掘分析, 揭示前述两种分析方法难以验证的、隐含的、先前未知的并具有潜在风险的线索的过程。 相比于数据审计对“既有知识”的“验证”, 基于数据挖掘技术的大数据审计是对“新知识”的“发掘”。 数据挖掘又称数据库中的知识发现, 是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程, 是目前人工智能和數据库领域研究的热点问题。 数据挖掘是一种决策支持过程, 主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等, 高度自动化地分析数据, 做出归纳性的推理, 从中挖掘出潜在的模式。 数据挖掘算法是数据挖掘的核心, 主要分为分类算法、聚类算法和关联规则三大类。 主要分析思路如表5所示。
本文以“明股实债”分析为例。 近年来, 在企业审计中发现部分违规交易行为更为隐蔽。 如在社会融资环境趋紧背景下, 部分国有企业利用自身的融资优势, 以“明股实债”方式向外部企业提供资金, 表面上看是以股权形式对外投资, 实质上是以获得固定收益及远期本金有效退出为实现要件的资金出借行为, 且资金最终的使用方多为房地产或地方政府融资平台等国家政策限制性行业或领域。 但是, 这类问题很难从财务数据或业务数据等企业内部的结构化数据入手查找。 由于多层包装隐蔽性高, 外部数据很难直接关联分析, 需要更多经验判断和特征模型挖掘相结合的大数据分析方法。 决策树算法是数据挖掘技术中较为基础、经典的算法模型之一, 是对实例进行分类的树形结构, 也是一种基本的分类与回归方法。 决策树的学习就是从训练数据集中归纳出一组分类规则, 规则对应的模型不仅对训练数据有很好的拟合, 且对未知数据也有很好的预测。
企业“明股实债”隐藏债务分析[8] 的主要分析思路是: 利用SPSS决策树挖掘分类算法, 对部分已标记隐藏债务疑点的企业样本进行模型训练, 形成隐藏债务企业决策树模型, 利用此模型对剩余未标记企业进行决策树分类, 锁定疑点。 具体而言: 一是数据准备。 把企业的相关信息转化为一系列相应的属性。 例如, 对“隐藏债务”企业相关情况进行分析, 选择12种属性作为筛选企业的特征。 二是数据标记、训练。 对已分类的企业样本标记是否为“隐藏债务”。 将已分类的企业样本数据作为训练数据导入SPSS软件, 选择分类->决策树, 将相应的变量选入自变量, 并选择因变量的类别。 三是结果分类。 对剩余未分类的企业, 遍历①决策树直至叶子节点, 即可得到该企业是否为“隐藏债务”。
综上, 上述三种企业审计数据分析类型在分析数据上逐渐多源化, 在分析思路上逐渐深入, 在分析技术手段上逐渐复杂化和智能化, 在分析方法上逐渐抽象化, 在分析目标上逐渐发挥企业审计的预警预测功能, 具体如表6所示。
四、健全企业审计数据分析技术方法创新应用机制
近年来, 国家审计机关企业审计数据分析技术方法的创新应用取得明显进展, 审计署修订了企业审计数据规划, 印发了企业审计指南, 建立了企业审计大数据信息综合管理平台, 实现了在数据分析基础上突出重点开展的企业审计。 但是, 与新时期企业审计的要求相比, 企业审计数据分析技术方法创新应用还存在以下不足: 一是总体分析尚不到位, 对国有经济布局结构的总体研判不足, 对中央企业分行业开展系统性、经常性分析研究还不到位; 二是分析方法共享机制不完善, 模型开发缺乏标准指导, 难以有效共享协作, 主要表现为对企业财务审计数据查询分析模型重复开发, 而揭示企业改革发展的深层次矛盾和风险隐患的审计数据分析模型开发动力不足; 三是智能分析应用不足, 对机器学习、人工智能等前沿技术探索应用不够, 缺少自动化模型开发辅助设施以及统一的智能化分析模型运行和监控平台, 开发门槛较高。
2020年8月6日, 中央全面深化改革委员会第十四次会议审议通过了《国有企业改革三年行动方案(2020-2022年)》, 国有企业混合所有制改革、国有企业重组整合、国有资产监管体制改革进入快速推进和实质进展的新阶段。 在国有企业改革的关键时期, 其审计更需要充分发挥“科技强审”优势, 健全企业审计数据分析技术方法创新应用机制(见图1), 建立以检查资金为主线的企业审计常态化经济体检机制、大数据分析技术方法共享机制和大数据智能分析平台, 及时揭示制约国有企业改革政策措施落地的体制性障碍、机制性梗阻和制度性漏洞, 促进国有经济优化和结构调整, 增强国有经济的竞争力、创新力、控制力、影响力和抗风险能力。
1. 建立以检查资金为主线的企业审计常态化经济体检机制。 根据新时代企业审计的目标定位和职责要求, 在审计署现有“中央企业审计分析和预警系统”等有关评价和预警指标体系的基础上, 以检查企业资金(国有资金、国有资产、财政补贴收入等)为主线, 进一步扩充数据来源、健全指标体系、延伸检查层级、跟踪整改成效, 建立企业审计常态化经济体检机制。 在数据资源方面, 可以围绕资金流转主线, 以企业财务收支审计数据分析为核心, 挖掘利用定期采集的企业财务核算数据、关键业务数据、重大决策管理数据, 辅以外部行业数据、部门监管数据、国民经济运行数据等进行综合分析。 在指标设计方面, 可突出资金流转重点, 对企业的重大政策措施执行情况、财务收支情况、经营管理和效益情况、境外投资情况、内部控制及风险管理情况、经济责任履行情况等涉及的财务收支重点指标进行定性与定量相结合的评价。 通过检查资金流向, 一方面揭示国有资金、国有资产以及财政补贴在管理和使用中存在的违纪违法问题, 另一方面, 及时发现风险隐患和重大政策措施落实中存在的问题。 在检查层级方面, 搭建包括“中央企业总体—重点行业领域—企业集团—重点子企业—重点业务”在内的企业资金穿透式“体检”机制, 对重要的资金款项设定抽查比例, 对资金问题线索一跟到底, 沿着资金问题产生的路径查深查透, 必要时从企业集团总部向企业二级单位、三级及以下单位做重点延伸。 在整改成效方面, 重点跟踪资金类整改措施, 包括资金节约或挽回损失、资金收回或上交、盘活资金等情况, 落实整改责任, 确保审计发现的问题能够得到及时有效的整改, 解决屡查屡犯的问题。
2. 建立企业审计数据分析技术方法共享机制。 企业审计数据分析技术方法的共享是提升企业审计能力、避免企业审计资源浪费的重要手段。 推动建立完善高效的流通和共享机制的技术难点是技术方法的确权问题, 即如何确认和保护技术方法分享人的权益, 通过相应的制度措施鼓励人人创新、人人分享。 在技术支撑层面, 可利用区块链技术, 搭建基于区块链的企业审计机关之间、企业审计各项目组之间和企业审计人员之间的共享通道, 对技术方法的产生、收集、传输、使用与收益进行全生命周期的记录与监控, 探索建立企业审计数据分析技术方法共享链。 在制度保障层面, 可建立企业审计数据分析技术方法创新标准体系, 对技术方法的开发、测试、应用、推广和升级等进行全流程规范, 夯实技术方法交流共享的基础。
3. 搭建企业审计大数据智能分析平台。 人工智能(AI)技术的应用是降低企业审计大数据应用门槛的有效途径。 当前, 国有企业改革进入攻坚期和深水区, 以往数据式审计模式发现的很多问题基本得以纠正, 一些违纪违法问题变得更为隐蔽复杂, 权钱交易线索也更为细小分散。 利用海量数据综合比对的“驗证式”分析模式锁定新型问题、新型线索的难度越来越大, 需要更智能化的数据挖掘分析技术支撑新型问题的深入核查。 本文建议, 可以在“金审工程”三期项目总体框架下, 完善现有的“企业审计业务管理与信息平台”, 突破以功能为中心的平台框架, 力求实现以数据为中心的体系架构, 建立企业审计大数据智能分析平台。 在智能化数据治理层面, 可集成图像、视频、自然语言处理(NLP)、机器翻译、对话系统、推荐系统等多领域的人工智能成果, 实现数据采集、数据标注、数据预处理和数据增强等相关工作的自动化和流程化。 在智能化模型算法开发方面, 提供可视化、交互式的模型设计开发环境, 利用关联分析、聚类分析、分类分析、时序分析等算法, 通过特征工程、模型训练、模型评估和模型部署等开发训练环节, 形成智能化的模型算法。 当前比较前沿的挖掘分析技术包括遗传算法(GA)、决策树算法(DT)、粗糙集算法(RST)、神经网络算法(BP)等, 都是智能分析的重要工具。 在智能化审计业务应用层面, 平台可通过不断地进行模型监控以判断模型的实用性, 并进行模型的迭代训练, 最终为企业审计人员提供企业审计业务细分、审计事项个性化推荐、审计知识图谱绘制、审计智能问答、企业智能预测等智能化企业审计数据分析技术方法应用服务。
五、结论
数据分析技术在企业审计领域的创新应用是新时代推动国家审计机关企业审计高质量发展的必由之路。 当前, 企业审计大数据应用实践正经历着从以数据采集预处理为主向数据综合分析利用转变, 从以财务数据分析为主向企业内外部多维数据关联分析转变, 从以数据查询分析和验证分析为主向数据挖掘分析转变的过程。 本文以案例分析的方式, 深入分析了企业审计领域三类典型的数据分析思路, 系统研究了大数据技术在企业审计领域的应用途径, 为进一步创新完善企业审计数据分析应用机制提供了有益的方向性参考。
【 注 释 】
① 所谓遍历(Traversal),是指沿着某条搜索路线,依次对树(或图)中每个节点均做一次访问。访问结点所做的操作依赖于具体的应用问题, 具体的访问操作可能是检查节点的值、更新节点的值等。不同的遍历方式,其访问节点的顺序是不一样的。遍历是二叉树上最重要的运算之一,是二叉树上进行其他运算的基础。
【 主 要 参 考 文 献 】
[1] 楚磊.浅析大数据对企业审计的影响及对策[N].中国审计报,2016-11-02.
[2] 李晓亮.对企业审计数据分析常态化的几点思考[ J].审计月刊,2013(8):12 ~ 13.
[3] 刘东喜,陈斌.从服务国家治理角度谈企业审计信息化[ J].审计月刊,2012(2):17 ~ 19.
[4] 曹华.数据挖掘技术在企业审计中的应用[ J].理财,2013(4):89 ~ 90.
[5] 崔竹.全覆盖视角下企业审计大数据应用研究[ J].经济研究参考,2019(9):90 ~ 114.
[6] 李晗博.中央企业审计分析和预警系统主要功能和应用:数据分析技术方法在审计工作中的创新应用典型案例[R].北京:审计署审计科研所,2020.
[7] 石磊.企业审计中虚构贸易疑点的发现:数据分析技术方法在审计工作中的创新应用典型案例[R].北京:审计署审计科研所,2020.
[8] 燕泽权,闫九枝.隐藏债务有“新招”大数据“法眼”让它无处可逃案例:数据分析技术方法在审计工作中的创新应用典型案例[R].北京:审计署审计科研所,2020.