楚文光 胡为民 雷年桢 陈赛霞
[摘要]实施大数据智能审计是贯彻落实国家科技强审战略、提高审计监督效能、促进企业高质量发展的重要举措。本文以五凌电力大数据智能审计应用实践为例,阐述了大数据智能审计平台建设背景、建设内容、应用成效、面临的难点及下一步拓展思路,为实现数智赋能审计,构建智能化内部审计体系,推动企业高质量发展提供参考与借鉴。
[关键词]内部审计 大数据 智能审计
一、大数据审计平台建设背景
党的十八大以来,党和国家高度重视审计工作,审计监督已成为国家治理的基石和重要保障。随着企业管理规模越来越大、层级越来越多、经济业务越来越复杂,内部审计对象、范畴、内容也较以往有了很大改变,对内部审计提出了更高的要求。现代信息技术尤其是大数据和人工智能技术的发展,为企业加快推进审计信息化落地,转变内部审计职能、提升审计效率,建设智慧审计奠定了良好的根基。
构建大数据智能审计平台,是对科技强审战略的积极践行,对于提升审计效率,促进企业经济高质量发展,充分发挥审计在国家治理体系和治理能力现代化中的职能作用也具有重要意义。在此背景下,五凌电力有限公司被选定为国家电力投资集团有限公司(以下简称国家电投)大数据审计试点单位,以“科技强审、智慧高效”为目标,构建大数据审计平台,以有效解决传统内部审计面临的“无法打通系统信息壁垒、不能全量数据审计、数据分析深度不够”等问题,拓宽内部审计人员视野,丰富内部审计技术手段,增强全量分析能力,提高审计效率和质量。
二、大数据审计平台建设内容
(一)大数据审计平台建设思路
大数据智能审计平台框架构建遵循“一个平台、两个核心、三个目标、四个视角、五个要素、六个领域、七类应用”的建设思路,如图1所示。
其中,一个平台,即构建集中统一的大数据审计平台;两个核心,即以数据和审计为核心,向大数据要资源,向信息化要效率;三个目标,即通过大数据审计系统,提供更强大的平台与技术支撑,更快速地发现和定位问题,进行更高质高效的审计应用;四个视角,即以风险和问题视角为导向,从大处着眼(领导视角),从小处入手(业务部门视角),综合多方要素,构建审计模型;五个要素,分别为内外部数据、制度法规、智能技术、用户角色、定位提示。通过企业内部数据与外部数据相互印证,结合企业及集团内部制度规定、外部法规、行业规范要求及机器学习等方法构建审计模型,并按照审计部门、业务部门等不同用户角度,进行审计问题的精准定位与风险提示;六个领域,即按照分步骤、分阶段实施原则,选择成本费用、资金管理、合同管理、招标采购、往来账款、资产管理六大重点审计领域,最终形成集指标看板、数据统计、问题清单、问题推送、核实整改、制度依据和模型管理于一体的七大应用。
在具体实施过程中,按照由浅入深、由少到多、由点到线、由线到面,循序渐进推进的原则,选取部分重点领域的关键环节作为一期大数据审计实践的主要内容,通过分期实现,最终形成整个集团全组织、全业务、全过程的大数据智能审计系统。
(二)大数据审计平台一期建设过程
五凌大数据智能审计项目一期建设始于2020年8月10日,从前期基础信息收集到模型框架搭建,根据重要性和可行性进行模型筛选、细化和数据治理,再到模型配置、功能开发、模型验证,直至最终大数据审计平台正式上线,历时100余天,于2020年12月1日通过验收评审。因项目时间紧、任务重,在具体实施过程中,按照业务层面、系统层面、数据层面三条线并行开展工作。业务层面,通过广泛深入调研确定了6大重点审计领域,筛选确认了46个模型、100个子模型,形成了高保真系统原型。技术层面,确立了大数据审计平台的技术架构、数据及模型处理逻辑、形成业务化的模型设计和产品化的模型配置,并定制开发了20个审计模型专用算子。此外,构建了兼顾内网安全及外网接口的网络架构,实现内外部数据的相互融合印证,并完成了大数据审计平台与五凌大数据平台、协同平台、业务系统的集成。数据层面,基于审计分析需求进行了数据寻源,从分散在五凌电力财务共享系统、ERP系统、协同系统及线下的12万张数据表中,寻找与6大业务领域审计需求相关的1200个指标字段。
(三)大数据审计平台一期主要建设内容
1.大数据审计平台系统架构。五凌电力大数据智能审计平台,基于五凌电力公司审计及业务发展需要,应用迪博数智云平台和五凌工业大数据平台,通过大数据技术和机器学习方法,充分融合企业ERP、财务共享、协同平台等系统内部数据,以及天眼查工商数据和迪博行业大数据,在招标采购、合同管理、成本费用、往来账款、资金管理、资产管理等6大重点领域,构建百余个审计模型,覆盖五凌本部及下属64家单位。系统架构分为3层:数据层、应用层和展示层,如图2所示。其中,数据层直接应用五凌工业互联网大数据平台,应用层和展示层使用迪博大数据审计系统。应用层包括十大模块,并与企业内部的协同平台、五凌通即时消息平台以及外部的天眼查平台和迪博行业大数据进行了对接。展示层包括PC端展示、协同平台和移动端推送。
2.大数据审计平台主要功能。(1)系统首页:审计驾驶舱。驾驶舱以多种视图形式对五凌电力及其下属单位存在的审计问题、疑点及问题整改追蹤情况进行可视化呈现。如通过疑点分布图,总览五凌电力各区域的审计问题分布情况,同时根据问题数量和模型权重,用红黄绿三种颜色代表问题的严重程度;板块排行榜和公司排行榜,分别从业务板块和下属各单位维度展示大数据审计问题排行;问题跟踪漏斗对发现问题数量、下发问题数量、核实数量、整改数量、关闭数量情况进行直观呈现;问题分类统计,按照领域统计问题的分布情况;消息和待办用于显示各种消息提醒和待办通知。(2)成本费用审计。将五凌电力财务共享系统中的单据、凭证、科目汇总表、明细账等从下至上分级别、分类型、分重点进行建模分析。以成本费用发生的场景为基础,将费用立项、报销、归集、核算进行统一分析,突出重点、异常提示,形成对成本费用超标、超预算,核算口径不一致,成本费用错列,账票不符,违规报销等问题和疑点的重点审计。(3)资金审计。以五凌电力ERP系统为主要依托,对其资金管理涉及的资金支付、债务情况、账户情况进行分析,对资金使用的授权审批问题、资金使用与计划偏离、融资结构问题、贷款利息问题、账户余额问题、僵尸账户等问题进行异常提示。(4)资产审计。主要关注固定资产、在建工程两类资产,其中固定资产因量大、类多、分布广泛,导致固定资产管理相对复杂,可能存在因分类不准确导致的折旧计提不准确,或者因保管部门、归口管理部门、财务部门之间的账、卡、表不一致导致的管理混乱、资产丢失、账目不明等,而到期资产清理不及时导致的长期挂账可能增大账目、盘点的难度。在建工程转固不及时直接影响了公司成本费用归集、资产折旧不准确等。从资产管理关注的重点出发,对资产权属、资产分类、账卡表对比、到期清理,以及在建工程的转固及时情况进行模型构建与异常提示。(5)往来账款审计。根据往来款项性质,对往来款项涉及的应收、应付、其他应收、其他应付、预收、预付等科目进行款项性质、账龄和坏账计提情况进行分析,提示往来催收不到位、清欠不及时等异常情况。(6)招采审计。主要关注招标采购各环节的外部合法、内部合规、注重效益、兼顾质量与成本。从组织单位来看,企业招标采购主要分为集团集中采购、公司层面采购、二级单位自采,各层级招标采购在采购范围、限额标准、采购方式、审批层级方面应遵循相应的规章制度。从招标采购的各环节出发,对采购计划环节的计划合理性、限额以上采购计划上报;对采购实施环节的组织单位、采购方式、供应商、打捆方式与范围,定标决标基本信息,以及合同签订与评价的时间、内容、评价结果等各环节、各流程进行分析;对采购方式异常、规避招采、采购单价异常、异常供应商及违规等情况进行异常提示。(7)合同审计。以合同管理流程为线索,对五凌电力及下属单位合同管理过程中的签订、执行、结算等环节进行持续监控,并对存在的合同签订异常、量价异常、结算异常、超期合同、倒签合同等情况进行提示。(8)疑点管理。针对各模型发现的疑点,集中进行疑点管理,包括疑点下发、疑点核实、问题整改、整改确认、问题关闭、疑点导出等环节,形成闭环管理,动态监控问题疑点整改进展。(9)模型管理。运用迪博首创大数据分析平台分层技术,进行模型的数据对象管理、指标管理、因子管理、统计分析管理、框架管理等,支持审计人员快速配置审计模型,不需要专业的技术背景和复杂的开发过程,也能够灵活进行审计模型的创建、调整、优化等操作,大大简化了模型的设计和开发程序。
三、大数据审计平台应用效果
(一)大数据审计平台一期模型应用案例
1.内外部数据结合:供应商围标模型。五凌电力大数据智能审计平台一期通过接入天眼查程序接口,可直接查询两家及以上公司之间是否存在关联关系;通过接入迪博数据资讯接口,可进行某个细分领域业务或产品的对标,快速发现问题或短板。以供应商围标模型为例,供应商围标主要存在供应商一致抬高或压低投标报价进行投标,导致公司采购成本大幅度提高,经营利润减少。传统审计中,因无法及时准确地获取关联关系或疑似关联关系信息,导致招采过程中供应商围标情况时有发生,严重损害企业自身利益。在审计模型构建时,利用大数据手段将企业的供应商信息与天眼查数据相结合,对同一项目的投标/报价供应商,通过天眼查核查单位负责人是否为同一人或是否存在控股、关联关系,提示招标采购过程中是否在供应商围标,并输出供应商围标疑点清单。
2.依据制度法规:会议费用违规报销模型。以会议费报销为例,按照国家电投和五凌电力相关制度规定,洗漱、烟、酒、休闲、娱乐、照相、摄影、风景、旅游、景区、会所、花草、绿植、水果等均不属于会议费报销范畴。传统人工审计利用抽检方式,因人力有限无法对会议费用报销明细与发票内容进行一一核查,会议费超范围报销情况时有发生。大数据审计模式下,可通过计算机视觉技术对企业发票、费用报销单等纸质票据进行快速扫描,获取发票类型、发票号码、开票日期、金额、销售方名称等关键信息,实现对企业发生所有费用报销情况进行全面排查,依据销售方名称判断是否存在会议费用报销明细、发票内容包含制度规定不能报销的事项,进而生成会议费报销超范围疑点清单,极大提高了审计效能。
3.机器学习技术:成本费用类型与科目列支不一致模型。对于没有明确规则,无法通过传统的规则集和专家系统进行构建的审计模型,可以通过机器学习方法,利用已有数据来训练计算机形成自己的判断逻辑,而且随着训练集的越来越大,训练的模型越来越精确。五凌电力大数据智能审计项目运用机器学习方法,构建了成本费用类型与科目列支不一致模型、资产管理领域固定资产分类不准确模型、往来账款同类项目预付款比例不一致模型、同类项目质保金比例不一致模型、招标采购中同类型外委未打捆采购和拆分、肢解项目规避招标模型六大类审计模型,有效解决了无法通过传统规则和经验判断实现的审计模型构建。
以成本费用类型与科目列支不一致为例,采集五凌电力财务共享系统中33,067条生产数据作为机器学习训练数据,分别采用K近邻算法、逻辑回归、互补朴素贝叶斯等不同的机器学习算法进行模型训练,最终根据逻辑回归机器学习分类算法,得到训练精度和测试精度均在90%以上的模型。
此外,本项目采用系统验证与项目验证双向验证形式,对大数据智能审计模型使用效果进行验证评估。其中,项目验证主要选择五凌电力下属新能源公司和力源公司两家企业,对审计专项发现的问题与数据模型交叉部分共计8项进行验证,均验证通过;系统验证主要依托ERP系统和财务共享系统数据,选取其中定位型和提示型子模型共计68项进行验证,验证结果均为通过。
(二)大数据审计平台一期应用成效
五凌电力大数据智能审计项目的应用,为审计工作带来了模式的创新与转变,项目成果得到五凌电力及国家电投的高度认可,获得了公司内部技术创新二等奖和突出工作奖,成为国家电力投资集团的大数据审计标杆。
1.五大转变。(1)实现人工抽样审计向大数据全量审计转变。传统审计主要通过人工抽样抽查业务单据,并将检查结果记录到底稿上。受限于项目周期、项目人手等条件,一般抽样比例在10%—20%左右,而且不同的抽样方式、抽样频率,得到的最终抽样结果可能不同,而大数据审计平台可实现业务记录全覆盖,有效避免发生漏查漏检以及人为疏忽导致的错漏。(2)实现不定期分散式审计向定期集中式审计转变。以往的审计模式以项目为单位,3年才能完成一轮全覆盖,对于某个被审计单位而言,2—3年才有可能被审计一次。通过大数据审计平台,可以每月完成一次全覆盖的数据式审计,在月底或月初进行集中整治新发现的问题,审计监督更加及时,可更有效地发挥对企业经营和管理的保障作用。(3)实现批量报告式整改向逐条精细化整改转变。以往的整改工作都是等审计报告或审计问题清单下发以后,被审计单位才着手安排整改,再定期批量反馈整改完成情况。而通过大数据审计平台可以随时发现问题,随时下发整改,有整改进展随时反馈整改情况,使问题整改更加及时、整改处置和跟踪更加精细化。(4)实现经验式专家审计向规则化智能审计转变。以往审计更多地依赖审计人员的经验和专业判断,审计质量和效率与人的因素相关性较大,受审计人员个体差异影响也较大。通过大数据审计平台,将审计人员的专业经验梳理成可复用的规则,内置到审计模型中,使审计平台具有专业判断力,成为不知疲倦、铁面无私、火眼金睛的审计“专家”。(5)实现单纯依靠内部数据检查向内外部信息整合发现问题转变。以往审计主要检查内部各种业务单据,有时也通过一些渠道进行相关信息验证,如通过工商系统进行信息查询,但这种外部信息使用方式不够便捷。而通过接入第三方数据接口,效率更高、功能更强。如通过接入天眼查程序接口,可直接查询两家公司之间是否存在关联关系;通过接入迪博数据资讯的接口,可以进行某个细分领域的业务或产品对标,快速发现问题或短板。
2.三大成效。(1)实现审计全覆盖。五凌电力共有64家下属单位,在审计部人力有限的情况下,只能做到3年全覆盖。通过大数据审计平台可以对全部64家下属单位进行实时审计监督,提高了审计检查的频率。(2)实现精准识别。以往的人工审计作业方式,往往要查阅大量资料和底稿,犹如大海捞针。而通过大数据审计平台,可以对疑点和问题进行精准识别,将审计人员从烦琐的资料查阅中解放出来,使审计人员的工作更具针对性,专注于更有价值的审计活动,提高审计效率和效果。(3)“网络+现场”模式。五凌电力目前的下属单位分布于11个省,未来还有海外分支机构,传统现场审计难以覆盖。通过大数据审计平台,可以便捷、全面、多渠道地获取审计数据,对公司各项经济活动进行全景式联网审计,同时结合现场审计,形成网络+现場的新型“O2O”审计模式,线上高效快捷搜集审计线索,定位高风险单位;线下深入调查研究,充分发挥各自优势,相得益彰。
3.六方面成果。(1)业务数据资产化。本项目梳理了招采、合同、资金、资产、成本费用、往来账款6个领域的业务数据,最终形成一批数据资产,包括56张表、88个数据对象、1233个字段的中英文对照。(2)审计发现自动化。通过大数据智能审计平台,固化了100个审计模型,包括80个精准定位型和提示型模型,可自动筛选出审计疑点,每个模型会根据大数据平台每天同步的增量数据,自动计算最新疑点。(3)核实整改日常化。通过大数据智能审计平台,可随时发现随时下发审计模型输出的审计疑点,及时进行整改,使审计发现和整改成为日常化工作,大大提高问题发现和整改的及时性,使问题一经发现就能得到有效管控。(4)信息沟通社交化。实现了与五凌通的对接,可在问题下发时通过五凌通将信息推送给被审计单位的对接人,对接人及时联系审计部下发人,针对问题进行深入沟通,共同探讨问题原因,设计整改方案,及时反馈整改情况,使审计沟通更加高效、透明,更具社交化。(5)模型设计简单化。本项目利用大数据平臺的数据对象功能和模型管理功能,可快速配置审计模型,不需要专业的技术背景和复杂的开发过程,就能够进行审计模型的创建、调整、优化、激活等操作。(6)审计管理体系化。通过大数据智能审计平台,不仅可以显示审计模型的计算结果,还内置了相关制度依据。同时,可进行问题下发、核实、整改、关闭,形成从制度规定到疑点筛查,再到整改关闭的完整管理体系。
四、大数据审计平台建设的重点难点
在整个五凌电力大数据智能审计平台一期建设过程中,数据是最为关键的环节,也是项目实施的重点难点所在。此外,进行审计模型构建和真正实现审计范围全覆盖也是本项目实施的难点。
(一)数据采集难:数据从分散到集中
五凌电力的数据大多分散在财务共享系统、ERP系统、协同系统等不同系统中,而且即使是同一系统中的数据,也存在以不同存储方式分散于不同存储位置的情形。在ERP系统和财务共享系统中,还存在部分临时数据,要经过持久化处理才能进行自动采集。此外,少量数据未在相关信息系统中存储,只存在于线下文件中,只能通过手工填报或导入方式采集。上述情形给数据采集工作带来较大的难度。
(二)数据寻源难:数据资产清理
目前大部分企业和五凌电力一样,各类数据往往分散于多个系统中,数据的集中度和数据资产的质量等情况也难以保障。大数据审计的范围往往涉及多领域、多系统、多模块和功能点,甚至需要从数万张表、数十万个字段中寻找出项目需要的字段,虽然从数量上看,可能仅占全部字段的1%,但是从项目投入上,数据寻源可能会投入项目组30%—50%的时间和精力,这是目前实施过程中最大的瓶颈。因此,在项目初期和项目过程中,要确保有足够的资源和技术保障,实现所需数据应寻尽寻、应采尽采。
(三)数据一致难:主数据管理与数据标准化
在实施大数据审计项目前,一般单位都没有系统地进行数据管理,有的数据存在多系统中,且数据不一致。比如,五凌电力信息化环境中有多套组织机构数据、多套用户数据、多套财务科目数据,这些不一致的主数据对模型的计算和数据检索造成了一定的困扰。所以,在项目启动前或项目初期,要提前进行主数据管理和数据标准化工作。
(四)审计建模难:抽丝剥茧理逻辑
大数据审计模型的设计过程,涉及多个环节,包括业务梳理、审计关注点分析、数据和技术可行性评估、业务模型设计、技术模型验证等,对建模人员的专业要求较高。此外,在审计模型构建过程中,需要对大量信息进行筛选和甄别,需要与多个部门及人员进行沟通协作,需要横跨业务的多个领域和多个系统,需要熟悉各种数据分析技术和审计建模技术,对于没有明确判定规则和结构化数据的审计模型,还需要使用机器学习、图像识别、自然语言处理等技术,建模难度更大。建议在建模过程中,综合考虑数据基础、逻辑清晰度、技术难度、预期效果等多方面,进行模型的取舍,优先选取可行度高的模型上线。
(五)全面覆盖难:点线面循序渐进
五凌电力大数据审计项目是国家电投首次组织开展的大数据审计应用和平台建设试点项目,在项目实施过程中没有历史经验可循,且当前企业的审计标准化基础和数据基础也难以支撑实现全面的审计模型覆盖,只能先选取部分重点领域的关键环节进行实践,再逐步由浅入深、由点到线、由线到面,循序渐进,最终形成集团全组织、全业务、全过程的大数据审计系统。该过程可能贯穿今后3—5年,是一个持续建设和优化的过程。
五、大数据智能审计平台下一步拓展思路
在高度上,要围绕一个目标、两个体系(SPI、JYKJ),从财务审计和专项审计向经营审计、战略审计、绩效审计迈进。在深度上,要进一步向行业纵深、业务纵深、问题纵深、技术纵深,最大限度挖掘数据和技术潜力。在广度上,要进行应用的拓展和整合。一方面,要将大数据技术,从审计领域扩展到风险管理、内控、合规、监察、管理对标等多个管控领域,构建大监督平台;另一方面,要将大数据审计平台与监控预警系统、其他管理系统、业务系统进行融会贯通,快速查看异常单据及事中、事前审计,实现审计关口前移。
(作者单位:五凌电力有限公司 深圳市迪博企业风险管理技术有限公司,邮政编码:518000,电子邮箱:huweimin@dibcn.com)
主要参考文献
[1] 李云香,周成轩,张铖怡,等.基于深度学习的智慧审计系统[J].中国内部审计, 2020(12):12-19
[2] 刘国城,王会金.大数据审计平台构建研究[J].审计研究, 2017(6):36-41
[3] 王文博.大数据审计的应用和探讨[J].中小企业管理与科技, 2021(3):14-15
[4] 张玉岭.智能审计在企业内部审计中的运用分析[J].财会通讯, 2019(4):87-91