首次应用大数据分析模型助力审计提质增效

2021-09-23 13:44何晓博刘恩航姚智琪
中国内部审计 2021年9期

何晓博 刘恩航 姚智琪

[摘要]为解决传统审计面临的资料审查覆蓋面不足、对关联资料分析不充分以及综合效率不高的问题,通过构建大数据平台和审计分析系统,融贯整合分析多源数据,快速提供直观、有价值线索的方法,推动审计效率和质量提升。初次在采办专项审计中实践应用就取得显著效果,为公司继续深化应用大数据审计提供了信心和方向。

[关键词]大数据审计   审计分析模型   采办   审计线索

一、前言

大数据不仅是一种信息资源,更是一种创新思维方式。随着越来越多的企业开启数字化转型升级,应用大数据思维和手段开展审计工作和提升审计绩效成为一种必然趋势。中国海洋石油集团有限公司全面贯彻习近平总书记在中央审计委员会第一次会议上提出的“要坚持科技强审,加强审计信息化建设”的理念,转变审计思维,强化大数据审计意识,学习大数据审计技能。随着集团公司2019年10月审计支持分析系统上线,为应用大数据开展审计工作提供了环境和条件。

本文主要以某公司采办管理专项审计为例,介绍通过大数据平台获取审计所需数据后,如何对数据进行建模分析和可视化处理,直观呈现审计线索,帮助审计师聚焦重点查证审计问题和提质增效。

采办管理是公司生产经营的关键环节,也是廉洁风险易发多发的领域,历来是审计的重点关注对象。由于采办过程存在招评标违法违规隐蔽性强、流转节点多、供应商众多、数据体量大等特点,传统审计无法快速锁定目标。审计师在审计过程中需要耗费大量的精力来分析大量结构化和非结构化数据,但还是难以全面、有效地分析出数据之间的关系,并揭示关系背后的隐含信息。

实践表明,大数据应用为提高审计效率和审计质量提供了解决方案。大数据审计的全样本和全关联特点能够帮助审计师在纷繁复杂的数据中快速发现隐藏的规律和信息,并通过可视化技术直观地展示数据间关系,帮助审计师高效地发现有价值的审计线索。

二、应用成果

本次审计聚焦“查问题、控风险、提效率、促发展”,检查评价公司采办的合规性及效益效率情况。此次审计共投入210人天资源,依托大数据审计,取得较好的应用成效和审计成果。

(一)大数据应用成效

1.基本实现审计样本全覆盖。利用审计支持分析系统等工具,实现ERP系统、采办系统、合同系统等业务数据互联互通,解决数据孤岛问题。改变以往抽样方法,通过大数据分析,审计样本覆盖率达到95%。

2.新开发10个审计分析模型。通过深入了解业务实质和流程,结合审计技术,新开发10个有针对性的审计分析模型,提高了审计线索发现的质量效率。

(二)审计成果

1.发现审计问题38个。主要包括涉嫌围标串标违法行为、存在排斥限制潜在投标人情形、供应商寻源管控不力、采办流程效率不高等重点问题。

2.向纪检部门移交相关问题线索3条。

3.促进采办时效提高10%。通过进一步厘清并压减冗余采办审批节点,消除无效耗时。

三、大数据审计的特点及实现路径

(一)定义及特点

1.定义:大数据审计是指应用大数据技术方法和工具,对数量巨大、来源分散、格式多样的企业经营管理数据开展跨组织、跨部门、跨业务、跨系统的深入挖掘与分析,提供有价值的审计线索和洞见,提升审计发现问题、评价判断和宏观分析的能力。

2.特点:与传统审计相比,大数据审计具备三个特点:一是全样本审计。从传统审计的抽样审计变为全样本审计,提高审计资料覆盖率,降低审计风险。二是全关联审计。基于大数据平台和审计分析系统,对多种类(结构化、半结构化、非结构化)的多源数据进行整合,利用数据挖掘、关联分析等技术进行数据分析,快速揭示和直观呈现出数据关系间的隐含信息,提供有价值的审计线索,提高审计发现的质量效率。同时,通过建立关联关系审计证据链,保证审计结论的可靠性。三是远程审计。大数据审计是基于云计算和大数据相关技术的联网审计,通过移动互联建立的远程审计模式,使现场审计可以实现非现场远程协同,提高审计的灵活性及工作效率。

(二)大数据审计的实现路径

根据大数据审计的实现及优化路径,可分为六个基本步骤,形成管理闭环(如图1所示)。具体内容如下:

1.明确目标。挖掘审计需求明确具体目标,根据具体目标设计所需要的参考指标和拟选取的数据范围。

2.数据采集。基于企业中已有的ERP、法律合同、采办、审计作业、MDM系统、HOS系统、BCS报表、久其报表等多源系统,运用数据库管理工具建立映射链接和访问关系,从中提取所需数据。

3.数据清洗。运用HDFS和Hive工具完成数据清洗和数据转换工作。通过对缺失数据、重复数据和异常数据进行处理,对数据类型进行转换,对数据进行排序等方式进行数据清洗,然后对格式不一致数据、不同颗粒度数据进行转换。清理转换后的数据具备进入数据仓库的存储价值和数据挖掘、关联分析等使用价值。

4.数据分析。数据分析环节是提供有价值审计线索和产生洞见的重要一环。通过结合审计技术和业务实质特点,搭建通用型和专用型数据分析模型;通过分析数据仓库中的对应数据形成审计洞察。构建数据分析模型的基本思路包括以下八种:

一是规则约束法:规则来源于制度对某业务活动发生频次、额度或时效的要求,或者对活动相关参与主体制定了量化的权限或资质要求。比如,通过设置审批权限规则并进行数据比对,发现某采办项目金额(3370万)超出该公司领导的审批权限(3000万)。

二是关联规则分析法:通过在海量数据中寻找关联关系发现审计线索。比如,通过运用Apriori关联算法,挖掘计算不同供应商参与投标及中标组合数据的绝对支持度、相对支持度、频繁项集等指标。当某频繁项集的相对支持度大于5,则较可能存在围标串标的情况。

三是依存关系分析法:根据依存关系是否存在冲突发现审计线索。比如,在库存盘点时,发现有某货物的入库验收单却没有相应的采购订单。

四是比例趋势核对分析法:根据勾稽关系对数据比例的变化趋势进行核对以发现异常。比如,在生产经营没有发生重大变化的情况下,同期主营业务收入增幅为6%,而采购总成本增幅为31%。

五是横向比对分析法:对可比物资进行横向比对发现异常。对同年同类型物资在不同分公司之间的采购价格进行横向比对,发现采办价格虚高的线索。比如,某公司对某物资的采购价格长期较其他分公司的采购价格高出2倍以上。

六是纵向对比分析法:对同类物资的历史采购类型进行统计分析,发现异常。比如,某物资出现单一来源与询价采办交替出现的情况,证明其单一来源的理由不成立。

七是复算比对分析法:利用外部数据,从不同角度进行汇总或复算,发现差异。比如,A公司系某上市公司B的第二大客户,但B披露的合同金额与A方合同系统显示的金额差异大于20%。

八是时间逻辑法:立项、寻源、竞标、中标、合同、履约、付款等采办业务活动应遵循时间顺序。当发现时间序列紊乱时,可能存在违规或者补签相关记录的可能。比如,合同履约记录日期早于合同签署日期,则表明存在未签合同先干活的违规情况。

5.数据展现。数据展现也称数据可视化。对于审计过程中抽象的大量数据,审计师很难快速发现隐藏的规律和问题。而Tableau等可视化软件可以将数据形象地展示出来,便于直观分析并高效得出结论。以发现供应商异常供货为例,图2展示了某企业全部供应商的分布图,每个大圆点代表一个部门或一个人员,红线代表已付款的供应商,蓝线代表未付款的供应商。在图2中,网络图直观地展示了供应商信息,可以帮助审计师清晰地辨识可能的异常供货行为。

6.反馈完善。通过对大数据审计的成效进行复盘分析,寻找数据选取和建模分析中的待优化点,不断迭代完善数据选取的精准度和分析模型的处理效率,始终保持算法的处理能力、先进性与企业发展的业务特点、数据增量规模相匹配。

四、应用实践

(一)寻源阶段

寻源阶段作为采办源头,是重要管理环节。审计师重点关注供应商寻源的充分性以及采办方式选择的合理性。此次审计主要应用了横向比对分析模型与纵向对比分析模型,现将不同类别问题的关键步骤及审计发现总结如下:

1.发现供应商寻源不充分线索。关键步骤:首先,审计师运用SQL(结构化查询语言)提取被审计单位过去三年参与邀请招标的供应商数据;连接SAP HANA数据服务器,读取各区域公司(如D公司、NX公司、ND公司)的供应商数据。其次,应用横向比对分析模型和可视化软件,输出同类物资使用供应商的名单及数量分布。如图3所示,不同颜色的长短代表不同单位供应商使用数量的多少。

审计发现:审计师可以直观地发现蓝色公司的水源水处理设备配件、内燃发电机配件存在供应商寻源不充分、供应商选择范围过窄的情况。

2.发现单一来源采办方式选择不合理线索。关键步骤:首先,审计师通过SAP HANA数据服务器提取各区域公司(D公司、NX公司、ND公司)的采办数据。其次,综合运用横向比对分析和纵向比对分析模型,输出同类物资使用不同采办方式的分布及数量情况。如图4所示,部分物资在ND公司采用单一来源采办方式,在其他地区则采用询价采办方式。如图5所示,部分物资在ND公司出现单一来源采办与询价采办交替出现的情况。

审计发现:审计师直观地发现起重机配件、控制阀配件部分物资的单一来源采办方式选择不合理,后续进一步检查还发现该项目在采办策略和计划阶段存在管理问题。

(二)招评标阶段

招评标阶段是采办业务的关键管理环节,占用大量的采办资源。审计师重点关注招评标过程的公平公正性以及合法合規性。此次审计主要应用了关联规则分析法模型。现将不同类型问题的关键步骤及审计发现总结如下:

1.发现存在限制、排斥潜在投标人或涉嫌串标的情形。关键步骤:首先,审计师从SAP HANA中提取招投标基本信息表。其次,在Tableau中新建计算字段(如表1所示),统计供应商中标率与废标率,并应用关联规则分析算法挖掘出不同供应商之间的关联度。随后,以供应商组合中标率为Y轴,以组合投标次数为X轴画散点图,圆点直径代表中标累计金额大小。再以组合中标率50%以及组合投标次数中位数的30次为分隔,将图6划分为四个象限,第二象限内的右上角区域为审计关注重点区域。

审计发现:审计师通过快速锁定红圈内的大额项目供应商,对其参与项目进行延伸查证,最终证实部分项目存在限制、排斥潜在投标人以及涉嫌串标的情形。

2.发现供应商围标线索。关键步骤:首先,审计师基于某一投标项目,运用爬虫技术提取不同投标单位的IP地址,与其进行匹配。其次,运用关联规则分析法模型统计分析出相同投标IP地址的关联度情况。关联度高的项目围标概率大。如图7所示,三家供应商投标IP地址相同,疑似围标。

审计发现:审计师通过跟进IP地址关联度、重复度高的线索,发现不同供应商之间存在关联关系,最终核实该供应商组合在多个项目存在恶意围标的情况。

(三)合同管理阶段

在合同管理阶段审计师重点关注是否存在低价中标高价变更的情况。此次审计主要应用了规则约束法分析模型,发现存在低价中标高价变更的情况。总结如下:

关键步骤:首先,审计师提取SAP HANA数据库中的数据表合同基本信息表,将拆分合同关键特征值写入Python中。其次,应用规则约束法分析模型,将进入价格评议第2、3、4名的价格设置为监控规则,与合同实际支付金额进行比对。如图8所示,9871个项目中共有14个项目存在变更后合同价格高于其他单位投标报价的情况。次数为0说明不超出投标报价,价格每超过1个其他单位投标报价计数1次。

审计发现:审计师经过查证、复核相关线索,最终发现某项目中标合同金额为2100万,变更金额达800万,最终结算金额为2900万。最终价格高于价格评议环节排名第二报价的2585万及第三报价的2792万,存在低价中标、高价变更的情况。

(四)采办效益评价

在采办效益评价方面,审计师重点关注同类物资采购价格的合理性,是否存在同品不同价的情况。此次审计主要应用了比例趋势核对分析法模型,发现存在个别物资价格虚高的情况。总结如下:

关键步骤:首先,审计师应用SQL提取不同区域公司曾购买过同类物资的数据(如表2所示)。其次,应用比例趋势核对分析法模型,对不同区域公司同时期采购量接近的物资采购价格基于最高价进行百分比转化后,进行比例比对分析(如图9所示)。

审计发现:审计师在查证线索后,发现A物资价格虚高背后另有隐情。

五、适用性及挑战

(一)大数据审计的适用性

在初次应用大数据审计取得一定成效后,更坚定了大数据审计转型升级的信心和前进方向。但并非每个企业都需要上线大数据审计系统,实践中还需要综合考虑企业发展阶段、业务规模及特点、数据可得性、人才等要素,再基于成本效益原则选择相匹配的模式。

本次应用大数据审计取得显著成效与具备以下几个条件密不可分:如企业信息系统比较完善;数据基础较好;管理层有战略眼光和战略定力,坚定地推进自上而下的数字化审计转型升级;审计人员开放的学习心态等。

(二)大数据审计的挑战

继续深化大数据审计应用依然任重道远,目前主要存在以下三个方面的挑战:

1.基础数据质量有待进一步提高。本次审计中发现采办系统与合同系统中数据存在断点,并且部分原始数据存在录入失误或信息系统有局限性,数据质量不高。数据清洗和转换难度大,制约大数据分析环节的价值发挥。

2.要繼续创新分析技术手段。非结构化数据的理解和分析处理还有很长的路要走,审计技术的理论突破和图像识别、语义理解算法的应用创新有助于充分挖掘非结构化数据中的数据价值,但目前仍未达到成熟应用阶段。

3.审计师的知识架构与创新思维不足。运用大数据审计手段助力审计提质增效,离不开数据模型。而建立数据模型需要审计师熟练掌握业务实质、制度流程、数据模式、逻辑关联等。

(作者单位:中国海洋石油集团有限公司南方审计中心,邮政编码:518000,电子邮箱:hexb@cnooc.com.cn)

主要参考文献

[1]陈伟.基于微信平台的互联网+IT审计教学系统研究[J].财会通讯, 2019(16):53-56

[2]靳思昌.大数据背景下国家审计服务国家治理的路径[J].财会月刊, 2016(12):105-108

[3]马迎辉,李萍.大数据审计的特征及实现路径[J].财税报道, 2018(5):226-227