刘巍 曹迎春 张伟 钟震宇
[摘要]针对现有方法的不足,结合建设项目审计实际业务特点,探索适用于通信运营企业建设项目审计的数智化审计方法。通过利用OCR等技术将非结构化数据转化为结构化数据,能够将建设项目管理过程中大量文档资料、签证记录、预算表格等转化为计算机可处理的结构化数据,然后运用RPA、NLP等人工智能技术,构建审计模型分析等方式辅助建设项目审计人员完成资料审核、准确定位审计疑点,达到降低审计风险、提高工作效率的目标。
[关键词]建设项目审计 数智化 通信运营企业
一、通信运营企业建设项目审计的内涵及现状分析
(一)通信运营企业建设项目审计的内涵
通信运营企业建设项目审计内容主要包括对通信工程类、土建类建设项目的投资立项、设计(勘察)管理、采购管理、合同管理、工程物资管理、工程管理、工程造价、竣工验收、财务管理、后评价等各环节的审查和评价。常用的建设项目审计类型包括工程预算审计、工程结算审计、竣工决算审计、全过程跟踪审计。
1.工程预算审计是指对工程预算编制的依据、过程及结果的合规性、适当性及准确性进行的审查和评价。重点审查预算编制是否真实、准确;预算项目是否与图纸相符;预算是否控制在概算允许范围内等。
2.工程结算审计是指对工程价款结算的真实性、合规性、准确性进行审查和评价。重点审查工程结算内容与设计、合同约定是否一致;工程量计算是否符合规定的计算规则、是否准确;定额选套是否合规,选用是否恰当;工程物资用量是否合理准确;设计变更、现场签证内容是否真实、合理、有效等。
3.竣工决算审计是指在竣工决算阶段对建设项目投资的真实性、合规性、经济性以及项目从立项到竣工验收的全过程管理情况进行的全面审查和评价。重点审查是否按合同约定准确结算价款;项目是否按照批准的概预算内容实施;项目建设是否履行基本建设程序,是否符合国家、公司有关建设管理制度要求等。
4.全过程跟踪审计是指在建设项目实施过程中,对项目全过程的真实性、合规性、有效性、经济性进行的跟踪审查和评价。重点审查事后无法复核及事后审计发现无法挽回损失的工程施工、建设管理活动。比如,重大设计变更、现场发生的重大非正常情况、隐蔽工程、重要物资采购、工程造价结算等关键控制点。
(二)通信运营企业建设项目审计的现状分析
通信运营企业建设项目管理流程较长,涉及的部门较多,实际审计中以结算、决算审计为主。审计送审资料来源既有通过系统提供,也有人工提供,大部分的审计项目采用委托事务所审计。审计场景也较复杂,例如结算审计中无线网络类建设项目站点分布范围广,管道类建设项目距离跨度大等,各种场景下审计的方式方法也不同。各类型审计项目作业标准流程见图1。
通信运营企业建设项目审计过程中存在的困难主要有以下五个方面。
1.管理及时性不足。管理中无法实时直接获取各单位建设项目审计需要的第一手数据,数据分析、对各单位实际业务指导相对滞后。
2.数据基础相对薄弱。档案资料、数据的信息化程度不足,建设项目实施过程中资料及数据的格式、标准、来源不规范,也不统一。
3.结构化数据积累沉淀较少。设计文件、签证材料、工程结算表、竣工决算表等都是独立的纸质文件或扫描文件、照片文件,对此类非结构化关键资料信息的解析、利用不够。
4.审计人员手工工作量大。随着5G大规模投资建设,结、决算审计的项目数量、送审金额逐年增加,而审计实施过程中信息化审计方式运用有限,且发展呈现出不均衡的局面,大部分工作仍需要人工审核,无法做到全量覆盖,难免会产生疏漏,影响审计的覆盖面、准确度。
5.数智化建设项目审计人才较少。作为传统审计业务类型,建設项目审计人才大多数为建设审计领域专才,面对数智化转型发展中需要的既懂建设项目审计业务,又懂数智化技术的复合型人才储备较少。
通过对以上现状、特点的分析,研究认为,将数智化审计技术引入通信运营企业建设项目审计过程中,需要加强信息资源整合与互联互通,并做好资料、数据的标准化、线上化、云化,构建数据审计模型、引入人工智能等技术,创新开发数智化审计工具软件,为建设项目审计数智化转型发展积累实践经验。
二、审计数智化的含义及方法
(一)审计数智化的含义
审计数智化是依照国家法规、审计准则和会计理论,在审计过程中以大数据、人工智能等新技术为基础,通过构建审计模型或运用大数据分析工具等方法,对被审计单位的财政、财务收支、经营管理活动及其相关资料的真实性、正确性、合规性、合法性、效益性进行审查、监督、评价、鉴证,以维护财经法纪、改善经营管理、提高经济效益的一项独立性的经济监督活动。
随着大数据时代的到来和移动互联网技术的快速发展,审计数据的载体变得越来越多样化,图片、照片、影像等资料承载着丰富的数据信息,为解读藏在这些信息背后的复杂关系和潜在风险,建设项目审计需要与时俱进,引入数智化审计工具来将这些非结构化数据解析为可审计的数字或文本信息,从而进一步揭示建设项目审计对象之间越来越复杂的关系。
(二)审计数智化的方法
审计方法是审计人员在审计过程中发挥审计职能完成审计任务所采取的方式、方法和技术的总称。通信运营企业建设项目审计中传统的审计方法包括:检查、盘点、观察、抽样等审计技术。在信息时代,面对纷繁复杂的数据载体,这些审计方法无法完全满足审计的需求,数智化审计结合审计业务实际,将新的人工智能技术引入审计方法中,主要方法如下。
1.OCR识别技术。OCR识别(Optical Character
Recognition,光学字符识别)技术飞速发展,可以实现对图形、扫描文本、身份证件、名片、表格中的文字识别,具体分类又可分为两类,手写体识别和印刷体识别。
OCR技術作为数智化审计非结构化数据的重要处理工具,解决了数据来源的问题。OCR技术可以降低人工成本、提升内部审计效率。
2.RPA技术。RPA(Robotics Process Automation,
机器人流程自动化)又被称为流程自动化机器人,是一种新型的人工智能的虚拟流程自动化机器人,通过模拟人的操作,根据预先设置的业务处理模型,实现业务自动化处理。模拟人工业务操作方式,加速了业务流转,减少了人力成本投入,提高了处理效率。
RPA技术在数智化审计中主要应用于业务处理流程高度重复、任务量大、处理时效要求高的场景,代替审计人员处理相应的审计任务,减少人力开销,提高审计质量。
3.NLP 技术。NLP(Natural Language Processing,
自然语言处理),就是用计算机来处理、理解以及运用人类语言(如中文、英文等),实现语法分析、语义分析、篇章理解等功能。其中,Jieba(结巴)分词技术主要是基于统计词典,构造一个前缀词典;然后利用前缀词典对输入句子进行切分,得到所有的切分可能,找出基于词频的最大切分组合。
NLP技术在数智化审计中主要应用于对工程文本文档、制度规范、定额、标准等进行词频分析,审计人员可通过该软件生成文档词云、词频分析结果,省去了人工统计的繁琐过程,能准确提取文档的关键词信息,辅助审计人员审核富文本格式的重复性、准确性,提供词频统计、词云展示等应用功能。
此外,数智化审计方法还包括机器学习、神经网络、数据挖掘、模型搭建、区块链等新技术,并且随着信息化水平的逐步提升,越来越多的高新技术方法被逐步引入审计领域。
三、数智化审计在建设项目审计中的探索与创新实践
(一)基于OCR技术的工程文档表格自动识别软件
通信运营企业建设项目实施过程中,存在大量的文档是纸质文件、扫描文件或者以照片形式保存的文件,这些文件都是非结构化数据,给审计人员审核带来很大的困难,审核过程中需要人工审阅相关内容,并将这些文件中的信息进行整理,重新建立电子表格,手工输入才能转化为结构化数据,然后再进行统计分析。
针对这一难点问题,基于OCR技术原理开发的工程文档转结构化数据表软件可以方便地将图片、PDF格式的工程文档转化为Excel表格,审计人员可通过该软件直接获得工程文档结构化数据信息,省去了人工整理信息再录入的繁琐过程。
工程文档表格图片转结构化数据表软件主要功能:一是通过OCR技术,将获取的工程文档图片信息进行灰度处理,采用自然语言处理、矩阵数组特征提取算法提取匹配文字信息,筛选形成结构化表单,完成表格重构。二是抓取表单中结构化文字,创建Excel表格,将结构化文字逐个录入表中,保存成Excel格式文件(见图2)。
(二)基于RPA技术的建设项目审计送审资料自动化审核软件
建设项目审计过程中对送审资料的审核是审计送审阶段的一项重要内容,由于送审项目数量大,每个项目的送审资料达数十项,涉及的范围包含项目建设过程中各阶段资料。比如,某公司结算审计送审资料具体包括设计图纸及预算、设计批复、验收证书、工程结算书、竣工图纸、开工报告、完工报告、交维验收报告、甲供材料领用、退库原始单据、乙供材料表及相关凭据、工程签证单、隐蔽工程验收记录、工程施工图(或竣工图)、设计变更单、工程施工合同、采购订单共17项资料。
目前,审计人员在对送审资料审核过程中由于项目数量大无法实现全覆盖审核,且需要花费大量时间通过人工方式重复比对送审资料与标准要求是否一致,有无缺漏,人工方式在实际工作中难免会产生疏漏、错误。
为提升建设项目审计送审资料审核效率及准确率,基于RPA技术开发的建设项目审计送审资料自动化核查软件,可以辅助审计人员从繁重的重复性核查工作中脱离出来。
建设项目审计送审资料自动化审核软件主要功能包括以下三个方面。一是审计人员通过工具软件左侧复选框进行选择,自定义配置适合本项目审计所需的标准化报审资料模板,可实现满足不同审计类型、不同送审标准的差异化需求(见图3)。二是自动化完成送审资料定制化审核,通过选取送审项目文件夹,即可通过程序对送审项目资料逐个审核,对照自定义配置的报审资料模板,分析判断送审资料是否满足要求,并记录审核过程。三是输出审核结果,包括项目送审资料中已通过审核的文件数量、名称,缺失的文件数量、名称,最终审核结果等信息(见图4)。
(三)基于NLP技术的工程文本分析词云、词频生成软件
在实际工作中,制度文件的健全性审核是一项主要工作,包括审计实施过程中审核建设部门是否按照国家规定和公司要求,建立健全制度体系,完成制度建设。此外,日常工作中也需要对工程制度规范、定额、标准等进行新旧版本对比、分析,掌握新旧文件之间的差异性。传统方法通过人工阅读,逐字逐句进行对比分析,然后再手工统计词频等方法得出对比结论或审核结果,需要花费大量的时间和精力。
针对这一审计过程中的难点问题,运用NLP技术开发工程文本分析词云、词频生成软件,实现词频统计、词云数据展示等应用功能,提升审计效能,加强数据化可视化呈现。
工程文本分析词云、词频生成软件主要功能包括:一是通过NLP技术,将获取的工程文本信息进行自然语言处理,采用Jieba分词技术进行分析,切分,对照Stopwords词表融合剔除非关键词等信息。生成词频统计结果,并保存在txt文件中。二是设置4个常用背景图片,可根据需求进行选取,实现数据可视化呈现,自动生成词云图片,见图5。三是可通过关键词文本文件,设置关键词,针对关键词重点统计词频信息,并生成单独的统计文件。
四、结语
本文通过探索数智化技术在通信运营企业建设项目审计中的实践,创新开发了数智化审计工具软件,聚焦于解决建设项目审计过程具体场景中的某一类问题,同时,开发的数智化审计工具软件具备敏捷开发、快速部署、迭代升级的功能。在实际工作中,结合“现场+远程+云化”审计工作新模式,实现人员、资源、能力的高效协同,能够进一步辅助建设项目审计人员提升审计工作效率,减少重复性的繁琐工作,提高审计质量,丰富审计数据可视化的呈现方式,为通信运营企业建设项目审计数智化转型发展积累实践经验,也为其他行业建设项目审计工作提供参考借鉴价值。
(作者单位:中国移动通信集团有限公司,邮政编码:100032,电子邮箱:zhongzhenyu@chinamobile.com)
主要参考文献
[1] 陈兆领.工程项目建设全过程跟踪审计体系构建及应用研究[D].杭州:浙江大学, 2015
[2] 程平,詹凯棋.基于RPA的初步分析性程序审计机器人研究[J].财会月刊, 2021(9):6
[3] 邢春玉,李莉,张莉.内部审计:从数字化到智能化[J].财会月刊, 2021(2):6
[4] 张婷婷,马明栋,王得玉.OCR文字识别技术的研究[J].计算机技术与发展, 2020(4):85-88