“审计+人工智能”在中国移动的创新应用

2020-06-21 15:34郭宇晨张国宏
中国内部审计 2020年6期
关键词:审计人工智能

郭宇晨 张国宏

[摘要]中国移动将内部审计与人工智能技术相结合,选取多个重点方向,综合运用自然语言处理、图文识别、机器学习、机器人流程自动化等先进技术,开展人工智能审计产品的创新应用,显著提升审计效率和质量。

[关键词]人工智能    审计    智能建模    流程自动化

一、信息技术发展对内部审计工作的影响

当前,以互联网、大数据、人工智能为代表的新一代信息技术蓬勃发展,对各国经济发展、社会进步、人民生活带来重大而深远的影响。从企业角度来看,新一代信息技术发展对企业内部控制环境也产生了深刻影响。一是促进企业内部管理水平的提升。企业信息化深入应用,集成化、移动化、智能化的趋势愈发明显,助推管理方式由粗放型向集约型、精细化转变。二是催生新的业态和模式。新技术进步催生出电子商务、互联网金融、数字媒体、共享经济等新的商业模式,促进企业主营业务、经营模式的变革,大型企业综合化经营、新业务创新的步伐不断加快。

企业内部控制环境的快速变化,对内部审计工作提出更高要求。一是企业业务创新加速,要求内部审计进一步发挥“前瞻预警”作用。企业新的产品形式、业务流程、对外合作方式不断涌现,带来新的风险形式,且风险特征快速变化,要求内部审计能够快速响应,在新业务发展初期就开展有效的风险评估,为新业务发展保驾护航。二是企业多元化发展,要求内部审计监督范围不断扩展。大型企业跨地域、跨市场、跨专业经营,经营风险多样化、复杂化,风险传导特征凸显,要求内部审计在更大的范围和领域开展审计工作,深入推进审计全覆盖。三是企业技术创新加速,要求审计技术方法随之不断升级。大型企业客户服务及运营管理均高度依赖信息技术,内部审计必须建立起与之相匹配的技术方法,及时获取审计资料数据,充分挖掘大数据价值,实现对业务的有效监督。

二、审计信息化的发展现状及局限

立足新时代,面对新情况,党中央、国资委、审计署均要求中央企业加强审计信息化建设、推进“科技强审”。审计信息化是内部审计发展的必然趋势,其核心目标是充分利用信息化手段,节约审计人力资源、扩大审计覆盖、提高审计精度,显著提升审计效率及效果,助力内部审计高质量发展。

目前大型企业审计信息化建设实现长足发展,普遍建立起审计相关信息系统,并不断推进审计技术创新与实践。一是实现审计管理及作业流程的信息化支撑。实现审计计划管理、现场作业管理、人员管理、档案管理、成果管理等相关功能,提高审计作业的标准化、规范化程度。二是积极储备大数据审计能力。通过采集重要信息系统的电子数据,利用大数据分析方法,对全量数据开展深度分析,提出违规问题或线索,变抽样为全量,提升了问题发现的深度。三是探索开展远程审计实务。部分公司构建大数据审计平台,通过数据接口等方式采集相关系统数据,并定期自动执行预设审计程序,实现对高风险领域的全量、准实时监控,提升审计效率,扩大审计覆盖。

尽管企业审计信息化建设取得了较好成绩,但与国家及监管要求、与企业自身对内部审计的要求相比,仍存在较大局限。一是数据采集困难。集团型企业各级单位自建系统较多,各系统数据被独立存储,“数据孤岛”现象明显,格式、口径均不统一,大范围的数据采集存在较大困难,使数据审计成为“无米之炊”。二是对非结构化数据的分析能力缺失。审计实务中大量的审计资料属于非结构化数据,如合同、会计凭证、业务单据等,传统的数据分析方法无法对此类数据开展审计,严重限制数据审计的范围。三是“机器”精准定位问题能力不足。数据审计的程序逻辑通常根据审计人员的经验设置,由于审计人员个人知识结构和工作经验的差异,程序逻辑不准确、对特殊业务情况考虑不完整等情况较为普遍,容易造成数据审计的查全率、查准率不高。四是远程审计难以适应新业务的快速变化。远程审计虽然可有效节省审计资源,但是由于现场投入审计力量较少,存在着审计结果核查不充分的问题,并且审计逻辑优化、更新速度慢,无法快速适应新业务变化。五是审计作业系统自动化程度不足。审计作业系统虽实现了审计作业的全流程线上操作,但自动化程度仍不足,在审计底稿编辑及录入、审计结果整理归档等方面仍需繁琐、重复的人工操作,制约了审计作业效率的提升。

三、人工智能技术发展现状

人工智能(Artificial Intelligence,简称AI),是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学。关于人工智能的科学研究最早发起于20世纪50年代,經过60余年的演进,相继取得一批突破性的研究成果。2010年之后,大数据、云计算、互联网等新一代信息技术的发展,为人工智能技术研究提供了更强大的运算能力和更广泛的数据资源,助力人工智能技术加速发展,促进人工智能从理论研究走向实际应用,特别是图像识别、语音识别、无人驾驶等技术应用趋于成熟,人工智能技术的社会影响日益凸显。2017年,国务院印发的《新一代人工智能发展规划》指出,“必须加快人工智能深度应用,培育壮大人工智能产业,为我国经济发展注入新动能”。

人工智能技术内涵深广,具有较多技术细分领域,通常需要多项细分技术相互衔接、组合应用。整体上,人工智能技术主要包括以下五方面能力:一是感知识别能力。自动从图像中识别物体、场景,可应用于人脸识别、签名识别等场景;自动对声音进行识别和处理,可应用于机器翻译、语音书写等场景。二是知识计算能力。以知识图谱、自然语言处理技术(NLP)为主要代表,能够持续获取知识信息,具备实体识别、知识演化建模和关系挖掘能力,在搜索引擎、智能广告、反洗钱等领域得到应用。三是认知推理能力。以近年来发展迅速的深度学习、强化学习等机器学习技术为代表,能够基于数据自动分析、挖掘、推理、演化,构建分析推理引擎,形成对客观事物的认知,其认知能力甚至超过人类,如在金融股价预测、疾病预测等领域得到应用。四是运动执行能力。以智能机器人、机器人流程自动化技术(RPA)为主要代表,把感知识别能力、知识计算等能力与机械自动化、系统自动化技术相结合,使机器人拥有判断、决策能力,能够在不同的环境中处理不同的任务。五是人机交互能力。“机器”通过交互方式为人提供信息,如苹果手机助手Siri、智能客服等应用;人帮助“机器”提升认知能力,如在机器学习技术的应用中,通常需要人对于机器产生结果的正确性进行判断,并反馈给机器,机器根据反馈信息进一步优化算法,提升其准确性。

四、“审计+人工智能”思路

人工智能部分细分技术已初步达到可商用的成熟度,但在审计领域尚鲜有应用案例。综合分析审计信息化亟待解决的突出问题及人工智能技术发展现状发现,将审计实务与人工智能技术相结合具有广阔的发展前景。“审计+人工智能”创新的核心思路是利用人工智能技术扩展审计人员的“眼”“脑”“手”,替代审计人工的“数字劳动力”。

一是运用自然语言处理、图像识别技术,实现非结构化数据的分析处理,扩展数据审计范围。合同、会计凭证、业务单据等非结构化数据是记录公司主要经济事项的重要媒介,是众多审计项目均涉及的审计资料。但由于资料数量庞大,实际审计中抽样率较低,问题较难发现,审计风险高。利用自然语言处理、图像识别技术,可自动识别合同文档、会计凭证及业务单据影像资料中的关键信息,将每份非结构化资料转化为一组标准化的结构化数据,再利用传统数据审计方法进行自动处理得出审计结果,这样可有效替代人工查阅原始资料的过程,大幅提升审计效率,扩大数据审计覆盖领域,扩展审计人员的“眼”。

二是运用机器学习技术,自动构建并持续优化数据审计模型,提升远程审计精度。部分违规行为操作复杂、隐蔽性强,且为逃避监督经常变换违规形式,如员工在业务运营系统中的违规操作、合作商违规套取企业营销资源等,其违规行为的特征不易人为把握,造成对应的数据审计模型准确率低,且滞后于违规形式的变化。引入机器学习技术,使用海量业务数据开展模型训练,由“机器”自动提炼违规行为特征、构建智能模型,并根据最新的业务数据自动优化、调整模型,可有效提升审计模型精度,扩展审计人员的“脑”。

三是运用机器人流程自动化技术,实现审计作业部分关键流程的自动化处理,提升审计作业效率。在审计作业过程中,部分工作不可或缺,但工作本身简单、重复、耗时耗力,利用机器人流程自动化技术,编制自动化执行程序,由机器代替人工执行相关操作,打造“审计机器人”,如审计资料的自动下载、互联网上批量信息的自动查询、审计作业底稿及确认单的自动整理及上传归档等,可有效提升审计作业效率,扩展审计人员的“手”。

五、“审计+人工智能”创新应用

中国移动充分利用公司信息化优势,创新性地提出构建“全信息交互智慧审计体系”发展目标,相继研发了合同智能审计、凭证智能审计、数据审计智能建模、“审计机器人”自动化作业等产品,并应用于审计实践,显著提升了审计效率及质量,如图1所示。

(一)合同智能审计产品

中国移动作为大型中央企业,下属50余家单位,业务范围广、客户数量多,每年对外签订合同数量超百万份,亟需通过智能审计技术实现合同自动审计能力。

1.产品功能。合同智能审计产品的核心能力包括合同文档识别、合同关键信息提取及合同审计模型,其中合同文档识别能力,可以利用深度学习技术构建文档分类器,可以从档案系统、合同系统的电子化归档资料中自动识别出合同文本;合同关键信息提取能力,可以利用深度学习技术构建关键信息识别模型,自动从合同文本中提取出甲乙方信息、合同金额、质保期、知识产权条款及归属、违约条款、合同标的、付款计划等31项关键信息,并将其转化为结构化信息进行存储;合同审计模型能力,可以基于大数据技术,将上述合同关键信息与报账平台、采购系统、智慧审计等系统中的相关结构化信息进行关联分析,固化审计模型,自动出具审计结果。如图2所示。

2.研发难点及对策。研发难点主要在于合同个性化程度高,样本差异性大,对智能算法的普适性带来较大挑战。原因是各所属单位合同管理水平参差不齐,各单位合同模板的数量、格式、内容差异较大,且大部分合同实际并未按照合同标准模板编制。实际研发中,一是需要投入较多人力对不同单位不同类别的合同样本进行人工标注,标注出希望机器自动识别的关键信息,交给深度学习算法进行训练;二是对于个性化程度特别明显的合同类别,需要单独训练识别模型,解决通用集成模型对此类样本识别率不高的问题。

3.研发成果。合同智能审计产品基于部分所属单位数据开展智能算法的训练及结果验证,已完成产品化封装,并在经济责任审计、内部控制审计及远程数据审计中得到推广使用。根据实测结果,合同文档的识别正确率超过96%,合同文档中关键信息的平均识别准确率达到95%;机器自动处理单个合同文档的时间仅需0.04秒。以每年100万份合同进行估算,假设人工审计需20分钟/份,人工全量审计需167个审计人员工作一年,而机器全量审计仅需0.5天,成效显而易见。目前产品已上线16个智能审计模型,在实际审计中发现合同关键要素缺失、預付款比例约定过高、未达质保期提前支付款项、合同预付款比例超过公司规定等传统数据审计无法发现的问题,有效扩展了数据审计监督范围。

(二)凭证智能审计产品

中国移动全集团每年的报账单据数量超千万,其中增值税发票(包括专票/普票)、火车票是全国范围内格式统一的票据,也是公司成本费用报账单中的主要票据。研发凭证智能审计产品可有效替代审计人员现场翻阅账本。

1.产品功能。凭证智能审计产品与合同智能审计产品较为相似,均是对非结构化数据的加工和处理。产品的核心能力包括凭证类型识别、凭证关键信息提取及凭证审计模型,其中凭证类型识别能力,是利用图像识别技术构建凭证分类器,可以从财务电子影像系统的报账单图片中自动识别出增值税发票、火车票;凭证关键信息提取能力,是利用深度学习技术训练文字识别(OCR)模型,自动从凭证影像中提取增值税发票号码、购买方及销售方信息、金额、税率等25个字段,火车票的席别、价格、出发到达地、姓名等8个字段,并将其转化为结构化信息进行存储;凭证审计模型能力,是基于大数据技术,将上述合同关键信息与报账平台、供应链等系统中的相关结构化信息进行关联分析,固化审计模型,自动出具审计结果。

2.研发难点及对策。凭证格式虽比较规范,但凭证图像的质量、凭证张贴的规范性增大了样本的差异性,从而对智能算法的普适性带来较大挑战。一是由于各所属单位采集凭证图像所用的设备不同、像素大小及灯光条件不一致,造成部分图像质量偏低,影响识别精度。二是由于凭证张贴人员遍布全公司,张贴过程中易造成的折痕、遮挡,以及部分单位要求相关经办人员在票据上签字等因素,这些都对图像文字分割及识别增加了难度。实际研发中,一要加大对于不同场景下样本的标注力度;二要充分利用先验知识,对部分错误识别结果进行矫正,如增值税发票的价税合计、金额、税额、税率应具备数学校验关系。

3.研发成果。凭证智能审计产品基于部分所属单位数据开展智能算法的训练及结果验证,也已完成产品化封装,并在财务审计、经济责任审计及远程数据审计中得到推广使用。根据实测结果,凭证图像的分类正确率超过95%,凭证影像中关键信息的平均识别达到83%,其中错误识别主要由于样本图像质量偏低导致;机器自动处理单个凭证文件的时间仅需0.38秒。以每年500万份凭证进行估算,假设人工审计需5分钟/份,人工全量审计需210个审计人员工作一年,而機器全量审计仅需25天。目前产品已上线12个智能审计模型,在实际审计中发现了违规业务招待、连号发票拆分报账规避审批、发票与合同收款方不一致等传统数据审计无法发现的问题。

(三)数据审计智能建模产品

中国移动内部审计对部分高风险领域开展了持续审计实务,按月持续监控违规行为,出具审计报告,促进相关单位持续完善管控机制,降低违规风险。但也存在持续审计模型运行一段时间后,模型准确性有所降低的问题。为此,利用机器学习技术自动建立审计模型,可促进审计模型准确性的提升。

1.产品功能。数据审计智能建模产品集监督学习、无监督学习、深度学习等相关机器学习算法,并与审计数据集市对接,可供数据审计人员研究及训练智能模型。产品的核心流程包括特征选择、模型训练、结果验证及优化反馈。以员工异常业务操作审计为例,如图3所示,在特征选择阶段,首先通过审计人员的业务理解,圈选出可能与员工违规行为相关的数据特征,如员工单次及累计转账金额、方差,转账业务类型、转账时间、转账客户性质、客户是否存在欠费、所在营业厅性质、所属公司等30余项数据特征,由机器通过随机森林、主成分分析(PCA)等方法,从中筛选出可能的特征组合,形成特征空间;在模型训练阶段,由于违规行为发现率低,带违规“标签”的业务数据较少,采用无监督学习方法,通过聚类算法,将业务数据按其特征值聚成若干数据集,对于明显偏离各数据集的少量游离样本,判断为异常业务样本,作为审计结果输出;在结果验证阶段,审计人员对模型提示出的异常结果进行核查,将结果正确与否反馈给“机器”,增加带“标签”的训练样本;在优化反馈阶段,模型根据人工反馈进行自适应调整,优化分类算法,不断提升模型精度。

2.研发难点及对策。机器学习的难点在于选择合适的特征及模型,以及快速适应违规特征的变化。实践中,一要注重模型的查全率及查准率的平衡。查全率及查准率是一对此消彼长的参数,进行模型训练时,如查准率设定过高,虽然结果准确性高但会遗漏较多的违规案例;相反,如查全率设置过高,虽能发现较多的违规案例但结果准确性不高。二要加强模型结果的核查力度。将远程审计与现场审计充分结合,对数据审计得出的异常结果线索进行充分核实,及时梳理违规行为的业务特征及适用模型,反馈给“机器”做强化训练。

3.研发成果。智能建模技术在员工异常业务操作、集团客户违规流量转售等数据审计专题中实施,有效发现了违规向内部员工或家属赠费、用于系统功能验证的赠费未事后回收、利用营销折扣差价转售流量套利等传统人为预设模型无法发现的违规问题,提升了数据审计的问题发现深度。

(四)“审计机器人”产品

根据流程诊断结果,审计人员在审计作业流程中大量的时间用于收集审计资料、整理审计作业底稿,大量占用本应用于审计查证工作的时间。“审计机器人”产品主要集成各类自动化工具,可以有效提升审计人员工作效率。

1.产品功能。“审计机器人”产品主要集成各类自动化脚本技术,可支持审计人员根据业务场景,自助开发或集成相关脚本,执行特定的自动化处理工作。目前常用的集成脚本主要集中于审计数据采集及审计资料归档上传。审计数据采集功能主要应用于从企业内外部系统中自动下载数据,弥补审计数据源的不足,如编制自动化脚本,自动从被审计单位OA系统中下载各项制度文件,自动从政府网站下载合作公司的工商企业注册信息等;审计资料归档上传功能主要表现为根据审计人员现场作业中形成的审计底稿、审计确认单中的信息,按审计流程系统中规定的格式,自动填充相关字段、上传相关文档及扫描件,实现审计人员对作业底稿及确认单的一次编辑、一键上传。

2.研发难点及对策。机器人流程自动化技术相对成熟、开发过程也较为简单,实际研发中需重点关注的事项是自动化脚本需针对具体应用场景实施个性化开发。比如,数据下载的应用场景、源系统的访问方式变化或页面格式变化均会导致原有脚本不可用,需重新定制开发,因此自动化脚本在每次使用前需预留时间进行开发及验证。

3.研发成果。审计机器人产品在多个审计项目中试点应用,取得了良好的效果。比如,部分项目应用该产品从政府网站下载合作公司的工商企业注册信息并与采购系统中数据进行对比,实现了现场审计从抽样审计到全量审计的转变,仅用数小时就完成了全部比对工作,输出审计结果。作业底稿及确认单的自动归档及上传功能,将审计底稿归档周期由平均5天降至1天,有效提升了审计作业效率。

六、实践经验总结

1.人工智能技术需与大数据、云计算技术充分融合,协同推进内部审计信息化建设。深度学习、强化学习等人工智能新技术,需要庞大数据量的训练样本、高性能的计算资源,如合同审计仅初始训练样本就需1万份以上的合同文件,员工异常业务操作模型建模所需训练样本超千万条,需要高性能服务器集群、高性能GPU等资源完成相关训练任务。海量的审计数据集市、高性能的审计云计算平台是智能审计创新的基础,应共同作为内部审计信息化发展的主要抓手,通盘考虑、统筹规划。

2.正确认识人工智能技术本身的局限性,切忌铺大面、迈大步。智能审计应用效果虽已初现,但要认识到,当前人工智能技术的泛化能力还不够强,相关模型需要针对应用场景、具体使用需求进行针对化的定制训练,如针对增值税发票的识别模型用于火车票识别则完全不适用,所以需使用不同的模型。而每一个模型的构建过程需要大数据的训练,需要在人工标注、算法调优、模型优化等方面持续投入资源。因此审计部门需认真分析,选取对审计效率提升最明显且技术可行的少量重点领域,作为智能审计的突破口,并持续性给予投入。

3.促进数据审计与现场审计的协同,建立高效的智能审计结果核查反馈机制。智能审计的模型优化依赖于持续不断的新增数据,尤其是经过人为验证并标注过的“标签”数据。对于模型结果尽可能迅速、广泛地进行验证,对模型准确率的提升效果最为明显。内审部门要积极创新工作模式,促进数据审计与现场审计的充分协同、加强模型结果核查及反馈,通过循环迭代的交互方式不断提升智能审计的效果。

4.持续提升业务管理水平,为智能审计提供更加有利的实施条件。业务管理的集中化、标准化程度越高,相关业务数据的噪音越少,样本方差越小,就越利于解决人工智能技术泛化能力不强的现实问题,如通过凭证智能审计,推进财务部门统一凭证影像的采集设备及采集规范,可以提升凭证图像识别产品的精度,实现技术与管理的相互促进。

(作者单位:中国移动通信集团有限公司,邮政编码:100033,电子邮箱:guoyuchen@chinamobile.com)

主要参考文献

陈俊,时现.审计全覆盖驱动下的审计技术方法创新研究[J].审计研究, 2018(5):22-29

刘娟.大数据联网审计模式探析[J].中国审计, 2018(3):55-56

曾繁荣.人工智能审计:IIA的框架与应用导向[J].中国内部审计, 2018(12):9-13

[美]罗素,诺维格.殷建华等译.人工智能:一种现代的方法[M].北京:清华大学出版社, 2013

[美]米歇尔.曾华军等译.机器学习[M].北京:机械工业出版社, 2008

猜你喜欢
审计人工智能
人工智能之父
2019:人工智能
人工智能与就业
数读人工智能
浅谈工程结算审计的方法与实践经验
下一幕,人工智能!
下一幕,人工智能!
从国家治理看审计反腐倡廉的作用