李源 王一鹏 魏强 张帆
[摘要]习近平总书记在中央审计委员会第一次会议上提出的“要加强科技强审,加强审计信息化建设”,为内部审计技术方法的变革与创新发展指明了方向。基于此,本文介绍了“人工智能”的含义及目前发展状况,较为详细地研究了人工智能在商业银行内部审计中的应用,以期在人工智能背景下,为商业银行内部审计的进一步发展提供参考。
[关键词]人工智能 内部审计 商业银行
在1956年的Dartmouth学会中,学者们首次提出“人工智能”一词,指出其可以对人类的思想、逻辑甚至意识等进行模拟和体现,人工智能的研究范畴十分广泛,涵盖了智能搜索、知识表现、知识获取、模式识别、机器学习等。经过几十年的发展,人工智能已经广泛应用于制造业、医疗卫生、航空发展、环境治理、社会治安等各个不同行业,不仅一定程度上降低了人力成本、物力成本,而且极大地提高了处理简单而繁琐事件甚至危机事件的质量和效率。
当前,越来越多的审计业务开始利用人工智能技术进行作业,各企业不断增加人工智能技术的研究投入,全力构建“云审计”平台。流程自动化、商业智能的移动、大数据分析服务使审计方法、模式及效率效果在很大程度上发生了改变;数字化技术在审计中的科学运用,将审计人员从复杂的批量工作中解放出来,使其从事更高质量的工作,同时也使得审计行业的技术得到了变革和快速发展。
与此同时,越来越多的商业银行在业务受理、客户服务等业务中不断开启数字化转型之门。数字化转型不仅提高了银行客户的满意度,而且极大地提升了银行的运营效率,有效地降低了营运成本,但也给传统的银行风险管理模式带来巨大挑战。内部审计部门不仅要在面临风险时迅速提出解决方案,更要对可能发生的风险保持密切关注;除对传统的业务合规及运营风险保持关注外,还需警觉数字化环境所带来的新风险,如网络安全风险、全渠道数字化运营风险、数据模型算法风险等。
一、人工智能在商业银行内部审计中的应用
商业银行的审计数据包括内部数据和外部数据。外部数据主要包括客户的基本信息、财务报告、经营状况、法人资信、关联关系等诸多方面;内部数据主要包括财务报告、贷款余额、个贷份额、存贷定价等。基于人工智能技术的内部审计实施程序主要包括以下三个步骤。
(一)审计数据的获取
1.外部数据的获取。在商业银行的信贷客户中,存在着大量中小或小微企业,由于信息不对称,这些企业的信息往往由客户自己报送。内部审计部门在验证材料的真实性时,难以搜索并整合企业客户的财务信息、工商信息或者税务信息。对于客户资料造假或者客户经理粉饰客户信息等风险行为,内部审计很难识别与核实。网络爬虫技术会自动在互联网上获取有关客户的各类信息,如客户是否已进入失信人员名单,股权是否被冻结以及是否存在违反税收法律的行为,是否有过少支付工人工资或者拖欠工程款的情况,其工作原理如图1所示。利用网络爬虫技术,配合各种大数据识别技术,可以快速从外部收集到大量有价值的数据,包括政府公开数据、企业官网数据、社交数据等,内部审计部门通过获取客户动态数据建立客户的全景图像。为确保审计范围的有效性和审计结果的及时性,可根据以上数据检查客户实际业务和提交材料的一致性,并判别数据的真实性。如在公司贷款真实性年度审计中,内部审计人员要了解客户的基本情况、营运状况及关联方关系等,就需要登录人民银行企业征信系统、个人征信系统、国家企业信用信息公示系统等多个外部系统及相关行内系统,逐一查询并下载客户信息,进行交叉比对验证,这一过程相当耗费时间及精力。借助网络爬虫技术,可以收集政府网站、公司官方网站、社交媒体网站等渠道中与公司相关的信息,形成外部数据集市,并进一步将银行内部的数据与外部数据相结合,从而丰富客户信息,如图2所示。
2.内部数据的获取。为应对日益严峻的监管环境和银行业复杂的业务情景,内部审计部门希望比以往更多地使用自动化、连续、低成本的审计工具。机器人流程自动化有助于在内部审计周期内完成自助式内部审计,以解决银行业内部审计周期长、高沟通成本和繁重重复性工作的业务问题。表1显示了数据收集、自动化测试、自动文档审查、自动化底稿准备和内部审计项目管理等工作项。在内部审计过程中,机器人流程自动化技术有利于帮助内部审计人员管理审计项目,完成文件初步审计,自动化并持续收集审计证据,并完成审计底稿的初步撰写工作,显著提高银行内部审计的时效性。审计人员通常应根据上一年的审计数据需求,结合当下的监管要求和行业业务发展近况,每年更新年度审计数据资料。机器人过程自动化的使用不仅可以根据既定规则自动检索存储在系统中的各种数据如业务账户、信贷协议、授信审批文档等各种审计文档,且不受系统基础结构、地理条件和时间制约。审计信息将通过电子邮件自动报告给审计经理,并在邮件中报告数据采集过程中出现的问题,以便管理员能够及时了解由于系统更改而无法获取数据的情况,从而优化机器人流程自动化获取资料的能力。随着机器人流程自动化技术的利用,降低了沟通成本和审计人员的重复性工作,减少了内部审计工作对其他业务条线日常运营的影响。银行不仅建立了持续一致的内部审计方法,而且银行的内部审计人员充分利用其优点,以更充足的精力和智慧去应对新环境和新业务中可能产生的新风险。在新的审计环境中可以最大限度地发挥内部审计的重要作用,实现加强风险管理,促进合规性和改善内部控制体系的战略目标。利用机器人流程自动化技术,内部审计人员通过系统完成简单而重复性的工作,节约了大量时间,从而实现内部审计的创新,使银行内部审计提升到持续、全面和智能的新层次。
(二)审计数据的处理
1.语音数据处理。客户是银行的价值资产,也是反应产品好坏的资源。银行可以通过客户反馈的诉求和建议识别操作风险,尤其是客户投诉反映問题既能完全涵盖银行业务,又能为内部审计人员提供问题线索。然而,在过去内部审计人员几乎不可能通过客户的电话记录来发现问题,主要原因在于:一是语音数据储存空间大、存储时间长、语音数量多,导致人工信息识别效率过低;二是抽查语音无法系统、全面地提取有价值的信息。自动语音识别技术是一种可以将人类语言转换为文本的技术,如图3所示。自动语音识别技术将语音转换为数字信号,将其分析为对应的单词或语句,然后对语音前后句进行语义解析,并利用卷积神经网络模型智能地校正词汇。自动语音识别技术帮助内部审计人员自动转写,分析和提取有价值的信息和特定的风险事件,识别“理财亏损”“本金损失”等关键词,了解客户投诉,并通过解析语言数据,明确投诉时间、地点和人物。如银行理财销售均有电话录音,可根据销售发生的时间和销售人员获取这条理财销售的录音并转化为文本,确认该销售人员违规对非银行产品进行代销,然后继续利用自动语音识别技术将此销售人员最近几年的录音全部转换成文字,分析是否有类似的销售违规行为。
2.图像数据处理。文字识别技术是将扫描后的文字图片,经预处理、切分、特征提取、匹配及模型训练等步骤变成可编辑文本的一种技术。随着数字化时代的发展,许多银行已开始应用这一新技术。如银行后台可通过用户在手机银行上传身份证照片实现身份证号和到期日期等信息的提取;业务经理可通过扫描客户填写的信息表来收集性别、学历等信息。在内部审计过程中,文字识别技术是将图片上的信息变成可编辑的文本,为人工智能下的内部审计提供更全面的审计证据。该技术降低了内部审计人员审计数据采集的工作量,使得全量样本审计成为可能,降低抽样带来的系统性风险。在内部审计人员的不断探索下,文字识别技术将运用到更多工作环节中,为内部审计工作带来重大变革,如图4所示。在公司信用风险年度审计中,审计人员需从系统中随机选择100个有贷款的对公客户信息,把贷款的用途与许可证范围进行比对,看是否存在舞弊的嫌疑。这意味着审计人员每年要手工录入并核对100个企业营业执照上的企业名称、相应的统一社会信用代码以及企业的经营范围等相关信息后,才能开始后续的审计工作。此外,100份样本并不能完整反映贷款投向的合理性,容易遗漏高风险样本。而在应用此技术后,审计人员只需获得所有企业营业执照的完整图片,再使用文字识别工具,就能获取可编辑的文字信息,然后用自动化工具聚合所有业务许可证信息以生成表单,从而大大压缩审计人员的工作时间,使处理效率提高80%。自动化水平与信息处理速度的提高使内部审计实现对全量数据的审核,有效降低因抽样审核而丢失关键信息的风险,并提高审核的质量。
(三)审计数据的分析
人工智能的核心在于机器学习,机器学习是人工智能技术的一种应用模式,可以让计算机主动学习,不需要明确地编程告诉计算机怎么做。机器学习可以让银行快速地从其数据中获得有价值的信息,减少风险,实现流程自动化,改善与客户的互动过程。
机器学习算法分为监督学习和无监督学习。监督学习就是把过去学到的经验应用于新数据中,而根据数据的集中度进行推断就是无监督学习。机器学习应用于审计时,首先要确定目标,即确定希望机器处理此前依靠审计人员知识或直觉来处理的业务;其次要训练数据,收集并准备好相关数据支持分析,如果学习目标包括审计人员判断,则还需要收集历史上的正确判断案例;最后要确定算法,算法会识别训练数据中的模式,使程序判断哪种情况是好,哪种情况需要进行预警。基于机器学习的预警规则确定流程如图5所示。
在银行审计指标预警规则的确认中,如果想通过对比其他机构来找出某一机构的异常点,则需确定合适的对比环境,即对比对象必须为该机构的对标行。对标行就是在同一机构层级某种业务规模相近的一群机构。在对标行内进行比较,才能更客观并准确地确定异常情况。因此,可以通过无监督学习中的K-Means聚类算法来获取对标行,聚类分析能够把具有相似特点的信息归为同一簇,把具有不同特点的信息放入不同的簇,从而确定对标行,以实现数据之间的横向比较,方便机构间的互相学习,促进彼此的进步。之后通过Z得分算法,设定反映总体环境中异常程度的指标,从而实现事前预警的效果。
如在银行绩效考核指标真实性专项审计中,个别分行批量对久悬户解除设置,并通过柜面存现等方式使客户达到结算交易笔数的考核条件,以满足客户维度考核指标中“剔除久悬户”的要求。利用K-Means聚类算法可选出审计对象的对标行,并根据对标行的均值,计算出Z得分指标,从而确认预警值。当触发预警规则时,审计人员可以第一时间得到反馈,并对发生的风险及时进行排查与汇报,相较于传统审计,利用机器学习技术监控,审计工作效率和时效性大大提高。
二、基于人工智能的计算机审计系统研究
智能化计算机审计总体设计,按照审计阶段的不同,可以划分成两个部分,也就是内部控制评价系统和实质性智能测试系统。根据计算机审计不同作业模式,可以进行审计智能Agent设计与审计数据分析的模型研究。
(一)基于智能Agent技术的内部审计模式设计
智能Agent内部审计主系统由知识库与规则库及协作推理Agent组成,知识库中含有内部审计证据和外部审计证据等相关资料,并对审计要点进行持续的积累和汇总,对相关标准进行进一步细化和拆分后,再反馈给采集与分析Agent,协作推理Agent根据审计人员设计的流程以及事件的推进不断完善和改进该过程。这种混合式的持续审计方法不仅能够审计微观问题,如某项详细的交易测试,以考察是否达到相应的控制效果,而且也能够在宏观层面进行审计研究,如对某个行业的风险进行综合评估等。基于智能Agent技术的持续内部审计系统包括嵌入模块、数据的采集与转置、数据的分析挖掘和报告结果三个部分。
(二)基于数据挖掘的智能审计应用
数据挖掘技术的应用需要专业的数据挖掘人员,审计人员应与其协调配合完成这一过程。数据挖掘系统的基本结构如图6所示。
在互联网信息技术的推动下,数据挖掘系统的内部审计研究使现有的审计工作更加数字化,让标准更加明确,增加审计工作的针对性,减少不可预期的误差,降低审计风险,同时保证审计的质量和时效性。
三、人工智能在商业银行内部审计应用中可能产生的不利影响
(一)在数据采集方面产生的不利影响
在数据采集方面,人工智能的发展企图在商业银行内部审计的应用中尽可能提高審计数据的真实性和完整性,但目前大数据高噪音、低密度的特点显而易见,尽管商业银行内部的结构化数据具有较高的真实性,但仍不能排除主客观因素导致的数据偏差甚至错误,这无疑增加了人工智能商业银行内部审计的系统性风险。
如在债券风险评估、银行信贷检查中,对于发债企业、贷款客户信用风险的分析不仅基于企业的基本面分析(财务状况),企业的舆情信息也是人工智能模型分析的重点。而舆情分析涉及金融文本等非结构化数据,其来源为众多的新闻网站。随着有价值的新闻网站被不断发掘,舆情监控也随之扩大,人工智能模型在最初训练时的数据源和后续的数据来源将有所不同。而数据源的变化将很有可能导致数据特征的迁移,如不同新闻网站的编辑具有不同写作风格及词语表达,最后可能导致最初的模型逐渐失效。一个比较好的做法是,对人工智能模型根据每天或一个时间窗口内的新增数据进行模型全量或增量优化训练,确保人工智能模型适用于最新的数据源。
(二)在数据处理和存储方面产生的不利影響
在数据处理和存储方面,对于来自不同数据源的信息,我们希望能够进行标准化的处理,并进行统一协调存储,但是因为商业银行各种业务运行模式的不同,审计证据的存在形式也必然不同。过度的数据简化和统一化易实现数据的标准化,但必然会导致部分个性化数据的丢失,如果针对不同的业务模式制定不同的数据规范方法,则又会影响数据效果的标准化,这种矛盾必然会带来系统风险的增加。
(三)在数据分析方面产生的不利影响
在数据分析方面,尽管人工智能能够在一定程度上通过所获取的信息找到审计疑点,锁定审计重点并提出解决方案,但是大数据本身的广阔性和复杂性也显而易见,这有可能会对评估分析模型的准确性造成影响,这种人工智能所带来的数据分析方面的固有风险,也是商业银行内部审计应用人工智能所带来的系统风险。
如在债券风险评估中,人工智能模型使用大量动态的结构化和非结构化数据源来为发债企业预警结果提供风险权重,包括发债企业财务数据、经营数据、行业和地区数据、舆情数据、债券交易数据等。重要的是评估其结果与那些仅使用静态和一些可识别的决策驱动因素的非人工智能系统所产生的结果是否一致,并了解产生偏差的基本原理。人工智能模型的输出结果往往需要经过人工的确认,因此模型使用和运维人员是否具备足够的专业性也特别需要关注。
此外,从更宏观的角度来讲,人工智能的应用还会导致故障排解与监管成本的提升,体现在两方面:一是因人工智能系统本身的风险性与复杂性较高,故障调节成本较高;二是人工智能改变传统行为模式,行为监管及责任界定的判定将变得非常困难。如因人工智能自身的学习、决策机制出现的行为难以追究,因开发设计者人为造成的恶意行为责任主体难以判定,其后出现的连锁反应的处理成本也会增加。
四、基于人工智能的内部审计模式管理对策
(一)提升内部审计人员的综合素质和参与度
首先,要提升内部审计人员分析发现潜在风险的能力,能够正确识别人工智能模型所展示出来的数据结果的实质内涵;其次,要全面掌握人工智能技术内部控制的特点,以保证能够更全面地看待和分析人工智能数据结果,更高效地完成内部审计工作;最后,要着力提升内部审计人员的管理才能,树立全局观念,充分发挥内部审计的增值功能。
(二)确保内部审计数据的安全性
数据是保证人工智能技术有效运行的基础。商业银行的内部审计掌握着大量的数据,而黑客和数据泄漏的普遍存在,使得数据安全成为人工智能背景下商业银行内部审计必须考虑的问题,因此,要围绕数据核心打造全方位、高速度、高质量的数据防范体系,以数据为核心,助力内部审计的风险管理,充分利用目前的网络安全技术,更深层次地把握和洞察风险隐患,排解可能出现的安全故障。此外,还要确保银行数据信息系统的安全,保证相关业务人员、财务人员在内部系统进行数据传递时的安全可靠。
(三)提高对审计沟通的重视程度
即使在人工智能时代,内部审计人员在日常的工作当中,也不能忽视审计沟通的重要性,由于内部审计问题的个性化,有些审计疑点必须要进行有效的沟通才能提出更具针对性的审计方案。沟通必须重视运用大数据,借助大数据技术来了解银行内部整体的风险控制状况,为人工智能背景下进一步提高审计工作质量和水平打下良好基础。这种沟通的过程,也可能促进人工智能解决方案的改进,可以说,这种改进可能比人工智能最初的开发成果更具有实践性和针对性,更加强调了审计沟通的重要性。
(作者单位:招行银行审计部沈阳分部,邮政编码:110000,电子邮箱:wudiliyuan@cmbchina.com)
主要参考文献
何曙光,赵安命,詹向勇,康滔滔,郭世钿,许灵.大数据网络化环境下银行内部审计的思考[J].中国内部审计, 2016(11):4-9
李视磊.基于人工智能技术的审计模式发展的思考[J].财经界(学术版), 2018(14):111-112
王李莹.金融科技下商业银行内部审计[J].财经界, 2018(12):163-164
王志成.关于深化金融审计的几点思考[J].审计研究, 2018(04):7-11
张凤元,皮雨鑫,刘美佳.将人工智能应用于审计的研究[J].对外经贸, 2016(12):158-160