徐建卫 张懿 周桐
[摘要]知识图谱技术为商业银行非现场审计提供了新工具。目前知识图谱已在审计知识查询检索、业务主体关系识别、金融账户交易监测、金融欺诈风险防范等商业银行非现场审计场景中得到运用,但数据治理能力不足、部门间协同程度较低、技术门槛制约以及内外部数据割裂等问题制约了知识图谱使用范围的扩大和作用的发挥。未来可从加强数据治理、升级应用平台、强化信息技术运用等方面着手,推动知识图谱技术在更多非现场审计场景中发挥其特有价值。
[关键词]知识图谱 商业银行 非现场审计
非现场审计是在现代信息处理和传递方式下发展起来的一种远程审计监督方式,它通过收集、整理和分析审计对象的业务经营管理数据资料,查找审计对象经营管理中存在的问题,评价其风险程度,为现场审计提供审计线索,为编制审计计划以及安排审计资源提供依据。非现场审计作用的发挥取决于大数据分析与信息处理技术的运用。作为一种大数据分析技术,知识图谱因具有强大的理解、推理和计算能力而受到关注,自谷歌公司于2012年推出基于知识图谱的搜索引擎之后,知识图谱逐渐在智能问答、舆情分析、数据挖掘和深度学习等领域得到运用。近年来,部分国内商业银行开始将知识图谱运用到非现场审计业务中。结合对部分银行的调研,本文对知识图谱技术在商业银行非现场审计中的运用条件、运用场景、面临的困境进行梳理和分析,并就如何推进知识图谱在银行非现场审计中的深度运用提出建议。
一、知识图谱在商业银行非现场审计中的运用条件
随着智慧金融的不断发展和图谱技术的不断完善,知识图谱技术运用商业银行内部审计中已经具备较好的基础和条件。
(一)商业银行具备运用知识图谱的基础环境
首先,银行业因与数据的高度相关性,成为最先应用大数据技术的行业之一。中国商业银行业在经历了金融信息化、互联网金融、金融科技等阶段后,正向智慧金融阶段迈进。作为智慧银行的重要构成部分,内部审计的智能化逐渐受到银行管理层的重视。银行智能化发展趋势为知识图谱的运用提供了环境。其次,商业银行支付结算和账户交易体系完备,在经营管理活动中累积了海量业务数据。这些数据为知识图谱技术的应用提供了强大支撑。最后,作为实力雄厚的知识密集型传统金融服务业,商业银行具有大数据和人工智能运用的良好人员和技术储备,在知识采集、数据的结构化处理、知识抽取以及算法开发等方面具有良好基础,相对更容易接受和推广知识图谱技术。
(二)传统非现场审计需要智能技术赋能
银行业务复杂性的增强和数据体量的快速增长,使得传统非现场审计方式难以适应内部审计工作的新要求。一是传统非现场审计主要通过电子数据查找审计线索、发现审计问题,不利于进一步深入挖掘审计线索特征,进而通过审计线索追踪到具有关联关系的更为隐蔽的问题。二是传统非现场审计模型的运行结果通常是表格化的数据,在易读性和友好性展示上效果欠佳,也缺乏对风险业务的提前预判能力,风险预警响应慢。面对这些问题,传统非现场审计亟需大数据技术赋能以提高审计工作质效。
(三)知识图谱为商业银行非现场审计提供了新工具
知识图谱能够运用可视化技术描述知识资源,通过绘制包含对象、属性及关系的知识映射图谱来挖掘和分析对象的相互关系。通过知识图谱可以高效直观地得到目标对象(如客户,账户、事件等)之间的关联网络,实现从多维度对审计对象进行画像。这为商业银行提供了从“关系”的角度去发现问题、研判风险的新工具。比如,商业银行通过构建知识图谱可获得企业客户之间担保和资金往来关系的可视化图谱。通过追踪图谱节点,审计人员能够快速抓取信息,为非现场审计的风险发现和信息检索提供直接帮助。此外,知识图谱是基于大数据分析的技术,理论上能够实现可用数据范围内审计对象关联信息的全覆盖,有效扩大了非现场审计的风险识别范围,能够避免传统非现场审计的抽样风险。
二、知识图谱技术在银行非现场审计中的应用场景
目前知识图谱在商业银行非现场审计中的应用主要集中在审计对象知识的查询检索、金融主体关系识别、金融账户交易数据监测以及金融欺诈风险防范等方面。
(一)审计对象知识的查询检索
查询和检索是信息評价的基础。传统非现场审计常常通过抽查来发现问题。由于审计对象涉及的知识领域较广,加之缺乏完善的知识管理,导致审计查询的效率较低,也无法进行关联知识的深度检索。目前商业银行非现场审计的范围主要包含对被审计行(机构)业务信息、会计信息、统计信息的真实性和完整性的检索、测试和评价。知识图谱技术在部分银行非现场审计实践中得到运用,实现了数据与检索者之间的信息交互。利用知识图谱技术实现了对审计对象业务数据的全样本查询和检索,获得对审计对象领域知识的全局认识。通过对检索指令反馈信息的程序化处理,能够解决多级并发访问,实现查询结果即时反馈,显著提高了非现场审计查询的效率。当知识图谱的数据库越来越大、内部关联越来越多后,借助知识图谱更容易展现知识的整体性与关联性,更容易获得需要重点关注的审计领域,提高非现场审计信息查询和检索的精准度。
(二)金融关联关系识别
银行传统的风险管理主要通过对拟授信主体的资产负债、现金流量等指标进行准入审核,但这无法判断主体间的关联风险。而知识图谱以图形式反映数据结构,对于“实体”间“关系”的分析以及知识推理是知识图谱的优势。这种关联关系的展示和推理能够弥补传统方法的不足,为识别金融主体间的非正常关系提供技术支持。目前在商业银行审计业务实践中,知识图谱对关联关系的识别主要体现为两个方面。一是客户主体关系识别。比如,某农商银行利用知识图谱技术对企业法人客户的股权关系、上下游关系、黑名单关联关系、集团关系、异常担保等潜在关系进行穿透式分析,为非现场审计中的客户风险识别提供支持。图谱中出现的异常节点或链接成为现场审计的重点。二是企业间关联交易识别。关联交易具有隐蔽性强和连锁反应快等特点,是金融风险控制的重要内容。某国有控股大型银行在对公司业务的内部审计中,利用知识图谱的大数据分析技术对审计对象的交易信息进行全方位画像,实现了对隐性关联交易的有效识别,发现了相互担保、重复抵押以及资金串用等关联交易行为。某股份制银行将知识图谱技术应用到企业关联关系和客户经理关系网络分析中,为对公信贷和个人理财销售提供精准服务,提高该银行的数据使用效率、数据资产管理能力和反欺诈工作效率。D165DAAF-0E61-4D2D-872D-CD2ED27B9763
(三)金融账户交易数据监测
对业务经营的合规性进行监督以确保业务经营安全,是银行内部审计工作的重要內容。商业银行通过非现场审计对金融产品、账户及交易数据进行监测,为现场审计提供指引。部分银行机构已经将知识图谱运用到金融账户交易的数据监测中。比如,某国有商业银行内部审计分中心团队在非现场审计中采用自上向下方式构建知识图谱,在金融账户交易数据监测上取得较好效果。一是账户交易风险监测。借助知识图谱对多层关联关系下的异常数据识别、知识推理和可视化展示的技术优势,该行非现场审计人员对某线上贷款产品的银行账户资金流向进行监测,成功识别出了向行内关系人违规发放贷款、借款资金通过支付宝渠道流向违规领域、关联客户恶意骗贷等问题。二是异常交易行为鉴别。该行内部审计分中心在一项针对所辖机构的专项审计中,利用知识图谱对多笔个人贷款中异常的金融交易行为进行追踪,揭示出了客户交叉违约、关联人关系、额度控制失效等问题。知识图谱技术的运用显著提升了该中心审计人员对金融账户交易的风险识别水平,有力推动了非现场审计从“抽样获取”到“智能识别”的转型。
(四)金融欺诈风险防范
对金融欺诈行为的识别和防范是知识图谱在商业银行风险管理中的重要运用。在内部非现场审计中知识图谱主要运用在业务真实性审查、贷款担保关系甄别、反洗钱等方面。业务真实性识别方面,一个典型的运用是借助知识图谱对海量数据进行程序化处理的便利,对个人金融业务中的诈骗、套现、“薅羊毛”以及盗卡盗刷等欺诈行为进行有效识别和风险提示。比如,某国有大型银行内审团队基于企业关联图谱构建贷前反欺诈模型,对客户进行风险画像,评估客户欺诈风险。结果表明,使用隐含在关系图谱中的信息比单纯使用企业自身特征数据建模,更有助于银行对企业申贷欺诈行为进行评估,提高风险识别的精准性。贷款担保关系甄别方面,典型的运用是借助知识图谱识别圈保链保关系疑点。实践中担保圈链内企业普遍存在融资杠杆率高、多头授信以及对外投资房地产及股票等现象。如果有企业对银行债务违约,将会引起多米诺骨牌效应。审计人员通过绘制担保圈链的知识图谱,可直观展现可疑节点,结合数据追踪,会更容易甄别可疑担保行为。近年来反洗钱和反恐怖融资受到监管层重视,反洗钱场景下的大数据应用受到金融机构的关注。商业银行在反洗钱管理中,利用知识图谱建立反洗钱分析模型,对客户交易数据进行挖掘,能够更好地识别资金频繁汇入汇出及聚集等异常情况,弥补原有反洗钱模型及黑名单管理模式的不足。
三、商业银行非现场审计中知识图谱的运用局限
商业银行非现场审计领域涉及范围广,但受数据要素、业务架构、人员和科技支撑等多方面制约,当前知识图谱技术在商业银行非现场审计中的应用总体还处于尝试阶段,运用场景较为有限。
(一)数据管理质量不高制约着图谱分析的精度
数据是构建知识图谱的基础,非现场审计中运用知识图谱需要高质量的数据源。然而实际情况是大多数商业银行内部数据治理能力并不强,海量数据信息没有转化为审计所需的数据资源,制约了知识图谱的运用。一是对基础数据缺乏有效管理。商业银行积累的大量业务数据以Word文档、Excel表格、PDF文件、图像、视频等形式分布于不同板块的业务系统或数据终端里,数据资源未被整合利用,没有形成有效的知识积累。这导致工作中往往需要大量的复制粘贴和手工录入,造成审计资源浪费。二是数据质量达不到图谱分析的要求。以大数据分析为特征的知识图谱构建需要高精度和规范化的数据。但由于非现场审计涉及业务范围很广,不同业务部门对基础数据的搜集和录入不规范,数据的存储和组织较为松散,数据中存在较多噪音和信息冗余,大量数据达不到图谱分析的要求。数据质量问题有时候甚至比没有数据更严重地制约知识图谱在非现场审计中的运用。
(二)部门间协同程度不高制约了图谱分析运用场景的扩大
非现场审计的目标是要通过数据分析与挖掘来发现审计对象可能存在的风险或问题,为后续现场审计提供方向。从涵盖范围看,这一过程几乎涉及银行所有经营管理业务,因此高质量的审计工作有赖于部门间的持续协作。部门间的协作包含了两个方面的内容:一是内审部门与其他业务管理部门的协作,二是内审部门内部不同业务处室(模块)之间的协作。实践中多数银行在这两方面的协作性并不是很好。前者的协作性缺乏主要表现为业务部门的数据管理水平不高,存在对公与对私、负债与资产、线上与线下、营销与管理等多维度的数据分隔,不能为非现场审计提供支撑。部门间协同的缺乏也给关联知识的深度检索带来困难,导致对审计知识检索的精度不高。后者的协作性缺乏主要表现为银行审计机构内部对审计资源的组织和动员能力不强。精通计算机技术、大数据分析和金融实操的审计人员既存在总量不足,也存在结构性缺陷。这导致审计业务需求与图谱分析技术无法实现有效融合,知识图谱的深度知识推理无法运用到更多业务的非现场审计场景中。
(三)内外部数据割裂限制了知识图谱在外部风险识别中的运用
知识图谱的数据来源总体上分为从网页上爬取和从数据库等结构化的数据集合中抽取得到。银行运用知识图谱的数据大致来源有三部分,即行内业务数据、监管数据和行业数据。目前商业银行非现场审计中知识图谱分析使用的数据主要为行内业务数据,外部数据的运用存在着“获取不足”和“整合失效”的双重问题。一方面由于外部数据资源协作程度不高,银行数据管理部门对来自工商、司法、税务、海关、舆情以及第三方合作等外部渠道的数据获取不足,无法实现行业数据的互联与互通;另一方面受数据爬取、存储及管理技术等限制,不同渠道的多源异构数据未能与行内数据完全相适配,形成内外部数据割裂。内外部数据割裂给客户的外部风险识别带来困难,使得知识图谱对担保、投资、控股等关联关系以及多头负债等情况无法给出准确判断,限制了知识图谱在外部风险管理中的运用。
(四)技术门槛影响了知识图谱在审计领域的深度运用D165DAAF-0E61-4D2D-872D-CD2ED27B9763
知识图谱技术在非现场审计中的有效运用主要取决于三个方面,即方法论、知识库和审计模型构建。方法工具上,知识图谱的应用涉及数据挖掘、自然語言处理、机器学习以及人工智能等多个方面。比如,自然语言处理技术决定了从爬虫平台获取数据的能力以及获取数据的质量,这些数据作为原料决定了知识图谱的运用。只有让技术门槛变低,审计才能回归业务本身。较高的技术壁垒使得知识图谱在大多数银行还停留在解决技术问题层面,没有被大规模运用到解决实际审计问题上。审计建模上,存在业务处室的审计人员不熟悉建模、模型开发人员不熟悉业务的普遍问题。业务人员所提的审计需求往往得不到技术部门的有效支持,审计模型构建需要反复沟通,效率很低。此外,从调研掌握的情况看,国有大型银行由于数据仓库建设较早投入较大,非现场审计具有一定技术基础,知识图谱在非现场审计中有了初步运用,但尚未深入数据挖掘和智能审计程度;大多数股份制商业银行和区域性中小商业银行还基本处于探索阶段,短期内知识图谱还很难在非现场审计工作中得到实质性运用。总体来看,技术门槛在很大程度上限制了知识图谱在国内商业银行非现场审计中的运用。
四、知识图谱在商业银行非现场审计中的应用展望
(一)加强数据治理,为知识图谱的运用提供基础数据支撑
加强数据治理,提升数据的审计分析价值,是当前商业银行非现场审计知识图谱运用需要解决的问题。首先,要确保基础数据的规范性和可用性。各业务管理部门在基础数据整理中要充分考虑数据存储的可扩展性、业务人员的易用性以及技术开发的通用性。各业务模块之间要采用一致的数据标准、口径和技术规范,以确保多模块数据在知识图谱构建时实现融合。数据的颗粒度最好到最小业务单元(如账户或银行卡),并以分布式方式存储,以满足数据扩容和不同场景分析的需要。其次,要实现内外部数据的融合。将来自多业务、多渠道、多系统的数据,抽离成符合知识图谱构建需要的各类实体、关系和属性,为知识图谱构建提供数据基础。最后,要打破数据治理的“部门墙”。产生数据的业务部门要做到“数据谁生产谁负责”,确保数据治理责任到位。总行各业务主管部门设置数据治理专职岗位,分支机构银行卡业务、票据业务、个贷中心、小企业中心等业务较为集中、数据产生量大的机构要设置专职数据治理岗位,二级分行以上业务条线部门要设置兼职数据治理岗位,业务处理中心、后督中心等机构要设置专职数据治理岗位。内部审计总部要利用内部审计信息化契机,压实各业务管理部门的数据治理责任,协调推进全行数据治理质量提升。
(二)升级打造全行级图谱应用系统平台
非现场审计的高效开展离不开审计业务系统的支持。相较于业务的快速发展,目前国内商业银行内部审计系统建设普遍较为滞后,急需推动大数据和人工智能技术在内部审计系统建设中得到更深入应用。一是要打造能够支撑高效在线分析和数据挖掘应用的审计系统通用平台。依托新的审计系统平台打通存贷、结算、汇兑、资管等多重关系,实现客户的统一视图,为非现场审计模型的构建提供完整视角。二是在审计系统平台中实现内外部数据资源的有效整合。运用自然语言处理等手段,将来自互联网及第三方的数据进行结构化处理,转换成能够满足非现场审计建模要求的数据形式。通过建立审计对象标识特征库,构建客户关系全网视图,从多维度呈现审计对象的真实属性和复杂联结关系。三是依托审计系统构建起以行业、客户、产品为实体的知识图谱数据库。支持审计人员建立符合多机构和多业务场景审计需求的审计应用模型。通过系统平台帮助审计人员快速梳理审计关系,确定审计思路,把握审计重点,助力非现场审计工作的高效开展。
(三)强化信息技术在非现场审计中的应用
随着商业银行内部数据治理和审计系统平台建设的不断完善,知识图谱技术将会在非现场审计中发挥更为重要的作用,但这也对内审人员的数据分析和信息处理能力提出了更高要求。遗憾的是目前国内商业银行审计人员这方面的能力普遍不高,技术门槛仍然是阻碍知识图谱深度运用的重要因素。商业银行需强化审计队伍的信息化建设,更加重视复合型审计人员的选拔、培养和锻炼。在人员入口关要加强对数据分析处理能力的考察,加强对其基层业务背景与内审岗位匹配度的考察。有条件的银行在跨区域的审计机构中要引进专业IT人员组建大数据分析团队,团队人员应熟悉后台数据基础表结构,熟练使用统计分析工具,辅助非现场审计人员进行深度的数据分析与挖掘工作。对在岗审计人员要加强对自然语言处理、人工智能、大数据等技术的针对性训练,不断提升其数据分析、新技术使用以及审计模型运用能力,有针对性地安排内审人员到属地分支机构业务管理和信息科技部门交流锻炼。通过降低技术门槛促进知识图谱技术在银行非现场审计中的运用。
(四)推动知识图谱技术在更多非现场审计场景中运用
目前知识图谱在非现场审计中的运用主要集中在准入筛查、违约识别、贷款预警等风险防控方面。实际上知识图谱在非现场审计中可以发挥更多作用。知识图谱在知识管理、精准营销、信用评估、适当性管理、内部控制等诸多业务场景中均能发挥作用,如利用图谱画像可以实现对业务营销的审计督导。在业务营销中客户经理可建立银行客户社交网络图谱,根据交往方式和频次定义图谱的关系模型,挖掘具有相似行为的潜在客户。审计人员利用知识图谱可以判断业务营销部门是否掌握了重点客户的资金、人员和上下游关系,是否有效挖掘潜在客户,向其推荐相关的产品和服务,为对营销部门的绩效审计提供参考。在管理人员离任经济责任审计中,对审计对象个人履历、分管业务、监督检查记录等设置关联规则,对其及关联账户和资金往来进行关联关系分析,可发现内外勾结和资金异常流动等违规行为。此外,利用知识图谱的学习功能可以建立审计报告、具体风险点及制度依据之间的关联,实现审计知识的高效管理。在此基础上,利用知识图谱技术可实现非现场审计报告工作底稿部分内容的自动生成,减少报告在不同人员之间的流转次数,能够有效提升非现场审计工作的效率。
主要参考文献
[1]陈伟,居江宁.基于大数据可视化技术的审计线索特征挖掘方法研究[J].审计研究, 2018(1):16-21
[2]金磐石,万光明,沈丽忠.基于知识图谱的小微企业贷款申请反欺诈方案[J].大数据, 2019(5):100-112
[3]李涛,王次臣,李华康.知识图谱的发展与构建[J].南京理工大学学报, 2011(1):22-34
[4]牛艳芳,薛岩,邓雪梅.审计大数据关联的网络分析平台构建及应用研究[J].审计研究, 2018(5):35-42
[5]万丹,任昌鸿,杨星.非现场审计在银行内审工作中的价值探索[J].中国农村金融, 2020(18):71-73
[6]王瑞萍,刘峰.审计知识图谱的构建与研究:基于Neo4j的图谱技术[J].中国注册会计师, 2020(9):109-113D165DAAF-0E61-4D2D-872D-CD2ED27B9763