郭峰涛
摘要:本文主要从中小城市商业银行管理角度出发,探讨在数据质量管理活动中如何有效识别、度量、监控和预警数据质量问题,探索数据质量管理评价考核方法,提高问题数据整改效率,推动统计数据质量的进一步提升,发挥数据资产应用价值。
关键词:银行 数据质量 校验规则
一、引言
随着大数据、云计算、金融科技等技术、概念在银行业金融机构的不断深入和运用,数据已成为银行非常重要的资产,其地位已不亚于金融资产,数据分析和数字化理念已贯穿银行整个经营管理活动,数据质量的高低,直接影响着数据资产的应用价值。本文根据作者在银行的实践经验,就中小城商行数据质量管理的需求调研、校验規则制定、问题跟踪整改、数据质量考核至规则关闭的全流程管理活动进行探讨。
二、数据质量管理概述
数据质量管理是指对数据自产生、采集、存储、共享、应用等各个阶段可能引发的各类数据质量问题,进行识别、度量、监控、预警、报告和控制等一系列的管理活动,从而进一步提升数据资产的应用价值。数据质量管理活动应贯穿银行的数据统计、经营管理和业务发展的各个环节,但中小城商行受人力资源和信息科技系统等方面的制约,应以首先满足解决监管金融统计的需求为主要目标,来稳步有序推动银行的数据质量管理。
三、数据质量度量原则
目前,城商行在数据质量管理活动中的度量原则一般可分为:唯一性、准确性、一致性、完整性、有效性和及时性。其中:一致性主要是确保数据在特定数据集中不存在重复值;准确性是指数据符合真实情况;一致性指同一数据项在系统内或不同系统间保持一致;完整性要求所必输的数据项的数据属性均被记录;有效性指数据符合已定义的格式规范和业务规则;及时性指数据被及时更新以体现当前事实。此原则构成了银行在具体实践活动中制定数据校验检核规则的方法论,若数据不满足度量原则即可归类于问题数据。
四、数据管理需求的调研与分析
数据管理需求的调研、收集与分析,是制定有效校验规则的必要环节和前提条件。通过对数据质量问题产生的原因、管理的动机和目标进行深度剖析,制定符合银行实际的校验规则,覆盖数据的全生命周期,达到管理目的。过程包括:一是对前台业务和管理人员调研,了解业务操作流程,调研数据生产者的管理需求;二是对数据应用部门调研,确认数据使用者的管理需求;三是对数据报送过程中遇到的问题进行经验总结,明确监管者统计需求;四是通过内部审计发现数据问题,确定管理者的数据需求。
五、构建数据质量核检规则
在度量原则的框架下,城商行可制定符合行内实际的检验规则,根据发现问题的属性主要分为:
(一)逻辑性校验规则
对统计要素或者信息项进行逻辑检验,定位问题数据。如对主证件号、客户号等信息唯一性检验;对总账与明细账汇总数据比对,核查总分是否一致;根据会计恒等式资产=负债+所有者权益,对会计科目的借贷金额进行比对,定位财务数据问题等。
(二)信息项变动监测
对信息项的取值在前后期资产负债表日的变动进行跟踪,确定变动是否真实、准确,是否有人为因素干预或因系统稳定性等情形导致。如核查企业规模、行业分类等信息项变动。
(三)风险数据预警
对风险指标数据进行监控预警,为业务管理活动提供信息。如对信贷客户的逾期警示,对贷后管理中财务信息是否及时更新等信息进行预警。
(四)重点业务监控
对重点管控的业务进行实时监控,如房地产、普惠金融信贷投放和利率管控等。
(五)关键字匹配监测
利用模糊查询方式,对带有特定关键字具有特定属性的信息项进行监控。如客户名称中有股份有限、有限责任字样的,其机构类型字段不应为机关法人;名称中带农村商业、证券、保险等金融机构,其同业客户类型应为对应的分类。
(六)值域检验
对统计要素或信息项的数据元取值进行空值、长度和编码值等监测。
为确保校验规则后续的有效运行,需要针对规则建立准确性和可靠性评估体系,城商行可以根据成本效益原则,合理确定评估周期,保持系统运行的稳定性;同时,根据规则运行情况,分析统计误差,不断改进和优化规则,实现规则的迭代升级。对于规则运行产生的问题数据较多情况,需进一步分析是否有必要对业务系统进行完善和优化,在业务系统中增加强制性规定、逻辑校验或者录入信息时的预警提示,从系统源头控制数据质量,来反向推动系统的更新升级。
六、数据质量管理监控
针对信息科技力量薄弱的城商行,若未建立数据中心或者数据集市的,通过在业务系统中建立业务查询SQL语句或者执行脚本的方式,实现对数据的监控和跟踪。此模式缺点是可能对业务系统造成一定的资源占用,影响系统的运行效率;优点是可以实时监控问题数据,确保问题能在第一时间发现和反馈。
针对已建立完成数据中心的城商行,可以依托数据中心,建立检验规则库或者开发专用的数据质量管理系统,将规则库加入数据中心的调度任务中,在数据跑批过程中实现问题数据的监控和管理。此模式缺点是依赖于数据中心的数据抽取、加载和加工完成后,方可进行数据监测,问题数据的发现存在一定的滞后性,且数据中心是经过标准化加工的数据,建立规则和定位跟踪问题数据时,需能熟悉和了解各个业务系统的数据结构,精准定位问题数据的系统来源和信息项;优点在于不占用业务系统的资源,且能从全局角度进行数据质量管理。
七、数据质量管理评价
数据质量管理评价是数据管理活动中最后一个环节,也是推动数据质量改善的主要工具和手段。城商行数据质量管理评价应综合考虑受评价主体的业务量大小、信息项的影响因子、问题响应程度和解决效率等因素,由数据治理委员会赋予一定权重后,形成科学合理的考核结果。若假定考核得分采用满分100制,数据质量考核计算如下:
其中,问题考核得分中的影响因子是根据规则对统计数据的影响程度赋予不同系数和权重,响应效率和解决效率表现形式如下:
其中,下发时间是指考核单位的数据质量管理员将问题数据下发至数据所有者的时间;解决时间是指数据所有者改正问题数据的时间。设置效率考核的主要目的是督促机构提高对问题数据的解决效率,激发对数据质量主动管理的积极性。
数据质量问题对于数据统计,类似于系统风险相对于商业银行,并不能完全消除,但可以通过培训、编制详细解决方案等方式,提高数据生产者和录入者的业务水平,降低数据源头的发生机率,同时提高问题数据的发现和整改效率,来推动银行数据治理成熟度水平的提升。
参考文献:
[1]龙海跃.欧盟统计数据质量管理体系及其对我国的借鉴研究巧[D].湖南大学,2013.
[2]李丹.商业银行数据治理研究[J].中国金融,2019年13期.
作者单位:长城华西银行计划财务部