臧其事 袁益中 崔中华
摘要 随着IT在银行应用的不断深入,银行建设了大量IT系统并积累了海量敏感数据、如何通过外展高效的数据治理工作、将数据这项重要资产管好、用好对于公司具有重要意义。因此,本文首先介绍数据治理的背景、内容、治理框架,其后简要分析了目前农行上海分行的数据治理现状,初步探讨了开展数据治理工作的重要意义和工作开展的简要思路。
【关键词】数据治理 治理领域 应用展望
1 背景
近年来,数据治理及相关标准体系的研究是国内外研究的热点之一。2014年6月,IT治理和IT服务管理分枝术委员会在悉尼召开第一次全会,中国代表团首度提出”数据治理”的概念,引发国际同行的兴趣和研讨。习近平总书记在2017年12月的中共中央政治局第二次集体学习时强调,要构建以数据为关键要素的数字经济。2018年5月21日,中国银行保险监督管理委员会友布《银行业金融机构数据治理指引》。数据已然成为重要且关键的基础资源,无论金融科技还是监管科技都离不开数据及治理工作的有力支撑。对于而言,如何为服务行业、服务监管、服务投资者、服务实体经济、服务社会这五大公司使命提供优质高效的数据服务及支持,如何開展数据治理相关工作,是当前面临的重要课题。
2 数据治理概述
2.1 什么是数据治理
《银行业金融机构数据治理指引》中定义为银行业金融机构商讨建立组织架构、明确高级管理层及内设部门等职责要求,制定和实施系统化的制度、流程和方法,确保数据统一管理、高效运行,并在经营管理中充分发挥价值的动态过程。
2.2 数据治理的内容
数据治理的内容主要包括:建立数据治理管控组织架构和角色职能划分;建立统一数据标准,明确数据标准提出、修改、退出及冲突协调的流程,使之覆盖各项业务和信息系统,建立数据质量管控体系,覆盖数据全生命周期,保障数据的真实性、准确性、连续性、完整性和及时性;建立数据安全策略,依法合规采集,依法保护客户隐私,划分数据安全等级,明确数据访问权限;建立数据架构,形成端到端的信息流传速与管控,通过数据仓库共享数据,打破信息孤岛,实现数据有效共享。
2.3 国内外数据治理框架
数据治理本身是一个新兴概念,处于不断进化中,国内外方法论种类繁多,且侧重点各有不同,以下仅选取对业界具有较大影响力的框架体系进行简要介绍。国际数据管理协会(DAMA)国际数据管理协会总结了数据治理的九大领域,主要包括数据架构管理、数据开发、数据操作管理、数据安全管理等领域。虽然许多治理框架看似复杂多变,但一些概念或基础领域均在多个治理框架中有所体现,是无法被裁剪和舍弃的。
2.4 数据治理的领域
数据治理含有许多具体的实施领域,其中基础领域包括但不限于以下内容;数据标准、数据质量、数据生命周期、数据安全、数据服务,且各领域之间并不是割裂存在的,领域之间互相协调依赖,也需要有机结合。例如通过管理和执行数据标准,对进一步提升数据质量,减少因口径不一、标准差异带来的数据统计问题,又如数据安全是贯穿于整个数据生命周期管理中的,针对数据的产生、使用、维护、存档、销毁的全过程中均须考虑安全保密问题,再如随着数据质量的不断提高,对内外提供征信、估值和咨询等增值数据服务也就有了可能。同时,数据治理领域是随业务发展而不断变化的,需要不断分析整合各领域之间的关系,并形成一个互相协同与验证的领域网。
3 农行上海分行数据治理现状
3.1 起步较晚
传统的银行业务除了主机系统外,对数据治理的依赖性并不强烈。因此导致各个系统化信息化建设相对滞后和碎片化,系统数据各自为政且整合困难,形成了信息孤岛。
3.2 质量较低
银行的数据信息,很多来源于一线的业务经理,或者是客户自行填报的数据。不同的业务经理对于同一字段可能存在不同理解,且有些字段信息收集颇为不易,可能会导致填报的数据质量不高。部分数据由于历史原因,各类业务记录数据多数仍以纸质或纸质扫描件的形式保有管理,结构化数据的比重较低,数据质量及完整性较差,对实现并提升信息系统自动化程度带来较大难度。
3.3 口径不一
监管数据报送一直是各分行面临的共同难题,各分行不仅面临人工填报工作压力大,还需解决报送监管部门众多以及多套监管表格数据标准不一致等问题,相对于保险已经建立的《家庭财产保险业务发素专项数据规范》,《人寿保险业本要素专项数据规范力等指导性文件,目前尚存在一些现有监管数据系统数据收集不准确、时效性不佳等问题。
4 农行上海分行开展数据治理工作的思路
4.1 数据治理工作的重中之重是数据标准
标准化是开展数据治理工作的首要基础。数据标准化工作不是一蹴而就的,需要从公司层面自上至下认识到标准的重要意义农行上海分行在系统建设时就要按标准设计,避免边治理边出现新问题,逐步汇聚行业各类信息数据进行数据标准建设,通过定义业务和技术层面的数据标准,在信息中体现数据价值,更可以通过数据治理水平标准的引领,带动行业建设过程中支持标准落地的过程。
4.2 围绕两个生命周期构建行业过程管控能力
数据生命周期主要由数据定义和数据使用两个周期组成。数据信息系统研发过程中,包括需求分析、概要设计、代码开发、集成测试等阶段的状态变化就是数据定义的生命周期,数据使用生命周期是指数据在信息系统投产至下线中发生的新增、修改、删除等操作导致的状态变化。农行上海分行可立足于信息系统的开发和运行程,建立基于数据标准的数据关联网络,通过建立生命周期流程管控平台、强化信息系统开发过程中对于数据演化过程所需的变更控制。
4.3 基于数据质量管理构建行业数据评估能力构建金融大脑
分析互联网银行数据治理及数据战略的实践,数据质量管理是指对数每个生命阶段可能导致的各类问题,路径进行行识别、度量、监测、预警等一系列活动。通过提升数据的可靠性,增加数据的使用价值,对行业日常经营、管理决策等领域产生积极的影响。农行上海分行可依赖信息系统运营过程中的数据输入,建立数据质量评估体系,尝试从多个方面对数据进行评估。通过评估,发现数据质量问题的源头及产生原因并进行解决,定期发布数据质量报告、逐步建立质量好坏奖惩机制、实现数据质量的良性循环。
4.4 基于行业数据中心构建行业数据集成分析能力
行业数据中心是通过相对实时的数据交互接口,将各分行涉及的业务产品信息、交易流水信、会计信息、公共信息等进行汇聚,形成基于结构化和关系型的数据积累。农行上海分行可尝试探索建立行业教据中心,实现数据的融合利用,尝试通过数据挖掘技术发现一些新风险、新规律、新价值、实现行业数据的融合利用,不断挖掘信息价值。同时、配合数据挖掘应用实例的宣传、帮助提高行业整体业务人员的数据分析能力、促进整体行业创新与发展。
参考文献
[1]张明英,潘蓉.数据治理白皮书国际标准研究报告要点解读[J].信息技术与标准化,2015 (06).
[2]陈龙强,胡瑞娟,管正刚,百信银行:如何从三大维度构建金融大脑
浅析互联网银行数据治理及数据战略的实践路径[J].当代金融家,2018 (05).