宁波银行:大数据应用进化论

2018-09-10 03:35谌力王柏寒
新金融世界 2018年4期
关键词:海王星数据仓库宁波

谌力 王柏寒

近几年银行业处于业务转型期,同时受到互联网金融浪潮的冲击,出现了利润增速下滑、人才流失、金饭碗风光不再等现象……。不破不立,银行业也一直在上下求索。面对新兴金融科技公司以及互联网领域巨头的“攻城略地”,各家银行机构纷纷寻找自己的创新转型方向,以期为大众提供更加贴心、安全、高效的金融服务。宁波银行在大数据时代下,积极拥抱智能金融,打造了“海王星”大数据平台及基于此的创新应用体系。

宁波银行作为一家区域银行,之所以能顺利实现FinTech落地,进行深度的数字化转型,全在于厚积薄发,宁波银行科技部把这个过程阐释为技术应用的“进化论”。“如同人类社会发展到现在并不是规划出来的,而是遇到挑战不断解决问题进化成现在的形态。银行的科技应用发展也是这个道理,我们会做规划,但更多的是碰到问题不断解决、不断进化。在大数据的应用上,我行科技部与业务部门共同用大数据、人工智能等新技术拓展业务视角,促进业务发展,并在软件研发、IT基础设施等层面不断解决问题,产生科技与业务的良性互动,实现大数据技术应用的进化。” 宁波银行科技部总经理沈栋告诉《新金融世界》记者。

早在2006年,宁波银行就开始建设第一代支持行内经营管理分析、外部监管报送的数据仓库1.0,2013年为支持新巴塞尔III达标相关系统建设,宁波银行建设数据仓库2.0平台并开始企业级数据治理工作。随着大数据发展,传统数据仓库技术已难以满足海量数据快速增长和计算处理方面的需求,2014年,宁波银行确定开始探索和实践全新的数据仓库系统,三年多来,海王星大数据平台的整个应用体系逐步落地。

不同于业内以计算、存储、查询为主要功能的大数据平台,宁波银行海王星大数据平台包括一套基础大数据处理平台、一套自建的金融数据模型、五大辅助支撑系统、一套指标体系、多个大数据应用,形成了一套完整的银行大数据应用体系。

“我行与大数据平台同步推进的还有数据治理工程,并打通了业务应用的‘最后一公里,通过我行的‘智能数据积木产品,全面应用业务指标体系,现在业务部门能够自己应用大数据工具进行数据分析、报表生成、风控审批以及数据来源和数据标准查询等,这些操作IT部门完全不用参与,大数据应用已完全融入业务工作的方方面面。”沈栋告诉《新金融世界》记者。

据了解,目前海王星平台已经实现了对宁波银行零售、对公、理财、资产管理、风控的全方位支持,并嵌入到多个已有业务系统中,与业务的运转和管理紧密结合。目前,平台上有效数据达150TB,每日运行40000多个作业。海王星大数据平台已然成为行内业务营销、风控、管理、运营的利器,真正实现科技赋能业务的价值体现。

打造卓越大数据应用支撑体系

海王星大数据平台作为银行业首例完全以Hadoop技术为基础架构自主创新研发的新一代企业级数据仓库平台,不同于业内部分应用开放架构或者双架构(混合架构)并行的实践,海王星大数据平台实现了全部应用系统的海量数据实时处理。

(一)开放架构跨越数据处理瓶颈

“非结构化、半结构化数据,再加上互联网外来数据混杂在一起,这引发出的计算瓶颈给数据分析带来了很高难度,用传统的数据仓库平台在应对企业级数据分析时局限性日益明显,我行打造了基于Hadoop生态链开放架构的大数据处理平台来解决上述难题。”宁波银行科技部高级经理薛成峰告诉《新金融世界》记者。

宁波银行科技部在研发海王星大数据平台进行了大量新技术的尝试,实现了多点突破。

第一,可跨数据源,即不仅可以查本行存储的数据,也可跨系统安全访问其它外部数据。第二,海王星平台输入、输出结果可以更全面,更详尽,更迅速,传统技术方案在亿级数据量,几百个关键字任意组合查询的场景下,根本不可能实现即时查询,而海王星能实现秒级返回,极大提升用户体验。第三,相比传统架构,海王星平台的单任务效率提升10倍以上,运行时间窗口缩短60%,响应性能大幅提升,速度快、成本低,真正实现提高“效”和“率”。

为保证Hadoop架构在数据仓库领域的有效落地应用,推动基于数据标准打造数据指标化和各类数据应用,宁波銀行科技部突破诸多技术难点:

·改造、优化传统数据仓库业务逻辑处理的ETL算法,解决Hadoop平台SQL语法支持不完善的问题。

·自主研发统一开发IDE、项目运维管理平台、统一调度与监控平台、数据管理平台、异构数据类型及不同协议的外部数据统一接入平台。

·自主实现大数据平台的统一批处理框架。

(二)金融数据模型

“数据仓库数据模型是大数据应用的灵魂和基石,宁波银行在应用了2、3年国外成熟数据模型之后,发现与国内和行内的情况并不是很契合。在与国内多家大中型银行交流后,决定自主建设面向应用,适合银行业务快速发展,长效适配的数据模型。” 薛成峰说。

在国外成熟模型的基础上,宁波银行全面优化改造适应于国内银行的企业级数据模型,模型充分融合了互联网时代诸如大数据分析、云计算、移动金融等多个新元素,建成后又多次邀请先进同业数据仓库模型领域的资深专家进行评审,得到普遍好评。

目前基于大数据平台的新模型已覆盖当事人、协议、事件、财务、代码等十大主题,超过300个实体,字段数据达到5600个。模型特点分为四点。

·企业级:一个统一的、共享的基础数据平台;

·动态:一个可扩展的模型能够经得住时间的考验;

·中性:设计基于能够满足各种不同的分析逻辑的要求的理念;

·持久性:数据具有可追溯性、不损失。

(三)辅助支撑系统

围绕数据仓库实施方法论,宁波银行研发了相关系统与工具,构建了涵盖开发、打包、投产、运维、调度、监控流程的完整数据仓库解决方案,以保证数据仓库在大数据平台的落地,以及更有效的开发与管理,同时针对互联网多类型的数据接入和管理,研发了外部数据统一接入系统。具体内容和优势表现为以下几方面。

·开发IDE :提供标准化代码开发框架和公共函数,开发测试流程平台化且支持语法自动检查,降低开发者入门门槛,提升开发效率。

·运维管理:提供数据加载配置,平台项目管理,投产管理,性能监控等功能,提升平台管理水平及效率。

·数据管理:提供元数据、数据标准、血缘、数据质量进行全方位管控,对大数据平台的数据管理形成闭环。

· 统一调度与监控系统:提供跨平台、多任务的批处理任务调度、管理,保障数据处理高效、稳定,既能自动监控,又能及时提醒。

·外部数据统一接入:提供行外多类型、多协议的数据统一接入,以及标准化行内数据共享服务,具有良好的功能可扩展性,为行内系统提供共享服务,易于管理和维护的外部数据接入平台。

深植数据基因,展现业务价值

在打造坚实的大数据处理平台和基础配套体系的同时,宁波银行在多个业务领域进行了大数据应用,让业务部门能够自发地应用数据分析、数据挖掘,这是一个说起来轻松,但做起来很难的事情。宁波银行让这道难题迎刃而解。

宁波银行科技部为业务部门打造了自主分析的平台入口,业务部门能够登录到海王星平台做数据分析的“探索发现”,能够自主分析实现端到端的业务场景。例如,进去以后首先可以看到海王星里面有多少数据,科技部门提供一些工具让业务人员查询数据,查出来了以后可以进一步分析。业务部门自主分析覆盖了行内不同角色、不同的工作需求。

(一)大数据风控

“基于近几年大数据应用能力的增长,我行的大数据风控已经从贷后风控升级到贷款风险预警、自动化线上实时贷款风控与审批,一分钟实现网贷发放。”

近几年银行业连续爆出不良,外部数据众多、日增量较大、需覆盖范围广,传统方法监控成本过高,排查难度和负担过大。宁波银行基于海王星平台的大数据风控应用可极大提升风险管理水平。“ 我们把基于海王星平台的大数据风控系统称为‘天王星,其优势体现在多个方面,一是是方便快捷,现有APP、微信、和网页等多个版本,支持实时查询;二是合作机构包括人行、证监、主要大型互联网企业等,数据来源丰富,结果可靠,概括为八个字就是及时、主动、全面、准确。” 宁波银行科技部高级经理沈甬泉告诉《新金融世界》记者。

“在2015年9月大数据风控刚上线时,即显现出了效果。例如,某家曾多次獲奖的明星食品生产企业是我行优质贷款授信客户,当大数据风控将该企业“食品生产许可被吊销“的消息推送给银行业务经理要求核实时,从企业得到的答复却是一切正常。然后,没过两个月,该企业就因市政规划原因,在建的市区工厂被关闭,在该企业丧失了主营业务收入后,很快资金流动困难,失去还款能力。不过庆幸的是,我行因为及时掌控预警信息,经调查后收回贷款,避免产生不良业务。”

目前,宁波银行的大数据风控服务已从单一的协助贷后风险预警,演进成高风险客户过滤、客户反欺诈、贷前风险排查、实时风控与审批、贷后预警排查与推送等系统化功能服务。

沈甬泉说:“回过头来看,行内业务管理对大数据风控的接受过程经历了三个阶段,2015年时想这个系统是什么、有没有用?之后是证明好像有用;2016年开始发现对工作有明显帮助;2017年总行要求各分行、各业务条线、风险条线或者被认为是有风险表现的部分,都要预先使用大数据系统进行风险评估测试,最后行领导更是直接要求所有的业务必须先通过系统审查再作进一步处理。三年时间经历了整个观念的逆转和改变。”

现在在内外部数据结合的情况下,宁波银行风险预警系统整合了 15 大类外部信息, 30余套行内系统风控数据和 10 余项专网数据,积累了1000 多万条风险信息,建设完成了针对客户、业务、行为、担保物的全生命周期的风险管理,搭建了非零售内评、零售内评、风险缓释、大数据风控、发债评级、信贷预警、客户反欺诈、交易反欺诈等风险分析类系统群。通过风险建模和人工经验知识写入机器语言总结出30000 多个风险信号,对客户实现有效预警,准确率达20%以上,成为风险管理的有效利器。2017年,通过监测分析数据的异常变化,贷前否决上百户,涉及金额几十亿,贷后有效预警数百户,金额50多亿,有效识别并控制了信贷风险。

(二)大数据营销、经营管理和其它方面

营销管理方面,宁波银行借助海王星平台对非结构化、海量数据的处理能力,落地客户标签,借助数据挖掘,提升营销的主动性,提升营销效率;提高个性化营销能力,提升营销精准度;提高营销响应速率,及时获取客户异动信息。行内平均每年有上百个数据分析挖掘项目,营销成功提升率在50~200%之间,这些营销场景的事件性营销和名单式营销上有着尤其明显的改善作用,

经营管理方面,通过海王星平台,大大提高分析报表的数据时效性,让经营管理人员及时掌握业务数据,提供自主分析平台,结合指标管理,供业务部门自主分析端到端的业务场景,从而提高整体作业运行效率,做出更精准的决策。数据驱动业务管理、业务拓展是大数据思维、大数据文化发展的必然结果。

其他方面,不同的用户组有不同的需求, 他们既是支持的对象,也是实现投资回报的方式。因此理解并满足他们的需求是至关重要的,大数据应用平台支持各类数据使用者,具有广泛适用性。

实现数据治理的最后一公里

对于数据治理的工作,我国银行业在10年前就已经提倡和开展了,但面临着数据溯源、统一指标等难题,真正落地的很少。宁波银行通过海王星大数据平台,一方面解决了行里每天产生几千万条到上亿条数据的追踪溯源,另一方面通过“数据智能积木”平台,梳理和构建全行统一指标体系,让数据治理能为日常业务工作带来实效。

至2017年年底,宁波银行已完成客户、公共代码、机构等基础主题数据治理和风险管理、客户管理及营销等相关数据治理工作。数据治理大幅提升银行数据质量,满足了当前业务经营风险管控方面的多元化要求,同时为宁波银行大数据应用奠定坚实基础。

宁波银行以数据标准为基础,以数据指标为依托,实现报表开发标准化、规范化、自主化、图形化,提升报表开发模式的转型,形成闭环以提升全行统计数据的准确性、使用的便利性。以指标体系为例,“数据百度”是依托海王星平台开发的数据标准的搜索查询应用,在原来只可以搜索统计标准的基础上进一步的升级,支持直接搜索到统计指标信息,对搜索到的统计指标可以加入到收藏夹中以备后续查看实际数据;有快速报表需求时,选择一个或多个统计指标后,可直接在线展示各项指标的系统取数结果;平台还提供了定制报表功能,进一步满足日常工作对报表个性化设置的需求。

為推动大数据应用融入日常业务工作,以“海王星”大数据平台的海量数据、高效处理能力为基础,实现了数据可视化功能,借助可视化产品工具,方便操作人员,尤其是业务部门的使用者直观明了的拖放产品分析数据,方便快速美观的得到结果数据。

触发行业先机,问道智能未来

在建设完整的大数据应用体系过程中,除了海量处理平台的IT基础能力和多业务场景应用的能力,宁波银行还在数据挖掘这一尖端领域自主创新,创建了DVA(Data Value Added)模型,在个性化营销和服务、产品优化和精准投放、潜客的发掘、高价值客户的流失预警、大数据风控等方面都发挥着巨大的作用,三年累计创造数千万DVA。

例如在大数据获客领域,能够根据分支行所在区域的经济发展情况,通过引入外部数据,为各条线提供潜在客群名单,并结合分支行自身经营情况,刻画全面的支行画像,支持分支行空中(E销)地面(上门)多层次名单制营销。例如在存量客户提升领域,能够深入分析存量客户的特征和需求,挖掘产品高响应精准名单,并提供个性化服务、交叉营销、客户挽留以及价值评价服务。

DVA模型的创建标志着宁波银行已经从大数据的具体单点应用上升到金融业务应用方法论的高度,即通过DVA模型的建立、业务应用的实践检验和反馈形成不断优化完善的行业方法论。

基于海王星大数据平台的创新银行大数据应用体系,其拥有一体化数据质量管控、健全的数据安全控制体系和灵活的数据处理调度机制,在数据处理、风险管控、运营维护等诸多方面展示着重要的存在价值和意义。宁波银行的创新化研究和实践过程可作为国内外现代中小型银行转型参考和科技创新学习方向。今天,“量身打造”的金融服务不再是新鲜话题,宁波银行也将继续问道智能未来,为更好地满足用户需求,进一步打造AI时代下的智能银行。

猜你喜欢
海王星数据仓库宁波
一图看懂宁波金融“五强”提升工程
我的狗来自海王星
基于数据仓库的数据倾斜解决方案研究
一图读懂宁波
拖起明天的希望
海王星
数据仓库系统设计与实现
宇宙常识
喜相迎
数据复用在存储数据仓库中的运用