美国CapitalOne大数据战略对我国商业银行大数据应用的启示

2018-09-10 09:02陈游
中国内部审计 2018年6期
关键词:数据模型数据挖掘风险管理

陈游

[摘要]本文分析了我国商业银行大数据应用的现状,介绍了美国CapitalOne在大数据应用中的成功经验,提出我国要借鉴国外先进经验,推进银行在大数据应用上的持续深化。

[关键词]大数据 数据挖掘 数据模型 数据分析师 风险管理

随着竞争的逐渐加剧,特别是近年来以互联网

为代表的非金融行业加速跨界,二次转型成为各银行发展的重大战略选择。利用金融大数据挖掘和分析,发现客户的潜在价值,改进银行服务,同时为业务发展提供前瞻性、指导性、引领性的决策支持,从而提高银行核心竞争力,防范金融风险,成为银行二次转型的重要支撑。

一、大数据:商业银行二次转型的重要支撑

(一)通过大数据定位目标客户

我国银行业通常通过增加营业网点和渠道、增加发卡量等方式拓展金融业务。但是目标客户相似、金融产品和服务同质化严重,银行运营成本一直居高不下。利用大数据分析,能够定位为银行带来利润和可观效益的客户群体,进一步明确目标客户群。同时,针对目标客户群提供满足需求的产品和服务,既能提升客户满意度及黏性,还能降低银行不必要的成本。例如,ING DIRECT主要面向美国中等收入阶层,利用电话和互联网直接向客户提供服务。运营中,ING DIRECT严格限制其互联网银行的业务范围,仅向客户提供一些最基本的金融服务。这种简单的运营模式能够节省大量的分支机构建设及运营费用、人工支出等。

(二)通过大数据分析进行风险管理与反欺诈

一是分析企业财务风险。获取各类财务风险模型所产生的具体数据,分析是否符合监管和合规的相关要求。二是进行市场与投资组合风险分析。结合手中大量的历史市场数据或者交易数据,进行更多的实时风险监控。三是评估贷款风险。银行通过公共信息等结构化或半结构化的数据源分析客户或潜在授信客户的真实状况,建立统一的风险控制视图,及时监测和发现交易异常。例如,Xoom是美国一家主要从事跨境汇款业务的企业,通过分析每一笔交易数据判断账户是否存在非正常资金出入。

(三)将大数据用于客户信用评估

银行传统的信用评估通常基于信用偿还历史等相关信息,通过评分系统进行信用评分,对是否授信及授信额度进行决策。随着银行之间的竞争逐渐加剧,中小企业群体也逐渐成为银行的目标市场。通过大数据分析技术和处理系统,这一市场可以为银行带来更多的预期利润。例如,ZestCash通过使用MapReduce对授信客户的数千个数据线索进行分析。在ZestCash平台中,用户选择借款额度及期限,就会立即显示每周需偿还的贷款金额,用户可以根据自己的情况调整条款。金融大数据时代的到来,银行的传统业务正在被具有数据信息优势的互联网金融机构逐渐侵占。银行需要借助数据挖掘分析,进一步完善和提升传统的信用评估机制,提升用户的服务体验。

(四)以大数据分析助力精准营销

我国银行在信息化进程中已经积累了大量的金融电子信息,通过对客户个人信息、行为以及区域定向等信息的动态分析和处理,可以向客户开展精准的营销。例如,某旅游类App让用户在最喜爱的目的地签到,通过客户忠诚度计划、住宿推荐及签到地点附近相关点评而获得激励。银行可以与这类App开发商合作,在客户购买产品或服务时提供个性化的信用产品。不仅能大大提升银行客户满意度,提高客户黏度,同时能极大地提高银行产品或服务的销售以及中间业务收入。

二、我国银行大数据应用现状——以建行为例

(一)大力加强数据管控,为业务运营提供高效数据支持

准确的绩效计量需要高质量的数据支持,一旦银行不同业务条线及营业网点的数据无法得到有效整合,形成数据孤岛,就无法进行深入的管理分析。早在2004年建行就已经认识到数据应用的重要性,开始探索具有建行特色的金融大数据管理体系。特别是2011年通过实施新一代大数据核心系统项目,借鉴国外同行最前沿的实践经验,进一步完善了建行数据管理体系。一是设计形成了一套规范的金融大数据语言。建立涉及数据标准与术语、评价指标体系以及数据模型等在内的一系列数据规范体系,同时准确定义了数据名称及相应业务含义、技术参数和数据采集加工规则。建行还在新一代项目开发中要求严格执行已经定义的相关数据规范,为建行彻底消除数据孤岛、实现金融大数据的融通共享奠定基础。二是建立了从数据采集到应用一整套数据管控机制,保证金融大数据质量。此外还将数据作为关键业务要素和资源,设计研发企业级、可视化的金融大数据资产管理平台,用以支持对全行数据进行全生命周期的管理,并以此为基础进一步扩展完善金融大数据仓库,集中整合积累的海量数据,开发多维度的大数据统一视图。建立全行统一的企业级数据供应路径,以自助查询、统计报表、数据模板等不同模式满足全行内部各层级、各业务条线方式灵活多样的数据使用要求。

(二)深入挖掘数据资源,提升业务精细化管理水平

金融大数据价值的实现常常有賴于深入的挖掘和解析,特别是按照管理目标对数据的共享、整合和应用,对建行这种亿级个人客户以及百万级企业客户的大型银行来说,无疑是一个巨大的挑战。通过整合各类交易系统中的大量基础数据,可以从产品、客户、业务条线、销售渠道等多个视角反映各项经营业绩,分析银行盈利结构,从而为实现以客户为中心、综合化、集约化的银行战略转型目标提供重要保障。一是实现交易级别下最细粒度的基础数据之间的整合,涉及存贷款、利息收支以及中间业务收支等。在此基础上,建行通过各个维度的聚合,制定各维度层面利息收支以及非利息收支的测算与拆分方法,从而形成支持盈利和成本计量的更为准确的基础金融大数据。二是统一各个维度的标识,同时进行多角度的海量数据挖掘和分析。银行大数据中的维度数据尤其重要,是主数据非常重要的组成部分。在数据规范中,通过严格定义客户、销售渠道、金融产品、业务条线等方面的数据标准,采取数据取值的统一管理加工、实现全行共享,确保金融大数据在全行内部的一致性。三是利用账户和交易数据制定多维度营利性计量以及成本分摊方法,从而进一步完善管理会计方法,提高绩效计量准确性。通过整合完整的银行账户或科目信息,设计多维度的账户体系,形成应用业务分成以及成本分摊计量方法,实行多维度的、风险导向的收益成本指标等银行内部管理报告制度。四是通过应用各维度盈利计量方法和结果,全方位提升业务精细化管理水平。

(三)完善数据基础质量,实现数据应用质量的改善提升

数据质量是金融大数据应用的基础。在开展管理会计、绩效考核过程中,建行逐渐探索出有效改善数据应用和质量的管理机制,使数据成为各部门绩效评价的基础,同时明确数据采集认责部门,使员工重视和提升数据质量。目前金融大数据不但广泛应用于建行财务部门的报告、分析、考核过程中,更逐渐应用于其他业务条线的精准营销、金融创新、综合定价等,切实支持了建行以客户为中心战略的推进实施。金融大数据在银行运营中应用得越深入,就越能发现源数据采集、数据计量方法以及数据模型存在的问题。通过提高数据基础质量,也会进一步提升数据分析与应用的深度和广度。建行通过企业级数据建模及大数据新一代核心系统平台建设,全面优化内部数据结构和质量,极大推动了数据在银行的深入应用。除传统业务中已经采集整合的相关交易、账户、产品等方面的结构化数据外,建行还逐步采集客户电子渠道中的交易行为、客户语音以及社交等数据,对这些海量数据的整合分析,将会拓展建行内部盈利的空间,加强成本分析能力,从而提升银行绩效管理水平。

三、我国银行大数据应用存在的问题

(一)没有差异化区分客户,难以进行精准营销

由于银行的客户群较为复杂,行业、分布地域、文化水平、风险偏好等方面的差异都会导致客户选择不同的银行产品。对于跨行业跨区域的集团企业客户,需求会随经营发展所处的阶段而动态变化。多样化是金融产品非常重要的特点之一,可以帮助客户按照需求理解不同银行产品的特点,选择适合自身的产品,进而取得收益,这也是银行维护其客户关系的根本所在。但某些银行产品由于设计和销售思路只从银行收益最大化考虑,并未考虑目标客户的需求特点,没有牢固树立以客户为中心的营销理念。

(二)银行数据准确性标准高,数据管理难度大

在所有行业中,银行业数据管理的难度最大。一方面,由于银行业的IT系统建设相对较早,随着业务发展不断“打补丁”,多年积累下来,信息系统非常复杂;另一方面,因为银行对数据准确性要求非常高,其中的一些高标准是其他行业难以比拟的。此外,历史原因使得很多银行数据非但没有统一的标准,而且还存在数据信息不一致、不完整的情况,这都增加了银行对大数据管理与应用的难度。

(三)外部数据资源有限,数据交易市场尚未形成

随着银行对大数据需求的不断增加,大数据提供商随之产生,但部分供应商企业规模、运营管理都处于初创阶段,并且市场前景不明朗。有的电商企业从自身业务出发,利用自身交易平台获取基础大数据,存储并进行处理,然后通过大数据交易得到一定收益。对银行而言,在外部数据的使用受到大数据开放环境限制、大数据交易尚未形成市场主流形态的情况下,使用、购买外部数据应持谨慎态度。

(四)难以及时更新大数据,风险控制水平尚待提高

目前,国内金融行业能够成功运用大数据进行风险管理的只有少数几家,主要依赖卖家累计的海量交易数据和资金流水,在几秒内完成对商家的授信,但是其模式的实质依然是应收账款质押融资或存货抵押融资,并未在真正意义上应用大数据。目前,国内银行相关平台缺乏闭环的交易信息,对借款人的约束力还不够强,无法有效地将风控和大数据进行结合,仅仅依靠大数据难以评估授信客户的违约风险。

(五)大数据人才严重短缺,大数据应用和开发受到影响

银行大数据应用要求其专业人员能够很好地理解金融产品、管理数据资产并具有处理及挖掘数据的相关能力。目前,银行内部机构大多采用条线划分管理,各部门各业务相关条线之间分工明确。由于技术条线与业务条线的专业人员难以有效沟通,使得大数据系统开发前期进展比较缓慢,一些高难度的银行业务转为数据处理的开发过程漫长。银行大数据相关人才严重短缺,使得大数据的应用开发受到影响。

(六)缺乏特定数据管理规则,数据噪音造成模型失效

美国征信系统的完善很大程度上缘于美国政府对其手中的大数据资源持开放态度且日益透明化。而目前我国一些权威的政府数据资源能否向民间开放,是信息化时代金融业发展遇到的最大挑战。目前各个平台借助自己的渠道,自发记录不同客户来源、维度、时间序列的交易数据并进行混合应用的现状,使得大部分数据没有特定管理规则而产生噪音,造成银行征信模型失效。

四、CapitalOne大数据应用战略对我国银行的借鉴

与大多数金融控股企业不同的是,CapitalOne最先起步时仅仅是纯粹的信用卡公司。但其早在1988年便已经前瞻性地意识到对现有客户群体进行分层管理的重要意义,并提出信息驱动这一战略对策。从目前的资产负债、营业收入和业务结构可以发现,CapitalOne似乎是一家标准意义的传统银行,并无太多新意。但如果進一步深入分析,就可发现驱动CapitalOne近年来高速发展的管理理念却与传统银行有着天壤之别。实际上CapitalOne传统业务结构外衣下隐藏的是一家以金融大数据分析为核心的信息化银行。

(一)自主研发数据模型,自主建设数据分析系统

CapitalOne一直将信息系统看作整个银行业务的神经系统,不能受到外部企业影响。为此首先抛弃了借助第三方企业外包提供信用评分相关模型的普遍做法,积极进行自主研发,同时投入大量资金构建客户数据相关信息处理系统。CapitalOne将其信用卡客户分为三类:过度借贷、违约风险较高的垃圾客户群体;信用良好、基本能够按期偿还的高收入群体;往往将欠款延期但能还本付息的低风险群体。前两类客户并不会给银行贡献太多利润,而占客户群体20%的第三类客户却能贡献信用卡业务125%的利润。因此,第三类客户是CapitalOne需要的优质客户。研究自身优质客户的特点及对银行产品的需求,不能全部依靠外部数据。尽管美国征信企业积累了大量个人数据信息,但如果只通过征信数据进行相关信贷决策就会面临两个问题:一是银行所有竞争者都能获得相同的数据;二是哪怕信用评分相同的客户,其信用产品需求和违约风险也不一定相同,所以必须在银行内部积累更为准确细致的数据信息。

(二)利用实验改进数据模型,利用实验结果改进产品设计

CapitalOne开始实施实验改进,通过营销渠道、收入状况以及信用评分等维度将信用卡客户区分为若干实验群体,将设计的产品投入到对应的实验群体中,同时利用内部数据模型,将客户反馈信息数据与现有客户相关的特征数据进行严格比对,从而将各类客户细化区分开来。因为CapitalOne所有的数据分析实验都是在严格的数据模型指导下设计的,因此得到的实验数据结果也更加精细。依靠这种大量的产品测试,CapitalOne就能深入了解各类客户群体的用卡习惯、产品偏好以及风险特征等信息,从而改进产品设计或营销方式,直至CapitalOne认为产品已比较成熟,才会开展大规模的产品推广。以信用卡管理最核心的风险控制为例,依靠积累的大量数据以及强大的数据分析能力,CapitalOne将不同类型客户的风险特征加以区分,从而大幅度提高对违约率预测的准确性。风险管理水平提高使得CapitalOne能够承受比其他银行低得多的信用卡年化利率,吸引大量优质的低风险客户,如此一来建立的规模经济优势增强了自身的核心竞争力,让竞争对手更加难以超越。

(三)通过信息驱动整合业务平台,通过并购增强数据应用能力

20世纪90年代末期,由于信用卡行业发展较慢,CapitalOne管理层着手业务结构调整,朝着业务多元化方向转型。在保持绝大多数子公司独立经营的前提下,CapitalOne通过建立业务平台方式将拥有同一业务内容的子公司进行整合。而这些业务平台的建立,均根据信息驱动战略实施。例如,CapitalOne在并购Summit后,通过将其客户数据系统与CapitalOne的信用卡客户数据系统共享对接,进一步优化信用评分模型,从而大幅提升汽车金融板块业务的绩效。此后不久,CapitalOne又并购PeopleFirst以及Onyx两家从事汽车金融的企业,两家公司的业务虽然已被整合至CapitalOne的汽车金融平台上,仍保持运营的独立性。在业务方面进行大力拓展的同时,CapitalOne也积极并购大量科技公司以进一步强化其数据开发和分析能力,近年来并购的几家企业如AmeriCommerce、BundleCorp、Bankons等均在大数据应用的某一细分领域具有明显领先的技术。

(四)重视人才综合素质,重视员工能力培训

完成如此大量且复杂的实验设计以及数据分析,必然需要一支高精尖的人才团队。在CapitalOne的人员招募中,尤其强调IT技术、金融以及统计分析等方面的综合素质。被CapitalOne录用以后,新员工要参加为期18个月的ITDP培训项目。同时CapitalOne也鼓励员工大胆试错,即使是初级数据分析师,也可以独立承担产品测试。此外,员工激励方面,CapitalOne慷慨匹配以全球顶尖企业薪水,同时鼓励人才参加股权激励。在CapitalOne创业初期,就有30%以上的员工持有股份。一般情况下,CapitalOne的项目组成员涉及技术和营销人员、业务和品牌经理以及数据分析师等,其中营销、业务和品牌人员主要负责项目整体设计,团队中的数据分析师主要负责项目前景分析,技术人员负责项目技术实现。这种集设计、分析、工程建设于一体的作业流程,成功实现了对业务的多维度监测。

五、加强规划,推动我国银行大数据应用的持续深化

(一)系统化推进金融大数据应用战略

金融大数据应用是一项系统性工程,涉及银行内部各业务条线,因此要在理念思维、机制建设、数据开发及整合上进行统筹安排,同时建立对金融大数据采集、加工、分析以及应用的统一管理机制,通过项目管理方式及工具,保障大数据平台建设。首先,要树立金融大数据决策理念,重视对已有大数据的开发利用,通过推进数据治理,进一步提升内部数据质量管理水平;营造数据治理的企业文化,倡导用数据说话,定期编制相关定量分析报告并以此进行业务决策;将积累的数据资源转化为信息资源,从而为业务管理和决策提供信息依据,使决策更加可靠。其次,进一步制定完善相应制度和流程,健全金融大数据管理应用体系,在确保信息安全的同时,大力提高数据利用率。此外,在组织架构上还需保障人员与投入,持续完善数据团队建设,同时加强总分行对基层各业务条线以及行业分析的团队建设,重点在于提升团队数据挖掘和分析能力,要求团队能够在决策相关信息不完整甚至互相矛盾的情况下进行合理判断,提出较为有效的解决方案;通过关注数据细节,能够对异常数据及时进行反应,了解数据模型隐含的营销思路。

(二)处理好与数据供应商的竞争合作关系

尽管各大电商平台每天都要产生大量交易,但交易相关的支付结算业务大部分被第三方支付机构抢占,银行由于处于支付链末端,相比之下从中得到的价值较小。目前银行自有数据库并不充足,可通过与电信、电商以及社交网络等达成战略合作关系,实现数据信息交换共享,进而全面整合客户数据信息,将银行服务与电商平台、移动网络以及社交网络等进行融合。银行要发展自身的大数据平台,就要突破传统的数据采集来源,注重互联网以及社交媒体等外部数据来源,利用各种渠道获取充足的客户和市场相关资讯。一是有效整合新的客户渠道,通过发挥社交网络作用,增强对客户的了解以及互动。二是注重发挥新媒体作用,利用网络论坛、微博、微信等即时通信平台,将其打造成与电话客服同等重要的服务渠道。三是通过将内部数据与外部平台数据互联,获得更加完整的客户数据。四是通过社交网络数据、移动数据等进行产品创新,实施精准营销。五是注重利用新媒体平台进行相关舆情监测,在潜在风险事件爆发前及时有效处置,从而降低声誉风险发生的可能。

(三)夯实金融大数据应用基础

进一步加强银行数据中心建设,精心构建数据仓库,不断积累相关历史数据、经营数据以及管理数据等信息;通过规划金融大数据处理平台,分步骤接入银行内外部各种渠道数据,从而逐步积累丰富银行的数据资产;进一步提高数据整合加工的速度与效率,尽可能快速地发现数据的价值。持续推进数据分析挖掘平台建设,深化金融大数据分析技术与工具研究和应用,持续提高团队数据分析能力。对具体的业务数据分析应用及时进行梳理,通过搭建相关数据分析主题集市,开发涉及客户分层、交叉销售以及风险评级与预警等一系列数据营销模型,逐步发挥数据决策的作用。进一步加强数据平台系统运行稳定性与处理能力,强化数据保障,形成全行制度化标准化的数据流程,优化基础设施建设,应用分布式架构,继续深化应用云技术,从而实现提升数据容量、加快数据交换速率,保障金融大数据读写速度及准确性多重目标。进一步提高数据治理与分析水平,通过与监管机构、科研机构、互联网企业等合作,不断积累大数据应用相关的技术储备,夯实大数据应用基础,为业务创新创造条件。

(四)提高数据分析师的工作效率

银行管理层可以对所有员工能力进行普查,这不仅能发现具有数据分析能力的人才,也有助于银行准确评估自身数据分析能力的缺口狀况。对银行内部的数据分析人才,可加强应用培训,使其更好地胜任数据分析师工作。进一步提升数据分析师工作效率,首先,建立信息技术架构,有效帮助数据分析师高效获取和应用数据资源,帮助其把更多精力放到分析和理解数据上,促使其发挥创造性才能,避免把时间浪费在搜集或者整理数据上;其次,促进分析师与业务部门间的沟通,使数据分析师准确理解业务需求的目的和意义;再次,不断复用已有的分析成果,将以前分析师所做的分析总结设计成流程、模板,提升数据分析师的工作效率;最后,有效管理需求质量,考虑安排需求的优先级,把有限的分析资源投放到最需要的地方,进一步释放分析师的产出效率。

(五)通过数据分析实现风险管理精细化

切实提高银行风险管理水平,运用大数据理念重新设计全面风险管理体系,同时理顺部门间的职责,进一步淡化部门色彩,摈弃以往小数据模式下部门、机构、区域以及产品间数据信息相互分隔管理、由基层分支行自行甄别风险的做法,形成根据客户群体集中统一管理数据的高效协调机制。大力推行现场调查方式和非现场数据挖掘分析方式相结合、模型筛查方式与经验判断方式相结合,进行以定性信息与定量信息等多重数据信息相互勾稽核验等为核心的风险管理创新。利用对大数据信息的深入挖掘分析,勾画出银行客户的全景视图,以便更全面地评估客户真实的风险状况,从而提升贷前风险判断以及贷后风险预警能力。持续完善金融大数据信息平台基础上的集中风险审查审批流程,采用大数据分析方式验证授信对象的数据信息,校正业务部门对借款人的风险评估结果。运用合理的参数和数据模型,计量出可接受信贷风险最大敞口,从而精准识别和动态审查每个借款人的每笔授信业务。利用习惯性数据信息及常识性逻辑性分析,通过更专业的判断使相关风险识别、防范以及决策更加可靠可信。

(作者单位:湖州职业技术学院,邮政编码:313000,电子邮箱:soundleon@163.com)

猜你喜欢
数据模型数据挖掘风险管理
基于数据挖掘探讨慢性肾衰竭处方规律
住房公积金风险管理信息化审计探讨
风险管理在心内科中的应用效果观察
基于区块链的微网绿电交易数据模型研究
关于PowerDesigner软件工程技术的研究
养老保险精算的分析与风险管理的研究
养老保险精算的分析与风险管理的研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究