孙伟力 王萌
一、信用评分与大数据征信
信用评分业务作为最早开发的金融风险管理工具,是征信机构在利用大量历史数据建立评分模型的基础上,充分运用预测模型进行自动、批量的运算,实现对信用风险自动化评估的业务形式。最早的信用评分系统可以追溯到1801年的英国,经过200多年的发展,西方发达国家的信用评分业务已经相当成熟,并充分应用于信用评估领域。信用评分可以减少对信用报告不必要的使用,而且相比于信用报告,能够在更注重隐私保护的前提下,对信息主体做出客观的信用评价。
(一)信用评分的规范应用需集中在金融领域
与信用登记、信用调查等其他征信业务不同,信用评分业务的产生与发展天然就是建立在大型数据库和模型构建技术这两个必要的应用基础之上的。自20世纪30年代以来,美国国内上千家征信机构经过不断地并购细分,逐渐发展为目前的益博睿(Experian)、环联(Transunion)、艾奎法克斯(Equifax)三大征信公司,也是目前全美最大的3家个人征信数据库,覆盖了超过85%的美国公民。在此基础上,费埃哲公司(Fair Isaac Corporation)利用模型分析技术建立了经典的FICO评分系统,信用评分业务得到充分发展。近年来,征信的信用信息共享功能日益为社会各界所重视,“信用评分”逐渐由金融领域扩大运用到民事、公共治理甚至行政司法领域,人们对各自领域所谓的“信用信息”进行评分,这一定程度上丰富了“信用评分”这一业务形式的应用场景,推动了社会信用体系建设的进步。但是从本质上讲,此类“信用分”并不属于征信意义上的信用评分,虽然在大数据背景下,传统信用评分模型逐渐向大数据方向转变,但其出发点依然是辅助进行信贷决策的信用风险评估工具,大数据下的信用评分仍然应该是传统信用评分业务的延伸,其规范应用也应该集中在金融活动和信贷交易领域。2021年1月11日,中国人民银行公布的《征信业务管理办法(征求意见稿)》,也明确指出信用信息指的是为经济金融活动提供服务,用于判断个人和企业信用状况的各类信息。因此,本文所有对信用评分的讨论均建立在这一原则基础上。
(二)信用评分是大数据征信的重要业务形式
大数据时代,随着数据挖掘和统计建模技术的不断升级,可用于评估人们信用的信息越来越多,“大数据征信”被反复提及,但业内人士却始终对此存在分歧,有人认为大数据征信是传统征信的重要补充,也有学者认为所谓“大数据征信”的概念带有“征信泛化”的倾向。实质上,分歧的焦点在于对“信用信息”概念的模糊认知,征信活动开展的基础是信用信息,而大数据指的则是无法在一定时间范围内通过常规手段进行采集、整理的数据集合,包括大量的半结构和非结构化数据,尤其是互联网时代,非结构化数据越来越成为大数据的主要构成部分,因而信用信息天然属于大数据,但并非所有的大数据都属于信用信息。大数据征信的实质就是利用先进的数据挖掘技术,低成本、高效率地获取更多的信用信息,其采集范围延伸至传统征信无法覆盖的领域,内容囊括了被传统征信排除在外的半结构甚至非结构化数据,在此基础上建立的评分模型也更重视信息的实时性和动态性,可以更好地缓解信贷交易双方之间的信息不对称。而且从普惠金融的角度考虑,在合规前提下充分挖掘可用于评估信用风险的各类数据,有利于提高信贷可获得性。
二、我国信用评分业务的发展现状
(一)传统的信用评分业务
1. 征信中心个人信用报告数字解读。我国目前已经建成了世界上最大的全国金融信用信息基础数据库,接入机构不仅包括传统商业银行,还包括网络小贷公司、消费金融公司、融资租赁公司等,具备开展个人信用评分业务必要的数据基础。在此基础上,中国人民银行征信中心推出了个人信用报告数字解读(以下简称数字解读),用于预测放贷机构个人客户在未来一段时间内发生信贷违约的可能性。数字解读具备传统信用评分典型的“5C”特征,預测变量覆盖还款历史、当前负债、信贷申请、信贷组合以及信用历史长度五个主要范畴,取值的范围为0—1000,并创新性显示相对位置排名,因为具有通用性、科学性和稳定性的特点,目前广泛应用于贷前、贷中和贷后管理的各个环节。
2. 传统授信审批中的量化风险指标。我们对主要传统银行业机构的授信审批进行了调研,结果显示,传统银行业机构在个人信贷业务审批实践中主要参考信用历史指标(未结清贷款余额、贷款和信用卡还款记录等)和财务状况指标(抵质押率、收入偿债比等),小部分银行会考虑借款人的道德诚信、人生阅历,但这一环节通常采取人工介入的方式进行评价,并没有相应的量化指标。另外,部分银行专门针对普惠性小微企业制定了评分模型,模型维度同样以财务指标为主,包括偿债能力、盈利能力等几个方面(见表1)。
可以看出,无论是个人贷款还是小微企业授信,传统银行业机构在信贷审批过程中更多依赖传统渠道积累的关联度高、易获取的基础信贷数据,其建立的信用评分模型也侧重于精准剔除高风险的客户群体,但一定程度上也将部分缺乏足够信用历史的优质个人和初创企业客户排除在信贷体系之外。
(二)互联网信用评分模型
1. 互联网金融的发展需要互联网信用评分。我国的征信体系以公共征信系统为主,互联网金融公司和金融科技企业在获取银行核心信贷数据方面受到严格监管,这主要是因为互联网金融作为创新性业态,风险隐患较多,而且我国的征信法规一向更侧重于保护信息主体的合法权益。这就导致一些有意向开展信用评分业务,但无法低成本获取全面银行业信贷数据的互联网金融公司,转而依托其他数据源,研发新的大数据信用评分模型。然而,就数据来源而言,互联网信用评分模型同样存在明显的局限性:相较于核心银行业信贷数据,行为偏好、消费习惯类数据与信用风险的相关性终究是太弱,不符合征信数据通用、成熟、稳定和信用相关性强的特点,而且不可避免地会存在“刷单”等模型套利行为,不适合用于大额的信贷审批,
2. 互联网信用评分具备典型的大数据特征。互联网信用评分的数据来源包含大量生活类信息,数据维度中加入消费者行为偏好、人脉关系等各种动态信息,更看重信息的时效性,可以最大程度上识别信息主体的信用风险,尤其是在缺乏信用历史的年轻客户群体风险识别方面,有其独特的借鉴意义。本文随机选取了500名20—30岁之间的年轻客户进行调研,结果显示:超过99%的年轻人有网络消费行为,其中使用过花呗的比例达到了91.78%,有22.97%的年轻人出现过分期还花呗的情况,另外还有6.08%的年轻人使用过借呗等网贷产品。与之相对比,仅有10.81%的年轻人表示自己在传统银行业金融机构开立过信用账户,但对未来有可能的贷款需求,95.89%的年轻人表示会优先选择传统银行业金融机构,剔除未来的房贷因素,仍然有超过半数的年轻人维持原来的观点。但当因缺乏足够信用历史被银行拒贷时,近七成(69.18%)的年轻人表示会首选正规的网贷平台,而在“网贷平台意向影响因素”一项,受访群体不选择网贷平台的原因也集中在“无法区分正规平台、担心遇到诈骗、担心泄露个人信息”3项(见图1)。
从这个结果可以看出:第一,相当一部分优质的年轻客户群体,在传统银行业机构缺乏足够的信用历史,但互联网信用消费行为却很普遍,在传统征信领域之外积累了大量的信用数据。第二,年轻群体对互联网金融的接受程度更高,未来也更容易接受网络借贷和信用消费行为,之所以将传统银行业机构列为优先选项,更多是出于对当下的风险认知,未来随着监管体系愈加完善,互联网信用评分的应用场景也会更为广阔。
三、未来信用评分业务的发展方向
传统信用评分与大数据信用评分侧重点不同,同样也都存在一定的局限性,二者结合能够最大限度地服务于信贷决策。然而,目前国内并没有出现可广泛应用于不同决策场景的大数据信用评分,这是由多方面原因造成的:一是因为我国征信行业起步较晚,大数据征信亦方兴未艾,目前尚没有经过市场论证的大数据信用评分模型。二是因为不同机构的信用风险管理水平参差不齐,而且在信贷审批实践中,时常介入人工干预,“数据驱动型”的量化信用风险分析占比相对偏低。三是我国的信用管理领域一直以传统征信为主,信息使用者主要是传统持牌银行业机构,对广泛开展信用评分的互联网金融领域暂时还没有实现全面覆盖。
2020年,艾奎法克斯(Equifax)与科尔曼·帕克斯公司(Coleman Parkes)合作,对零售银行、金融公司以及债务处置等信用管理部门的业内专家进行了一次深入调研:超过1/3(36%)的受访者表示希望通过更先进的数据分析技术支持更加准确的信贷决策;还有近1/3(32%)的专家表示,希望在进行信贷决策时能够实时获取交易活动信息,31%的受访者希望获取上下文交互信息来强化传统的信贷分析模型。另外,调研过程中还发现,大部分信用管理专家(74%)认为强化数据挖掘和分析技术会大幅推动信用管理产品创新。换句话说:未来信用管理行业的发展势必要融合“大数据思维”,信用评分作为与大数据技术联系最为紧密的征信业务形式,未来也不能仅仅停留在对信用报告进行数字化解读的初级阶段。
四、发展大数据信用评分的政策建议
(一)支持全链条模式的独立风控模型机构
在当前数据维度剧增的情况下,FICO评分那样的传统“5C”模型无法满足各类群体的风控要求,需要的是能够编辑处理大数据的新型信用评分模型。但传统银行业机构目前更多地是依托信贷历史数据自建风控模型,而金融科技公司受业态限制无法有效获得核心信貸数据,因此,需要加大对全链条模式的独立风控模型机构的支持,增加大数据信用评分在传统信贷领域的应用,打通信用数据、模型技术和信息使用者之间的“次元壁”。
(二)参考大数据网络征信模式开展信用评分
未来信用评分业务应该充分借鉴先进的大数据网络征信模式,推动人工智能和机器学习、移动/5G和区块链技术与信用管理的专业整合,利用大数据技术充分挖掘、分析实时交易活动、信息交互等高相关性的半结构和非结构化数据,不断改进决策过程、升级决策模型,最终落脚于为资金供给方提供更精准的信贷决策、为企业和个人提供定制化的征信服务。
(三)依法采集互联网领域可用的信用信息
互联网拥有更为广泛的用户群体,包含各类电商平台和第三方数据公司。电商平台积累的消费数据有利于全面评估个人的信用意识,而第三方数据公司提供的特定领域数据可以帮助判断企业或个人的履约风险,此类数据可以有效增加模型精度,因此应该重视对此类数据的采集。
(四)联合政府职能部门推动公共信息共享
无论是对传统银行业机构还是互联网金融机构来说,社保信息、司法、工商、税务等公共事业信息对提升风控模型精准度都有着极大的帮助,因此,要想借助大数据技术构建一个全面的信用评分模型,必定要联合政府职能部门实现此类数据的互联互通。
(五)加强对信息主体合法权益的保护力度
《征信业务管理办法(征求意见稿)》明确强调要加强个人和企业信息主体权益保护,保障信息安全。大数据信用评分模型涉及传统征信信息以外其他信息的数据采集和存储,比如采集支付宝、花呗等消费记录判断信息主体的收入水平等,因此,信息采集前获得信息主体授权以及数据处理过程中做好隐私信息的保护是开展评分业务的必要前提。
五、结语
大数据信用评分是未来信用评分发展的重要方向,但这是建立在模型数据充足以及模型精度经过反复论证的前提下,虽然以“芝麻信用分”为代表的互联网信用评分目前覆盖了购物、出行、通信等多个领域,但是当下我们最应该做的是融合多渠道信用信息构建大数据评分模型,并且回到信贷决策场景中进行充分的市场论证。
(责任编辑 刘西顺;校对 WY,XS)