王书斌 谭中明 陈峰
(江苏大学财经学院 江苏镇江 212013 江苏大学管理学院 江苏镇江 212013)
从2007年诞生第一家P2P网络借款(以下简称网贷)公司到2018年全国1931家网贷平台①数据来源于网贷之家公布的《2017年中国网络借贷行业年报》。,我国网贷行业经历了从无到有、从野蛮到规范的快速发展过程,P2P网络借贷已成为小微企业和个人融资的重要渠道。截至2017年底,网贷行业贷款余额达到1.2万亿元,同比上升60%,相当于全国商业银行用于小微企业贷款总量的5.24%②数据来源于银监会发布的《2018年银行业金融机构用于小微企业的贷款情况表》。,占全国境内消费贷款余额的3.78%③数据来源于中国人民银行发布的《2018年金融机构本外币信贷收支表》。。自2007年P2P网络借款诞生以来,网贷平台数量和贷款余额快速增长,我国P2P网贷行业的发展为缓解小微企业融资难提供了有益的补充,也为人们的生活带来了诸多便利。但是伴随行业快速发展,我国网贷行业同样出现了一些问题,如以贷养贷、多头共债和伪造借款者等。为解决这些制约网贷行业发展的问题,社会各界已经充分认识到发挥行业信用征集(以下简称征信)的重要作用。但就目前的征信发展状况来看,还是不尽如人意,尤其是在征信共享方面发展缓慢。鉴于此,本文倡导建立合理的信用共享机制,利用数据驱动发现网贷市场中借款者的数据价值,为行业发展拓展一种创新思路。
网贷信用共享是指多个网贷平台共同拥有借款者的借贷信息,共同分享信用信息的使用权。网贷信用共享有助于减少借贷双方信息不对称问题,激励借款者如期履约。通常一家网贷平台无法掌握全部借款者的信用信息,而不同网贷平台掌握的借款人群不同,贷款人信用信息也存在差异。如果能够通过信用信息共享机制实现网贷平台间的信息共享,就可以消除彼此之间的信息差异,帮助网贷出借者做出更客观的投资决策,降低借款违约率和投资风险(Jappelli,2002)。同时,信用信息共享能够对借款者产生自律约束力。由于信用信息共享机制的存在,借款者任何违约信息都立刻会被其他的出借者分享,而当借款者知道违约信息共享后,选择履约并保持良好信用记录成为最佳选择(Martin,2007)。
从征信共享模式来看,网贷信用共享模式分为政府主导型、市场主导型和会员型三类:政府主导型共享模式以公共征信机构为中心,强调个人权利保障,以欧盟成员国征信体系为代表;市场主导型共享模式以全国性私营征信公司为中心,运用市场机制提升网贷信用服务质量,以美国的征信体系为代表;会员型共享模式致力于协会成员单位征信数据的互联互通,如我国安融惠众的“小额信贷行业信用信息共享服务平台”(MSP)就属于封闭式的会员信息共享模式。每个国家选择网贷信用共享模式、建立网贷征信共享机制时不能照搬照抄别国模式,而应结合国情和实践,有选择地借鉴国外经验,形成适应本国经济、社会和信用文化发展的网贷信用共享机制。有学者认为,在互联网征信业务发展初级阶段,应以政府主导模式为主,逐步引导市场主导型模式健康发展,加快建立互联网金融行业协会成员信用信息共享机制,最终形成政府征信机构为引导、市场征信机构为主体、行业协会征信机构共同发展的网贷征信共享体系(牛润盛,2014)。
从征信共享参与者来看,网贷信用信息共享机制可划分为横向和纵向共享两种方式:横向信用信息共享方式是指同业联盟或协会组织下网贷平台相互共享信用信息的方式;纵向信用信息共享方式是指由征信公司牵头,与银行、证券、保险、小贷、担保等公司合作,组建征信联盟,跨行业共享信用信息的方式。网贷信用共享是减少网贷信息不对称问题的重要手段,我国应当分步骤建立网贷信用共享体系,但是,目前就建立信用共享体系的具体路径以及利益冲突的解决方法等问题尚未提出解决方法。
共享经济(Sharing Economy)也被翻译成为分享理论,是指将社会海量、分散、闲置资源平台化、协同化地集聚、复用与供需匹配,从而实现经济与社会价值创新的新形态(程维,2016)。共享并不以互惠为导向,也不是为了追求收益。共享经济在互联网环境下广泛应用,资源通过互联网平台将共享扩展到了陌生人。交易成本理论认为共享经济能够消除信息不对称,使得消费者看到历史服务质量和价格记录,同时激励生产者以产生优质服务(Rogers,2015)。消费协同理论认为共享经济超越所有权限制,通过共享产品和服务实现财富的重新分配(Belk,2014)。共享经济实质上是供需双方进行市场重组、创造新的市场的商业运作模式(Prahalad,2014)。共享经济为消费者和服务者创造价值,包括闲置资源的更有效利用、降低交易成本、扩大交易范围、减少信息不对称、增加信息集聚效应、增进消费者福利(刘奕,2016)。网贷信用共享属于共享经济,优化了社会资源配置,创造了经济和社会价值。从已经掌握的文献来看,采用共享经济理论分析网贷信用共享体系的文献并不多,有待进一步研究。
数据驱动概念来源于计算机软件工程中的数据驱动测试,即黑盒测试。把测试对象看作一个黑盒子,利用黑盒测试法进行动态测试时工程师只需要测试软件产品的功能,不需测试软件产品的内部结构和处理过程(陆惠恩,2017)。借助这种理念,数据驱动下网贷征信把借款者信用看成一个黑盒子,通过共享机制全面提供借款者的信用信息,侧重征信的功能性。数据和数字技术是21世纪的重要基础设施,各国政府应利用数据技术创新,大力发展中小企业和高附加值服务业,尤其是公共部门、卫生保健、科教方面的服务业,从而促进生产力增长和提升社会福利(OECD,2017)。因此,应积极推动数据驱动因素在网贷行业的普及,使借贷双方获得数据驱动带来的预期收益。
1. 主要网络征信平台发展现状。当前,我国主要的互联网征信平台如下:一是上海资信的网络金融征信系统。成立于1999年的上海资信有限公司是我国首家从事个人征信业务的机构。该公司主要收集全国的网络借贷、小额贷款、消费金融、融资租赁等互联网金融及非银金融信用信息,从而向合作机构提供个人征信共享服务、信用评级、征信增值产品开发等创新业务,并帮助网贷机构接入央行征信系统。二是安融惠众的小额信贷行业信用信息共享服务平台。该平台由北京安融惠众征信开发,旨在满足借款者黑名单信息共享的需求,设有借款者不良信息共享查询服务功能,采用传统的信用信息批量归集、定期更新和查询服务方式,使业内机构可以规范地对“借款者黑名单”信息在行业内、会员机构间进行披露和使用,从而起到防范授信风险、惩戒违约失信行为的作用。三是个人征信业务预备平台。2015年1月,央行印发《关于做好个人征信业务准备工作的通知》,要求芝麻信用、腾讯征信等8家机构进行个人征信业务准备工作。以芝麻信用为例,该信用机构是蚂蚁金服旗下独立的第三方征信机构,主要通过云计算、机器学习等技术客观呈现个人的信用状况,在信用卡、消费金融等上百个场景为用户、商户提供信用服务。其主导产品芝麻信用分是根据采集的个人用户信息进行加工、整理、计算后得出的信用评分。2018年2月,百行征信有限公司获得央行批准,成为我国第一家获得个人征信牌照的公司。该公司注册地为广东深圳,注册资本10亿元人民币,业务范围为个人征信业务。百行征信由中国互联网金融协会牵头,由芝麻信用、腾讯征信、深圳前海征信、鹏元征信、中诚信征信、中智诚征信、考拉征信、北京华道征信8家机构共同出资成立,其中互金协会持股36%,其余8家机构分别持股8%。
2.网贷征信行业现状。我国网贷征信行业的发展已经取得长足进展。一是发展网贷征信已经成为社会共识。电子商务信用信息数据已经成为一类重要的信用信息来源,在中国征信体系建设中,社会各界已经充分认识这一趋势,并积极地参与到网贷征信的建设之中。二是网贷征信企业已经初具规模。截至2018年2月,上海资信的网络金融征信系统累计签约机构1127家,共收录自然人4760万人,借贷记录数15.1亿条,日均查询量17.7万次。安融惠众的小额信贷行业信用信息共享服务平台累计签约机构2398家,共收录自然人1129万人。三是网贷征信的适用场景越来越宽泛。芝麻信用评分、腾讯信用评分等已经广泛应用到租车、购物、住宿等诸多领域,使消费者可以享受免押金服务,提高了社会的信用水平。
我国网贷征信行业也面临诸多问题。一是网贷征信覆盖广度和深度不足。虽然我国互联网用户规模已经超过7.72亿人④数据来源于第41次《中国互联网络发展状况统计报告》。,但互联网征信收录的自然人数量还不到1亿人,由此可见,尽管我国互联网金融发展迅速,但互联网征信覆盖广度和深度明显不足。二是现有网贷征信数据的利用率较低。互联网经济的繁荣带来了海量的用户信息,消费者在不同网络消费场景下的注册、网购、物流、搜索和评论等信息被各类征信机构重复采集,造成征信数据的大量冗余以及信用数据有效使用率的下降。三是网贷征信缺乏有效的数据共享机制。目前各家数据服务商之间以邻为壑、数据污染、非法搜集、倒卖个人数据现象较为严重,数据孤岛问题突出。网贷征信共享问题是当前我国社会征信行业发展迫切需要解决的问题。四是现有社会征信机构缺乏相应的行业规范标准和法律依据。当前我国网贷征信数据共享改革正进入深水区,如何解决数据共享和运营模式成为行业关注的焦点。网贷征信数据涉及企业风险识别、控制、评估和预警等,是企业花费巨资打造的风控根基,在没有相应经济利益激励的情况下,征信企业不愿意将核心竞争力进行共享。央行推出的信联平台是对建立行业数据共享机制的一次尝试,其共享效果有待于实践的检验。如果共享机制设计不好,信息孤岛还会广泛存在,因此信联平台如何解决数据源、运营模式等问题受到市场关注。
如上所述,我国网贷征信现状不容乐观,网贷信用信息的法治建设还不完善,征信资源整合难度大,存在行业标准缺失以及个人隐私泄露等问题。解决这些问题,网贷征信共享系统是基础。从数据驱动的角度来看,我国网贷征信共享系统发展滞后原因主要有:
1.网贷征信需求多样化。网贷平台在其股东背景、业务类型和衍生模式方面差异明显,导致征信需求水平不一。从网贷平台的股东背景来看,平台可以划分上市公司、银行、国资企业、民营个体和风险投资公司五类。例如,银行系平台风险控制完善,出现问题平台极少,社会征信需求弱;民营系平台数量众多,风险控制能力弱,社会征信需求强。从网贷平台业务类型来看,平台业务包括信用贷款、房产抵押贷款、车辆抵押贷款、股权质押贷款、供应链金融、委托贷款、银行过桥、票据、融资租赁、配资、资产证券化、保理、艺术品抵押⑤资料来源于网贷之家。,网贷平台既可以是单一业务类型的平台,也可以是多业务类型的平台。业务风险控制水平不同,社会征信需求也不同。例如,信用贷款的风险控制高度依赖信用风险的控制,迫切需要社会征信系统的支持,其社会征信需求较大;但对于以车辆抵押贷款为主的平台来说,由于车辆抵押贷款金额少、周期短,车辆抵押登记安全性和流动性有保障,同时车辆的保值性高,不会在短时间内出现急速贬值的情况,即使贷款逾期,抵押物也容易拍卖以补偿贷款损失,因此车贷平台对于社会征信需求不大。从网贷的衍生模式来看,网贷模式先后衍生出P2C、P2B、P2G、P2N、P2F等借贷模式。在这些衍生模式中,网贷征信需求已经由传统的金融机构征信需求向多元化征信需求转变,导致社会征信需求多样化。
2. 社会征信机构数量多与服务能力有限并存。如前文所述,随着互联网金融的兴起,我国征信机构大量涌现,新兴的电商巨头和传统的企业集团纷纷建立各自的征信平台,按照自己设计的场景解决企业内部的征信问题,并附带提供相关的社会征信服务,但个性化设计远远无法满足整个互联网金融行业的发展需求。同时,社会征信机构数量多还容易导致征信行业内部竞争激烈,两极分化明显。如前海征信、鹏元征信等企业发展时间长,处于社会征信行业的领导者地位,而新晋的征信机构在从业人员和市场份额方面明显处于劣势,信息收集的范围偏窄、历史数据积累有限,严重影响企业征信服务水平。由于社会征信机构并不是唯一的,不具备政府征信数据库的权威性和强制性,不同级别的社会征信数据服务费用不同,网贷平台可以自由选择适合企业的征信系统,所以新晋的征信机构面临巨大的生存压力。为了吸引更多的网贷机构参与进来,降低服务价格是常见的一种手段。但是长此以往,征信机构无法提高征信数据的质量与企业的服务水平。而且,对于网贷平台而言,不同征信系统信用数据来源不同,带给企业风险控制水平的效果不同,因此,选择合适的征信机构也是网贷企业面临的一大难题。
3. 社会征信系统信息共享与利益分配的矛盾。互联网环境下,共享经济受到广泛关注。社会征信系统信息共享体现在信用数据资源的共同分享及利用。以互联网为媒介,各家社会征信系统以不同的方式付出和受益,共同获得信用信息的红利。但是目前社会征信系统信息共享尚未实现,主要的问题集中在技术和利益分配上。在技术上,各征信机构依托自有系统建立的信息标准体系之间互相不兼容,征信信息实现共享需要各平台对自有系统进行改造。在利益分配上,共享数据的数量和质量存在巨大差异,一家平台不愿意将自己的客户信用数据进行分享,因为信用数据是互联网金融企业的核心竞争力。征信机构规模有大小之分,信用数据数量和质量就会出现悬殊。每家平台都为获得信用信息投入大量的资源,如果拱手让与自己的竞争对手,将会造成自己平台业务发展的被动、市场份额的下降,使自己处于市场竞争中不利的地位。社会征信系统共享是一种公共利益的体现,净化的是整个网贷行业的信用,甚至是整个社会的信用环境,但是单独的某一家征信机构没有能力、也没有动力搭建社会征信共享平台。
1.总体概况。美国网贷征信共享模式具有服务效率高、信息共享程度高的特点。该模式采取市场化方式运作,注重构建公正有效、市场主导的信用共享体系,形成规模大、集中度高的征信行业。在美国,全国性个人征信公司仅有三家:Equifax、Experian、Trans Union(Artzrouni,2009),能够依据市场需求提供多样化产品。其余1000多家小型的征信公司面向特定的细分市场,为需求量较小的需求者提供服务。联邦贸易委员会(FTC)和消费者金融保护局(CFPB)负有对个人征信机构的监管责任。
2.征信共享基础。美国信用共享内容包括身份识别信息、贷款交易、偿还记录、与信用相关的公共记录。美国信用共享注重以下几个方面:一是规范标准化的数据格式。由私营征信机构组建美国消费者数据协会(CDIA),制定统一数据报告格式(Metro1)和统一标准数据采集格式(Metro2),定期更新信用数据标准,并通过各家征信公司的长时间使用达到数据格式的统一。二是广泛使用数据黑盒。个人信息被封闭在数据黑盒中。美国征信共享涉及个人数据采集、使用、披露,禁止共享个人敏感信息,如思想、宗教、健康、犯罪嫌疑等信息。同时,美国信用系统信息不允许过度使用或者滥用个人数据对消费者隐私造成侵害。三是注重信用数据的质量。由于个人征信涉及海量数据,纠正错误需要付出很大的成本,1970年美国出台的《公平信用报告法》(FCRA)明确指出,个人有权利对不正确的信息提出异议,并要求对信息进行修改或者删除。四是防范身份盗窃的影响。所谓身份盗窃是指非法获取他人账号,假冒他人身份使用信用信息获得资格证明、商品或者服务。消费者成为获得更多自身信息并使得自己成为防范身份盗窃的第一人。五是采集线上和线下信息。信用机构不但可以从报纸、社区等线下渠道收集消费者信用,也可以通过互联网、手机等线上渠道收集信息。
3. 征信共享机制。一是信用风险定价统一。美国推行单一价格法,促进了其信贷征信市场的形成。《公平信用报告法》规定,在消费者信用市场上使用单一价格,也就是消费者信用风险定价与地理位置无关。信用评分是统一市场下的重要征信衍生产品、是消费者信用报告的数字摘要,是自动化贷款决策的基础(刘新海,2016),也是评估消费者违约风险的依据。二是具备完整信用产业链。美国有3万个数据提供商,提供的数据包括公共信息和企业信息,而全国性征信机构和专业征信机构共享这些数据,再由FICO和SAS等数据技术提供商进行数据挖掘,最后通过征信服务商向征信需求者提供征信服务,形成完整的征信产业链。征信机构巨型数据库一旦形成,具有规模效应,成为小型征信机构业务的依托。尽管三大征信机构的数据有95%相同,覆盖大约90%的人口(刘新海,2016),但由于数据处理方式不同,最终的信用报告和信用评分也不同。专业征信机构聚焦于特定市场,进行更深度的调查,如就业、房租、电信缴费等。三是数据处理技术发达。在大数据的驱动下,以计算机人工智能为代表的信息技术使得数据处理维度更加丰富、评价结果更加稳定、评价效果更加理想。美国的征信共享数据库是通过不同征信机构兼并重组而形成的巨型数据库,是典型的集中式征信共享模式。四是信用产品丰富。如评分产品包括综合信用评分、损失评分和定制化的风险评分等。其中,综合信用评分用于预测偿付违约可能性,损失评分用于预测个人破产可能性,定制化的风险评分将使用者定制的风险评估模型运用于个性化的风险评估中。又如个人风险报告,包括信用价值评估、欺诈预警、决策支持和策略咨询等。五是数据使用收费。三大征信机构的分销商或者代理商按照批发价获取征信报告以及不同信用机构的共享数据,并提供增值产品或评分服务。消费者可以免费获得信用报告一次,超过一次则需要向征信机构支付服务费。
1.总体概况。欧盟的个人征信模式属于政府驱动的公共征信模式,是主导个人权利保障的征信共享系统。欧盟的的私营征信机构主要依托公共征信机构,例如中央银行的征信信息。
2.征信共享基础。一是保护个人数据黑盒。2016年欧盟通过《数据保护法》完善个人隐私数据保护,防范数据泄露和滥用,维护信息主体合法权益,在保护人权和开放数据之间取得平衡。二是提高数据黑盒的质量。保证个人对自己信用的所有权,允许信息主体有权更正和阻止错误信息的传递。如果信息有错误,信用机构有责任予以更正。如果认为信用信息不属实,信息主体可以提出异议,甚至可以举例反驳。例如,德国的《联邦数据保护法》规定:个人数据的处理和使用必须征得本人的书面同意,同时将用途告知当事人,并且当事人有权获得自身信息并进行更正(李俊丽,2010)。
3.征信共享机制。在欧盟成员国中,私营征信机构和公共征信机构并存,互为补充,是典型的分散式征信共享模式。行业采取统一的标准,在数据采集、整理及发布上必须严格遵守相关法律。公共征信由政府协调各方面信息,建立信息数据库,容易形成规模,主要向金融机构提供服务,但是产品缺乏竞争力。
部分国家征信共享内容
其他国家的网贷征信共享系统以日本为代表。日本个人信用信息中心是日本最主要的个人征信机构。其征信共享的数据信息主要包括身份信息、信用交易信息和公共信息等(邱念坤,2014)。日本的个人信用信息中心不以商业赢利为目的,对提供的信息数据采取收费方式,维持中心的运行和发展。
1.统一数据标准。数据标准的统一需要从国家和行业层面着手,尽快构建统一的数据标准体系,规范互联网征信机构的信用信息采集、传播和处理途径,以此提升基础数据的质量和处理能力。
2.扩大数据范围。海量数据是网络贷款征信的基础,数据驱动下网络贷款征信将不同部门的数据进行整合,并在数据技术的辅助下加工成为有效征信基础数据库,为相关企业和个人提供信用评估服务,提高全社会信用评估效率和准确性。积极指导各类新型征信机构采集的信用数据纳入征信系统,扩大征信系统的采集范围,进一步实现新型征信机构与传统金融服务行业的信息共享。
3.保障数据质量。鼓励有条件的大型网贷机构联合数据技术服务商创建互联网征信平台,自主开发数据驱动的方法,挖掘数据价值的潜力,更加准确地评估客观风险,为网贷平台资金出借者的投资决策提供依据。
1.数据驱动的标准化。借鉴美国模式,将数据驱动进行标准化。如图1所示,从标准化查询到标准化信用反馈,中间就是数据黑盒。对查询者而言,征信共享系统就是信用数据黑盒,查询者无法获得其中的细节信息。在数据驱动下的征信系统中,统一的征信查询能够充分发挥市场征信数据的价值。数据驱动技术构建数据黑盒,有利于客户资料的保密和消费者权益的保护;有利于社会征信企业提升管理水平,打造规模化和专业化的核心竞争力;有利于市场效率的提高,减少不同机构反复信用评估和查询,节约社会资源。
图1 数据驱动的标准化图
2.数据驱动技术的多样化。随着人工智能、云计算等技术的不断发展,数据驱动技术能够进行海量数据挖掘并得出有价值的数据。为满足多样化征信需求,不同的数据驱动公司可以在自己的领域开发和研究数据挖掘产品,并且形成竞争。当网贷平台需要评估借款者信用时,可以筛选数据驱动技术服务商为其提供标准化查询服务。在市场竞争环境下,数据驱动技术服务商一定是在借款者所在细分市场中最合适的数据挖掘技术服务商,能够帮助网贷平台准确评估借款者的违约风险,为放贷者提供决策参考。如果数据驱动技术服务商服务水平有限,导致放贷者遭受损失超过行业的平均损失水平,数据驱动技术服务商就会面临淘汰的风险。对于数据驱动技术服务商而言,需要满足客户多样化的信用评估需求,而且评估结果需要标准化。客户的需求可能是多样的,数据驱动技术服务商的产品是单一的,数据驱动技术服务商需要具有强大的数据挖掘能力,遵守征信法律法规,满足客户多样化需求。
3.数据经济价值的产业化。产业化有利于解决大型平台不愿意共享数据、小型平台缺乏数据的问题。建立一条从征信需求者到数据技术服务商和数据供应商的产业链,在规定时间内数据供应商按照数据的质量和使用频率对数据使用进行收费,有利于促进整个社会征信行业的市场化,实现数据技术驱动下数据价值的最大化。
1.宏观基础。经济学理论中的萨伊定律表明:供给创造需求,经济一般不会发生任何生产过剩的危机,产品生产本身能创造自己的需求。商品交换意味着买的行为必须对应一种卖的行为。一种商品的支付增加,就等同于需求的增加。萨伊定律运用到征信市场上,征信的供给必须与需求匹配。但是这个机制经常失效,需求常常不能匹配供给。原因在于,出借者首先会考虑借款人的信用,而不会将资金借给愿意支付溢价的借款者,因为高利率容易导致出现逆向选择,最终提高借款者违约的概率,同时,高额的借款费用也会提高违约的可能性。信用报告的目的在于弥补这些信用问题,提供信用数据帮助出借者甄别借款者的真实目的,预测未来的行为,对违约风险进行定价。
2.微观基础。网贷征信共享系统依赖于经济微观个体。一是底层数据的标准化。有价值的数据是经过清洗、标准化的数据,因此统一的数据标准和统一的信用数据是数据共享的基础。二是数据市场供给交易机制。应分类规定数据交易:第一类是限制交易数据,包括医疗数据和个人隐私数据;第二类是或有交易数据,在特定场合下交易数据需要经数据主体同意才可以进行交换;第三类是无限制交易数据,主要是社会公开的数据,包括司法执行数据、可通过公开查询获得的数据。三是数据的合法性,包括微观数据取得合法、使用合法、规范等。四是数据使用的对价。共享并不意味着无偿使用,即使是政府官方数据也应收取使用费用,因为数据的收集、加工和整理需要支付费用。无偿使用无法促进企业提供高质量数量,不利于数据提供者的优胜劣汰。网贷信用数据是无形资产,其数据使用费用的确定即定价是网贷信用信息共享首先需要解决的问题。
图2 数据驱动下网贷征信共享系统的运行模式
数据驱动技术是建立在大数据基础上的,应用于网贷征信共享系统的数据收集、清洗、转换、整合、存储、挖掘和报告等各个环节。数据驱动技术推动数据的资产化、智能化发展,创造出数据价值,提升风险评估水平,获得数据价值回报。数据驱动技术能够对最新数据及时反馈,提高整个网贷征信共享系统的快速反应能力,减少整个行业内的信息不对称。同时,数据驱动技术要求从共享的大数据中发现规律性价值,并能够按照征信需求确定分析对象,选择最优方法统计分析数据,帮助客户管理和识别风险,作出投资决策。数据驱动下网贷征信共享系统按其功能可划分为数据资产化采集、数据智能化挖掘和征信报告产品三个部分,并需要不断跟踪和提高数据质量(如图2所示)。
1.数据资产化采集。建立网贷征信共享系统的第一步是数据采集。每家网贷平台都会采集并且加工客户数据,既包括借款者财务收入、家庭状况等硬信息,也包括借款者相貌、社交言论等软信息。这些信息需要经过采集者的一次清洗和征信共享系统的二次清洗,这是提升数据价值的基础。只有经征信共享系统反复检验,并且对征信供给决策具有贡献度的信息才会被纳入共享系统,征信报告的使用者才会支付信息对价,实现数据的资产化。
2.数据智能化挖掘。数据驱动的核心在于数据智能化挖掘,最常用的方法包括聚类、分类特征选择和相关性分析等。通过人工智能等数据挖掘方法实现数据的交叉验证,判断授信主体的信用状况和信用发展趋势,协助出借者作出正确的决策。到了互联网时代,智能识别技术发展迅速,目前已发展出行为模式识别法、决策树算法、集群支持向量机、利润得分法、助长树方法、BP神经网络法、粒计算与信息融合法、模糊综合评价法等识别技术。这些技术能够提供知识表示和决策支持,帮助出借者进行风险评估。
3.征信报告相关产品。征信报告产品是标准化产品,通过数据驱动技术测算潜在风险,为出借者提供高效、便捷和准确的产品。数据驱动下的网贷征信报告产品能够为网贷平台提供有价值的借款者信用分析报告。利用智能化挖掘技术,征信报告可根据使用者的需求,围绕某一主题进行数据挖掘,充分利用共享数据,挖掘出借款者的特征,评估潜在的风险特征。
1.信息要素分配的重要性。按要素分配是指在市场经济条件下,根据各种生产要素在生产经营过程中发挥的贡献的大小,使用者按照一定比例,对生产要素的所有者支付相应的报酬的一种分配方式。网贷行业中,征信信息成为创造财富和价值的主要资源,是一种战略资源和生产要素。征信的作用代表不确定性的减少、风险的下降。根据马克思的劳动价值理论,征信信息本质上是网贷平台信息劳动成果,直接或者间接地参与平台的价值创造。一方面,征信信息提高了信用风险识别水平,使网贷平台风险识别能力大大提升;另一方面,征信信息降低了网贷平台的运营成本和信息不对称的程度,使得信用创造更有效率。征信共享对信用价值具有放大效应,在相同的时间内,征信共享创造的价值大于征信独占。这种价值放大效应来源于信息劳动成果。信息劳动成果创造了信用和知识,大大提升了行业的信用水平,使得网贷风险识别更加智能化,同时也有效防范了借款者的违约行为,提高了信息劳动成果的使用效率。一方面,借款者通过了解和掌握自身的征信状况,提升信用意识,增加信息劳动成果的价值;另一方面,信用意识提高能更好地帮助借款者利用自身信用,再次或多次使用信用,形成复杂的信息劳动成果,创造出更多价值。
征信要素对于网贷经营活动中的影响集中在征信技术减少了借贷双方之间的信息不对称,增强了借款者的守信意识,减少借贷市场的外部交易成本和内部协商成本。依据新制度经济学理论,交易成本是指在建立商品交易过程中没有被考虑到而损耗掉的成本。通过征信共享可以大大增进借贷交易双方的信息沟通,减少网贷平台的交易成本。因此,征信要素已经成为网贷平台的生产要素,甚至是核心竞争力。网贷平台可以通过征信要素降低交易成本,创造企业效益。
2. 征信共享系统在信用产业链上的重要地位。征信产业链的产生与网贷行业的劳动分工相联系,可以说征信产业链产生的本质是网贷行业的劳动分工。网贷企业的组织形式和共性特征催生了社会征信产业的内部分工,从而形成产业链。基于征信共享系统的产业链是行业信用资源的整合,以征信共享系统为核心,将不同类型的网贷平台联系起来,促进信息流和信用流的整合,能够实现征信信息的效用最大化。基于征信共享系统的产业链涵盖巨大的借款者群体,大量信息的汇集可以减少产业链信息之间的信息不对称。基于征信共享系统的产业改变社会信用的积累模式,促进了批量化和专业化的开发,提供了综合性产业集群服务。
3. 征信产业链的构成。征信产业链是一个共生的信用生态圈,各个经济主体通过供给与需求紧密联系在一起,创造价值并分享利润。各个经济主体业务关系紧密,并进一步形成商业信用关系,大幅降低交易成本,使得产业链上游信用收集和加工、产业链下游信息使用和监督等费用大大减少。在数据驱动下,网贷征信共享系统从征信需求者到数据供应商,形成一条完整的信用产业链(如图3所示)。征信查询者向数据技术商付费获得征信共享系统的查询机会。当数据技术商向共享信用系统提交查询要求时,共享系统按照一定的规则选择最优的数据供应商,并根据数据使用情况向其支付一定查询费用,数据供应商将查询结果反馈给共享系统,共享系统将查询结果反馈给数据技术服务商,再由数据技术服务商向征信查询者提供征信报告,也可以提供特定领域的信用评估报告。另一方面,数据技术服务商需要定期收集征信使用的实际效果,通过向征信使用者支付一定比例的费用收集信用使用情况。数据技术供应商根据征信数据使用情况和借款者信用情况,检验共享系统中的数据合理性。最后,更新数据供应商数据或者对数据供应商进行优胜劣汰的选择。可见,双向付费方式建立了从征信需求者到数据提供者的基本产业链。
图3 数据驱动和数据共享下网贷征信产业链示意图
基本产业链还可以不断向产业链上游拓展。如图4所示,将征信需求者细化为专业金融机构,数据服务商并不与专业金融机构直接发生征信业务,而是通过代理机构获得高质量的征信客户。代理机构付费给数据技术服务商,批量购买征信数据,以低于市场价格的成本获得征信数据查询机会。另一方面,对获得的征信数据按照专业金融机构的偏好,进行客户挖掘,主动将优质客户提供给不同的专业金融机构,获得匹配专业金融机构的客户营销收入。同时,对个人提供免费的征信服务,让更多个体时刻关注自身的征信状况,提高征信的数据质量,并通过代理机构获得优质的金融服务,降低融资成本。
图4 网贷征信产业链向上游延伸示意图
1.信用数据定价的决定因素。一方面,信用数据使用的定价与数据来源密切相关。数据来源主要是指征信原始数据的生产者,包括政府部门和企业。其中,政府部门是国内公开数据的来源,政府部门数据是在管理相关社会领域活动时生产并公布的,例如工商企业注册信息数据、失信被执行人数据等。此类数据可以通过查询政府相关部门网站或者统计年鉴获得,具有以下几个特点:一是权威性。数据由政府管理部门直接发布,是进行社会管理的需要。二是公共品属性。在社会管理过程中,政府发布的数据是公共信息,是社会管理需要的信息,由专职部门独立统计,各个部门都可无偿使用。三是公益性。政府公布的数据有益于社会的发展,涉及国家安全、商业机密和个人隐私的数据都不会对外公布。企业的信用数据是指企业在生产经营过程中生产并保存的数据,例如消费者信息数据、产品使用数据、信贷记录等。此类数据一般为企业内部掌握,不会对外公布,具有以下三个特点:一是财产性。数据是企业管理的核心资源,涉及企业产品营销、质量和服务多个方面。二是私有性。企业数据直接来源于企业生产过程,受到企业管理者的保护。三是利益相关性。数据是企业的无形资产,是企业的隐形利益。
另一方面,信用数据使用的定价还与数据质量密切相关。高质量的数据可以获得高价值,每一家信用平台都希望获得高质量的数据。网贷数据质量主要取决于信息、技术和管理等因素。数据记录反映企业微观细节活动,每一家信用平台根据企业实际业务保留数据记录,而且在具体数据创建、获取、传输、加工和使用上,技术水平和管理能力都是不同的,因此不同企业记录的信息存在巨大差异性。
2. 信用数据收费的合理性问题。信息劳动成果需要支付的成本包括:违约者的暴露成本,主要表现在借款者违约后给网贷平台带来的居间费用损失、出借者本金和利息损失以及平台声誉损失等;信用信息维护成本,主要表现在网贷平台需要购置信息数据库,聘请专业人员开发、建设和维护数据库,防范数据篡改和非法侵入等。对于政府部门公布的数据,虽然没有信用数据的使用费,社会各界可以无偿使用,但是如果这些数据经过数据服务商加工整理,并由数据服务商系统全面地提供数据服务时,要获得这些信用数据就必须支付服务费用,包括数据的收集、加工、存储等相关费用。也就是说,即使数据本身是公开的,但数据服务收费是合理的。对于企业的数据,其个人信用数据获取渠道十分狭窄,主要依靠借款者自行申报和企业征集。对借款主体信用数据的征集工作,不仅占据企业大量人力、物力,也会造成企业的运营成本压力,而且所取得的数据只会在企业内部或者关联企业范围内使用。如果突破这一范围,在没有激励措施的情况下,企业不愿意共享自己的数据。社会信用数据不同于央行征信数据,央行征信中心的成功,在于所有受认可的放贷机构需强制上传信息,这样才能建立起统一的共享数据库。社会征信机构不是国有企业,缺乏直接管理的行政约束力,只能做到“谁使用谁上传”,且使用多少上传多少,无法强制约束所有数据进入共享系统。举例来说,假设1个月内一家互联网金融机构发生信贷记录1万笔,但只有100笔使用了机构征信产品,由于缺少征信强制收集规定,也就只有100笔记录进入到征信数据库,也就是1%的覆盖率,难以做到真正意义的共享。可见,企业信用数据不同于政府部门数据,建设网贷征信共享系统离不开对企业共享征信数据的激励。因此,允许企业信用数据收费才能促进行业发展,具有一定的合理性。
3.数据驱动下的网贷征信共享系统信用数据定价方式。考虑到信用数据定价受到数据来源和数据质量的影响,信用数据定价成为网贷征信共享系统建设的难点。如果定价恰当,能够激励企业积极参与网贷征信共享系统的建设,促进互联网金融信用的集聚,如果定价不合理,则很难解决信息孤岛问题,难以实现征信共享。网贷征信共享系统信用数据的收费方式有以下类型:
按照时间长短进行分类。一是限时的收费方式。限定信用数据的收费时间段,覆盖信用数据建设开发成功之后到转化为公共征信信息。有利于社会信用资源共享、有利于信用作为一种特殊公共品价值的实现、有利于形成信用社会,但牺牲了部分信用数据建设开发者后期利益。二是无限时的收费方式。依据信息要素、信息质量收取服务费用。市场经济供需规律激发了信用数据建设者的热情,但会出现重复建设、数据保护等问题,不利于节约社会资源和社会共享。
按照提取方式进行分类。一是浮动比率收费方式。设定最高、最低或者中间的佣金比例,允许收费在此基础以下、以上或上下区间浮动。二是单一固定收益分成收费方式。预先规定应得的收益分成,按期支付,收益在整个投资期内不变。
按照使用情况进行分类。一是查询次数收费方式。以央行征信查询为例,个人每年查询第3次(含3次)以上的,每次收取服务费25元,即每年前两次查询免费。二是使用时间期限收费方式。在使用期限内缴纳一定费用,无限制使用征信数据的收费模式。三是使用场景的收费方式。按照不同的交易场景收取差异性费用。
综上所述,本文研究了我国网贷征信共享系统发展现状和滞后原因,运用共享理论,结合数据驱动技术,构建了贷征信共享系统的运行模式,分析了未来可能的征信共享系统的产业链,和网贷征信共享的收费方式。根据上述研究,笔者认为建立我国未来的网贷征信共享系统的条件如下:
网贷的发展是建立在个人信用数据基础上的,个人信用的收集、加工、存储和使用等都会涉及个人隐私或者个人权利侵犯。在数据驱动理念指引下,数据供应商应将涉及个人隐私的内容封闭成数据黑盒,使外部数据技术加工无法获得内部信息,只是提供合法、标准的数据接口,并在法律法规限制下界定个人隐私的数据边界,保护征信主体合法权利,提高征信服务的数据质量,平衡网贷行业风险防控与个人权利保护之间的关系。
统筹社会征信资源,满足网贷征信多样化需求。网贷社会征信系统建设是一项系统工程,三层系统的建设有助于整个网贷行业的发展。第一层系统是建立以政府为主导的社会征信系统。政府参与社会征信系统建设,审核和监督社会征信机构信息的真实性,确保信息数据的权威性,同时提供金融、司法、工商等多渠道宝贵数据,丰富网贷征信数据来源。第二层系统是以社会征信机构和行业协会为主体的社会征信系统。专业化细分社会征信机构功能,防止征信机构各自为政和重复建设征信系统,形成社会征信的合力,减少信用数据的大量重复。互联网金融协会设立征信机构,通过采集互联网金融企业信贷信息开展征信活动,促进整个行业的征信建设。第三层系统是网贷平台自身的征信系统。一般而言,网贷企业的征信系统与业务系统是交织的,是企业风险管理的基础,也是整个网贷社会征信系统的数据来源。网贷平台自身的征信系统关系到整个系统的质量,是征信系统的微观基础。
在全社会认识到社会征信系统巨大作用前提下,通过行业法规制度强制网贷企业接入大型社会征信系统。打破大小网贷企业利益束缚,丰富征信渠道,扩大征信体系的覆盖面(赵沁乐,2017),实现整个行业,甚至是社会的征信共享。网贷平台无论规模大小,必须接入统一的大型社会征信系统,实现行业风险管理水平的整体提升。加快建设互联网金融征信行业标准,形成协会成员信用信息共享机制,实现有偿征集和使用信用信息(侯兆辉,2017)。按照一定的制度收取征信服务费用,用于企业运营和建设。信息共享进一步扩大了征信数据的范围,改善了社会信用环境,对于整个行业的发展,乃至于社会经济的进步有重要的作用。
网贷的差异化业务需要不同的征信产品,包括欺诈预警、价值评估、风险评级、指数化服务等。当前我国征信公司开发的个人征信报告远远无法满足行业的多元化需要。差异化的征信产品能够不断提高征信机构适应市场的能力,推动征信行业的发展。
网贷征信行业具有规模放大效应,在征信共享体系中增加一则有效信息,就相当于每个使用机构同时增加一则有效信息,信息以广播方式在共享体系内传递。征信机构共享机制越完善,网贷平台收集贷款人信息成本就越低,逆向选择可能性也就越小,风险控制成本将大幅下降。同时,征信机构也会获得数据规模扩大带来的人均绩效的上升和产品质量的提高。
随着网贷的快速发展,全社会需要迫切提高对征信基础性和重要性的认识。社会化网贷征信不但可以完善借贷风险控制体系、保障投资者资金安全,而且可以净化民间金融信用环境,减少恶性非法集资事件发生频率。在我国金融市场化改革过程中,需要整合各种信息资源,降低高额的征信成本,利用征信体系对借款者进行有效的信用评估和风险评估,提高网贷行业的征信使用效率,有效防范网贷信用风险,促进互联网金融的健康发展。