大数据征信:挑战与进路

2017-05-17 06:30王砾尧
中国信用 2017年6期
关键词:个人信息信用信息

◎文/本刊记者 王砾尧

近年来我国个人征信业务备受新兴互联网公司追捧,“大数据征信”概念迅速走红,供应链征信、小贷征信、互联网征信等名称五花八门。尽管成立背景不同、数据类型各异,但在个人征信业务的具体规划上,各家征信公司均不约而同地突出了“大数据”和“互联网征信”。虽然央行个人征信牌照迟迟没有下发,但征信领域,大数据征信自下而上的热度已全面引爆,各企业争抢先发优势。得益于互联网技术的进步,征信机构收集和处理信息的能力大幅提高,应用场景不断拓展。同时,大数据让征信主体信息源更广泛、内容更多维、更新更及时。

然而近日,有多位国内外征信业资深专家陆续发声,就大数据征信的概念和适用范围等提出了讨论和质疑,更有国际上的专家对于大数据征信不太“感冒”,引起了业内关注和讨论。在当前个人征信牌照暂缓发放的背景下,所谓的大数据征信在当前市场中到底应扮演什么样的角色,成为各方热议的焦点。

概念引质疑 数据质量待考验

“在国际上,并没有大数据征信这个概念,比如知名美国信用评分公司FICO,在美国不会称自己是一家征信公司,更不会说是大数据征信公司,而是一家数据分析和风险管理服务公司,而且目前也没有任何人将大数据用于征信。” 世界银行集团旗下国际金融公司(IFC)东亚及太平洋区金融基础设施技术援助负责人赖金昌表示。

“所谓‘大数据征信’就是公牛的奶。征信就是共享债务信息,之所以有大数据征信的错误概念出现,是因为很多非征信业专业人士把信用风险评估和征信混为一谈,而大数据信用风险评估是可以有的。”算话征信CEO蒋庆军也表达了类似观点。

欧洲个人信用信息服务商协会(ACCIS)主席Neil Munroe认为,目前该协会会员虽然对大数据很关注,但尚无一家提供大数据征信产品,“因为要确保这些大数据的准确性,以及是否符合征信行业的基本原则。”

“坦白说,世界上只有在中国才看到利用大数据来开发信用评分这种现象,”世界银行集团全球金融基础设施建设技术援助负责人Tony Lythgoe表示,利用大数据来开发信用评分产品的前提是,首先要确保数据的准确性,包括数据模型及其运作的准确性,“但是从社交网络采集的信息是由个人提供的,很难保证数据的客观准确性。”Tony Lythge说:“ 传 统的征信机构会明确规范哪些数据可以使用,并适用于什么样的用途。比如在美国,性别、宗教、血型等信息是不可以征集的,你也可以查到它的确没有征集这些信息。但大数据更像是‘黑箱操作’,你不知道它到底征集哪些信息,很难检查到它征集的哪些数据不能用。”

“请谨慎使用‘征信’这个字眼,”赖金昌此前呼吁,“并不是大数据里面的数据都不能用于征信,只有少部分符合国务院的《征信业管理条例》的数据可以用,其基本要求是数据来源明确、客观、准确。”

在近日举办的2017年中国信用4·16高峰论坛上,中国人民银行征信管理局局长万存知指出,互联网大数据不是征信,但是互联网大数据对征信有影响。二者之间具体的关联还需要进行理论探讨和制度规范。

万存知认为,当前互联网大数据信息来源渠道相当复杂。“所谓大数据就是要把各方面、各领域点点滴滴分散的数据汇集到一起形成一个海量数据。现在采集的数据有的能结构化、格式化,质量较高,有的不能结构化、格式化,质量较低。但从征信系统建设来看,信息来源渠道和使用方式必须清晰可追溯。对于企业,要维护商业秘密和合法权益,对于个人,要维护个人隐私与合法权益。所以互联网大数据和征信不一样,但是有联系有影响。具体有哪些联系和影响,还需要在学术上做研究和进一步设计。”

除了在概念方面有待厘清,大数据征信在技术和应用也面临挑战。业内专家撰文指出,当前大数据的获取难度较大。随着互联网带来的广泛数字化潮流,全社会的基础信息搜集和信息共享机制有所改进,但仍不足以支撑全面的大数据征信,一方面以水、电、煤气为代表的基础信息、教育、住房、司法系统信息尚未完全联网,底层数据缺乏;另一方面支付信息和社交信息呈彼此封闭、割裂的状态,市场上的电商、社交平台对于信息共享问题同样非常谨慎,进而导致大范围内的数据获取存在障碍,数据获取成本过高。除了数据获取难度大,所建构的大数据模型的可信赖性有待检验。征信数据模型的精度提升必须建立在大数据有效、充分抓取以及处理的基础上,需要不断的实践反馈和反复修正。由于应用时间较短,缺乏历史数据参考,现有的大数据模型大都基于规则制定,其中带有大量的传统征信规则,还是一种中间形态,大数据征信的优势难以突显。

应用范围有限 公平公正难保

赖金昌认为,当前征信市场商业数据信息的使用范围可分成三个层次:第一个层次是最广的范围,即普通商用数据;第二个层次是用于金融服务的数据,特别是用于信贷方面;第三个层次是征信数据,其范围最窄。

“征信收集的数据范围是非常有限的,其目的也是很有限,它提供的服务仅限于征信系统的会员。”赖金昌表示,征信信息的管理最为严格,由于涉及金融领域的违约率,所以对数据保护的要求更高。

“用大数据来帮助放贷是没有问题的,但并非是大数据征信的概念。美国的征信机构有正常的征信业务,但除此之外也提供很多市场营销服务,为客户画像提供数据,帮助零售商能够更低成本地找到客户,但这并不是征信业务。”赖金昌强调。

对照国际征信行业,当前我国除了在大数据征信概念上有待厘清外,互联网和大数据技术的爆发也为征信带来了新问题——赢家通吃的互联网发展模式让征信机构在业务和公司治理结构上丧失了第三方独立性;各造闭环的发展模式割裂了市场信息链加剧数据孤岛,没有充分理解征信理念规则导致数据采集和使用上陷入误区。

一位业内人士告诉记者,有些机构号称其大数据征信会通过定位来判断个人信用,比如倾向判断在金融区域工作的人具有较高收入工作,继而判断其个人信用良好。“但收入高不等于信用良好,我们做过一项测试,很多低收入人群信用情况反而更高。”

中国人民银行征信管理局局长万存知在2017年中国信用4.16高峰论坛上发言 摄/ 本刊记者 韩乾

此外,在面向公检法采集信息的过程中,有的机构不知道该要什么数据就希望全部接入,也经常会遭到法院拒绝。而在该人士看来,征信的内涵非常聚焦,只会判断这个人会不会还钱。征信机构接入的只应该是经济案件的判决信息、执行难信息,甚至不包括诉讼信息。

在确保业务范围的限定性方面,多位专家强调,征信产品运用场景主要是在信贷领域。全国人大财经委副主任委员吴晓灵表示,个人征信信息与道德信用不是一回事,征信的结果主要用于金融活动领域,不要随意拓展。

万存知分析说,现在个人信用评分比较火,很多互联网大数据企业,通过信用评分得到了不少便利,但是有三个问题值得总结研究和反思。一是很难评估和论证个人信用评分。因为互联网大数据企业所运用的数据是有限的、不完整的。每个互联网企业都想做各自的业务闭环,信息都是分割的,互相之间并不共享。

二是公平公正难保证。在很多互联网大数据中,有交易信息,还有行为信息、社交信息。当前有一个倾向是,社会精英的信用分相对高,反过来信用分相对低。无论是做信用建设还是做征信,首先要保持公平正义。

三是信用分的概念混淆。现在很多互联网大企业采集的信息,除了网上扒取和来自央行征信、公安人口等特许信息,还有来自于自身平台的消费。消费越多,评分越高。甚至有一种提高信用分的方式明确表明,要提高个人的信用分,就告知具体的信息,例如车辆信息、住址信息、配偶信息、甚至还包括房产信息等,只要上报以上信息,个人的信用分自然提升。

中国人民银行副行长陈雨露曾指出,征信业务活动应充分体现社会的公平正义,确保政治上的正确性,既不能将征信产品当作把人分为不同阶层、不同群体的工具,也不能应用于某些低俗的社交活动,背离征信的本意。

个人信息保护司法解释出台影响大

无论是数据来源不清晰,还是适用范围有限定,征信领域相关立法有待完善成了彻底解决这些问题的共同出口。近年来,国务院相继出台《社会信用体系建设规划纲要(2014-2020年)》《征信业管理条例》和《征信机构管理办法》,初步形成了征信市场的法律框架。但上述法律规范的调整和规制对象主要是传统金融机构,至于是否适应互联网金融行业特别是大数据征信的要求,尚待有效验证。

5月9日,最高人民法院、最高人民检察院发布《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,明确了侵犯公民个人信息罪的定罪量刑标准。显而易见,对征信行业的规范在提速。

“该司法解释在一定程度上会影响金融业格局,尤其对于经营‘与个人信息相关’业务的金融企业,包括大数据、个人征信企业等产生重大影响”,大成律师事务所合伙人肖飒告诉记者,此项司法解释的发布,对于经营“与个人信息相关”的企业或机构将产生很大影响,尤其是大数据和征信类企业。

此次发布的司法解释首先明确了“公民个人信息”的范围,是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。

目前市场上有很多所谓的大数据公司,会倒卖来源于黑市的数据,这些数据很多涉及公民个人信息。棱镜大数据研究院首席科学家廖辰瀚博士表示,“在贩卖的数据中,有些数据是合法的,有些数据是违法的。线上消费的、网银的、pos机的、信用卡的、运营商的、甚至是工商的数据都有人卖。此次司法解释出台为有关部门严打大数据征信行业乱象提供法律依据。”

肖飒认为,此项司法解释会给区块链产业带来发展机遇。“我国相关自律组织对网络借贷平台进行自律管理时,就采用‘区块链技术’将数据打散,一方面符合我国保护公民个人信息的法律法规政策;另一方面也让会员放心,其提供的‘借贷信息流’不会被人随意截取,即便是截取了也无法知悉具体内容,可以最大程度保护商业秘密”。

据统计,当前中国有接近10亿成年人在个人征信系统中,在全国工商登记中带有征信字样的企业有50多万家。一面是天量的个人信息,一面是海量的征信企业,如何加强监管、防止征信信息被滥用就成为重要的课题。数据的收集、整理和应用是征信行业的基石,期待征信行业在信息共享与信息主体权益保护的动态平衡中前进。

猜你喜欢
个人信息信用信息
防范电信网络诈骗要做好个人信息保护
个人信息保护进入“法时代”
主题语境九:个人信息(1)
警惕个人信息泄露
信用收缩是否结束
订阅信息
信用中国网
信用中国网
信用消费有多爽?
展会信息