互联网金融背景下基于数据分析的个人信用评估研究

2019-12-05 02:48湛维明王佳
无线互联科技 2019年16期
关键词:数据统计网络借贷

湛维明 王佳

摘   要:文章从互联网金融的发展趋势和数据特征出发,分析互联网金融的4种数据统计途径和每种数据统计途径的优劣。接着针对互联网金融所面临的数据杂乱问题和信用评估的实时性需求,构建个人信用风险评估方法。在研究中重点讨论互联网金融数据不完备问题的解决方案和实时信用评估中数据分析、挖掘的方式,为互联网金融背景下的个人信用评估提供较为合理的数据统计方案与应用模型,以利于提高信用评估结果的科学性、有效性与可解释性。

关键词:网络借贷;个人信用评估;数据获取;数据统计

互联网金融的落地主体是网络借贷,即通过互联网进行实时或半实时的贷款。随着我国移动互联网的普及和宽松货币政策的推行,各类中小型网络借贷平台发展迅速,形成了一个竞争与协作并存的庞大融资系统。网络借贷平台充分利用互联网的优势,无限放大了可贷人群的数量和范围,极大地满足了被商业银行忽视的个人小额贷款需求。然而,个人小额贷款和中大型企业贷款有着较大的区别,个人贷款的准入门槛低,用户信息不完备性高,放贷时限要求急,政府监管薄弱,因此,发生违约的情况较多。针对可能发生的违约风险,融资机构一般采用信用评估的方法进行风险预防。其中,信用数据的采集、审核和信用评估指标体系的确立是进行此类风险预防工作的核心内容。面对互联网新背景下的这些新问题,需要从互联网经营模式的特点和互联网大数据获取途径两个方面出发,以用户的互联网基本属性、社交行为属性两个方面为切入点,充分利用用户的互联网行为数据,构建一套数据获取难度低、数据计算实时性高、决策方法开销小、评估过程科学可行的中小型网络借贷平台个人信用风险评估数据模型,以把握新常态下中小型网络借贷平台个人信用风险评估的脉络,帮助中小型网络借贷平台进行违约风险的预防,为其进行实时个人信用评估提供参考。

1    互联网金融征信数据统计来源分析

为了对借款人进行合理的信用评价,通常需要统计被评估对象的强相关数据。然而,中小型网络借贷平台有别于大型商业银行,普遍面临强相关数据获取难度大、数据积累少、数据完备性低的困难。即使能够在线通过用户提交的方式获得部分数据,也属于弱相关数据,通常只能利用这些数据进行辅助评估。总结几种典型的中小型网络借贷平台的数据统计来源,除使用用户提交的基本数据之外,还可通过以下几种方式进行补充。

1.1  直接委托信用服务提供商进行信用的评估和查询

随着金融市场的开放及金融机构信息化、网络化程度的加深,市场上已经有一些大型的信用服务提供商,这些信用服务提供商能够提供信用评估、数据查询、信用报告生成等“一站式”服务,同时,收取一定的费用。这种方式的优点是信用服务完全外包,缺点在于信用评价过程集成度过高,类似于“黑盒”,对于具体的网络借贷平台来说没有针对性和自主性。

1.2  向第三方机构协商购買数据

在当前的互联网大数据时代,用户在网络上的各种行为数据被大量分散的第三方机构所记录。中小型网络借贷平台可以向一些较大的电商、融资平台、商业银行、电信运营商等第三方机构购买或查询用户的相关数据。这种方式的优点是所获得的数据一般为强相关数据,缺点在于获取这类数据往往需要支付一定的费用,且受第三方相关规定的约束较大,部分核心数据由于某些行政或隐私保护而不易获取。

1.3  以平台间合作的形式共享数据

中小型网络借贷平台在竞争中的主要缺点在于其规模较小,很难形成规模性的数据积累,针对这种情况,中小型网络借贷平台可以考虑与其他类似情况的借贷平台寻求合作,共享数据。合作的平台越多,数据的规模就越大,数据的可用性就越高。这种共享数据的方式不会对平台造成大的经济压力,但需要平台间进行有效的协商,实现互利共赢。

1.4  以技术手段在互联网上获取公开数据

通过网络爬虫等技术手段,根据用户提供的个人信息,如姓名、电话号码、微博账号、网络购物账号、社交媒体账号等进行其网络公开数据的获取。这种方法一般能够获得大量弱相关数据,这些数据并不能够“一定的”完成信用评估工作,大多时候只起到辅助评估的作用,平台可以从这些弱相关数据中尽可能多地获得一些有用的信息。

中小型网络借贷平台应当充分利用互联网的优势,除了利用强相关数据之外,还要积极考虑社交信息、消费信息等弱相关数据,采用多种多样的信用评估手段形成对用户的综合评价。同时,从技术角度来讲,中小型网络借贷平台也要争取自建用户数据库,通过人工智能或数据挖掘的方法对不完备数据进行自动挖掘和决策,动态、实时地对用户数据进行计算,完成信用评估。

2    互联网金融信用评价指标体系构建

个人信用评价以信用数据为基础,主要包括以下两方面的信息:(1)个人身份信息,如性别、年龄、月收入、婚姻状况、学历、职业等,这些信息描述了个人的基本属性。(2)个人信贷信息,主要包括持有银行卡状况、信贷历史等,以此了解个人的历史违约情况。对于中小型网络借贷平台来说,获取完备的上述信息显然是不切实际的,即使能够获得这些信息,查验其真实性也需要较长时间和较大精力。因此,必须充分利用互联网公开或半公开数据进行补充,包括社交媒体数据、消费数据、手机通信数据等[1-2]。

按照判别项、数据来源、信用评估说明3个分栏构建中小型网络借贷平台信用评估指标体系,如表1所示。

该评价指标体系可以进行两方面的应用:(1)对用户提交的常规数据进行交叉核验,例如用户提供的电话号码是否真实、是否为常用号码,用户提供的年龄、婚姻状况、职业是否有网络数据作为佐证等。(2)通过大量的互联网数据对用户的个人行为和个人品质进行挖掘和评估,确定用户的行为倾向和消费特征。最终通过对被评估对象常规属性和行为品质的判别完成对其的“画像”。这个“画像”不仅限于一个评分或一系列评估值,还应包括对用户性格、行为、意图、倾向、喜好、规律的描述,完成一个基于互联网数据的高维度的用户信用评价[3-6]。

3    结语

本文从互联网金融蓬勃发展的现状出发,深入分析网络贷款的特征,探讨了中小型网络贷款平台中个人贷款业务所面临的两大问题,即数据来源问题和数据的实时处理问题。对于数据来源,建议在获得少量强相关数据的基础上加入消费行为和社交行为数据,通过平台间合作共享数据和利用爬虫技术获取公开数据等多种方式丰富信用评价数据库,最终完成对用户个人行为品质的挖掘。对于贷款业务的实时性审核问题,可在获取多源异构网络数据的基础上充分利用互联网数据进行用户信息的交叉核验与用户画像。交叉核验的方法可以过滤掉隐含的风险用户,从而免去人工审核环节,最终的用户画像可以完成对客户的甄别和分级。

[参考文献]

[1]王景利.互联网金融征信发展分析[J].金融理论与教学,2019(2):22-24,28.

[2]陆地璇.互联网金融背景下征信体系发展对策研究[J].金融经济,2019(6):179-180.

[3]冯兴元,燕翔.中国互联网金融的发展现状、问题与对策[J].福建商学院学报,2019(3):1-8.

[4]陈恒亮.从P2P行业探析互联网金融的信用风险[J].中国商论,2019(13):74-76.

[5]刘国刚.互联网金融背景下我国个人征信行业发展实践及展望[J].金融理论探索,2018(2):62-70.

[6]贾拓.大数据对征信体系的影响与实践研究[J].征信,2018(4):17-25.

猜你喜欢
数据统计网络借贷
网络借贷平台中电子合同的法律效力分析
山西省不同导线电线积冰特征对比分析