肖肖 骆建文
摘要:互联网融资平台利用大数据技术进行信用评级,提供融资服务已成为互联网金融的重要形式。文章首先分析了这一形式在技术上和规模经济上的优势所在,然后介绍了互联网融资平台信用评级的模式以及实施路径,最后对互联网融资平台在进行大数据信用评级时的风险管理提出了建议。
关键词:大数据;互联网金融;信用评级;风险管理
一、 引言
长期以来,信用评级的做法是从宏观经济环境、行业发展趋势、企业管理层基本素质、企业财务指标、企业组织结构、企业销售业绩、特殊事件风险等角度收集信息,对被评级客体能否到期偿还进行定量分析与定性分析。所以,信用评级是一个综合考虑宏微观因素,对资金需求方的客观还款能力和主观还款意愿进行评估的系统性工作。但是,囿于数据的收集和数据的分析技术,传统信用评级方式存在如下缺陷:(1)评级是以企业的往期财务信息和其他运营信息为基础,不能提供这些数据的企业,特别是小微企业,就无法获得信用评级或只能获得极低的信用级别,募集资金因此也受到限制,使得授信活动无法实现普惠性。(2)对企业管理者主观因素的分析尚停留在表面,因偿还意愿导致违约产生的原因还需深入挖掘。(3)使用的信息为静态、过期数据,缺乏动态、即时性数据,存在时滞性,缺乏前瞻性。因此,传统的信用评级是一种静态的、滞后的、局部的评级方法,以这种方式进行信用评级,会产生资金分配的不平衡性,使得信用等级高的主体越发容易获得资金,信用等级低的主体越不容易获得资金,即所谓的马太效应。为了克服传统信用评级存在的这些局限性,业界和理论界围绕信用数据的收集和分析进行不断的理论开拓和应用创新。
进入21世纪以来,快速发展的信息处理技术和IT硬件技术,推动着人类依托互联网进行信息交流,资源分配,生产安排和资金融通等经济活动,形成所谓的互联网经济和互联网金融。在互联网经济发展的过程中,人们通过网络积累了海量数据。因此,对数据的理解、获取、存储和使用等方面都得到了极大地拓展,开始进入大数据时代。
大数据是指信息量大到无法在一定时间内用常规软件工具对其内容进行抓取和处理的数据集合,它具有“4V”的特征,即多样化(Variety)、大量化(Volume)、快速化(Velocity)和价值化(Value)。其中,多样化是指大数据类型十分丰富,需要用多种分类方法才能描述。比如在信用评级领域,信用大数据按内容划分,可分为运营大数据、交易大数据和交互大数据。按组织形式划分,可分为结构化数据、半结构化数据与非结构化数据。按时序性划分,可分为静态的离散型数据(点数据)与动态的连续型数据(流数据)。大量化是指大数据的数据量惊人。比如,Facebook每天产生300TB数据,淘宝每天产生30TB的数据。因此,大数据企业总是存在数据快速增长与数据存储扩容相对缓慢的矛盾。快速化是指由于大数据包含的数据量无比巨大,因此处理信息的速度需要十分迅速,才能实现大数据的可适用性。为达到这一目标,云计算和数据挖掘技术被广泛使用在大数据处理上。价值化是指大数据能提供足够的信息去发现研究对象的内在规律,即所谓的知识发现(KDD,Knowledge Discovery in Database)。由于信用大数据来源丰富多样,属性信息极为复杂,数据量十分庞大,数据价值密度低,为实现这一属性必须利用机器学习进行数据挖掘,获得有用的知识。
大数据和大数据处理方法的出现对信用评级乃至整个金融行业都产生了深远的影响,围绕大数据技术重新构造信用评级行业成为理论和实务热点。在理论研究上,孙中东(2013)提出应用大数据技术,银行的信用评级体系可以进一步完善、创新。蔚赵春等(2013)从挑战和机遇两个方面分析大数据给商业银行带来的影响。赵付玲等(2013)则围绕大数据背景下商业银行的信息化建设展开讨论。王伟等(2014)认为可以用大数据思维强化小微企业信贷风险管理。在实际操作中,信用评级的方法和业务模式都发生了显著和深刻的变化,建立网上融资平台,使用大数据收集和处理技术进行信用评级日益成为互联网金融的基本业务模式,对传统金融业务模式形成了强烈冲击。
在大数据下,互联网融资平台进行信用评级较传统信用评级具有哪些优势?如何通过互联网平台进行大数据信用评级?大数据评级过程中又有哪些问题需要考虑?本文围绕以上几个展开阐述,以期对大数据下互联网融资平台的信用评级做出一个较为全面的把握。
二、 基于大数据的互联网融资平台优势分析
1. 互联网融资平台的技术优势。首先,传统信用评级使用的数据,主要是来自于企业在各类生产运营活动结束后汇总、记录的运营数据,这些数据多以文件或电子文档的形式存在。比如从企业财务报表可以获得财务数据,从季报、年报等可以获得销售数据,从仓库台账可以获得存货数据等。而利用大数据技术,则不局限于生产运营结束后,从运营前的准备过程、运营中的操作过程都可以收集到数据进行信用分析,数据的形式从文本扩展到音频、图片、视频等多媒体形式,收集的范围也从企业文件扩展到各种存储媒质、互联网网页上、电商网站的后台数据库中,甚至社交软件的聊天记录里,从运营大数据扩展到交易大数据、交互大数据,因此包含的内容也更加丰富,不仅包含传统评级必需的“硬信息”,也包含丰富的“软信息”,从而形成实现对企业的全面、实时、动态性信用评级的基础。
其次,在获取到这些信息后,需要在云计算下利用大数据机器学习技术进行数据挖掘和知识发现,这需要有软件和硬件良好的结合与支持。互联网平台能够为云计算和大数据机器学习提供这种对接通道。
由此可见,利用人力资源进行信用评级的传统做法在信用大数据下就不再适用,而必须在一个组织规范的互联网平台上才能进行,因此通过互联网平台进行信用评级是技术上的必然要求。
2. 互联网融资平台的规模经济优势。进一步,通过互联网平台进行信用评级,较之传统信用评级方式能实现规模经济优势。
由于传统的信用评级方式需要贷前调查,贷中跟踪,贷后审计,存在较高的成本,如果融资额度不够大,会使贷款利润较低。而互联网平台在设计、运营和管理等方面的投入具有固定成本的性质,总成本不随评级企业的数目变化而发生显著变化,单个企业分摊的成本却越来越小,从而实现信用评级的规模效应。
此外,通过互联网技术能对企业进行实时监测,一旦企业出现危险的信号和行为,会即时预警,提升信用评级的预判性,能够增加信用评级的深度。同时,将经营成熟的互联网融资平台的数据库在监管机构的管理下实现联网,进而建立起面向全社会的信用体系,能够增加信用评级的广度。由于依托互联网融资平台进行大数据信用评级,可以实现传统信用评级下不能或不愿提供的融资业务,从而使其成为互联网金融的基本运作方式。
三、 基于大数据建立互联网融资平台的信用评级模式
1. 互联网融资平台的运作模式。对于互联网融资平台的运作模式,从不同的角度可以进行不同的划分。比如,从运营形态上,可以分为:(1)电商平台模式,如阿里小贷、京东京宝贝;(2)网上超市模式,如陆金所、各家商业银行的网上银行;(3)P2P模式,如人人贷、拍拍贷;(4)众筹模式,如众筹之家。从资金的来源上,可以分为:(1)平台提供资金,如阿里小贷、京宝贝;(2)平台担保,银行提供资金,如京东的供应链金融;(3)平台利用吸收的资金提供贷款,如各家商业银行的网上银行;(4)平台做信用评级,撮合投资者和资金需求方进行融资交易,如各家P2P。
尽管这些互联网融资平台的运作方式不同,但都需要对客户的融资需求进行信用评级,因此是否具有成熟可靠的信用评级技术,有效控制信用风险,成为互联网融资平台的核心竞争力。
2. 互联网融资平台信用评级的模式。当前互联网融资平台的信用评级模式按评级信息的来源划分,主要可以分为三种模式:
(1)基于运营大数据的信用评级。该模式多用于各商业银行的网上银行,以及P2P网贷平台、众筹平台上,其中尤以P2P最为活跃,面对的客户为个人及小微企业这一类低信用水平群体,融资金额从几千元到上百万,很大程度上弥补了信息不对称情况下传统金融机构不愿意对该类群体提供融资服务的空白,因此处于快速发展阶段。
(2)基于交易大数据的信用评级。该模式多用于成熟的电商平台提供的融资服务中,如阿里小贷、京东的京宝贝等。这一类融资平台最近几年随电商市场的发展也保持着良好的发展态势,市场份额上升的很快。
(3)基于交互大数据的信用评级。该模式目前多用于一些提供个人贷款服务的互联网平台上,知名的企业有ZestFinance和WeCash闪银。这类融资平台目前还处于萌芽阶段,但可预见,未来基于交互大数据的信用评级会逐渐成为信用评级的主要方式信贷,会逐渐从个人及小微企业贷款发展到对大企业贷款。
由于不同信用信息的来源、属性不同,导致各类融资平台评级时在指标设计、数据收集、数据分析、数据运用过程中采取的方法都不尽相同。但信用评级的基本流程是相同的,只是在一些步骤的实施过程中,受信息属性的决定而使用不同的评级技术。
四、 基于大数据互联网融资平台信用评级的实施策略
1. 信用评级的流程设计。大数据信用评级的流程可以用图1表示。
由图1可见,实施大数据评级,第一步是对待评项目的理解。首先要掌握项目运营方式、客户特点、市场状况、风险构成等项目内容;其次根据对项目内容的理解设计项目计划,包括安排项目可行的技术路线,制定项目的进度等;再次,待项目计划安排好之后就要确定大数据的来源,因为大数据来源虽然众多,但会受到各种限制,如有的可能过于昂贵,有的则不开放,必须选择那些技术上与经济上均可行的作为数据源。因此,需要基于对项目的理解做好这些在项目正式实施前的准备事项。
第二步是准备数据。所做工作是:根据数据的来源,确定数据的类型,采取可行的数据收集技术,获取大数据;很多数据存在不完整、重复、错误等缺陷,要对数据进行预处理;预处理后的数据如果属于非结构化或半结构化数据,需要进行格式化,转化为结构型数据,为实施下一步骤做好准备。
第三步就是进行机器学习。首先是选择合理的数据挖掘技术对数据进行分析,从中寻找关联关系,其次是解读和评估数据挖掘的结果,找到最合理或最有说服力的,实现知识发现;最后就是根据知识发现的内容,建立适用的信用评级模型。
第四步就是实施评级。根据知识发现的模型,开展对被评级对象的信用评级,生成评级报告,并对结论进行分析,帮助客户理解评级结果。最后对整个项目的运行做全面总结。
在以上各个步骤中,技术上的重点和难点在于数据准备过程中的大数据转化与机器学习过程中的大数据挖掘。大数据转化的困难在于需要把各种各样的非结构化半结构化数据转化为可以被机器处理和学习的结构化数据,大数据挖掘则在于需要对数据进行理解,选择最合适的数据挖掘技术实现知识发现。
2. 信用评级的实施路径。信用评级的实施路径可以分为内容计算和流计算。首先是内容计算。内容计算多采取主动方式获取数据,方法是设置好信用信息发布源和信息采集时间段,针对信息源的原始信息格式,设计支持多协议的上站机,每隔一段时间对特定的信息发布源进行查询,遇到新内容则马上采集过来,再用于下一步的数据转化和挖掘。
其次是流计算。流计算多采取被动方式,一般用于处理融资平台上的流数据,具体做法是,后台流程设计中在不同的数据流入环节设置不同类型的数据接入接口,及对接的流计算平台,流计算平台负责设置相应的处理规则,根据预设规则将流入的各类数据转化成可以直接分析的结构化数据,从而实现实时的业务分析与判断。
五、 基于大数据互联网融资平台信用评级风险管理策略
互联网融资平台在进行信用评级及提供资金时,处于风险管理重心的是对信息技术风险的控制。由于大数据自身的“4V”特性,且数据中包含的又是大量的用户隐私信息,这使得信息技术风险主要产生在两方面:一方面是大数据存储的安全性风险,另一方面是大数据的收集和使用过程中对公民隐私权的侵犯风险,因此如何确保大数据的存储安全及在使用时的隐私保护是一个挑战,前者涉及到技术安全层面,后者涉及到制度安全层面。
在技术安全策略层面,可以采取的措施有:首先,应依托大数据加密技术对使用的数据实施加密管理,制定出完整的加密保护方案,包括数据密级的设定、加密技术的选择、对密码安全性的攻击测试等;其次,严格网关管理,可以对不同类型的用户制定不同的权限级别,严格控制访问权限;最后,建立面向全平台的数据实时监测引擎,第一时间对各类非法操作发出警告。
在制度安全策略方面,在当前尚无明确立法规范的环境下,要积极进行宣传和游说,获得政府主管部门和社会舆论的重视和支持,争取早日出台规范的数据获取及共享标准,互联网融资平台的设计、管理和风控标准,从而把可能出现的信息技术风险限制在可控范围内。
六、 结论和展望
互联网融资平台利用大数据技术进行信用评级,提供融资服务,与金融机构传统的信用评级和融资服务相比,具有两个方面的优势:一方面,利用大数据技术进行信用评级能克服传统评级方法静态性、滞后性、局部性的缺点,为更多的社会成员提供融资服务,克服资金配置不平衡产生的马太效应,体现技术上的优势;另一方面,利用互联网平台进行大数据信用评级和融资服务,较传统金融机构能产生更大的规模经济效益,增加信用评级的深度和广度。因此,基于大数据的互联网平台融资已成为互联网金融的重要形式。今后除了要在理论上和实际操作中进一步发展和创新信用大数据挖掘技术和评级技术,也需要对信用大数据产业早日形成立法监管和行业技术规范,确保受信主体在获得融资服务的同时自身权益不受侵害,促进本产业持续健康发展和全面信用型社会的建设。
参考文献:
1. 何非,何克清.大数据及其科学问题与方法的探讨.武汉大学学报,2014,(1):1-12.
2.刘智慧,张泉灵.大数据技术研究综述.浙江大学学报,2014,(6):957-972.
3. K.Kambatla, G.Kollias, V.Kumar, et al.Trends in big data analytics.Journal of parallel and distributed computing,2014,74(7):2561-2573.
4. 孙中东.大数据技术应用与银行信用评级体系创新之探.金融电子化,2013,(11):40-41.
5.蔚赵春,凌鸿.商业银行大数据应用的理论、实践与影响.上海金融,2013,(9):28-32.
6.赵付玲,安锋,张晓锋.大数据时代商业银行信息化问题浅析.金融理论与实践,2013,(10):56-60.
7. 孟小峰,慈祥.大数据管理:概念、技术与挑战.计算机研究与发展,2013,(1):146-169.
8. 王伟,宋西圣.中小企业信用增级与信贷风险防范.金融发展研究,2014,(4):83-84.
基金项目:上海哲学社会科学规划课题(项目号:2012BGL011);上海市金融信息技术研究重点实验室开放课题资助项目;国家自然科学基金资助项目(项目号:71372107)。
作者简介:骆建文(1966-),男,汉族,浙江省杭州市人,上海交通大学安泰经济与管理学院教授、博士生导师,研究方向为供应链金融、采购与供应管理;肖肖(1982-),女,汉族,湖北省黄冈市人,上海交通大学安泰经济与管理学院博士生,研究方向为供应链金融。
收稿日期:2014-11-10。