大数据在企业金融的生态应用

2018-11-26 11:14刘德彬
软件和集成电路 2018年8期
关键词:中标评级数据挖掘

刘德彬

我们的定位就是帮助政府、金融机构、企业进行风险评估。我认为我们的核心能力应当分为三块。第一,数据收集能力。在我们创业之初,我们认为大量分布式爬虫技术,可在互联网中收集各种各样的数据,我们通过与电信、银联、航天等机构进行合作,逐渐扩大了数据来源,并拓展了我们的数据能力。

第二,数据清洗。我们为金融机构提供大数据服务时,会在文本中遇到大量的数据,所以我们就需要把多源异构的数据进行融合,这就会涉及数据清洗。

第三,数据挖掘。在我们得到清洗后的数据后,应当如何运用?对我们而言,我们帮助政府、金融等机构进行数据处理时,需要将挖掘出来的数据进行预测,帮助企业解决未来可能发生的信用风险。所以我们开发了很多新型模式,而这些模式是基于时间序列的风险预测模型以及知识图谱的企业风险评估模型建立的。有了这三个能力后,我们将重点放在两个方面的创新。一个是对规模型企业的智能评级。在市场中有很多评级公司,他们的评级方式是依靠专家。我们的评级业务是针对中国的上市公司和发展型公司,所以我们需要结合公司的财务报表、行业的数据行为和数据基本信息,对这些企业的债券进行风险评级,这种评级具有动态性和实时性,可以帮我们做出预警。

一个智能动态评级系统,需要用到财务报表。但是在中国,除了上市公司和发债公司有手机动态财务报表之外,中小企业的财务报表却很难获得,所以我们对几千万的中小企业,通过关联关系、历史行为数据来构造行为模型和异常检测。我们的目标非常简单,通过算法模型来寻找异常行为。通过异常检测,从海量数据中寻找异常行为。

我们的具体做法是,把找到的600多万家中国企业所面临的风险和异常情况全部挑选出来,利用机器学习技术进行数据挖掘,最后整理出企业的行为模式。从中我们便可以得知企业发生某项事件的百分比。

我们在发展大数据业务方面,主要从事三个业务板块:一是标准化服务金融机构,二是政府项目:三是数据金融业务。我们在生态中有哪些应用?第一,国内各级部门对自己所管辖区域内的企业,都有风险监控和风险监管的需求,所以我们就帮助政府部门进行风险监管处理,我们有整套的风险评估、分发、风险处置的流程和方法,并实现闭环的管理。

第二,我们在数据金融领域进行创新。在五年前通过个人姓名、身份证号、手机号来获得贷款的方式非常新颖,在三年前手机贷款和现金贷层出不穷,在未来金融行业所呈现的是依靠大数据来加快审批的速度,更好地解决中小企业所面临的问题。所以我们认为,金融大数据的发展需要的是场景。比如中标贷和酒店贷等领域,我们可以通过该领域的核心场景中,来获取数据同时定制模型,这一做法可帮助金融机构创造新型的金融产品,帮助中小企业解决他们在场景中所面临的问题。

酒店贷是我们今年重点推出的产品,该产品已经在我国西南地区落地应用。在2017年,我们发现国内的中小酒店存在融资难问题,因为大部分酒店与物业是租赁关系,酒店无法给银行提供担保,所以酒店就无法从银行获得贷款。我们通过与合作伙伴的合作,以酒店的入住、开票和个人数据为基础,同时结合我们自身拥有的企业数据构造了三套模型。一是获客模型,二是风险定价模型,三是贷后监控预警模型。我们可以通过获客模型,从两万家酒店中选取信用良好的酒店,并把他们标记成可放贷对象。然后我们通过从酒店收集到的个人数据、经营数据、行业数据、企业数据、关联方数据对酒店进行风险定价。资金方可以依靠此项依据对酒店进行放贷,最后我们的监控预警系统,可以对本次的金融行为进行监测。

中标贷也是我们的产品,我们利用中标贷系统对重庆几十家招投标网站进行监控,该系统一旦发现中标信息,就可以自动分析招标单位数据,同时预测中标公司存在哪些风险,最后将评估出来的结果推送给资金方。通过这一个项目,放贷量已增长到40亿元。

一直以来我们都在进行基于SaaS的服務帮助金融机构做好中小微企业风控,而我们的重点是开发群体性智能预警,通过以点带面的方式,进行多维度的数据采集。此外,通过数据挖掘、算法模型等技术,从海量信息中挖掘蛛丝马迹进行风险比较。

我们发现中国上市公司所开放的年报90%以上是正向的,从年报中很少能发现哪些公司存在不足。所以我们只能对这些公司进行全网监测,而监测后得出的数据可以告诉我们所关注领域的风险信号。我们对中国3000多家上市公司的数据进行梳理,当我们去掉不重要的关联关系时发现,近两三百万家企业和这些上市公司关系密切。我们通过对两三百万家企业进行实时监控,利用我们的模型进行分析,发现这些企业确实和很多上市公司的风险有所关联,比如上市公司市值管理风险、退市风险等,都可以通过大数据建模分析,给我们提供一些情报线索。

(根据演讲内容整理,未经本人审核)

猜你喜欢
中标评级数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
分析师最新给予买入评级的公司
基于R的医学大数据挖掘系统研究
创投概念股评级一览表
《钱经》月度公募基金评级
《钱经》月度私募基金评级发布
一本面向中高级读者的数据挖掘好书