智慧的风控会学习

2017-04-27 21:42董莉
IT经理世界 2017年8期
关键词:人工智能金融特征

董莉

智融集团通过人工智能的方式来做在线贷款的风控,它想做互联网金融圈的“最强大脑”。

“这是人工智能的黄金时代,其最好的应用领域之一是金融,因为金融是唯一纯数字和钱的领域。”创新工场创始人兼CEO李开复认为,人工智能在中国爆发的第一个且最大的领域一定是金融。

去年以来,他不止一次提及,未来的投资机会将集中在人工智能领域,而金融业可能会最先被人工智能化。对于人工智能的看好,让李开复所带领的创新工场投资了不少这个领域的创新公司,智融集团就是其中之一。

在今年2月的一次关于人工智能话题的公开演讲中,李开复就将智融作为人工智能在金融方面尝试的案例。这家公司将人工智能应用到小额、短期借贷的领域,它并不负责用户的放款,而是与传统金融机构合作,由后者提供贷款,智融扮演的角色是通过人工智能的方法对目标客户进行信用评估。

在智融集团CEO焦可看来,对于小额分散、高频、标准化程度较高的金融业务,人工智能有着天然优势。首先,机器可以处理海量数据,能大大提高服务效率;其次,机器学习速度极快,以人工智能为核心的模型可以实现高频次的优化迭代;再次,机器在反欺诈方面优势明显,大大提高了系统的安全性。

弱特征的强表现

焦可曾就职于创立初期的百度,主管搜索类产品的市场与运营工作,后相继就职于赶集网、马可波罗等互联网公司。2013年,看到机会的焦可创立贷小秘,主打结构化的贷款数据库及智能化推荐引擎。

统计数据显示,美国家庭87%的平均负债率,而这个数字在中国只有40%。另外,中国有85%的人群无法享受目前传统金融机构提供的金融服务。

创立贷小秘的初衷是,贷款用户与银行之间存在着巨大的信息不对称,想通过搜索与推荐引擎机制,把银行产品和用户结构化,以提高双方的信息匹配程度。但是,在业务开展将近一年半后,焦可发现产品表现并未达到预期,在将借款用户推荐给传统金融机构的过程中转化率极低,各机构产品并没有明显的差异化,导致信贷服务同质化。

贷小秘触礁让焦可着实思考了很多,他发现自己对于市场的认知存在偏差:“业务无法继续的原因在于国内传统金融机构无法给这些用户提供相应的金融服务,本质上说是供需不对称,而不是我们原来想的信息不对称。”

在想清楚症结根源之后,焦可选择放弃继续贷小秘,进行业务转型。2015年7月用钱宝(现为智融集团旗下产品线)上线,将人工智能的风控解决方案应用于金融领域,为用户提供小额短期借款的智融应势而生。在用钱宝上,用户可以借贷的金额最低500元,最高5000元,而借款期限最低7天,最高30天。

传统金融机构是以人的经验作为风控判断,或者依靠某一项核心技术实现身份认证。而当一套风控流程特别依赖某一项技术或某一个经验的时候,很容易引起特定情况的攻击和欺诈。锁定人工智能是因为焦可和团队相信,解决市场供需不对称的根本方法,在于具有技术变革意义的新金融技术。

在焦可看来,国内金融机构之所以会出现供需不对称,很大程度跟银行的风控逻辑有关。传统上,银行风控主要是依据一些强特征数据,比如不动产证明、工资流水、社保证明等。那些刚步入职场的月光族、工作地点不固定的蓝领工人、服务人员和刚毕业的大学生等人群,在风控数据上的表现不具备这些强特征变量。

与银行不同的是,在贷前风控环节,智融的人工智能风控引擎注重的则是弱特征。焦可认为,弱特征和强特征的区别就在于,强特征是非0即1的;而单独的某一项弱特征,对于用户的信用评估和逾期率,没有绝对性的指导意义,需要很多弱特征在一起,才能对用户进行准确的评估。

传统金融机构人为处理贷款申请时经常依赖贷款“老司机”的经验,所看到的数据只是水面上的冰山一角,水下的冰山主体存在着大量的弱特征数据。焦可觉得,虽然无法凭借几条弱特征数据来做出借贷的决定,但当这些数据积累到上百项弱特征时,便能以此为风控依据做借贷决策。

在梳理特征的过程中,焦可和他的团队尝试过很多变量,不相关的很多很多。“星座跟逾期有没有关系,其实是没关的,这个其实就是我们很重要的一个工作,首先找到这些人有什么特征。”焦可介绍,很多弱特征完全不在传统风控人的经验里,甚至有很多是人不能洞察而机器可以发现的。比如,一个人的手机电量也能成为参考标准,申请贷款时电池电量低的人要比电量高的人逾期率更高;再有,有的人通话行为体现出非常强的单向性,经常单向播出很多电话,却很少接到来电,这样的用户逾期率比有来有往通话模式的用户要略高。“这是老司机办不到的,即使他能够想到这一点他也很难做定性定量的判断。”焦可说,目前智融已成功挖掘1200多个维度的有效弱特征数据。

基于人工智能的分析技术,智融的目标用户锁定在以刚刚步入社会、消费没有计划性、经济收入不高的年轻人。同时,在发展方向上明确 “不做理财、不做学生群体、不做地推、不做展期”的几个原则,把业务中心放在利用人工智能技术,从海量数据中挖掘出有效的弱特征。

数据反哺模型

一般情况下,贷款平台公布数据都会着重放款额度,但焦可认为,能体现金融科技技术能力的参考指标不是贷款交易的金额,而在于交易的笔数。“贷款笔数一方面体现出一个企业服务和影响到的人数,另一方面,通过大量样本的产生和挖掘,实现人工智能风控的进一步完善。”焦可说。

智融集团CTO齐鹏也透露,用钱宝在服务大量用户的同时为风控模型带回了大量的数据样本,可以不断进行模型的迭代和訓练,其精度将越来越高,从而提高通过率、降低坏账率,实现马太效应正循环。

具体来说,智融现在的月交易笔数120万笔,意味着在贷款陆续到期后,其I.C.E.人工智能风控引擎将收获120万个数据样本。这些具备完整生命周期的样本,可以反哺到系统中,持续不断的训练及优化模型。“举例来说,我们现在每天通过的交易笔数在5万~6万人,每个人有1200多个特征点,也就是说每天的风控需要处理的特征量是6000万~7000万个。这已经远远超出人的计算范围,而这正是机器擅长的。”焦可说,“我们现在的大数据计算架构很出色,可以存储海量数据,运算速度也很快,一个用户提交以后整个的机器决策只需要8秒钟。”

经过不断磨合迭代,智融自主研发了以人工智能技术为核心的“I.C.E.风控引擎”——Identify(识别)、Calculate(计算)、Evaluate(评估)的缩写,分别对应了“柯南特征工程”、“Anubis大数据计算框架”、“D-AI机器学习模型”三大组成部分。基于此,智融平台的通过率是同行业两倍,同时逾期率仅为行业平均水平的60%。

选择人工智能进行分控也决定了智融在人员的配置上的差异化。比如,智融没有CRO,只有CTO,高管团队具备百度、民生银行等技术与金融的背景。另外,来自于顶级互联网公司的核心研发工程师占比超过70%,他们占据了知春路上一座办公楼的大半层办公室。目前,智融还在不断丰富智融的数据科学家团队,不断加强统计分析、数据挖掘、文本挖掘、机器学习、能力表达及大数据处理方面的优势。

除了创新工场,智融的技术也获得了更多资本的青睐。今年3月28日, 智融获得4.66亿元人民币的C轮融资,由金砖资本、中金甲子领投,国科嘉和、源码资本、创新工场、光信资本等机构跟投。

“智融集团是一个让我们非常自豪的投资,他们有很棒的技术团队,以技术为核心把握住了非常好的风口和先机。”李开复在融资当天的活动上说。

中金甲子董事长梁国忠认为,相比于依托互联网和移动互联网技术的金融科技1.0阶段,金融科技2.0阶段表现出极强的“技术驱动”的特征,在它的背后是人工智能、大数据分析和区块链等关键技术的赋能。“金融科技2.0将是金融与科技的化学反应,有着极大的想象空间。”

随着新一轮的融资,智融集团战略布局也随之露出水面:第一,用钱宝手机APP将提供“千人千面”的产品,提供不同的额度及分期;第二,优化I.C.E.,通过人工智能的方式对人进行风险定价,不仅用于自身产品,还可以实现对外输出的风控技术;第三,通过基于大数据与人工智能自动化技术搭建的信贷过程管理平台“慧诚帮帮”,独立提供信贷过程中的全流程服务。

智融希望基于技术打造一个以人为核心的金融体系——不像往常以产品为核心,而是通过新的技术对个人进行评估和风险定价,然后给他推合适的金融产品。“以产品为核心的金融其实是不太合理的,最好的是以人为核心。”焦可说。

猜你喜欢
人工智能金融特征
如何表达“特征”
不忠诚的四个特征
何方平:我与金融相伴25年
2019:人工智能
君唯康的金融梦
抓住特征巧观察
数读人工智能
下一幕,人工智能!
P2P金融解读
线性代数的应用特征