丁晓蔚
(南京大学信息管理学院,南京 210023)
互联网金融(简称“互金”)是金融与互联网相融后形成的金融业态,较之传统金融有许多创新,但潜藏不少风险。其中我国P2P(peer to peer)网贷从2007年兴起,到2020年清零,短短十数年让无数投资者血本无归。现互金中其他新金融、类金融仍潜藏风险。惨痛教训呼唤前瞻性风控和监管,金融情报学可望提供解决方案。金融情报学“通过爬取一系列相关数据,在此基础上按情报学的专业要求进行数据挖掘、清洗、分析、处理、研判,寻找数据之间的关联与风险防范和预警之间的关系,并辅之以专家智慧”[1]。其中特别关键的是构建贯穿和支撑预警风控与监管治理全流程、发挥“耳目、尖兵、参谋”作用的互金全面风险情报体系。
以往关于互金及其风险的研究成果甚多,但从情报学角度所作研究较少。
2.1.1 国内互联网金融及其风险研究成果丰硕
可分为四类:①对互金进行理论研究。吴晓求[2]探究互金生存逻辑、理论结构及监管准则。刘力臻[3]探索互金机理、监管和趋势。王海军等[4]通过互金的逻辑推演构建相应理论框架。②对互金风险及防控进行研究。杨群华[5]就我国互金特殊风险进行探究。黎来芳等[6]论析金融风险如何被互联网放大。米传民等[7]基于SEIS(susceptible-exposedinfected-susceptible)模型进行互金风险传染研究。③大数据在互金风控中的应用研究。吴连冠[8]基于大数据分析进行互金风险预警研究。巴曙松等[9]研究将大数据用于互金风险防控。④互金监管研究。霍伟东等[10]采取P2P网贷视角观照互金的平衡监管与创新。陈碧莹[11]探讨监管沙盒对互金监管的启示。张钦利等[12]研究互金刑法适用问题。此外,金信网银“冒烟指数”和BBD公司“红警”均系助力监管实践的有益探索。
2.1.2 英文文献中的互联网金融及其风险研究
联合国贸易和发展会议(United Nations Confer‐ence on Trade and Development,UNCTAD)将互金界定为基于网络的金融服务,包括网上证券、网上银行等。Huang[13]指出,中国P2P借贷的爆炸式增长,与互联网深度渗透、大量资金供应和未获满足的金融需求有关。Liu等[14]研究P2P网贷模式。Ag‐garwal等[15]研究社会信任对小额信贷的影响。Wei等[16]研究P2P贷款中的市场机制。Jiang等[17]对基于软信息的网贷违约预测进行研究。Guo等[18]基于P2P贷款实例对投资决策信用风险进行评估。Serra‐no-Cinca等[19]研究出借方预测盈利而非信用风险来优化贷款选择。Wan等[20]探讨P2P网贷决策模型。Emekter等[21]研究P2P网贷信用风险和贷款绩效。Zhao等[22]研究基于数据挖掘的P2P贷款投资推荐和风险管理。这些成果对本研究有启发性。
2.2.1 国内外情报分析研究成果
美国《国防部军事及相关术语字典》将情报分析界定为通过对全源数据进行综合、评估、分析和解读,将信息处理转化为情报以满足用户需求的过程。美国早期情报分析服务于战争,后范围拓展至安全相关领域。行业奠基之作《情报研究与分析入门》(杰罗姆·克劳泽,1976年首次出版)探讨如何思考、撰写和生产有用情报等核心问题。
国内相关研究情况如下:①情报学基础理论研究与时俱进。苏新宁等[23]基于生命周期探索应急情报体系理论模型,指出应急响应的情报功能是事前感知、事中处理和事后管理,对本研究有启迪意义。马费成等[24]系统分析了大数据对情报学研究的影响,有利于拓宽研究思路。②基于大数据的情报分析研究得到长足发展。周晓英等[25]探讨大数据的影响与情报学的应对策略,夏立新等[26]探讨大数据时代情报危机发展演变及应对策略,李纲等[27]从国家安全事件态势感知的情报需求出发提出国家安全事件图谱,卢小宾等[28]构建了基于复杂网络的信息分析模型,毕强等[29]在超网络视域中进行数字资源深度聚合的实证研究。这些成果为互金风险防控情报分析提供了学术智慧。
2.2.2 情报学中另一些成果与本研究密切相关
其中包括:①竞争情报。苏新宁[30]将竞争情报系统设计置于网络环境下进行观照。包昌火等[31]将信息分析的学理研究与竞争情报案例分析相结合。②信号分析。刘嘉琪等[32]基于信号用微博预测企业绩效。③风险及预警情报。王康等[33]探讨产业风险预警体系,展示竞争情报与风险的紧密联系。张宇栋等[34]研究公共安全风险预控情报。④金融情报。彭靖里等[35]论析了我国金融情报中存在的问题。吴光伟[36]和王幸平[37]出版了专著。⑤计算型情报分析。李广建等[38]以情报分析和数学模型为分析手段,对数据内容及模式进行深度挖掘和学理阐述。
2.2.3 从情报学角度对互联网金融风险进行的研究相对缺乏
情报学者较少介入互金风险研究。在中国知网输入“互联网金融风险”“情报”分别进行篇名、关键词、主题检索,得到0、0、8篇文献,无一与互金风险和情报均相关。在Web of Science作相应检索,结果为0。
由上文分析可见:①现有互金风险研究与预警预防、优化处置、精准监管、精准施策等实践需求尚有较大差距。②互金风控和监管理论与实践紧密结合的论文尚少,应用性研究论文更少。本文倡导的互金全面风险情报体系或更能解决互金风控监管实践中的痛点难题。③直面互金风控和监管场景的大数据情报分析研究成果鲜少,情报学对金融安全与风控涉及不多。金融情报学当大有用武之地[39]。本文将致力于扬情报分析之长,回应情报学和金融学的共同呼唤;以P2P为鉴,聚焦理论探索,后续将开展应用实证系列研究。
对互金风险的特点及监管短板进行科学认知,是互金全面风险情报体系构建研究的基础。
互金改变了金融市场形态、金融活动模式、金融服务深广度及金融风险机理和构成。
互金风险可分为两类:与人性相关的风险和与技术相关的风险。根据全面风险管理体系,与人性相关的风险主要有信用风险、市场风险、流动性风险、操作风险、声誉/舆情风险等,与技术相关的风险主要有技术风险和某些操作风险。
互金中与技术相关的风险剧增。网络安全风险(自身安全风险、供应商安全风险、客户安全风险)将成为金融业面临的首要风险[40]。技术风险还包括数据和系统安全风险、客户隐私泄露风险等。
互金中与人性相关的风险依然存在。在互金中,贪婪、恐慌、从众等人性因素往往因互联网而加剧。互联网具有海量信息、极速传输、覆盖全域等特征,多重风险叠加能瞬间引爆风险、加速传染,加剧风险正反馈螺旋,极易引发系统性金融风险。
互金监管虽已有长足进步,但短板明显。
3.2.1 存在一定盲目性
表现之一:某些方面缺乏规划。传统监管多采用事后监管、追责和秋后算账的模式,缺乏规划性、前瞻性和预判性,常陷入被动招架困境。
表现之二:有时近乎盲人摸象。传统监管应对互金风险,茫然不知下一只“黑天鹅”将在何时、从何处飞出。这里关涉一根本问题:金融活动、合规风控等数据是否可信(完整、连通、匹配、正确、真实、及时等)[41]。如果不可信,那么监管部门就跟盲人摸象无异,遑论预警防控风险。
3.2.2 以传统方式监管互联网金融系刖趾适屦
传统金融中较成熟的风险管理体系是全面风险管理体系,较成熟的监管规制框架是《巴塞尔协议III》,但这些在互金中近乎空白。
即使是传统金融中风控监管也不甚成功,主因是基于“小数据、小模型、小计算”范式,依重小数据抽样检测分析,且抽样不及时(如上市公司季报、年报等),根源上就存在滞后性。监管实践呼唤“实时大数据、大模型、大计算”情报范式驱动的前瞻性和预警性全面风险情报体系。而互金企业很多信息不公开,即使向监管部门报送,也存在数据不及时、不可信等问题,其严重程度远甚于传统金融。故需另辟蹊径,亦呼唤互金全面风险情报体系。
综上,以传统方式监管互金,既难以及时发现、识别蛛丝马迹中情报,又缺乏作为情报产品的风险测度、前瞻性量化指标和预警性风险因子,因而无法形成一整套量化理论和方法,无法进行推理论证和可重复实验,无法做到风控和监管科学化、系统化、最优化。
3.2.3 政策法规相对滞后
在现实中,互金政策法规制定相对滞后,分辨真伪创新有相当难度。无论是规则监管还是原则监管,都难以及时应对不断变化的金融科技创新,不能满足监管需求。构建互金全面风险情报体系,可监测政策法规执行效果,监测互金行业风险点,并得到来自底层的情报反馈和支持,以利评估和进一步优化完善,帮助监管机构逐渐将工作方式
从对政策法规事后评估演进为事前预判优化。
互金全面风险情报体系是以情报工作和情报研究全面覆盖互金风控和监管的情报体系。它以情报学原理为支撑,以大数据情报感知认知技术为手段,对互金各类风险进行监测、预警、分析、处置,提供系列情报产品和服务,推动形成互金版全面风险管理体系和监管框架(当前为空白),助力精准监管和精准施策(图1)。体系包含定义、目标、内涵、特点、要素,基础理论研究和应用实证研究并进,成果包括前瞻性和预警性风险测度、风险因子、特征指标、理论方法、实践工具等。
图1 互联网金融全面风险情报体系运行示意图
4.1.1 定 义
互金全面风险情报体系,是在借鉴并改造传统金融全面风险管理体系基础上构建的、在互金风险防控和监管治理中发挥“耳目、尖兵、参谋”作用的风险情报体系。
狭义互金全面风险情报体系,除相应理论外,还包括风险测度(含数学定义)、框架、模型、算法、工具、流程等一系列情报产品和情报活动。其中,基础情报产品含风险数学定义和量化测度、风险评分和风险指数等相对风险测度、预期损失及在险价值等绝对风险测度等;在此基础上形成衍生情报产品和服务,含微观分析、中观分析、宏观分析、可视化分析、风险态势感知、风险趋势预判、敏感度分析和测试、风险敞口分析、优化处置、压力测试、情景仿真、沙盘推演、对策建议等。从广义上说,它还包括直接支持精准监管、精准施策等的全生命周期情报解决方案和智库情报服务。
可从数学上定义该体系中最基础的风险测度及研究框架。下文以P2P网贷平台为例。
1)微观层面:平台风险
令Rij=(Ritj:t∈Z)表征平台i∈{1,…,imax}的第j∈{1,…,jmax}种风险(信用风险、市场风险、流动性风险、操作风险、技术风险、法律风险、声誉/舆情风险等)时间序列,其中imax为平台总数,jmax为需量化测度的风险种类数目,本例中jmax=7。Ii=(Iti:t∈Z)和Oi=(Oit:t∈Z)分别表征该平台的内外部信息流时间序列。在t时刻,令
其中,ft(ij)为针对第j种风险的合宜的大数据风险情报挖掘函数,体现了将互金平台内外部信息流映射到特定风险情报的思想。该定义有如下特点:一是基于t之前的所有内外部全源大数据提炼出t时刻的风险情报。不同平台间风险传染可由外部大数据来捕捉。在定义和框架层面先保持通用性,实际很多场景中内部数据不可得或不可信。如某些数据可能比另一些数据更重要,可留待具体建模时用EMA(exponential moving average)权重、Attention机制等方法解决。二是无论是作为输入的Ii和Oi,还是作为输出的Rij都被定义为时间序列,既体现了风险动态演进的特征,也方便后续从时间序列角度进行分析预测。三是各不同风险对应不同的f(·j),输入同样的Ii和Oi,可提炼出不同种类的风险情报输出(但不一定互斥)。四是f可为专家打分法、层次分析法等主观方法,也可为统计学、计量经济学、金融工程、机器学习(如神经网络、深度学习、基石模型)等量化模型。在框架层面保持开放性和兼容性,既便于各种模型算法即插即用,也便于对之进行比较、优选和融合。若为量化模型,则f可能是时变的,否则固定不变。此外,f可随平台而变,但因单个平台数据量有限,从稳定性和鲁棒性考虑,希望f跨平台不变。综合上述两点将公式(1)简写为
其中,c为jmax×1待定系数向量;Φ1,…,Φk为一组jmax×jmax待定系数矩阵;ϵt为jmax×1零均值白噪声向量随机过程。式(3)旨在对jmax种风险协同演进进行联合建模。更进一步地,可对多平台、多地区、多行业/业态甚至全国互金风险进行联合建模。
为方便起见,将平台总风险定义为Rit=(ωit)TRti,即不同风险的权重向量和风险向量的点积。可令权重向量为常向量,即Rit=ωTRti。风险权重的作用举隅:可通过调整权重,体现互金时代技术风险和法律风险相对上升的发展趋势。
可直接通过大数据风险情报挖掘函数f对总风险(而非细分风险)进行提炼。时刻t的平台总风险测度为其中,f为从平台内外部信息时间序列到平台总风险情报的映射。这里仍假定f为时变、跨平台。
因互金企业数据未必公开或未必及时、可信,故问题转化为如何应用情报学原理和感知认知等大数据情报技术,对海量、多源、异构、高维、稀疏、高噪的内外部大数据进行实时分析处理,挖掘其中蛛丝马迹,对各风险进行有效推演、探析、识别、评估、监测、可视化等,并赋能风险态势感知、风险趋势预判,为预警防控、优化处置、精准监管、精准施策等提供情报支持。
2)中观层面:区域和行业/业态风险
在全面风险情报体系中,各层面风险应逻辑自洽,统一一致。将微观平台风险加总集成后得到中观风险,令RtAm=(Rit,i∈Am)为区域Am中各平台风险时间序列变量组成的向量,ψA tm为该区域各平台权重所组成的向量,RA tm为其总风险,则有
此处权重向量设置为时变向量,其本身为时间序列,一般将平台的注册资本金或贷款余额处理后用作权重。一来各平台之间相对分量和重要性随时间演进,二来作为时间序列还可单独对权重进行建模预测。
可将各平台间此消彼长关系纳入模型,采用权重矩阵来体现平台风险间更精细的互作用,
同理,行业/业态Sn的加总集成总风险为
3)宏观层面:全国风险
对全国C而言,加总集成的总体风险为
其中,RtC=(Rit,i∈C)为全国各平台风险时间序列变量组成的向量;为各平台权重所组成的向量;为考虑各平台相对分量及互作用关系的权重矩阵。
在上述各加总集成运算中,主要用到对平台风险的线性运算。这要求风险测度定义能支持线性运算。一般专家打分法、层次分析法等不具备这一条件。对微观层面专家打分法得出的风险测度,经加总集成后得到的数值是否确有“宏观集成风险”的物理意义,有待研究。
4)相对风险测度:风险评分(risk-score)和风险指数(risk-index)
作为重要的基础情报产品,风险测度分为相对风险测度和绝对风险测度。前者指构建风险评分和风险指数时无量纲、无单位的风险测度,以表示。等各 级 指 标 使 决 策者能随时掌握风险演变情况,能以统一指标比较不同体量和特征平台的风险,还能比较各时期、各地域风险随时空而变的相对值并实时掌握相对变化趋势。
5)绝对风险测度:预期损失(expected loss)和在险价值(value-at-risk,VaR)
其中,FX为累积概率分布函数,一般从历史数据中拟合而得;α为给定置信水平。RVtAL为预期损失而非损失,与传统金融有所不同。公式(9)的意义在于:若互金主体不报送VaR,或者报送不及时、不可信,则监管机构可用此法进行估算和交叉检验。
6)f具体实现方案
上述框架保持开放性和兼容性。f函数可有多种实现方法。本文提出基于概率估计的方案:着眼于最基础的微观平台风险,就上文相对风险测度和风险评分/指数,最直接、最具前瞻性的做法是将其定义为未来T观测时间窗口内发生风险事件的概率:
相应地,可推导出绝对风险测度:
其中,Ct为t时刻的涉险资金净额。此处,传统金融中VaR并非完全等价,但高度相关,可作为互金版VaR使用,也可使用公式(9)计算互金版VaR,借此激活并借鉴传统金融中围绕VaR的系列风险管理工具(如RiskMetrics、压力测试等)。
综上,问题转化为基于全源大数据对未来T时间窗口内风险事件发生概率进行估计或预测,可通过时间序列分析、计量经济学、金融工程、机器学习模型来求解。在机器学习领域,对概率的估计和预测有多种模型和方法,但模型和数据的适配度、训练的完备程度、样本不均衡性等都会影响估计预测效果,需对概率估值进行校准(calibration)后方能作为概率使用。该问题引发较多研究。在深度学习中,近年来兴起的非卷积类神经网络模型,能同步提升预测准确率和校准度,代表前沿发展方向。
优良的风险测度和研究框架应能很好地概括、解释风险现状(风险态势感知),预测、预警风险演进趋势(风险趋势预判),将微观、中观和宏观打通,形成统一一致、逻辑自洽的风险测度体系。本方案具备如下特征:在定义和构建风险测度时,已赋予其内嵌前瞻性,故其本身为前瞻性指标,随着实时数据的持续流入,可不断作出前瞻性预测;同时,模型将所有数据汇聚到当前一点,包含了对现状的概括和总结。此前虽已存在专家打分法和AHP(analytic hierarchy process)等多种指数构建方法,但本文所提出的内嵌前瞻性定义和测度,既能用于风险监测,又能用于风险预警防控,其拥有较强有力的统计学理论基础支撑,具有客观性、科学性、系统性,且能进一步支持风险情报线性和非线性运算。由此,上述风险数学定义和量化测度、风险概率、相对风险测度、绝对风险测度等基础情报产品,为压力测试、风险敞口分析、敏感度分析、沙盘推演、决策支持等衍生情报产品和服务奠定基础,打开大门。
互金全面风险情报体系借鉴传统金融中全面风险管理体系和《巴塞尔协议III》并加以调整改造,生成具备“耳目、尖兵、参谋”功能的情报产品、服务和工具箱,其覆盖互金风控和监管各阶段、各环节。其中最关键和最重要的,是前瞻性的风险测度、预警因子、特征指标、模型算法、理论方法、实践工具等,由此才能进一步支持风险防控、应对决策、精准监管、精准施策。大数据情报分析可从多源、异构、高维、稀疏、高噪的海量大数据中,快速准确地挖掘隐藏信息、蛛丝马迹、安全线索,提取出能映射到全面风险体系中各风险的预警因子、特征和指标,赋能互金风险预警防控和优化处置。
在应用实践部分,情报产品还包括重要的情报基础设施。为维护国家金融安全与稳定,国家层面应拥有能覆盖监测和预警新金融、类金融风险的全国风险地图、风险前沿曲面、可视化风险曲线和风险实时监测预警平台等。
4.1.2 目 标
当前互金中,像传统金融那样的全面风险管理体系和监管框架尚属空白。互金全面风险情报体系的目标是:汇集情报学者、金融学者、监管部门及业界相关人士的智慧,通过构建该体系作为底层中间件,为构建互金版全面风险管理体系和《巴塞尔协议III》奠定关键基础和提供关键支撑,为风控监管提供一系列前瞻性、预警性的高效情报产品和服务,探索消除风控监管中短板的新进路。
4.1.3 内 涵
该体系与金融全面风险管理及《巴塞尔协议III》一一对应,直接服务于后者。中国银监会《银行业金融机构全面风险管理指引》规定,银行业金融机构应建立全面风险管理体系,采取定性和定量相结合的方法,识别、计量、评估、监测、报告、控制或缓释各类风险。全面风险管理,指以全天候、全覆盖方式,对信用风险、市场风险、流动性风险、操作风险、技术风险、法律风险、声誉/舆情风险等各类风险,进行准确识别、审慎评估、动态监控、及时应对、有效控制和全程管理。
传统金融监管的“小数据、小模型、小计算”范式和滞后的统计抽样本身存在根本性缺陷。互金监管面临更多严峻挑战:互联网助长风险传染和爆发,存在较多非银和类金融机构等。应借鉴传统金融中全面风险管理体系和《巴塞尔协议III》,并对之进行改造适配方能应用。由“实时大数据、大模型、大计算”情报范式驱动的互金全面风险情报体系能促成上述改造、适配和应用,实现超越,提供前瞻性、预警性情报支撑。
4.1.4 特 点
一是“全面”。与金融全面风险管理体系严密适配并直接提供支撑,全面覆盖互金全生命周期,全面覆盖微观、中观、宏观层面,全面覆盖情报原材料采集、分析加工、生产制作和发挥作用全过程。
二是促进互金风控体系和监管框架的形成。用情报产品、服务和工作来促进对传统金融全面风险管理和《巴塞尔协议III》的借鉴改造,推进其互金版形成并发挥效能。
三是对互金风控监管持全面观、系统观、动态观,而不是零敲碎打研究单个风险源、单个风险部门、单个风险解决方案。由传统金融中主要关注单点风险,升级至研究各风险共振合力、传染转化、综合演变和联合防控。
四是由“实时大数据、大模型、大计算”情报范式驱动,着重强调前瞻性和预警性,研发我国国产安全、自主可控的大规模互金全面风险情报体系和国家金融安全情报预警超算“天眼”系统,实时发现各种不为人知或鲜为人知的潜藏的蛛丝马迹,为优化互金风控监管提供新进路。
4.1.5 要 素
构成要素包括:各类行为主体,即监管者(风险情报使用者)、受监管者(风险情报作用对象)、投资者和融资者(风险情报获益者)、情报学者和情报工作者(风险情报研发者);风险情报,具体为情报产品、服务、标准、工具箱等;相关政策法规,为风险情报生成和发挥作用的依据;情报支撑技术,指大数据、人工智能、区块链等;运行机制,含理论引领机制、多维防控机制、人机融合机制、多层覆盖机制。
4.2.1 认 知
1)对互金风险的基本认知
互金未改变金融本质,但风险形成机理、表现形式、传播方式较之传统金融有很大变化。
互金风险特色在于:线上线下联动、金融风险与舆情风险共振叠加,形成自激型正反馈螺旋。金融事关广大公众切身利益,通过互联网能瞬间在大范围内形成舆情狂潮和风险,造成严重心理震荡和社会震荡,后者又会形成和加剧挤兑风潮。特别是恐慌情绪的蔓延,会使金融机构A的风险引发多地区、多行业、上下游金融机构B、C、D等出现恐慌性抛售潮、现金挤兑潮,并由公众争相无序退出而引发“踩踏”潮,导致风险和损失因正反馈循环而加剧。
2)对助力互金风险防控监管的情报分析的基本认知
在情报分析过程中,通过对蛛丝马迹和数据信息的搜索、挖掘、分析,运用统计学、计算机科学、数据科学理论与方法,探寻事物间因果和相关关系,监测现实动态,预判发展趋势,预警风险事件,提供优化方案和决策支持。大数据情报分析凭借全样本,探索事物间存在然尚未被发现的关系,其本质是对可能包含蛛丝马迹的大量结构化、半结构化和非结构化数据进行分析处理,形成前瞻性、预警性风险情报产品和服务,可有效破解上述互金风险瞬间爆发、极速传播和风控监管短板难题,助力风险监测预警、防控应对、精准监管、精准施策。
4.2.2 原 理
情报学原理是互金全面风险情报体系的基础。
1)情报分布原理
“信息、知识和情报是以离散形式分布的,在离散分布基础上趋向集中。由于信息、知识和情报的离散分布是绝对的、复杂的,所以我们才需要研究如何用科学的方法获取情报密度最大的情报源,为用户情报需求提供最优服务”[42]。关键点有二:一是用科学方法获取情报密度最大的情报源,二是把握在情报离散分布基础上形成的核心趋势和集中取向。情报大量蕴含于大数据中,互联网有始无终、无边无际,数据样本量极大,为“情报密度最大的情报源”。原始形态的全源大数据,以离散状态分布于广阔无垠的网络空间及物理空间中。须凭借慧眼、睿智,灵敏地抓住离散分布基础上趋向集中的关键点,获取高附加值的互金风险情报。
2)情报转换原理
由数据、信息到情报须历经转换过程。“数据是事实的数字化、编码化、序列化和结构化”[43]。数字化,即把纷繁杂乱的信息转换为可度量的数字,在此基础上建立相应数字化模型,同步进行金融世界向数字世界映射的编码化处理。序列化和结构化,是对信息、数据、知识进行加工、使之转化成为情报的必经路径。情报转换面临三个问题。
一为数据高噪高维稀疏。大数据分析面临挑战,数据可能实际上未获有效转换和发挥应有作用。
二为数据不及时、不可信。须用感知、认知等大数据情报技术对海量、多源、异构、高维、高噪的互金全源大数据进行实时分析挖掘、推演探究,洞察蛛丝马迹,感知监测风险态势,预判预警风险趋势,提供风险测度、风险指数、风险模型、风险前沿曲面、VaR等风险管理工具、决策支持、监管框架等各种前瞻性和预警性风险情报产品。
三为金融工程/AI(artificial intelligence)模型存在局限性。模型训练数据仅能覆盖历史已知风险。研究者希冀模型能泛化到未来,对预警未来未知风险有所帮助。然而金融风险不会简单重复历史,这是2008年全球金融危机中模型算法未能及时预警和有效防控风险的原因之一。鉴于此,危机后业界主流理念为:在纯数据统计和AI之外须补充注入专家智慧、经验洞见、知识推理、直觉灵感等人类高端智慧。在进行情报转换时,不放过任何蛛丝马迹,探索采用贝叶斯网、马尔科夫随机场等概率图模型及不确定知识推理和学习等技术,形成人类智慧和机器智能相融合的人机高效协同的智慧型金融情报理论架构和实践体系,方可能科学系统地预警“黑天鹅”等金融风险。
3)情报传递原理
情报在传递过程中遵循一定原理。“从情报源到情报汇发生的情报转移过程称为传递,我们可用transfer表达,对情报场中的情报运动,我们可称为情报交流,用interflow表达,对情报传递的多向过程,可称为扩散diffusion或传播dissemination”[44]。情报传递,从纵向看是情报从情报源到情报汇的转移过程,其间的情报运动体现为情报交流;从横向看是一个多向扩散过程,情报由一点向多点传递、扩散。情报传递的目标对象主要有:政府监管部门,情报的“耳目、尖兵、参谋”功能在此处得以充分发挥;互金企业,金融风险情报对它们而言生死攸关;投融资参与者,该群体的安全稳定是国家金融安全稳定的基础之一。
在情报传递过程中,一则,应注意互金风险情报传递的时效性:瞬息之间,互金风险就可能由轻度变为重度,由小范围变为大规模,由普通风险升级为系统性金融风险;二则,应注重从情报使用者处吸纳反馈意见,以不断提高情报产品和服务的质量。
4.3.1 功 能
该体系的功能在于以前瞻性、预警性的风险情报基础设施、产品、服务、工具箱,助力互金风险识别、评估、监测、预警、防控、处置、优化,并为从风险预警防控、应对处置,到精准监管、精准施策的互金风控监管全流程提供决策情报支持。若无情报助力,风控监管部门可能会是睁眼瞎,所谓“金融创新”实际上是盲人骑瞎马;而如果建立全面风险情报体系,面对各种新金融、类金融,风控和监管可望做得更好。
4.3.2 架 构
如图2所示,在前述理论框架(板块一)的基础上,下文深入探讨大数据风险情报挖掘函数f和衍生情报产品与服务的研发及应用。板块二从外部通过大数据建模推演企业风险情报并进行动态建模及预警研究,研究对象为第一类风险即法律风险、舆情风险及部分流动性风险等。板块三从外部大数据探析企业内部情报后形成相应风险情报,研究对象为第二类风险即市场风险、信用风险和另一部分流动性风险。此处假设内部数据不易得或不可信,故着重强调外部大数据,当然如能获得(部分)内部数据则效果更佳。在形成上述两大类互金风险情报后,板块四构建微观层面全面风险情报体系,其特点是实时、量化,可赋能互金企业个体的风险防控和优化处置。板块五构建中观、宏观层面的行业、区域及国家全面风险情报体系,以使互金监管更精准、更智慧及更具规划性、前瞻性和预判性。
图2 互联网金融全面风险情报体系研究架构图
(1)从外部大数据推演互金企业风险情报(板块二)。
关键词为“推演”,研究从外部通过f大数据建模推演上述第一类风险。
其一,注重情报发现。“通过聚类,一些看似不相关的事件很可能就靠在一起了”;“通过分析,挖掘出其中的联系,很可能具有较大的情报价值”[45]。来自不同渠道的信息/数据,经聚类被打通、勾连,在割裂状态中为表象遮盖的隐性联系被发现。例如,围绕互金企业,市场监管部门的企业经营情况、舆情监测机构的舆情报告及媒体所作报道等,能折射出其经营风险、资金挤兑风险、舆情风险及其他隐含风险。作为情报的原材料,大量信息/数据的情报价值并不呈现于表层,而在其深层,既要大范围采集,又要向纵深处挖掘。通过清洗数据,剔除无价值、不相关或错误的部分,提取精髓。情报发现须由现象分析本质(洞察),由结果追溯原因(归因),由过程探寻规律(合律)。
其二,注重情报预测。当前,互金领域尚缺少对互金企业风险动态演进所作预测建模。基于前述风险测度等情报产品,采用时间序列、面板模型、深度学习等研究风险动态演进及机理,并融合使用宏观数据、微观数据及从复杂网络和知识图谱中提炼而得的关联特征和图谱特征,可实现真正的互金风险预警预防。历史上一些商用平台仅停留于监测评分,金融监管部门一度只是根据评分分值采取调查、约谈等措施。现在看来,当可通过情报预测,提前一周、一个月等预警,真正做到预警性、前瞻性风控监管。
一是基于前述相对和绝对风险测度曲线,提前预测、实时预警未来一周、一个月等风险变化。可将如下变量融入预测模型:国内外政治经济等领域重大事件,金融市场基本面情况和未来走势,典型个案、媒体报道及其社会影响,政策法规及其影响,投资者观点、情绪、心理及其变化波动。此外,多家互金企业的风险曲线可合起来形成高维时间序列和面板数据,据此可考察风险如何动态演进、相互影响和传染等,可获得比单一风险曲线更精准的预测效能;还可对风险曲线(族)本身走势进行考察,特别是深入研究其剧烈震荡和波动情况,构建类似于GARCH(generalized autoregressive conditional heteroskedasticity)等波动率模型,可望捕获风险中隐含的二阶和高阶特征及非线性风险因子等蛛丝马迹,赋能更精准、更智慧的动态实时预警。
二是对P2P网贷平台倒闭和“跑路”等恶性风险进行预警研究。可防控新金融和类金融中恶性风险,为监管者和投资者提供决策参考。形成如下情报产品:平台恶性风险指数和预警指标,如发生倒闭、“跑路”、血本无归等事件的概率和潜在损失;预警模型,比如,根据企业相关信息如诉讼、舆情及蛛丝马迹等构建而成的模型;事件风险关联图谱,如由股权结构或股权关系、债权关系、企业上下游关联关系所引致风险事件的关联图谱。大数据风险情报分析可围绕关联图谱展开,对多平台风险联合建模,并深入研究特定主体与关联主体风险如何联动,在哪些情况下会放大、引爆风险,以及如何消减、避免风险。
(2)由外部大数据探析互金企业内部风险情报(板块三)。
关键词为“探析”(由外至内)。此板块研究上文第二类风险,重在基于大数据情报分析f对数据、信息和蛛丝马迹进行挖掘和分析,从外部探析(“逼近”“拟合”)企业内部风险情报(企业内部经营财务数据不易得、不可得,或在精度、信度、时效等方面存在欠缺)。
其一,侧重于应用和创新情报分析中发掘和拼接的方法。
对网络大数据进行爬取、挖掘、分析,并通过情报分析方法对数据进行拼接和补强。毕竟蛛丝马迹是存在的,P2P网贷的部分经营和业务信息也是间或有所披露的。一些内部财务和运营数据不定期公开、选择性公开,但这些数据和信息,一来不够准确,二来只是零散分布在不同时空,须将各多源异构数据拼接起来才能形成完整正确的认知和情报。可将关于“企业画像”、企业行为、前述内部数据、其他外部数据(如新闻报道、舆情和社会评价、黑白名单等)情报数据拼接融合,交叉检验并修订完善,用来逼近拟合内部财务和经营等风险情报,并通过智慧型情报分析弥补数据的不足。
进而,从外部探析企业内部风险情报,可进行时、空、人三维联合建模。在时间维度上,通过调查或统计抽样获得时间序列或面板动态数据,进行统计分析和模型曲线拟合,推测缺失数据;在空间维度上,采用深度学习、强化学习、迁移学习(如从上市公司迁移学习至未上市公司)等技术,从部分可获得质量较高的财务经营数据的企业拟合数据存在问题的企业;在人的维度上,注入专家经验、洞见、推理、直觉等高端智慧成分。通过计算实验方法找出对模型的精准度影响最小的数据进行补强,找出受数据缺失影响最小的最鲁棒模型进行补强。据此对内部风险动态演进进行建模,实现真正的风险预警预防。当前基于大数据情报分析从外部探析企业内部财务和运营风险情报这一技术尚未成熟,但哪怕是不完美的风险情报也仍有其价值。因为更重要的、更具前瞻性的、对未来泛化能力更强的风险情报密码不仅存在于一阶曲线中,还隐藏在导数即变化趋势和曲线波动率或更高阶非线性成分中。这些成分要么肉眼不可见,要么无法直观感受,而需通过情报分析来深入挖掘和揭示。通过对变化趋势和波动率等隐藏成分进行风险情报建模,可提升风险模型的预警性、前瞻性和泛化能力。而变化趋势和波动率作为相对变动指标很大程度上不依赖一阶曲线自身准确度,且计算过程中往往能过滤掉一部分噪声和差错。
其二,综合运用情报分析中其他方法。
一是竞争情报方法。关注对象为竞争对手、自身信息、竞争环境等。竞争情报可充实监管工具。采用一切合法手段收集和分析互金情报,搜集分析各种蛛丝马迹,监测互金风险中各种诱发性因素,为监管部门正确地、前瞻性地决策提供支持。
二是信号分析方法。捕捉互金企业的各种征兆、信号,并“进行解释、质疑、假设、数据补充、验证和评价”[46]。以e租宝[47]为例,其疑点早就存在:平台自称将“融资与融物”相结合,然而实际却大相径庭;2015年6月后,标的金额多分布于2500万元上下,利率稳定在12%左右,有违经济规律;存在自设资金池嫌疑。信号分析在事发前就能捕捉到上述异常情况,有利于加强风险情报的前瞻性和预警性。
三是计算型情报方法。强调大规模计算甚至超算,能提高情报分析的洞察力和泛化能力。互金全面风险情报体系离不开计算型情报分析方法和工具。
(3)微观层面的互金企业全面风险情报体系(板块四)。
关键词是“交叉参照”“协同建模”。侧重于应用和创新情报分析中注重统计和融合的方法,在交叉参照的基础上进行协同建模,绕开传统风险管理的数据难题,构建微观层面企业全面风险情报,为后续研究和应用奠定基础。
“通过对多源数据进行挖掘和融合,有利于提升信息分析的作用、减少信息错误与疏漏、防止决策失误”[48]。在板块二、板块三中采用不同计算路径和模型算法f分别得到上述两大类风险情报产品,再进行二次挖掘和融合以形成微观层面全面风险情报产品。
该成果可用于微观风险应对和决策优化,包括风险监测、预警和处置;建立案例库,并对正反典型个案做比较研究;构建风险指数,对风险发生机理和防控规律进行学理探讨;围绕风险预警分值,采用运筹优化技术制定最优处置方案,对遭预警企业的经营参数进行优化调整,使风险下降并脱离警戒区域。更多的情报产品和服务如图1所示。
风险情报体系中不同互金企业对应由经营、财务、内外部环境的组合向量构成的高维空间中不同的样本点,每个样本点又通过f映射到风险测度(公式(1))。高风险、低风险样本点在经营、财务、内外部环境组合方面各有其共性特征和规律。由此构成风险等高线/面。风险分为正常经营风险和非正常经营风险(如金融犯罪等),对后者应坚决控减,对前者应予以优化(金融本质就是经营和优化风险)。风险控减对应通过拟合、插值、优化等方法,将企业样本点从高风险等高线/面移至某个低风险等高线/面。风险优化则对应将样本点移至某最优风险等高线/面。此外,还可探索对风险进行置换,如允许某些风险有限度抬升以换取其他风险的控减。
(4)中观、宏观层面互金行业/业态、区域、国家全面风险情报体系(板块五)。
关键词是“综合集成”。公式(5)~公式(8)打通了各层面底层风险测度,可收获中观、宏观实时风险地图和风险指数,基于此,通过综合集成可研发更多风险情报产品和服务。
其一,微观、中观、宏观风险情报立体交叉的集成。
综合应用大数据情报分析中可视化分析、地理空间分析、统计分析、知识发现、复杂网络、知识图谱、图计算等方法,对中观、宏观集成风险情报和微观个体风险情报进行联合建模,可望收获更优的风险预警成效。根据行业、区域和全国的集成风险情报曲线及其动态演进构建多因子模型,进行归因研究,可更好地解释、预警集成风险。成果能实时可视化,进一步支持全国系统性风险监测、预警和防控。此外,可视化往往更能激发专家经验、洞见等人类高端智慧,助力形成人机高效协同的智慧型金融风险情报。
其二,精准施策与精准监管的集成。
实时、量化的微观、中观、宏观全面风险情报体系,使基于多智能体等技术的沙盘推演、回测、可重复实验成为可能,可用于评估优化互金政策法规,从而赋能精准施策。探索相关性、多层次、多因子、风险传染等模型应用,产出支持事前预警、事中处置、事后评估优化的风险情报产品和服务,从而赋能精准监管。
其三,监测预警和决策应对的集成。
将情报分析从风险监测预警推进至风险防控和最优化处置。围绕实时量化风险情报,在响应决策层面建立运筹优化模型并探索风险最优化处置之道。建立新金融、类金融案例知识库、模型工具库、策略库、政策法规标准库等,进行沙盘推演、压力测试和沙盒监管,优化行业、区域和国家总体风险应对策略,助力防控系统性金融风险。
更精准、更智慧、更具规划性和前瞻性的风控监管须做到“内外兼修、双管齐下”。就“内”[1]而论,需打造基于区块链可信大数据AI的下一代数字金融基础设施、体系架构、计算范式,实现可信、安全、隐私保护、有温度、智慧、高性能的数字金融2.0。就本文阐述的“外”而言,站在国家层面,为维护国家金融安全与稳定,宜构建可监测预警全国百十万家新金融、类金融风险的全国风险地图、实时风险曲线、风险前沿曲面可视化监控预警平台。
在应用实证研究中,为构建互金全面风险情报体系,本课题组搜集了28个省市1031家P2P网贷平台数据,包括经营、事件、工商和舆情数据。投入近20人通过检索百度、Bing、谷歌中文、百度贴吧等10多个数据源,进行比对、清洗、挖掘和情报分析。时间选取2015年9月27日至2018年12月31日,共1192天。在这期间,每日经模型训练、参数寻优、最优模型选择(模型池中含logistic regression、
SVM、LightGBM、XGBoost、CNN、LSTM、DNN、BERT等模型)、最优模型预测,获得每日风险情报,并形成逐日连续风险曲线及全国风险压力地图等情报产品。从相对风险测度和绝对风险测度两个方面,展开微观、中观、宏观风险情报分析和典型案例研究。实证PoC Demo(图3,地图版请见https://fin‐tech.nju.edu.cn/lwzzkwjbccl/index.html附图)调用了约50000 CPU核和相应GPU进行大规模训练和风险情报超算,初步验证了本理论在应用实践中的可行性和有效性。
图3 实证研究PoC Demo智慧大屏
鉴于此,本文呼吁构建“实时大数据、大模型、大计算”情报范式驱动的国产安全、自主可控的互金全面风险情报体系与国家金融安全情报超算预警“天眼”系统。
致谢感谢金信网银郭锐、BBD袁先智、陈文等先生提出宝贵意见。向泽涛、王哲、严宇枫、高咏歆、刘春雨、戴思贤、徐煜晖、康亦嘉、许天行、杨仕嘉、丁一峰、韦梦媛、孙锦瑶、林天舒、龚顾忻童、章佳敏、马骁、薛雨晴、马艺娜、高浩然、张梓昕等同学为本课题实证研究板块提供部分数据采集、比对、校验、清洗,以及文献检索、图表绘制等支持,一并致谢。