■王延昭 唐华云 黄烁 马凯迪
近年来,数字化转型已经成为金融业的共识。各金融机构纷纷启动数字化转型,将其作为推动业务经营转型升级、提升客户体验、增强竞争力等的重要手段。随着信息技术与金融的深度融合,金融机构的数字化转型将朝着服务生态化与智能化、业务自动化与数据化的方向前进。金融业应以提升技术先进性和业务合规性为目标,在风险防控、智能服务、产品运营等业务领域持续创新,围绕平台、技术和数据三位一体布局,为数字化转型打下坚实基础。本文以挖掘数据业务价值为关键,探索债券市场基础设施数字化转型的关键技术及总体方案。
数字化转型是指经济主体利用数字化技术来推进其生态系统、服务模式、组织架构等变革。随着大数据、云计算、区块链等数字化技术的渗透力逐渐增强,各行业都在加速进行数字化建设,这为债券行业带来了全新的竞争和挑战。债券市场基础设施的数字化转型可以理解为以数据为驱动要素,利用数字技术对金融市场基础设施的传统业务流程进行变革,对内提升服务能力和管理水平,对外提供基于个性定制的智能化专属服务[1]。
作为典型的数据密集型行业,金融业应当深入挖掘数据要素的生产力潜能,形成对其他要素的效能倍增,在保证依法合规和数据安全的前提下,激发数据应用潜能,释放数据业务价值,促进整个金融行业的可持续发展[2]。然而,传统的数据融合模式例如公开的数据采集以及数据共享等在对数据相关方的隐私保护方面存在着十分明显的缺陷。债券市场流转的金融数据直接关系到用户的资产、信用、消费习惯等重要隐私,因此债券数据的融合应用必须严格保障数据隐私安全,确保其符合法律法规。国家在“十四五”规划中明确提出,将联盟链作为区块链领域的研究重点,将分布式账本、共识算法、加密算法和智能合约等作为创新点,完善监管体制,在多方合力作用下,推动信息存证溯源、监管服务和金融科技等领域应用方案的完善[3]。随着科技的进步,依托于分布式账本、多方安全计算以及联邦学习等新兴技术,如何做好数据融合这一问题,已有了诸如“限额配给”以及“隐私信息加密”等有效的解答[4]。
一是分布式账本依靠顶层设计具备了信息透明可追溯、业务协同自治去中心化、结果安全不可篡改等技术优势。近年来,其在证券互信体系构建、数据互联共享、协同效能优化、业务流程精简等方面的应用优势不断显现[5]。对于交易前业务,应用分布式账本,参与方可以将产品发行、募集、申购、评级、监管全数据进行上链管理和共享,对资产实现穿透式透明化管理,避免传统模型的信用风险问题,助力控制流通性风险,从根源上杜绝在中间环节营私舞弊。在交易的执行过程之中和之后,分布式账本可以将现阶段对中介依赖性较强的业务流程如债券存托管、交割、证券清结算等,通过去除中间环节做到一定程度的精简;同时依托于智能合约等实现认证流程化,尽量避免人为因素所带来的操作风险[6]。
二是当前债券市场基础设施可使用的大数据安全融合处理技术主要包括多方安全计算、联邦学习[7—9]、数据差分隐私或脱敏、可信计算等。联邦学习非常适合训练数据规模庞大且数据源多元分散的业务模型;多方安全计算的隐私保护能力更强,但受限于计算速度,不适用于较大规模的数据[10]。各种技术都有各自的优势与不足,在使用过程中应对其进行科学组合、扬长避短。基于联邦学习框架的数据融合方案已经在合规者识别与认定、金融风险预警以及金融科技监管等方面迈出坚实一步,并且在可预见的未来都将具备活跃的业务需求和光明的发展前景。目前已被纳入人民银行金融科技创新监管工具的创新项目中,已有多个涉及小微企业融资、涉农信贷、跨境结算等场景的项目应用了多方安全计算和联邦学习等数据融合支撑技术。
三是多方安全计算凭借其特有的技术优势,在国家间、行业间、机构间和层级间的数据要素互联互通过程中,发挥着举足轻重的作用。首先,目前存在着金融业务数据在不同机构乃至不同行业之间共享难的问题,这在一定程度上阻碍了依赖于数据要素的金融产品创新。多方安全计算通过将数据加密,使其能够在终端间安全传输,改善了数据难于共享的现状。其次,在风险防控方面,多方安全计算可以通过借助AI等技术智能识别与预警潜在风险,提升金融风控能力。最后,金融监管方可以借助多方安全计算,在充分保护数据隐私的前提下,从业务相关数据中探知潜在风险,从而保证数据既满足“可用但不可见”,又具备充分的时效性。通过综合多源异构的金融数据,构建风险监测模型,精确辨别和规避金融风险,拓展监管范围,强化监管能力,全方位提升风控水平和管理能力。
随着分布式账本、多方安全计算和联邦学习等新兴技术的迅猛发展,金融科技领域正在迸发出无限活力,数据资产的利用价值将会得到进一步彰显,金融产品也将更加人性化和智能化,金融服务的业务场景将更加贴近客户所需[11],经营管理模式将更加高效,金融机构的数字化转型总体上将呈现以下趋势:
一是数据来源与形式将会更丰富,数据价值将会更突出。随着5G、物联网、音视频等技术的发展,金融机构将借助数字化技术无缝感知客户,获取数字化时代赖以生存的数据生产要素,满足数字经济时代经营发展转型与市场拓展竞争需要。同时多方安全计算等隐私保护技术的快速发展可以实现数据“可用不可见”,将推进金融数据与行业数据、政府数据等融合,加速数据要素市场建设。后续金融机构数据来源与形式等将进一步地扩大和丰富,数据作为金融机构生产要素的作用和地位将会更加突出。
二是智能化技术将会得到规模化应用,金融业务将更加智能化。随着NLP、计算机视觉、生物识别、RPA、语音交互等技术能力的提升及门槛的降低,金融业数据蕴含的价值将被充分发掘,为产品服务、市场营销、供应渠道、风险监控等业务带来更加个性、精准的应用体验。形成规模化应用,甚至能够对一些复杂程度高的金融业务做出科学预测及决策参考。
三是金融机构服务将会全面开放,进一步提升客户体验。债券市场基础设施可使用金融科技手段丰富特色场景,拓展服务范围和应用模式,逐渐构建出开放共享、多元化、消弭金融与非金融界限的服务方案蓝图,打破时间空间的桎梏,为债券市场用户提供产品便捷、隐私安全、边界不限的全方位服务。
四是金融业将加深与产业的融合,生态体系实现多方共赢。头部金融机构正在逐步建设自己的行业生态,也将会更密切地融入各个行业生态中。未来,一方面围绕金融机构的科技体系将会形成生态共同体,金融机构将联合头部企业,优势互补,在基础设施、开放化业务系统建设、产品服务等方面,共同合作输出行业解决方案;另一方面,金融机构将与其他行业更加密切合作,在数据互联互通、开放平台构建、智能产品设计、预测模型训练、科技人才培养等领域共同进步,致力于营造全业务协作、全用户共享、全市场互通的金融生态环境。
一是宏观经济环境发生深刻变化,对债券市场基础设施的产品服务、业务运营、公司管理等提出了更高的要求。当前的债券市场运营环境已发生巨大改变。首先,传统金融机构直面当前金融科技公司的快速崛起,与其他非金融机构展开较为强烈的跨界竞争,使得传统金融行业不得不加快数字化转型进程以适应高速发展的市场,并解决其产品服务存在较大同质化的问题。其次,国外环境日趋复杂严峻,而我国经济恢复稳定性和均衡性仍需观察,金融机构传统业务发展增速变缓。最后,在稳增长宽信用的政策导向下,金融机构利差收窄。国际商会2020年全球贸易金融调查报告显示,77%的银行正在考虑通过数字化转型改善和增强自身能力。
二是客户结构特征发生了变化,服务方式和业务渠道随之改变。90 后和00 后在社会消费中所占的比重不断提升,他们推崇个性,偏好差异化服务。相比传统的柜台服务,现今客户更倾向于使用网络移动端服务。存折、银行卡等实物媒介已经被手机银行、网上银行等虚拟介质逐步替代。Business Insider Intelligence发布的《美国新生代银行研究报告》显示,89%受访客户正在运用移动渠道办理业务,而70%的客户表示移动渠道已成为其使用的主要渠道。
三是金融监管趋严,对金融机构的业务创新合规性、信息安全保护等提出了更高的要求。针对频发的个人信息泄露、信息非法采集等公共安全事件,国家为了增强个人信息保护,从行业规范、部门监管以及机关立法等层面,先后出台了多部法规,如《App 违法违规收集使用个人信息行为认定方法》《数据安全管理办法(征求意见稿)》《中华人民共和国个人信息保护法(草案)》等。人民银行印发《金融科技(FinTech)发展规划(2019—2021年)》(以下简称《金融科技发展规划》)的目标之一就是持续增强金融机构合规水准与金融监管能力,明确提出破解金融行业信息壁垒,打通信息融合使用通道,消弭金融业信息孤岛,发挥金融数据的信息汇聚和增效作用,并陆续发布了API、生物识别等领域的标准。
一是新经济战略提供转型新动能。在新经济战略的带动下,我国数字经济发展迅速,特别是2020年在新冠疫情影响下数字经济逆势增长,显示出了强大的生命力和韧性。2020年5月,《国务院政府工作报告》重点支持大数据中心、5G 建设等新基建建设及规模化商用,深圳等地区陆续试点数字货币,这些宏观政策及通用基础设施升级为债券市场基础设施的转型创造了完备的外部环境。二是金融科技快速发展为债券基础设施数字化转型提供新技术手段。科技一直是推动债券市场基础设施创新改革和转型发展的核心力量。《规划建议》提出“健全金融支持创新模式,加快新技术应用规模化和产业化的展开”,5G、物联网等基础设施的革新使得债券基础设施数字化转型拥有了基础设施支撑,人工智能、大数据处理等新技术在金融业务应用的广度和深度将进一步提升,金融与科技将深度融合发展,有助于进一步深入探索新型金融服务方案,在维持运营成本水平与提升产品服务效能之间找到平衡点,构建数字化未来金融机构。三是创新监管日趋规范。2019年12月,受人民银行委托,第一批金融科技监管应用试点项目在北京市开展,截至2021年9月北京已有22 个金融科技创新监管试点项目纳入创新监管沙箱中,雄安新区、深圳、上海等多个城市和地区也在逐步加入应用试点范围。
从国内外金融机构数字转型实践经验来看,金融机构数字化转型最初主要从以下几个方面的其中一点或多点开始切入,并逐步向其他领域延伸,持续打造数字化转型能力,转型的结果包括客户体验改善、服务能力提升、运营效率提升、快速创新能力提升等[12]。
部分金融机构以提升客户体验为切入点,使用数字化手段对用户的服务终端进行包装,能够随时随地为用户提供全方位、端到端的金融产品服务,构建面向全客户和全渠道的服务能力,全力提升金融产品的用户体验水准。部分金融机构结合未来业务战略和定位,以组织架构调整、体制机制优化、企业文化创新等为切入点,开展数字化转型,例如:成立直销金融机构、金融科技公司、虚拟金融机构等各种创新组织,通过新的组织开展数字化转型研究、试点等,待成熟时再扩大试点规模,避免原有的系统、业务、管理等方面的限制。部分金融机构以提升内部运营效率为切入点,使用新架构、新理念以及新的数字化手段构建经营体系,例如:建设线上与线下一站式的经营体系、构造一体化的后台运行模式、提升智能运营和智慧管理能力。通过提升内部运营效率,由内向外提升业务处理效能、风险控制能力和客户服务能力等,减少经营成本,推动人力资源向高价值岗位流动,支持业务经营转型发展。部分金融机构以建设场景为切入点,将金融机构的服务通过API、SDK、H5 等方式嵌入到客户的衣、食、住、行等生活场景以及合作方场景中,在教育、培训、医疗、旅游等多个领域满足客户多元化的金融场景需求,为客户提供无边界、随时响应的金融服务。同时,通过场景营销提升客户营销精准性与成功率,降低金融机构获客、活客、黏客的成本。部分金融机构以新技术创新研究与引入、IT 架构转型等为切入点,通过多种方式布局金融科技,加大人力、资金等资源投入,提升IT 架构灵活性,加强新技术创新应用,为业务创新、经营转型发展等提供支撑,支持业务快速创新以响应市场需求。
近年来,国家已将数据列为可参与分配的,与知识、管理、技术、土地、资本等并列的生产要素。数据是金融机构数字化转型的基础,驱动金融服务创新和流程再造,未来数据资源价值将更为凸显。金融机构应当重视数据的治理和保护,形成安全用数体系,充分发掘数据价值,强化数据分析技能,并构建数据驱动型应用,活用、善用、巧用数据资产,全方位提升数据管理能力[13]。
一是加强数据治理,实现数据全生命周期管理。金融机构应从数据来源、标准、存储、处理、服务等全方面加强数据治理,提升数据质量,构建企业级数据管理应用平台(如数据湖、数据仓库、数据中台),推动数据在不同业务部门之间共享,实现数据全生命周期管理,为业务创新提供数据支撑。
二是加强数据保护,提升信息安全水平。新技术在创新业务、提升服务效率的同时,也使金融风险的行为模式和传导链条发生了结构性的改变,数据产权、隐私保护等问题更加突出,金融机构应综合应用业务与技术手段提升信息安全保护水平,防止发生侵犯客户隐私,泄露业务信息等安全事件,例如:在业务管理上,金融机构应制定严格的内部信息管理制度、内控审计制度、奖惩措施等,业务人员按“知所必需、最小授权、用而不存”的原则查询获取信息;在技术上,金融机构应通过多方安全计算技术、同态加密技术等实现数据使用者和所有者在计算层面上的隐私隔离,防止真实原始数据的泄露,降低数据泄露的风险。
三是参与数据要素市场建设,推动数据资产化。债券基础设施应积极参与数据要素市场建设,在满足安全性、合规性和统一性原则的基础上搭建债券市场数据流转平台。综合运用联盟链架构、联邦学习架构、大数据融合处理、多方安全计算协议等技术手段,确保数据要素流转中各参与方的数据隐私安全,在依法合规的前提下确保债券市场数据要素化,释放债券数据业务价值,构建债券数据流通产业,推动数据资源向数据资产转化。
四是强化数据创新应用,创造业务价值。在有效采集、存储各类结构化与非结构化数据的基础上,对数据进行深入分析和应用,挖掘数据价值,以数据挖掘、客户画像、智能模型、智能感知等形式支撑业务应用创新,打造面向分析场景、研发场景、应用场景的开放、共享的数据智能服务,贯彻方案规划、产品运营、服务支持、风险控制等各个环节,构建模块化、集成化、自动化的智能运营治理体系与专门化、交互化、定制化的智慧服务体系。
与数据隐私保护相关的条例从法律层面保障了用户数据隐私安全,同时也使金融机构数字化转型中数据孤岛的问题愈加严峻。多个数据拥有者(如金融机构)之间由于监管方对数据隐私保护的要求和行业间的竞争关系,无法实现客户数据的共享,难以进一步通过数据互通全方位地挖掘数据价值,开展数字化转型并推出创新应用。联邦学习[7—9]正是面向多个数据提供方隐私保护和数据安全需求的采用分布式协同训练构建的全局最优模型的解决方案[14],根据数据提供方拥有的数据差异程度,联邦学习主要有联邦迁移、纵向特征联合及横向样本联合三种方式[15]。
一是横向联邦学习[16],适用于多个数据提供方提供相近业务但具有不同客户的情况,因此拥有的数据特征接近而样本不同,模型训练过程与基于样本的分布式模型训练相同,每个数据提供方利用隐私数据本地训练模型并将参数返回服务器,服务器聚合各数据提供方上传参数,更新模型后反馈给数据提供方。例如,在我国债券市场的三个后台中,中央国债登记结算有限责任公司(简称“中央结算公司”)、中国证券登记结算有限责任公司(简称“中国结算公司”)和上海清算所(简称“上清所”)可以通过横向联邦构建模型,为债券发行登记业务提供全量数据,以助力应用创新、服务监管需求。
二是纵向联邦学习,适用于多个数据提供方具有相近客户但提供不同业务的情况,因此拥有的数据样本接近而特征不同,模型训练过程中通过加密样本对齐和模型加密训练避免数据暴露,保证在所有数据提供者都能够获得数据隐私保护的同时,减少模型在不同数据样本间的损失,协同提升模型的准确度。例如,在债券市场中,中央结算公司在和金融数据供应商合作之外,还可与各金融机构进行特征联合,对债券发行主体进行风险监测,开展包含事前风险预警、事中风险处置、事后风险分析等在内的,基于多源多模态数据的精细化全流程创新业务。
三是迁移联邦学习,适用于多个数据提供方具有的客户和业务均不相同,但其中一方具有成熟可靠的模型和业务经验的情况,因此可以利用多方在数据、业务或模型之间具有的相似性,将源领域的成熟模型迁移至目标领域,并使用目标领域独有数据进行迁移学习,最终助力新领域业务开展。例如,债券市场基础设施可以参照证券公司对于股票的风险预警、估值等已得到广泛研究的成熟模型,进行联邦迁移后获得服务于债券市场,针对债券业务的新模型并加以应用。
数据已经成为重要性极强的生产要素,数据安全不仅关乎广大人民群众的利益,更关乎国家安全。姚期智院士在20世纪80年代提出多方安全计算概念:各参与方不泄露各自私有输入的情况下,安全计算一个事先约定的函数。经过多年发展,如今多方安全计算已经在实际应用中成为解决数据安全问题的重要密码技术[17],在数字资产安全管理、隐私保护机器学习、多方联合数据洞察等场景具有广泛的应用价值。
多方安全计算可以被看作是一种在多个数据提供方互相不信任的情况下提供一个可信方功能的加密方法,可信方接收数据提供方输入的隐私数据,计算一个函数并把结果返回相关参与方。由于对于安全的强需求,多方安全计算具有广泛的实际应用潜力,目前已经在安全的通用统计分析、金融监管、生物医学计算和卫星碰撞检测等领域应用并取得了一系列的成果。债券市场基础设施在数字化转型过程中可以应用多方安全计算框架,同时引入不经意传输(或称“混淆传输”)、零知识证明、同态承诺、同态加密、秘密分享、混淆电路等技术解决方案,将信息交互计算全过程在密文下进行,在保障数据隐私和数据安全的前提下同其他金融机构联合开展业务。
我国债券市场金融基础设施包含中央结算公司、中国结算公司和上清所。人民银行和证监会于2020年7月联合发布允许债券市场基础设施开展互联互通工作,促进数据共享合作的公告,号召服务于交易所与银行间债券市场的金融机构启动破除数据壁垒工作。然而在当前的债券市场中,仅有国债、企业债、地方政府债支持跨市场托管,仅有国债、地方债、城投债支持跨市场交易。整个债券市场连通性较弱,缺乏支持高效流转和跨市场清结算的债券服务体系和相应的监管渠道。构建全局有效的监管信息报送与流转系统是目前债券市场多方共同面对的难题,一个全局性的登记确权系统是债券市场未来的发展需求。而分布式账本技术可以通过智能合约、加密算法和共识算法[18]构建全局统一的新型债券市场基础设施,复用现有金融市场基础设施,实现数字化转型和机构之间的互联互通,做到业务及监管全局统一而无须进行大规模的机构合并或变革。
分布式账本技术[19]是一种用于记录网络节点间交易情况的分布式数据库,不设立中心化的管理者和数据存储,每个节点均持有账本副本,保证任何记录都能够在节点间分享、同步和验证,相互之间通过点对点网络和共识算法连接。分布式账本的访问控制主要通过设置公私密钥和电子签名来实现,从而保障所存储资产的安全性和准确性[20]。对于债券市场基础设施而言,中债登、中证登、上清所、上海证券交易所、深圳证券交易所、中国外汇交易中心等市场参与方可作为提供数据的节点接入网络,开展业务并更新账本,而证监会、银保监会、人民银行、金融委等监管部门均可作为许可节点加入并通过权限控制功能赋予监管权限,实现不同市场不同后台的债券业务及数据互联互通,为实时监管提供技术支持,共同保障分布式体系的安全性、高效性,形成合力优势。
联邦学习[7—9]、多方安全计算、分布式账本几项技术旨在深入挖掘债券市场基础设施独有数据的业务价值,促进债券市场基础设施向业务数据化、产品智能化、服务开放化、市场生态化方向进行转型。联邦学习旨在融合多方数据提升用户服务质量,实现多个金融机构间联合开展数字化、智能化业务时的数据隐私保护,满足数据不出本地要求,符合法律法规和监管要求[21];多方安全计算旨在保证多方机构的敏感数据在无暴露风险的前提下实现信息交互计算,依托同态承诺、同态加密协议、零知识证明、混淆传输、秘密分享和混淆电路等技术手段实现数据的可用不可见,在保证数据安全和隐私保护的基础上构建债券市场数据开放共享环境和债券服务数据互联互通生态[22];分布式账本技术[23]旨在确保债券市场交易记录不可篡改,链上全数据可追溯,通过共识算法、智能合约、链上权限管理支持等技术保障数字世界的价值表示和价值可信转移,解决不同市场间、不同机构间数字资产流转障碍和互信障碍,在品质溯源[24]、数字存证[25]、信用网络[26]、金融科技[27]、价值创新等多个领域具有重要作用。
在债券市场基础设施数字化转型过程中,联邦学习、多方安全计算及分布式账本技术仍存在一些障碍:
1.传统联邦学习具有较严重的中心依赖、激励不足和单点欺诈问题,对于协作方恶意行为、掉线故障、虚报数据的发现、监管、解决能力较差,且数据体量大的用户没有足够动力与数据体量小的用户构建联邦。
2.多方安全计算要求多方同时在线,隐私保护算法设计难度高、安全性验证困难,网络带宽要求较高、计算量大、效率较低。目前大多数多方安全计算产品仅考虑半诚实模型,缺乏对恶意行为的约束。
3.分布式账本节点间有限的通信、存储能力与债券市场较大的存储需求限制了分布式账本的落地应用及发展。且由于金融机构需要遵守数据隐私保护条例的要求,并具有独享数据价值的意愿,无法将数据放入分布式账本中共享。
针对联邦学习、多方安全计算及分布式账本的特点,参考国内外前沿技术提出三种技术综合运用、融合互补的债券市场基础设施转型方案:
1.以分布式账本技术赋能债券市场基础设施,通过联盟链权限管理、访问控制等功能确保参与机构间互信,为联邦学习的各参与方建立安全可靠数据流转机制,为多方安全计算提供统一数据存取出入口,为联邦学习训练得到参数提供安全可靠存储。
2.以联邦学习技术赋能债券市场基础设施,各参与方本地处理业务相关隐私数据,符合隐私保护法规,同时提升机构参与意愿。仅将批次训练结果上链存储,为分布式账本降低存储资源开销,减小节点通信压力,并提升分布式账本的运行效率。
3.以多方安全计算赋能债券市场基础设施,通过同态加密和零知识证明等数据保护技术确保业务模型参数不泄露,建立数据价值安全释放的业务平台,并通过分布式账本的可追溯、防篡改性能对做出恶意行为的参与机构进行事前、事中监管与事后追溯,建立债券市场业务数据安全共享生态。■