涂晓军
近年来,伴随数据流通增多,国内外数据泄露事件频发,各国对数据流通安全高度关注。欧洲、美国和我国,均对个人隐私进行立法保护。隐私计算在“数据使用”与“隐私保护”两者并重的要求下,为业界提供了一种技术解决方案,能够打破以机构为单位形成的“数据孤岛”,可在一定程度上化解数据价值释放与数据保护之间的矛盾。隐私计算技术以其“可用不可见,可控可计量”的特性,在保护原始敏感数据不出域的基础上实现对于数据的分析与计算,从而提供了一种新型的安全数据流通范式,在保护隐私的前提下实现数据价值流转。目前,隐私计算重要性已日趋凸显,逐渐成为促进隐私保护和数据融合应用的核心技术。金融业对数据安全和隐私保护要求较高,我们应重视使用隐私计算护航金融数据安全有序流通,发挥数据要素乘数效应,为推动高质量发展提供有力支撑。
隐私计算的三大技术路线方向
当前,隐私计算基本形成了以多方安全计算、联邦学习、可信执行环境为代表的三大技术路线方向,以及以同态加密、差分隐私、零知识证明等其他密码学技术为辅助的成熟技术体系。
多方安全计算是一种基于多方数据协同完成计算目标,实现除计算结果及其可推导出的信息之外不泄露各方隐私数据的密码学技术。多方安全计算近年来在工程实用性方面已取得一定的突破,当前正在探索适合的应用场景。
联邦学习是一种多个参与方在保证各自原始私有数据不出数据方定义的私有边界前提下,以保护隐私数据的方式交换中间计算结果,从而协作完成某项机器学习任务的模式。联邦学习本身就是面向工程问题的解决方案,当前在跨机构的联合建模场景已有较为成熟的应用模式。
可信执行环境是基于硬件级隔离及安全启动机制,为确保安全敏感应用相关数据和代码的机密性、完整性、真实性和不可否认性目标构建的一种软件运行环境。该技术已广泛应用于手机等终端场景,服务器侧的可信执行环境当前受限于芯片等因素,成熟度有待进一步提升。
隐私计算的应用前景
随着隐私计算各类技术的不断深化发展,商业银行、运营商、互联网公司及科技公司等基于自身发展的考虑,纷纷开展隐私计算方向的研究和布局。
信贷风控方面,面对金融行业数据的敏感性和数据隐私保护的强监管态势,数据孤岛问题日益影响金融机构的外部数据合作,而数据又是影响风控效果的核心要素。通过隐私计算技术引入跨行业的用户、企业特征,进行联邦建模、联邦预测,可以有效解决跨机构合作中数据隐私与数据共享的矛盾,打破数据壁垒,丰富金融场景数据维度,在双方或多方合作中保障数据价值交换时的数据安全。另外,利用多方安全计算技术可以实现在数据提供方不获取查询内容的情况下,以隐私信息检索方式增强行业的风控质量,既实现了敏感数据不出库、不泄露,又保障了多方数据的安全共享。
精准营销方面,由于金融行业涉及的客群交易活跃且需求多样,精准营销对金融机构提升客户黏性、降低获客成本至关重要。隐私计算有助于解决数据维度不够丰富、关联企业间的数据共享渠道难以打通的问题,提升金融机构精准营销能力,加强客户价值挖掘。联合营销包括纳新拓客、存量客户营销、客户画像等细分场景。金融机构利用多方安全计算,在保障原始数据不出域的前提下,完成客户资产管理规模的结算与提升,增强客户黏性、降低获客成本。集团与子公司、总行与境外分行联合统计用户总资产,激活沉睡客户。另外,跨行业机构之间利用隐私计算,通过纵向联合建模,挖掘潜在用户和高净值客户,基于不同企业特点设计信贷、委托、贷款、政府贴息等专项金融产品,降低信息不对称成本,实现产业链延伸、价值链提升和供应链贯通。
金融反诈方面,在保障隐私数据安全的前提下,利用多方安全计算、图联邦等技术,结合互联网、运营商数据的社交关系属性,可准确鉴定关系链条上的欺诈风险,实现对诈骗犯罪团伙的识别。此外,银行对客户信贷资金流向监控始终存在着“跨行难”的瓶颈,同样可利用多方安全计算与图联邦技术整合结算数据,共享并汇总客户的交易流水后形成跨行资金流向网络,为贷后资金流向提供更多维度的判断,在信贷诈骗识别方面起到显著的作用。
随着隐私计算技术的发展,未来有望形成数据要素流通的安全底座,并结合其他数字技术应用进一步构筑金融数据要素流通基础设施平台。该平台可为金融业及各行业提供数据要素流通新范式,助力数据、模型、算法、应用及服务的价值流通共享,帮助加快数据市场、算法市场、模型市场、算力市场等数据流通生态市场构建,实现不同企业、不同行业间的数据要素可信共享共治、信息可控可监管的跨场景服务效果。基于该框架,可进一步探索基于数据合作的商业模式可行性,使数据提供方、数据使用方、数据撮合方、技术输出方和监管审计方等各司其职,充分发挥自身价值,形成兼容开放、互利共赢的良性生态。
中国银联隐私计算的创新研究与应用实践
中国银联自2019年开始成立隐私计算研究团队,在三大技术路线上均有相关的研究与应用实践,并牵头金融业隐私计算互联互通工作,相关成果荣获2021年度中国人民银行金融科技发展奖二等奖并入选“2023金融信息化10件大事”。
基于联邦学习的隐私计算平台建设。中国银联基于联邦学习开源项目以及云原生架构作为底层能力支撑,并在此基础上二次定制建成“银联隐私计算平联邦学习台”,支撑了与工商银行、国泰君安、蚂蚁科技等商业银行、证券机构以及互联网公司开展相应的数据合作。一是安全可控,从底层通信、安全算法到上层应用的核心代码均自主掌控并通过系统检测。二是具备企业级功能与性能。平台界面友好、功能完备,能够支撑亿级规模数据进行隐私计算。三是数据安全管理架构清晰,专门设计了契合金融企业场景的分离部署方式以明确数据责权。四是有条件、有限制地与大数据平台对接试点,按照监管政策要求,把握技术发展阶段,逐步从研究向应用转化。五是打造开放生态架构,解耦隐私计算底座、算法与算子,便利互联互通。此外,中国银联高度关注平台底层的基础安全,进行了一系列安全加固,并与上游社区、业界情报以及业务部门形成联动机制,当前已经具备对于风险事件进行第一时间研判复现以及处置的能力,进一步保障数据安全。
基于安全多方计算的安全人脸监管沙箱项目。人脸识别技术以其便利性在支付验证中得以应用,但验证过程需要采集属于个人隐私范畴的生物信息,争议较多,监管较严。结合隐私计算中的安全多方计算技术,中国银联联合交通银行以及产业相关方共同申报了人民银行上海金融科技创新监管试点应用项目“基于安全多方计算的图像隐私保护产品”(上海市2020年第二批),共同开展了基于隐私计算的生物特征识别应用研究,实现个人生物特征(人脸)敏感信息的隐私保护。项目结合隐私计算安全多方计算技术和人脸识别技术,在不传输生物特征原始数据的前提下通过安全多方计算的方式完成人脸的认证比对,从而在不改变用户交互流程的前提下达到保护用户隐私信息的目的。
基于可信执行环境的安全存储服务。敏感数据的安全存储是数据监管、数据治理的重要环节。为解决敏感数据的加密存储问题,中国银联探索构建了基于机密计算的安全存储服务,在应用和数据库系统之间增加前置加密模块,拦截、解析数据并根据加密策略对数据进行加解密。在数据处理过程中,数据和密钥均放置在机密计算加密的内存环境中,保障敏感数据在计算和存储状态下的安全。
隐私计算互联互通能力建设及标准制定。隐私计算因其“可算不可见”的特性成为打破“数据孤岛”的关键技术,但隐私计算平台差异仍然限制了跨平台的数据流通。为切实化解隐私计算技术平台壁垒,推动金融业数据要素在异构隐私计算平台间的有序流通共享,依托北京金融科技产业联盟,中国银联联合主要商业银行、电信运营商、科技公司、互联网公司、检测机构、开源社区等业界50余家单位组成金融业隐私计算互联互通工作组,协同攻关金融业隐私计算互联互通难题,当前已取得突破性进展。工作组秉持“安全互通、兼容开放、生态共融”理念,统一框架共识,建立标准规范,开展技术验证,探索场景应用,提出了金融业异构隐私计算平台互联互通框架与标准,涵盖隐私计算多种技术路线,有效解决了互联互通产业协调与技术整合难题,并与通信、互联网、能源、数交所等重要行业机构积极沟通交流,持续在技术上对齐拉通,支持跨行业数据要素流通,发挥了技术与标准引领作用。
未来,中国银联将基于互联互通标准以及银联隐私计算平台持续开展隐私计算业务创新,赋能跨机构数据协作,在合法合规的前提下支撑更多场景应用,不断发挥银联网络和数据的价值,并助力推动金融行业数据要素流通良性生态的构建,更好发挥金融数据要素服务实体经济的能力。
责任编辑:隗胜楠