xID: 保护数据流通的隐形卫士

2019-04-25 00:33张贝贝
软件和集成电路 2019年3期
关键词:交易中心合规流通

张贝贝

xID标记技术组合了上海数据交易中心的数据流通技术与公安部第三研究所的eID技术。利用数据分类规则、不可逆匿名化生成与转化、传输控制等多项技术,保证了数据流通过程中的数据标识(ID)的安全性。

数据已成为国家基础性战略资源,大数据时代,个人信息的非法收集和利用以及无处不在的数据监控给公民的信息隐私带来巨大威胁。在数据资源的开发与利用成为潮流的今天,必须谨慎地设计信息隐私保护的路径,以期达到信息自由与隐私保护的平衡。而在不同领域,数据流通、隐私保护等都应该通过何种手段进行保障呢?

上海数据交易中心运营经理王润垠认为,自从大数据概念诞生以来,数据安全和隐私保护问题一直如影随形。尤其是在金融风控、互联网精准营销等涉及与“个人信息”相关数据的场景下,人们更加担心出现隐私泄露、财产被盗等问题。如果数据流通过程中个人信息安全问题得不到解决,必将阻碍大数据产业未来向更广阔的领域发展。

xID标记技术应运而生

在数据流通与隐私安全保护如此急需的大数据时代,xID标记技术应运而生。据介绍,xID标记技术是实现个人信息合规存储、合规流通的底层数据安全保护技术。该技术是上海数据交易中心与公安部第三研究所联合研制,能实现与个人信息相关数据合规存储与流通的各类应用场景。

具体来看,xID这项技术是如何来实现数据安全保护的呢?从技术方面理解,xID标记技术将个人信息分解为“标识信息”“特征信息”以及“标识关联性”三个基本元素。“标识信息”进行多方隔离的去身份匿名化处理,“标识关联性”进行可信第三方控制,并且保留“特征信息”,实现了在保护中流通个人信息的难点问题。这些达到了既能保护个人隐私,又能提供价值信息的数据流通目标。

从实际的应用来看,王润垠举例道:“比如我本人有身份证,身份证号码就是我的数据标识,我本人的性别、家庭地址、学历甚至包括在互联网线上的一些消费倾向、兴趣爱好等,这些都是我的个人特征信息。

此外,还有一个元素就是关联性。我这个身份证号和这个人具体的特征信息形成关联性。而数据保护要做的是将就身份证号码的具体信息进行加密变成一个代号A,这样一来,后面的那些特征描述就不会对准某一个个人,泄露A1这个人的一些行为特征。这里需要强调的是,A1这个代号不能再还原成具体的身份证号码。也就是说,这个加密的手段和算法是不可逆的。这样才能符合数据合规的存储要求,也对数据隐私与保护提供了有力的保障。”

据了解,在数据流通领域,对个人信息保护的技术处理一般采取“去标识化”,但是由于各方普遍使用标准化的统一的“去标识化”算法(例如MD5或SM3等算法),使得相同个人标识在各个机构的匿名化结果相同,结果是匿名化的作用与意义被削弱。并且,目前市场数据流通方式是两方参与(需求方与供应方),存在供应方知晓需求方商业秘密的问题。没有第三方参与的数据流通,缺少了判断数据交易主体间的合规性的独立中间方,使得数据交易合规流动遇到了较大的障碍。

举例来说,如果一套算法,可把某身份证号匿名化为A1,因为供需方的生成算法是相同的,参与数据流通的各方都会把某个身份证号转换成A1的符号,那么从根本上就没有起到数据保护和隔离的作用。具体到银行风控业务中,银行需把需查询的数据标识发给征信公司,例如,有A1-A1000这样1000个数据信息,但是征信公司的数据量并没有达到等量的验证,可能只有500个,那么这些数据供应方包括征信公司,通过帮助银行校验的过程积累着需求方的数据,补充自己的数据维度。另一方面,这些个人信息有可能会被泄露出去。

对此,王润垠介绍,xID标记技术组合了数据分类规则、不可逆标记生成、传输控制等多项技术,使得交易数据无法识别个体且不能复原个人信息,形成的无特定标识的个体标记数据,即“去标识数据”。

同时,基于真实应用场景,在数据流通规则控制下,在线实现数据的合规按需获取。为数据流通领域中的个人信息提供完整保护和安全利用的解决方案,为个人信息安全保驾护航。

xID助力数字经济发展

综合来看,上海数据交易中心的交易平台结合xID标记技术的数据流通运营生态网络的出现,为个人信息的數据合规治理提供了解决方案。通过xID标记技术的数据流通运营生态网络,既实现了各方个人相关标识信息的隔离,又可在法律合规范围内实现数据流通,为数字经济发展提供了安全、有序、合规、可控的底层安全保障技术。

目前,按照客户实际的反馈,银行在业务过程中存有海量的针对个人的金融数据,对数据安全管理的要求非常高。

xID标记技术首先可以帮助银行解决数据存储的安全合规问题。银行可利用xID标记技术将个人信息中隐私等级较高的标识(姓名、身份证号、银行卡号、手机号等)转换,实现内部数据分级管理的机制。存有个人隐私信息的数据作为机密数据管理。同时,经xID处理后,不可识别具体标识信息的数据作为普通管理等级数据处理。

“在金融获客与风险控制等银行常见的业务场景中,需要通过外部数据查询的方式补充数据,在此过程中,可以通过上海数据交易中心数据合规流通网络进行客户数据维度的补全。在流通过程中,所有与个人隐私相关的敏感数据标识均通过xID进行流通,确保数据获取的合规性与合法性。”王润垠强调。

就银行业一个应用场景来说,中国目前有300多家银行与保险公司等金融机构,相关数据服务公司数以千记。金融业数据合规流通具有巨大的市场规模与应用价值。

那么,除了金融行业的一些用户,其他领域的数据保护和流通,xID能否发挥作用呢?

对此,王润垠谈道,在互联网行业,会通过人群画像进行数据分析,维度越全越好,但是人群画像、行为分析也与数据标识相关,比如运营商内部有手机号相关联的这个人的手机使用数据及信息。

银行、保险等金融公司有银行卡下面的刷卡记录分析出这张卡相关的信息。但是,要实现手机号与银行卡关联,需要多个行业之间关键数据的打通,如果采用直接数据关联,存在法律合规性与商业机密等阻碍,较难实现。如果采用xID技术的三方数据流通,可在不同的数据源之间建立既隔离又关联的数据服务,多维数据融合就有可能实现,可以最大范围的整合数据资源。从行业应用层面来说,就能够更清晰、精准的实现人群画像。

总体来看,无论是在哪个行业的深挖和深耕,xID标记技术从本质上可实现以下两种数据安全保护服务,帮助企业提升数据安全管理能力:

1.合规存储。结合公安部eID(公民网络电子身份标识)算法与上海数据交易中心的成员管理体系,为企业提供具有唯一性的个人标识信息的匿名化处理服务。

2.合规流通。利用上海数据交易中心的数据流通技术,为企业间需要流通的信息提供数据标识的关联性服务。

通过xID标记技术的研发以及应用,实现对个人信息的保护,其核心意义在于个人信息的去标识化。

过去由于不同机构去标识化的标准不统一,对于数据是否符合流通要求的判断不一致,检查判断主体的不明晰等问题,都使得这项工作进展缓慢。在结合xID标记技术形成一套在线/实时/按需的“去标识化数据”流通网络生态,突破了传统加密网络点对点的限制壁垒,为数据的流通提供了更便捷、更安全的流动载体,对流通平台进行完善及补全。

xID开出创新之花

从技术的推广应用来看,上海数据交易中心通过现有存量转换首年30%(供需方调整期)、次年70%(成果推广期)的推进计划将xID标记技术覆盖应用整个交易平台,并且在新增的业务上率先应用xID标记技术,一些持有敏感数据或是对数据需求希望保密的组织或企业,也会因xID标记技术所提供的安全保密机制,从而打消之前的种种顾虑,进入数据流通的生态圈来进行业务的拓展及创新。鉴于xID标记技术的附加价值提供了更高的安全公信力及业界认可度,后续平台交易的活跃度、数据交易量都将得到增量效益,预计三年后每年提升率为30%。

从创新性来看,xID标记技术是结合“技术+规则”综合性解决方案。该方案的创新性是将数据流通过程从两方参与(数据需求方+数据供应方)转换成了多方参与(标识生成服务+标识关联转换服务+数据需求方+数据供应方)。这种多方参与的模式是个人信息相关数据可以被分解后拆分处理,实现敏感信息有效隔离,最终实现个人信息合规存储与流通。在此过程中,“规则”部分由上海数据交易中心研发;数据匿名化与关联性匹配的算法技术由公安部第三研究所在eID技术基础上实现并提供技术服务,从根本上确保了数据的安全性与服务的权威性。

访谈实录

Q:中国大数据产业生态联盟、《软件和集成电路》杂志社

A:上海数据交易中心运营经理王润垠

Q:如何从创新性的角度来诠释和理解上海数据交易中心技术的产业贡献?

A:上海数据交易中心承建大数据流通与交易国家工程实验室,参与相关大数据方面的国家标准的制定,开展了以数据连接为目标的标准、规范、技术、法律方面的基础研究。自主创新和研制的“技术+规则”双重架构的数据互联整体解决方案和实时在线的数据流通交易平台,形成了“数联网”数据连接的多个标准与专利技术,对应五层数联网结构,主要为:

1.多维数据分类标准,控制流通数据种类;(数据层)

2.“六要素”规整方法,定义流通数据规格;(数据层)

3.xID居间标记技术,保护数据主体隐私;(数据层)

4.单侧确权溯责规则,隔离责任连带路线;(应用层)

5.前置缓存配送技术,控制数据许可范围;(接口层)

6.三边互联路由技术,管控数据流通方向;(传输层)

7.交叉价值质量验证,提升数据评估公信。(服务层)

Q:“六要素”数据规整方法出现的意义是什么?

A: “六要素”数据规整方法是国内首创的流通数据定义标准,已成为大数据流通领域行业认可的基础规范;与公安部第三研究所联合研制的xID居间隔离技术是国内当前唯一能实现个人信息保护且利用的流通解决方案。

Q:当前,除了xID方面的技术研发和应用外,贵公司还有其他哪些业务拓展?

A: 依托上海大数据资源优势,上海数据交易中心已经组织了以营销、征信和建设物联网为目的的合规高效的數据流通网络,可以快速帮助政府、行业企业获取发展所需要的其他第三方数据资源,为企业规划、精准营销、内外联动、智慧城市建设等提供有效支撑。

Q:如何通过技术和科研投入来加快技术发展的步伐?

A: 公司针对我国大数据共享交换及交易流通不畅、标准不明、数据质量参差不齐、应用需求牵引不足等问题,围绕创建数据流通规则、加强安全与隐私保护、突破流通交易关键技术、拓展数据应用场景等需求,研究与建设大数据流通与交易技术创新平台,支撑开展政企数据资源共享交换、公共数据开放流通、大数据流通的理论方法和技术验证、样本数据库及其服务支持系统等技术的研发和工程化。目前,国家工程实验室拥有一支专业知识和实践经验丰富、知识结构合理、创新突破能力强的科研队伍,下设15个研究中心。

行业应用案例

案例名称:征信行业数据流通案例

核心特点:结合xID标记技术的流通生态网络,对流通的标识进行不可逆的转换,以确保个人隐私信息的安全。并且在需要时可对不同流通主体转换的标识进行匹配,避免了之前征信数据流通过程中的安全隐患,以标识代替信息,打破了恶性循环。同时,保障了数据流通的安全性,完善了流通方式的合规性。

应用解读:在目前数据流通领域,尤其是在征信数据流通领域,存在个人隐私信息流通的隐患,对个人隐私保护存在较大的风险。目前银行、保险等领域因业务管理流程控制,需对客户进行个人信息的背景调查,在此过程中使得大量个人隐私信息流向征信公司。

而个人信息的外流会引起更多维度的个人信息调查校验需求,这种恶性循环将使更多个人隐私信息外流,很多个人信息通过数据黑色/灰色产业链被不法人员掌握,为社会安定带来安全隐患。

应用价值:整合xID的标识流通解决方案,保证了在法理合规的前提下,提供了安全数据流通的途径,为征信领域的数据流通提供安全保障。完善上海数据交易中心的征信类业务场景的数据流通的安全性及合规性。

猜你喜欢
交易中心合规流通
企业如何做好反商业贿赂合规
在合法合规中提升民企竞争力
公共资源交易中心管理的经济规范化研究
我国流通产业现代化的路径思考
浅谈对建设工程交易中心发展方向的思考
加想建北美首个人民币交易中心
The Japanese keiretsu system
我国商业银行合规风险管理研究
双色镶嵌流通纪念币前景看好