郑佳斯,蓝 云
(1.中共广东省委党校文史教研部,广州 510003;2.广州南方学院公共管理学院,广州 510970)
当下,整体性治理已成为理论界和实践界的一致共识。在政务服务领域,“互联网+政务服务”是整体性治理的有力抓手,各地以“放管服”改革为路径,以信息化技术为支撑,推进数据上云、政务下沉,实现从“群众跑腿”到互联网“数据跑腿”的服务管理新模式[1],涌现出“最多跑一次”“一枚印章管审批”“一网通办”等实践探索和创新[2]。然而,在各地如火如荼的政务服务一体化创新实践背后,数据的共通共享依然是一大瓶颈[3]。统计报告显示,我国超过70%的政务服务平台未能与部门办事系统实现数据共享[4]。政府的组织机构、体制机制、资源配置等基本管理要素与数据共享要求存在一定的不匹配性。不同层级的政府对数据的治理能力存在显著差异,彼此之间缺乏协调与统一[5]。跨层级、跨地域、跨系统、跨部门、跨业务存在天然的数据壁垒,横向上“护城河”“防护栏”密布,纵向上“隔离带”“信息烟囱”林立,政府系统与社会系统则存在“玻璃门”“弹簧门”以及“旋转门”等[6]。种种现象折射的是跨部门数据共享难题,这直接制约了政务发展和数字政府建设的深入推进[7]。
针对跨部门数据流动的难题,现有研究主要从制度路径对其进行探讨。一是借助地方行政长官或领导小组的高位推动;二是重新进行业务梳理和流程再造,如把串联事项变为并联事项,以“办成一件事”倒逼政府进行部门合作;三是制定部门间正式协议,或在区域内部形成统一公认的数据共享技术标准。但通过制度路径依然难以解决跨部门数据因规制不统一、数据权属模糊和信任鸿沟而引起的合作难题,其本质原因在于组织间难以建立根本性的信任关系。在信息不对称的情况下,理性经济人出于个体利益最大化的考量,难以将核心的信息、资源与他人共享,这使得“拜占庭将军难题”没有得到真正破解。尽管经过了新公共管理运动和政府再造运动对官僚制组织结构的改良,然而,强调分工作业和科学管理的行政组织构成原则依然没有改变,政府结构仍旧是“典型的纵向科层化的和横向职能化的”[8]。长期以来,政府信息安全系统遵循的是“谁保管,谁负责”的部门负责制[9]。与此同时,各地数字经济发展不平衡,数据政策和措施存在天然差异,数据优势区域与数据弱势区域合作缺乏激励性。再者,频频见诸报端的隐私泄露事件进一步加深了信任鸿沟,隐私保护和数据安全的政策目标使得各地的数据合规监管日趋严格。数据共享在规范化的同时,也使得各部门出于数据安全的考虑进一步限制数据的对外开放。现实情况是,出于隐私以及社会、文化和政治等方面的考量,越来越多的数据流动限制措施被采用,包括单边规制、限制数据类型、实施歧视性技术标准等方式,以阻碍数据向外转移[10]。因而,在短期内,通过制度层面的组织重构达致数据共享难以实现。对此,跨学科研究(尤其是计算科学)从技术路径着手,为解决跨境数据流动难题提供了新的方法论。在实践中,人工智能、区块链、隐私计算等新技术与具体业务场景的结合越来越频繁;但在研究中,相关的新技术应用于数据共享尚处于起步阶段,有待理论跟进。在多源异构的大数据时代,面对需求旺盛的数据共享和日趋严格的数据合规要求,如何以技术路径为突破口,借助更为精准、更具适用性的技术手段打破数据孤岛、促进数据有效共享、实现数据价值最大化,成为推进政务服务一体化和数字政府发展亟需解决的问题。
在新技术赋能于数据共享的实践背后,厘清其运作机制及由此带来的数据秩序变化和治理理念迭代,成为公共管理未来需要重点关注的议题。作为在虚拟空间运作的新型要素,数据以字节的形式穿梭于无形的世界,突破了传统物质的正常物理限制,理解数据流动和共享离不开对数据流动空间的深入探析。在建筑美学上,密斯曾相对于古典静态建筑提出流动空间的概念,指向一种新的虚实与透明的建筑空间概念[11]。信息化、网络化、数字化打破了传统的行为空间模式,空间概念早已突破了可以被测量的事物的客观属性,全新的流动空间概念伴随着流动社会的产生而产生。20世纪90年代,曼纽尔·卡斯特敏锐观察到网络空间使物理空间从传统文化、历史和地理意义中脱离出来,被重组进类似于意象拼贴的功能网络中,故而产生一种流动空间,过去、现在和将来可以被设定在同一信息里且彼此互动,时间的概念随之消失在这个新的空间之中[12]。所谓流动空间,即通过流动而运作的空间,是以新传播技术为物质基础的社会意义的空间[13],借助电子信息技术组织整合不同空间[14]。卡斯特的流动空间概念富有启发性,信息技术在分割物理空间的同时,也通过信息流动形成新的空间概念。这种新的组合在过去较大意义上是虚拟空间和现实空间的交互,而随着区块链、隐私计算等技术的出现,分布式账本、受保护的“飞地”等新的空间概念也在形塑。论文援引此概念,认为数据流动空间是指以新技术为物质基础而建构的新的社会意义空间,涵盖了数据流动的空间结构和运动方式。本文基于政务数据跨部门流动共享的三个典型案例,深入探讨数据多种共享机制及数据流动的空间建构,以此回应相关理论和实践问题,希望为数据的流通共享和数据价值挖掘提供新的思路。
为进一步推动政务上云、服务下沉,广州市番禺区政务服务数据管理局在全国首创推出5G+VR“政务晓屋”智慧政务新模式。2020年5月,“政务晓屋”最早在广州大学城试点落地,税务“云坐席”成功上线。“政务晓屋”通过“云坐席”在线精准政策推送解决了港澳台企业税收优惠政策、粤港澳大湾区无差别办税渠道咨询等问题,构建了大学城15分钟办税缴费舒适圈。“政务晓屋”以云政务服务大厅为依托,对各部门的业务和资源以“云坐席”的方式进行统筹,打破了地域界限和行政壁垒,目前已经在北京、广东、浙江、湖北、湖南、山东、海南、广西等地20个城市共设置153台5G+VR“政务晓屋”,可办理的事项超过9 000项。
除了推动政务上云外,“政务晓屋”借助5G和VR技术设置了“云坐席”远程指导,通过不见面、非接触、云端批的方式,提供远程“面对面”政务服务和贴心“手把手”全程指导。办事群众通过“政务晓屋”便可实现与多部门“云坐席”“面对面”沟通,包括即时咨询反馈、即时业务办理和即时问题处理等,提升了政务服务的效率和质量,真正实现“一屋通晓,一屋通办”。截至2021年12月,番禺区“政务晓屋”共计办理业务7 925宗,其中税务4 450宗、商事业务840宗、社保业务462宗。现共配置173个“云坐席”帐号,可办理9省20市4 118个事项,粤港澳大湾区1 442个事项,全国省市跨域通办事项2 676个。
在传统的概念中,空间是相对固化、相对静止的客观物质存在,具有明确的物理边界和固定的场所。在此意义上,以往的“一站式”政务服务改革,通常的做法是将后端窗口前移到“综合窗口”,减少办事人员在多个窗口跑动;但由于不同省市的业务协同困境,一站式政务服务依然难以解决跨地办事的难点。新技术应用可打破传统地域空间概念的“临近性”及时间概念的“同时性”,将不同时空的行动者和信息重新凝聚、汇集到新的空间中,以此实现行动者的交汇和数据信息的融合,形塑新的流动空间。“政务晓屋”依托远程协助、5G、VR等新技术应用,实现不同部门在新的物理空间的重新聚合,通过“部门不动,场景动”破解跨地域、跨部门协同难题。
1.“云坐席”跨系统切换,打破数据壁垒
传统政务共享的难点在于,不同部门基于自身数据库存在数据分类、格式、类型等差异[15],而数据流通技术平台在算法原理和系统设计上也不尽相同,导致数据和信息之间难以实现无缝交互。即使统一数据平台和数据标准有助于在一定程度解决数据交互难题,但由于不同区域在数字技术应用和数字经济发展等方面存在差异,平台和标准的统一目前无法在全国范围实现,这导致跨部门尤其是跨区域的数据共享依然存在瓶颈。为有效打破行政壁垒和地域界限,“政务晓屋”创新性设置了“云坐席”,即不同部门通过云端登录到“政务晓屋”共享平台,依然可以采用自身系统进行相应业务操作。由于操作系统不需要调整,各个参与方无需进行业务系统对接、事项流程变动、签订合作协议,有效规避了数据共享中的系统对接难、升级难等问题,为畅通各部门政务互动、协同支撑、高效服务提供了新的路径。
2.5G+VR辅助核验,推进承诺制审批
在政务业务前端,既有的行政审批通过统一窗口办理,可以提升群众的办事效率,但对边远地区或交通不便的群众依然不够便利。“政务晓屋”通过5G+VR的技术应用,创新性地将人工窗口迁移到“政务晓屋”平台,对需要进行现场核验的服务事项推进承诺制审批,提升服务的便利性和效率。5G的高速率、大容量、低延迟,VR的立体感、沉浸感、交互性,使得群众在“政务晓屋”依然可以获得与实体大厅窗口一样的体验感,与“云端”工作人员进行实时的交流和互动。“政务晓屋”通过可视化窗口,将省、市、区所有服务事项下沉到基层,将行政审批事项过程中直接面对群众的提交申请等工作环节前移到离群众最近的地方,并通过科学合理布点,优先配置到镇、街、村、重点园区、商圈等需求较为集中的区域,真正做到群众“就近办”“多点办”。在此基础上,通过建设云政务服务大厅统筹管理各部门“云坐席”资源,创新集约化改革模式,全力推进网上办事、服务事项流程再造,在政务下沉的同时实现“数据上云”,实现“一屋通晓、一屋通办”,增强人民群众便利感。
个税股权转让涉及税务和市场监管等部门。根据原有流程,个人在办理股权变更登记前,需向税务部门申报缴纳个人所得税,再前往市场监管部门,经对完税情况进行查验后再进行股权变更登记。这个流程存在明显的弊端:一方面,纳税主体需在两个部门跑动,时间成本较高;另一方面,在不同部门的资料提交中,潜在资料篡改的风险,增加了相应的审核和监管成本。为提升纳税人办税体验、提高数据共享效率、优化税收营商环境,进一步实现涉税业务的跨部门数据共享,2021年7月,广州市税务局联合广州市市场监督管理局、广州市政务服务数据管理局,创新推出“区块链+股权转让”应用,探索区块链技术在涉税领域跨部门合作中的应用,实现了“申报完税—数据上链—智能审核—股权变更—后续管理”的跨部门、全流程实时链上业务流转,为个人股权转让“先税后照”提供全链条信息保障,全流程办理时间缩短近60%。
依托“自然人股东股权变更管理功能模块”,税务部门受理完股权转让个人所得税申报后,相关信息自动归集上链,市场监管部门实时获取链上的完税信息,核验通过并完成股权变更业务后,自动将股权变更的明细数据实时回传上链,供税务部门从链上获取用于后续管理。基于区块链信息可追溯、不可篡改的技术特性,股权转让涉税业务上链之后相关信息可自动生成凭证并上链存证,智能合约根据既定规则对完税信息和股权转让金额等信息进行自动比对和确认,这一功能既规避人工审核的诸多风险,又从系统层面杜绝了虚构完税证明的可能性。①广州税务:《创新推出“区块链+股权转让”应用》,《广州日报》2021年8月27日。
总体而言,通过“区块链+个税股权转让”的创新应用,既为纳税人提供了全流程电子化、无纸化的业务办理,也为堵塞征管漏洞、降低股权转让风险提供了有力抓手,提升了股权转让个人所得税管理效能,真正在服务上实现“群众少跑腿、数据多跑链”,管理上实现“链通数通,共治共管”新升级。②《广东创新推出“区块链+税务”应用,让办税更加便利》,《中国新闻网》2021年9月28日。
与物理空间的固定性不同,流动空间弱化了物理边界和行政边界,依托节点重新建构信息与符号的流动空间,因应节点的变化形塑动态变化的结构关系。区块链作为一种基于密码学原理构建的分布式共享数据库,系统内的所有节点都有权限对当前区块链的完整副本进行备份,多个参与计算的节点共同参与数据计算和记录,互相验证信息有效性并提供可追溯路径。区块链的任何变动都会同时引起全网区块链副本的更新,具有分布式对等、数据可溯源、难以篡改、集体维护、公开透明、智能合约、自动执行等技术特点,具备突破传统组织边界壁垒的天然自组织特性[16],依托分布式账本所形成的流动空间将为破解多方协作、多方信任问题和数据共享困局提供新的解决方案。具体而言,区块链通过共识机制在参与方之间建立信任基础,实现点对点的价值传递;通过智能合约实现链上数据真实性验证和审计;通过协同机制、激励机制的设置与共识,促进数据开放共享与价值协作。①隐私计算联盟-中国信息通信研究院云计算与大数据研究所:《隐私计算与区块链技术融合研究报告》,2021,第10页,https://www.docin.com/p-2822169277.html.
1.智能合约:可自主执行的计算机协议
传统的合作一般通过双方或多方签订正式的合同协议,协议明文规定双方的权责及具体要求,合同的签订一般建立在双方具有一定信任的基础上,具有可信的第三方作为合同监督者,或合同条文可以全面涵盖未来可能发生的情形。但数据的开放共享往往是一种实时的交易,且运行逻辑较为复杂,难以通过正式的合同事先予以约定。对此,智能合约(Smart Contract)提供了一种新的可能性。智能合约最早于1994年由美国计算科学家Szabo提出,其本质是一种计算机协议,但其运作机制是自动化和数字化。一旦触及相应规则和约束,合约即被触发和自动执行,无须依托可靠第三方的监督或依赖于合同双方的自我约束。此外,在智能合约执行的过程中,所有的数据和操作行为都是可追溯且防篡改的,这使得合同的执行过程公开透明,在不借助第三方的情况下也可达成信用共识,极大降低了传统合同执行中的交易成本,也提升了多方的合作动力和意愿,提高了跨部门的协作效率。
具体到股权转让的数据共享实践,首先,由税务部门和工商部门共同制定一份数据共享的合约,包括数据交互的方式、数据的使用范围和使用条件、异常情况的自动保护与预警等,然后通过点对点传输技术(P2P)网络对相关涉税信息数据化上链存证,最后由智能合约自主执行检查、验证、保存等[17]。在这个过程中,利用区块链智能合约技术,对链上的信息传递进行加密处理,每笔交易过程都会被详细记录,具备不可篡改的技术特性,真正做到数据可追溯、可查、可验、可信、可管控,②《广东创新推出“区块链+税务”应用,让办税更加便利》,《中国新闻网》2021年9月28日。从而保证了个人完税台账信息的真实可信;并基于审批规则自动根据链上信息数据进行智能化比对,确认完税信息与申请股权转让金额等关键信息相符,保障审批安全,规避人工审批的诸多风险。
2.全流程存证:数据可溯源
政务数据全流程存证,为优化城市数据监管体系提供了新的突破口。在具体执行细节上,每条上链数据都会同一些特殊的字段信息(包括数据的发送方和接收方、发送时间、所属群组、数据类型等)一起封装成一笔“交易”,即上链数据的基本载体;然后多笔“交易”会被打包成一个区块体,同区块头(内里包含唯一的时间戳、日志信息、生成该区块的节点信息、共识节点列表等字段信息)一起组成区块,通过一系列数据同步和共识等过程后,将其按照时间顺序链接到区块链上,最终实现数据的上链。链式结构、时间戳以及底层数据字段的结合使得历史数据的追溯变得简便,如当链上的数据信息出现不合理问题时,可随时通过查证数据的发送方和接收方、所在区块的生成节点信息和共识节点以及时间戳等信息,知晓数据的来源和流向,排查出可能跟该数据有密切联系的某些节点。这些信息将被永久保存在链上,不可伪造,不可篡改,真实可靠,同防伪溯源的契合度很高,可应用于历史数据和现实数据的对比性分析,适配于政府重大工程监管、食品药品防伪溯源、电子票据、审计、公益服务事业等监管场景。①中国信息通信研究院:《区块链赋能新型智慧城市白皮书》,2019,第10-14页,https://www.doc88.com/p-59399408286930.html?r=1。区块链的不可篡改、去中心化等特点恰好与税务监管的需求逻辑相呼应。原来由纳税人提供纸质完税证明给市场监管部门进行变更审核的方式存在很大漏洞,难免有人铤而走险弄虚作假。“区块链+股权转让”上线使用后,自动生成不可篡改凭证上链存证,从系统层面杜绝了虚构完税证明的可能。
3.去中心化的分布式账本:“多对多”数据共享模式
跨部门数据共享和数据交换在实践中通常有两种模式:较早期的是“多对一”的模式,各个部门统一将数据上传到共享交换平台,再由大数据管理中心进行管理和依申请使用,如各地新成立的政务服务数据管理局承担的就是这个职能;另一种则是“多对多”的模式,各个部门可以根据业务场景需求,点对点在信息共享交换平台上发起数据共享和交换,更具灵活性和复杂需求适应性[18]。区块链的本质是一种分布式账本,数据信息不由单个机构或个人维护,而是由网络中的每个节点单独构建和记录,可以实现多节点甚至无中心的数据交换,保障不同部门之间的高频复杂数据共享[17]。基于数据治理业务场景需求,区块链可依托多群组架构的联盟链体系,支持各区块链节点启动多个群组,并通过网络准入机制和账本白名单实现不同群组间交易处理、数据存储、区块共识相互隔离和对链上数据的隐私保护,并在保留系统间数据互操作性的同时,降低系统的运维复杂度(见图1)。基于数据自动上链、多方共享的“多对多”数据跨部门共享模式的灵活性,目前广州市税务局逐步对接其他政府部门在区块链下达成合作共识,延伸不同业务场景的数据共享合作,如“区块链+非税收入残保金”“区块链+出口退税”“区块链+医保费政府资助”“区块链+不动产契税”等应用,有效打破部门壁垒,发挥数据资产价值。
图1 基于群组的区块链分布式系统
健康医疗大数据具有体量大、结构复杂、规模巨大等特点,医学研究、基因分析等工作高度依赖于海量数据的积累。然而,由于医疗数据涉及个人信息权和隐私权,存在数据安全风险[19],医疗相关机构的数据平台开放性普遍较低,医疗大数据行业整体存在碎片化、孤立分散、类型多样、标准不一等情况,数据资源大多割裂和离散在不同机构及业务系统内,数据难以互通互联,数据价值开发利用程度低[20],严重影响了医疗水平的提升。2020年10月,中共中央、国务院印发了《“健康中国2030”规划纲要》,明确指出要推进健康医疗大数据应用,推进基于区域人口健康信息平台的医疗健康大数据开放共享、深度挖掘和广泛应用。在充分考虑医疗大数据整体安全性和合规性的基础上,探索健康医疗大数据的应用开放,成为推动健康医疗大数据发展的重要议题[21]。
作为国家医疗健康大数据首批试点城市,厦门卫健委依托翼方健数公司建设了“健康医疗数据应用开放平台”,以此破解医疗大数据互联互通难题。“健康医疗数据应用开放平台”基于隐私计算技术,为医疗大数据的所有方和使用方提供了一个新的合作平台,旨在夯实城市级医疗数据底座、打破医疗数据壁垒,构建医疗数据开放和共享的数据生态系统,为厦门医疗大数据的科研协作分析以及精准医学的发展提供了有力的基础设施保障。这也是目前首个利用隐私计算技术实现城市级数字化应用的案例。①《隐私计算:数据隐私保护的技术退路》,《中国科学报》2021年5月25日。
医疗数据因涉及生命健康及个人私密信息,具有高度敏感性和复杂性。《个人信息保护法》就将医疗健康信息界定为敏感信息。因而,相比于其他领域的数据流通和共享,医疗数据开放使用的边界和条件更为严苛。与此同时,医疗大数据的数据权属关系尚未厘清,法律层面对数据所有权、使用权、经营权等缺乏明确的界定和权益保护,进一步制约了医疗机构、企业和民众等主体的参与积极性,导致基于原始数据的开放和共享在医疗领域难以通行。
在一定程度上、在限制原始数据共享的基础上,实现医疗数据在供给方和使用方之间的隐秘流通,成为医疗数据开放共享的前提和必要条件。近年来,快速发展的隐私计算技术理念与医疗数据的开放共享需求不谋而合,其旨在解决一组互不信任的参与方之间保护隐私的协同计算问题。通过构建隔离的数据空间,在不共享原始数据的基础上,依托独立的数据计算过程输出具有共享价值的结果数据。具体而言,隐私计算以保护数据全生命周期隐私安全为基础,借助密码学、人工智能、数据科学等跨学科技术体系,在对原始数据进行隔离的前提下,对多方数据在加密状态或非透明状态下进行融合计算,①《隐私计算2020盘点:数据安全流动新蓝海业已形成》,《中国日报》2021年1月4日。破解了数据在中间处理和运算环节中的隐私安全难题,实现数据所有权和使用权的有效分离,达到促进数据要素流通融合、有效提取数据要素价值的目标。
在技术细分上,隐私计算的核心技术主要包括联邦学习、可信执行环境和多方安全计算,不同的技术根据不同特性为数据的共享提供差异化的治理思路,技术的有效叠加最终形成完整的数据隐私保护安全屏障,实现不同源头的数据安全共享和数据价值挖掘。隐私计算的本质是在数据供给方和需求方中间构建隔离的运算环境,实现数据运算和输出的分离,形成一个隐私的数据流动空间。其中,联邦学习的核心是原始数据不出库,只在本地模型训练,通过“数据不动,模型动”进行密文形式的中间计算结果的交互;可信执行环境通过特殊的硬件芯片为原始数据搭建一个安全的执行环境,为敏感数据提供受保护的“飞地”,确保数据的完整性和机密性[22];多方安全计算则直接面向数据,通过构建系列基础运算操作,将多方原始数据转换为密文,对不同源头数据的通用安全数据进行联合计算分析,促进数据安全流动。
1.联邦学习:原始数据不出库
联邦学习最早于2016年由谷歌率先提出,指向的是一种基于人工智能,并与密码学相融合,意在打破数据孤岛、释放AI应用潜能的分布式机器学习技术系统[22]。作为机器学习和隐私计算的结合体,联邦学习为解决大数据的孤岛问题提供了新的方法路向。由于数据散布在不同的供给方,当两个或多个供给方需要联合各自的数据进行机器学习模型训练时,传统的做法是将数据聚合到一方进行训练,但在这个过程中原始数据容易被泄露。联邦学习提供了一种新的数据联合训练方式,通过分布式机器学习技术,建立一个虚拟的共有模型,实现“数据不动,模型动”。由于原始数据依然存储在本地,有效地规避了隐私泄露和数据合规问题。联邦学习的核心机制是分布式计算、原始数据不出库、模型共享,各参与方在不披露底层数据和底层数据的加密(混淆)形态的前提下,通过加密机制下的参数交换方式共建模型,实现联合建模、模型推理和预测服务。②《AI训练遇隐私难题,联邦学习这样打通数据孤岛》,《科技日报》2019年11月19日。在现实场景中,基于联邦学习,多个医疗机构可以在不共享原始数据的基础上,通过安全的算法协议进行联合机器学习、联合建模和联合数据分析,在数据不出域的前提下实现数据背后价值的移动、转移和共建,破解医疗数据孤岛难题(如图2所示)。③腾讯:《隐私计算白皮书》,2021,第19页,https://www.docin.com/p-2657204652.html。
图2 隐私计算在医疗领域的应用示例
2.可信执行环境:构建数据运算隔离空间
可信执行环境指向的是一种具有运算和储存功能,能提供安全性和完整性保护的独立处理环境,其本质是在硬件中为敏感数据单独构建出与外部隔离的安全计算空间,除了经过授权的专门接口,硬件中的其他部分无法访问隔离空间的数据信息,以此实现数据的隐私计算。根据Sabt等人的定义,可信执行环境可理解为“一个运行在分离核上的执行环境”,其需要满足以下安全性准则:数据独立(data separation),储存在某个分区中的数据不能被其他的分区读取或篡改;时间隔离(temporal separation),公共资源区域中的数据不会泄露任意分区中的数据信息;信息流控制(control of information flow),除非有特殊的允许,否则各个分区之间不能进行通信;故障隔离(fault isolation),一个分区中的安全性漏洞不能传播到其他分区。①Sabt M,Achemlal M,Bouabdallah A.“Trusted execution environment:What it is,and what it is not,”In Trustcom/bigdatase/ispa(Helsinki,Finland:IEEE,2015),p.57-64.与联邦学习“数据不动,模型动”的原理不同,可信计算直接面向数据,通过特殊的硬件为数据的计算提供一个独立的安全区域,有效保证内存屏蔽区域的数据安全。
3.多方安全计算:形成加密协议和算法
多方安全计算(Secure Muti-Party Computation)最早源于1982年姚期智提出的“百万富翁问题”,②注:两个百万富翁在街头偶遇,双方既不想被对方知道自身总资产,又希望可以知道谁更有钱,如何不依赖于第三方直接得出谁更富有的结论。其核心思路是在无可信第三方的情况下,互不信任的多个参与方按照公开的加密协议和算法协同计算一个约定函数,除计算结果外,各参与方都无法获取其他方的原始数据,也无法通过输出的结果函数推导出原始数据。③Yao A C,“Protocols for secure computations”(Proc.of the 23rd Annual IEEE Symposium on Foundations of Computer Science,1982).多方安全计算的目标即是保证各参与方的数据安全,并通过计算协议保证计算的准确性和结果的可靠性,既可以得到参与各方期待的计算结果又能保障隐私安全。
联邦学习、可信执行和多方安全计算的共同原理都是为原始数据提供保护屏障,在数据不出域的前提下,实现模型的联合计算或数据的结果输出。在现实的场景应用中,由于单一技术路线难以应对复杂的计算任务和不同量级的运算规模,因而一般采取多技术融合的方式,为适配不同的场景和任务需求提供综合技术方案,提升总体技术的精准性、稳定性和安全性。④深圳市洞见智慧科技有限公司:《多方安全计算(MPC)发展脉络及应用实践》,2022-04-28,https://baijiahao.baidu.com/s?id=1731346395339645713&wfr=spider&for=pc.依托于隐私计算技术,“健康医疗数据应用开放平台”对多个医疗机构的数据流动秩序进行重构,原始数据的所有权依然保留在各数据供给方,加密后的数据使用权仅限于平台内部,数据所有权和使用权的技术分离为破解数据权属模糊难题提供了新的解决思路。依据“最小可用原则”,多方医疗数据在经过授权开放后,可以在技术平台上进行计算,包括联合建模、隔离运算、结果函数输出等方式,需求方可获得最终数据结果但无法下载原始数据。如此一来,在原始数据保护的前提下充分挖掘了数据的潜在价值,实现了多参与方的跨平台数据价值共享。更重要的是,依据新的数据流动空间,“健康医疗数据应用开放平台”事实上构建了一个全新的数据共享“生态系统”,①《隐私安全计算成“关键之钥”翼方健数突破医疗数据共享困境》,《新京报》2020年9月18日。重新连接了“数据”和“计算”,提供了新的数据安全保护机制、数据价值分配机制和数据共享流通机制,有效满足了数据所有方、数据使用方、数据服务供给商的多元需求。数据“可用不可见”的新共享机制的构建,在数据隐私保护和数据价值共享之间获得了平衡,使得各参与方即使互不信任依然可以进行有效合作,真正破解数据壁垒信息孤岛难题。
数据作为一种特殊资源,需要流动起来才能产生价值。“政务晓屋”“区块链+个税股权转让”和“健康医疗数据应用开放平台”三个案例都是对跨部门政务数据共享的创新尝试,是新技术应用破解传统跨部门合作难题的典型经验。新信息技术在促进数据流动的过程中也在形塑新的数据流动空间,不同的技术建构不同的社会意义空间。数据流动的空间结构、运动方式和逻辑机制进一步影响了跨部门数据共享的深度和广度。
在数据流动的空间结构上,“政务晓屋”依托“云坐席”、5G+VR等技术,在线上构建了一个新的互动空间,将处于不同物理空间的办事中心平行聚合到新的虚拟空间,实现了多部门联动。区块链技术运用的是分布式网络,节点的账本记录过程是公开透明的,建构的是一个共享和透明的分布式数据空间,具有开放性、自治性和去中心化的特征,不同节点的用户进行互信和协作,共同维护数据安全,适用于参与方互相信任且数据可公开的场景。隐私计算则是建构一个隐秘性的数据空间,在数据提供方不泄露原始数据和计算算法的前提下,依托可信执行环境,确保输入的独立性、计算的正确性以及输出的不可推导性。
在数据流动的运动方式上,通过远程协作,“政务晓屋”使得跨区域、跨部门合作成为可能,相关政务业务涉及的不同部门得以在“同一个场域”联合办公,并无触碰到不同部门内部数据的问题,只是进行组织前端的聚合以及业务流程的并联。借助5G和VR技术,群众与业务部门可以形成“面对面”的联结,以“部门不动,场景动”实现跨部门协同办公。“区块链+个税股权转让”则是依托区块链进行数据的确权,通过竞争机制下的“矿工”,为信息打上“时间戳”,使前后传播的信息间产生异质性;通过智能合约,自动实现信息在不同主体间传播时的产权流动;通过分布式账本,即多方主体相互制约、相互监督的形式保证这个过程的实现[23]。借助分布式账本、智能合约和数据可溯源等核心机制,构建部门间的信任地带,通过不同部门的数据上链、全过程数据跟踪和溯源,以“部门不动,数据动”实现跨部门合作。“健康医疗数据应用开放平台”依托隐私计算,将技术嵌入到数据内部,在保证数据提供方原始数据不出库的前提下,根据数据需求方的要求对数据进行处理和计算,进而完成数据价值的挖掘,通过数据“可用不可见”的方式实现数据所有权和使用权的分离。在保护数据源的同时也解决了数据流通的问题,通过联邦机制、可信执行环境和多方安全计算等机制,实现“数据不动,价值动”,进而从真正意义上破解跨部门协作难题背后的数据流通和隐私保护的悖论。
在数据流动的逻辑机制上,去集中化、去中心化、去信任化。“政务晓屋”借助远程技术,将不同组织整合到同一空间,将部门的业务前端移动到同一个场域,不同组织之间无需进行内部业务的打通和融合,只是实现物理边界上的跨部门合作,并不涉及数据的共享,颠覆了以往将部门聚合到政务服务中心的思路,是一种去集中化的过程。区块链技术是通过去中心化、高信任的方式集体维护一个可靠数据库的技术方案,每个节点运行的逻辑都是同样的,所有节点都是对等的,通过分布式网络、加密算法和共识机制三大核心技术搭建去中心化的网络框架,以公开透明、不可篡改的特征构建新的信任体系。隐私计算是一个链下、去信任的计算环境,在不触及数据源的基础上对数据进行分析计算,程序在其中以私密、安全、廉价的方式执行,并且运行时间不受限制。流动不是数据本身的共享,而是数据价值的流动。由于各方原始数据不出域,数据需求方无法对原始数据进行二次加工应用,确保了数据的安全性和合规性,既能满足数据流动需求,又能保护数据与隐私安全,使得互不信任的参与者在不泄露各自隐私数据的情况下,利用隐私数据参与保密计算,得以共同完成某项计算任务。在一定程度上,也降低了数据供给方对数据泄露风险和责任风险的顾虑,提高了数据的开放度,拓宽了新的数据资料市场,是一种去信任化的过程(见表1)。
表1 不同技术框架下数据流动空间的形塑机制
随着大数据、云计算、区块链、元宇宙等的快速发展,数字时代已然到来。相比于原子时代,数字时代将是一个物理世界不断进行数字更新的过程。在这个过程中,正如卡斯特所预想的,现代通信技术推动了全球流动——“资本流动、信息流动、技术流动、组织性互动的流动、影像、声音和象征的流动”[13]。在信息化和网络化变革大潮中,数据作为载体带来了新的物质世界的流动和重组,而数据本身的流动也在不断形塑新的空间,社会结构在这个动态过程中也在不断变革。在这个意义上,全部的网络和信息系统都可以看作因数据流动而运作的社会实践。数据,不仅构成在线虚拟空间中社会实践持续生产和再生产的资源,而且还影响线下空间里各种社会实践中的自然和社会资源的再配置[24]。
“政务晓屋”依托5G+VR的技术,对传统线下信息空间进行重构,形成线上线下一体的新的信息空间。而区块链、隐私计算的技术则进一步打碎传统物质空间,创造出新的信息空间,数据在分布式账本、可信执行环境里流动,形成新的流动空间。物质比特化、比特数据化使得现实空间中所有事件与行为不断被“分解”成结构化的、离散的数字符号,并被吸纳进新的数据空间中。结果是,局部的、“地方的”物质空间反过来成为全局的、流动的信息空间的附属,数据流动开始引导着物质的流动。全球数据资源的分布经历着深刻改变,数据资源在世界范围内重新配置,社会生活与生产方式在数据流动驱动下演变出更加广泛同时又分层次的一致性[24]。
新的流动空间和流动秩序的变化蕴含着社会结构的变革。卡特尔提出了流动空间的三个层次:第一个层次是由电子交换的回路所构成;第二个层次是由节点和核心所构成;第三个层次是占支配地位的管理精英的空间组织。三个层次作为信息社会中支配性过程与功能支持的物质形式,共同构成了流动空间。[25]在此基础上,黄璜等进一步将数据流动划分为四个层次,即数字机器、应用系统、数据网络和信息空间。[24]从本质上来说,数据的流动空间既包含了算法等技术层面、数据流动等规则层面,更包含了精英文化等社会行动者层面。在这个意义上,数据网络与自然空间、社会空间紧密关联,流动空间的形塑与建构最终必然涉及流动规则的制定和数据权力结构的配置。更进一步,政府数据治理可视为对全社会数据资源进行权威性分配的活动,既要关注技术和应用系统层面的规则制定,又要关注不同于传统物理世界的数据流动空间分布。在这个层面上,跨部门数据共享可被视为数据流动公共空间的拓展以及相应的数据权力结构的重置,政府需要更加关注数据共享所涉及的组织结构重塑和激励机制分配,尤其是关注数据流动空间背后的流动秩序重塑和组织边界调整,以及更为深远的组织行为文化的变迁。技术固然是实现合规的关键手段,但合理、科学的制度也是数据保护中必不可少的一环,①《隐私计算:数据隐私保护的技术退路》,《中国科学报》2021年5月25日。需要为新技术产业的发展树立合法性框架,通过相关的法律、政策、标准等实现数据保护。例如,隐私计算在技术层面为多个参与方的原始数据保护和数据共享提供了新的解决思路;但在其应用过程中,如何为数据持有方、计算方和结果方提供权益保护和责任追溯,需要在法律制度层面进一步厘清和界定,否则将影响隐私计算的拓展应用和商业落地。②腾讯:《隐私计算白皮书》,2021,第19页,https://www.docin.com/p-2657204652.html。因而,在制度层面,关键是不断健全完善数据共享和流通的政策监管体系,通过技术标准建设规范行业发展,建立新技术产业发展的合法性框架,拓展更多的技术应用场域。在此基础上,数据价值的深入挖掘有赖于海量数据的聚合和流动。因而,需要建立数据共享网络,通过建立科学的数据价值贡献评估和利益分配机制,激励更多的数据拥有者参与进来,建立开放、多元、多层次的数据共享网络。③隐私计算联盟-中国信息通信研究院云计算与大数据研究所:《隐私计算与区块链技术融合研究报告》,2021,第23页,https://www.docin.com/p-2822169277.html。在这个过程中,还离不开政企、政社关系边界的调整。