沈逸,姚旭,朱扬勇
1. 复旦大学网络空间治理研究中心,上海 200433;2. 复旦大学计算机科学技术学院,上海 201203;3. 上海市数据科学重点实验室,上海 201203
推动数据资源,尤其是政府数据资源的开放共享是我国实施国家大数据战略的核心内容。习近平总书记指出:“推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。”如何构建一套有助于推进政府数据开放共享的务实路径,是当前实施国家大数据战略过程中必须面对的关键挑战之一。从已有的实践以及国际比较经验来看[1-3],以数据自治(即明确数据资源权属并界定必要的使用—维护成本)为基础,由政府相关部门自主推进数据资源的开放共享,可能成为一条适应中国特色的实践路径。
以数据自治为基础,推动政府掌握的数据资源的开放共享,是由中国数据资源分布的客观特征决定的。从1994年全功能接入互联网开始,中国的整个信息化与网络化进程就有着显著的政府主导和强调顶层设计的特点。尽管在商业运用中,市场化的力量展现了自己独特的优势,但是在基础资源以及覆盖全社会的系统的数据收集与整理方面,中国政府仍然具有非常显著的优势。20世纪90年代开始的中国政府电子政务建设具有非常显著的条线特征,即垂直条线业务部门采取相对封闭的方式构建垂直的数据采集与业务处理的信息系统,由此产生的现象是海量的政府数据,在若干关键而重要的垂直条线部门内部业务系统的数据枢纽节点上大量累积,形成了块状的“数据金矿”,其中具有代表性的包括人口基础数据、工商基础数据、税务基础数据、健康医疗数据等[4-7]。虽然,腾讯、阿里巴巴这些大型互联网企业的高速发展与快速崛起也形成了海量数据的累积,但是在数据质量、准确性以及系统性方面,政府内部累积的数据资源仍然具有非常显著的优势。
以数据自治为基础构建政府数据资源的共享,要解决的是阻碍数据共享的关键问题之一,即不同层级政府部门数据开放和共享动力不足的问题[8]。从欧美国家的实践来看,数据开放是作为一项理念或者价值性的要求出现的[2];从现有的研究成果来看,在中国的研究者中,主流仍然将推进数据开放的主要动力寄托在价值和理念的层面上[9]。虽然从法理或者应然的角度来说,要求政府以免费或者极低成本的方式开放数据资源给各方自由取用,可以找到非常多的理论和价值依据,但务实地看,很多国家(包括欧美发达国家)成功的基本经验之一,就是必须用各种不同的方式给开放数据的政府部门予以正面反馈,只有这样才能有效维持推进数据资源开放的动力[10]。从制度经济学的角度出发,如果能够对数据资源进行有效的权属确定,那么理论上构建一种适当的制度安排,在数据原始权属所有者、数据维护和管理者以及数据实际使用者之间构建一种基于自愿提供、有效管理和付费使用的业务模式,是必要的、可能的,也是可行的。换言之,数据自治开放是政府数据资源开放的可行模式。
对政府来说,这样的制度安排能够从以下3个方面提供正面反馈。
其一,数据开放带来的正面的外部效益(包括社会效益和经济效益)能够直接成为工作绩效,从而通过相应的制度转化为正面的激励。
其二,数据开放带来的正面的经济效益,可能在一定条件下转化为推动实体经济的新动能,而受这种新动力来源驱动的实体经济的良性发展,将通过缴纳税收、创造就业等方式给政府提供经济领域的正面激励。
其三,明确权属和价格之后,以公开、透明的定价机制挤压灰色数据交易的生存空间。正如经济学理论和实践证明的那样,当一样资源客观上具有市场价值,同时又没有公开的渠道进行正规交易时,强烈的需求就必然导致地下市场的出现。就数据公开而言,考虑到数据本身具有的国家安全、公共利益以及个人隐私价值,用公开、规范且处于有效监管下的市场取代事实上存在的地下市场势在必行。
在国际社会上,欧美发达国家已经在数据资源开放共享领域进行了有效的实践,并形成了可供学习借鉴的重要经验。
在现有国际体系中,规制关键数据资源的最主要的行为体还是国家;从主权国家的视角看,有效的管理数据资源已经成为国家主权在大数据时代最重要和关键的延伸;就具体实践模式而言,从全球看,开放政府掌握的数据资源在有效管制的基础上推动数据整合运用,鼓励安全有效监管下的数据跨境流动和商业应用,已经成为各方共同聚焦、努力探索的重要问题。换言之,未来数据自治将在事实上成为实现国家数据主权的一种有效方式。从已有的探索看,在相关领域发展相对成熟的欧美发达国家已经形成了一套有鲜明特色的治理体系。
美国形成的是“政府—企业—社会”三元强势模式[11],即政府从国家安全利益出发实施的强监管、高流动,以政府非涉密性公共数据的自主开放为一般,以涉密数据高强度保管为例外;以公司对数据资源的高强度商业利用为一般,以对公司数据挖掘行为的管制为例外;以社会对政府—企业隐私侵犯行为的高敏感度监控与反制为一般,以配合政府的安全监管以及企业的高强度商业数据挖掘为例外。欧盟形成的是以“隐私保障与个人权益”为核心特征的温和折中模式[12],即政府主要以个人隐私权益的保障为核心出发点,以控制和限制掌握技术优势的公司对数据的强势商业挖掘为主要目标,配合政府一般性的信息开放原则规定,谋求构建一套以高度敏感的个人隐私数据保护体系为主要特点的治理体系。
从最新的进展来看,构建和完善有效的跨境数据流动模式是欧美国家推动政府数据开放实践中的新焦点。在相关实践中,美国和欧盟也形成了自己独特的治理模式。
美国的跨境数据流动治理模式可以归纳为“对外控制型”[13]。美国在跨境数据流动治理、隐私保护与数据安全领域的实践虽然总体上比较分散,但可以清晰地归纳出其特点,即依托私人部门与公共部门的结合性力量对外实施有效控制。虽然美国在明面上更依靠私人部门进行跨境数据流动的治理,并始终坚持以“自由流动”为一切政策的出发点,但这无法改变美国作为对外控制型治理模式代表的现实。
欧盟的跨境数据流动治理模式可以归纳为“内外折中型”[14]。欧盟在跨境数据流动治理领域选择了相对中庸的治理模式,希望兼顾内部成员国与外部世界的诉求,将内外所需进行折中。但平衡并不是常态,只是动态张力不断变化中的一个点,也只有通过不断的碰撞与摩擦才能继续寻找下一个平衡点。从欧洲的经验看,这种折中路线的优势在于能够延缓高速发展的信息技术革命带来的冲击,兼顾技术能力不同的各方的利益,但同时也使治理绩效相对低下,整体看,过于强调均衡以及兼顾各方需求的治理模式正日趋凸显其不足,对不断涌现的问题愈发缺乏适应能力。
总的来看,尽管存在差异,但是在国家层面,美欧发达国家在推进数据开放与共享时,均以不同方式强调保护国家安全核心利益,即数据开放共享不能给国家带来威胁。相比欧盟,美国更加强调主导权,以是否能够获得对网络空间关键资源的有效控制以及主导全球网络空间治理秩序作为衡量国家网络安全的标准;欧盟则相对温和一些,希望以更加均衡的方式维护和保障主权国家的关键诉求。通过数据自治的不同实践模式,确定关键数据资源的权属,承认其可以获得的合理收益,然后以制度化的方式加以实践,在确保核心利益诉求的情况下实现数据资源的开放共享,正成为各方共同采取的路径。
当今国际体系的主要特征仍然是主权国家构成的国际体系,推进以数据自治为基础的治理模式意味着承认主权国家在其核心利益诉求得到尊重、主权平等得到承认的基础上,实现对关键数据资源的有效开放共享。这种模式不同于无视主权、片面追求数据开放广度和深度的模式,也不同于强调主权的绝对属性,将保障数据主权等同于用主权壁垒切断跨境数据自由流动的主张,能够较好地兼顾国家核心利益诉求以及信息技术发展的内生需求,有助于在安全与发展之间找准定位。
在数据开放与共享的过程中,如何有效保护个人隐私,维护和实现公民数据权,是另一项重要的议题。结合已有实践可以初步发现,数据自治将是维护和实现公民数据权的一种有效方式。
欧美国家调查局显示,信息技术和大数据应用的发展对有效保障个人隐私和实现个人数据权提出了严峻的挑战:美国民众对网络隐私缺乏信任,这种担忧不但指向了美国的公共部门,也直接指向了私人部门。2015年,美国人口普查局通过对41000名美国境内的网络用户进行询访,发现19%的用户都遭遇过不同程度的网络安全与隐私问题[15]。网络用户最关心的问题依次是:个人身份信息泄露(63%)、信用卡盗刷与诈骗(45%)、个人资料被企业收集(23%)、对个人资料与账户失去控制权(22%)、个人资料被政府收集(18%)。美国国家电信和信息管理局认为,半数美国国内的网络用户因为对自身隐私权的担忧而在从事网上交易、电子商务活动甚至是表达政治观点时产生犹豫①https://www.ntia.doc.gov/blog/2016/lacktrust-internetprivacy-andsecurity-maydeter-economicand-otheronline-activities,这对于美国整体经济结构的复苏与重构有重要的影响,应该给予重视。
为有效保障公民数据权,欧盟也尝试过数据自治之外的模式,即强调法理和价值的制度化解决方案。欧盟在长达半个世纪的时间里大力推进建构全球跨境数据流动治理的制度框架,力图以制度方式实现欧盟及成员国对跨境数据流动规制的强烈要求,消除欧盟成员国对国家主权尤其是网络(信息、数据)主权被过分侵害的担忧。但就实践情况来看,效果并不理想。在国家层面,无法有效抵御外部强势行为体基于技术能力实施的监控与攻击性的数据活动;在企业层面,未能催生出匹敌美国大型互联网企业的欧洲本土力量;在个人层面,个人隐私和数据资源面临的网络犯罪威胁日趋严重。
在保护公民数据权的问题上,面临的一个经典难题是个人不可能完全依靠自己的技术能力或掌握技术优势的其他行为体的主观善意,采取“自助”模式来保障个人数据安全;同时,个人在客观上又迫切需要获得信息技术革命带来的各种便利和福祉,以此来提升自己的生活水平,实现个人的发展。因此,最终的结果是,个人采取委托授权的形式,要求政府来保障和维护自身的数据权。这需要解决行动的成本问题。承认数据自治,能够在很大程度上解决授权和成本维持问题,从而形成一种具有可行性和可操作性的模式,可持续且富有弹性地推进数据的开放共享。
综上所述,在以大数据广泛落地和深度应用为主要特征的信息技术革命高速发展的背景下,数据自治是一种有效的建设和完善开放政府的务实模式。从本质上说,开放政府的建设是一项公共政策,在务实推进时,必须解决成本维持与有效激励等操作层面的问题;单纯的理念引导与价值教育较难形成有效的公共政策制定和执行的关键动力;数据自治能够在相当程度上解决这些问题,依靠相对较低的成本以及对信息技术革命的适应性,较好地胜任推进开放政府建设的重任。
基于上述分析,对以数据自治为基础,推进中国政府的数据开放共享和有效治理体系提出如下初步建议。
其一,推进支撑以数据自治为基础的数据开放共享的基础设施建设,在条件成熟的省会城市以及直辖市构建覆盖省一级单位的跨部门数据中心,并以此为枢纽节点,构建最终覆盖全国的政府数据资源共享网络。这个共享网络将构成支撑数据自治开放最关键和重要的基础设施,侧重解决数据开放共享的安全、可靠以及便捷实用等问题。
其二,通过有效的立法和顶层设计,推进数据资源的权属界定机制,探索完善相应的交易模式,构建完善相应的定价机制。在此过程中,推进数据交易对象的规范化,从数据的全周期(即采集、存储、交换、使用等环节)构建有效的制度保障,杜绝非法数据交易,将数据交易的主体逐渐引向规范合理的数据资源使用和处理结果交易,而不是容易产生负外部性的原始数据交易。同时,推进政府职能和角色转变,从全生命周期强化政府作为监管者的使命和任务;通过有效的制度安排,确保在此过程中形成的收入能够实质性地转化为完善数据自治开发的资源,从而形成良性的循环。
其三,推进落实、完善基于数据自治的政府数据开放共享建设手册的研究。由相关高校和研究机构组织选取具有代表性的政府部门样本,进行数据质量和现状的摸底调查,然后在此基础上形成一本能够有效反映当前政府数据资源掌握、管理和使用基本情况的背景资料手册,从而为推进下一阶段工作打下基础。
其四,选择具有代表性城市的数据资源,在相关职能部门的配合下,开展数据自治基础上的开放共享示范项目建设,然后以最佳实践和自主学习的方式,形成一系列具有滚动示范能力的精品项目,从而实质性地启动相关项目建设。在预算和决算制度中进行必要的创新,确保数据自治的费用运行处于有效监管之下;平行推进数据资源的深度开放共享,以有序引导的方式深入推进电子政务的可持续建设,同时高度重视公民个人对相关数据及其合法权益的救济渠道建设,确保能够及时进行信息反馈和控制,将可能对个人隐私以及相关权益构成的损害和风险降到最低。
有效的数据共享是推进电子政务建设、提升信息时代政府治理能力的关键。我国在推进网络强国建设的过程中必须努力探索共享数据资源的创新模式。本文尝试定义数据自治开放的概念,这一概念能够在共享数据的同时,解决政府相关部门动力/激励机制相对不足的缺陷,比较契合我国的实际,有可能在此基础上建设完善一条务实的实践路径。本文从概念界定以及国内外比较的角度,展开对数据自治开放内涵的界定,并初步构想了实践的路径。如何结合技术的发展,更加清晰地描绘数据自治开放的外延,结合具体的场景,界定实践数据自治开放的机制,是未来努力和完善的方向。
展望未来,数据技术和应用将持续高速发展。追赶并弥补相关治理机制中的不足,建设完善实施有效的数据治理机制,对数据自治开放这样的创新概念进行不断测试与调整,是政府、公司以及社会三方共同的责任。对我国来说,这也是建设网络强国进程中必须完成的战略任务和历史使命。
参考文献:
[1]MICHAEL B. Open data: empowering the empowered or effective data use for everyone[J]. First Monday,2011, 16(2): 1-3.
[2]CHUN S A, SHULMAN S, SANDOVAL R,et al. Government 2.0: making connections between citizens, data and government[J].Information Polity, 2010, 15(12): 1-9.
[3]MISURACA G, VISCUSI G, WEERAKKODY V.Is open data enough? e-governance challenges for open government[J].International Journal of Electronic Government Research, 2014, 10(10): 19-36.
[4]宁家骏. “互联网+” 行动计划的实施背景、内涵及主要内容[J]. 电子政务, 2015(6): 32-38.NING J J. Implementation background,connotation and main content of internet plus[J]. e-Government, 2015(6): 32-38.
[5]BERTOT J C. 大数据与开放数据的政策框架: 问题, 政策与建议[J]. 电子政务, 2014(1):6-14.BERTOT J C. Policy framework of large data and open data: problems, policies and suggestions[J]. e-Government, 2014(1):6-14.
[6]陈秀刚. 开放数据可以帮助人们摆脱贫困[J].世界科学, 2013(7): 6-7.CHEN X G. Open data can help people get rid of poverty[J]. World Science, 2013(7):6-7.
[7]苏磊, 韩婧, 付国乐, 等. 大数据: 新闻出版业的价值金矿[J]. 科技与出版, 2016(1): 3-8.SU L, HAN J, FU G L, et al. Big data: the value gold mine of the press and publishing industry[J]. Science-Technology & Publication, 2016(1): 3-8.
[8]付熙雯, 郑磊. 政府数据开放国内研究综述[J].电子政务, 2013(6): 8-15.FU X W, ZHENG L. A review of the domestic research on government data opening[J]. e-Government, 2013(6): 8-15.
[9]张毅菁. 从信息公开到数据开放的全球实践——兼对上海建设“政府数据服务网” 的启示[J]. 情报杂志, 2014, 33(10): 175-178.ZHANG Y J. Global practice from information disclosure to data opening[J].Journal of Intelligence, 2014, 33(10):175-178.
[10]高丰. 开放数据: 概念, 现状与机遇[J]. 大数据, 2015(2): 6-9.GAO F. Open data: concepts, status and opportunities[J]. Big Data Research,2015(2): 6-9.
[11]陆健英, 郑磊, DAWES S S.美国的政府数据开放: 历史, 进展与启示[J]. 电子政务,2013(6): 26-32.LU J Y, ZHENG L, DAWES S S.US government data opening:history, progress and inspiration[J].e-Government, 2013(6): 26-32.
[12]任晓玲. 个人数据保护立法推动技术创新——欧盟拟修订《数据保护指令》[J]. 中国发明与专利, 2011(1): 100.REN X L.Personal data protection legislation to promote technological innovation[J]. China Invention & Patent,2011(1): 100.
[13]MELTZER J P. The internet, cross-border data flows and international trade[J]. Asia& the Pacific Policy Studies, 2015, 2(1):90-102.
[14]洪延青, 左晓栋. 个人信息保护标准综述[J].信息技术与标准化, 2016(6): 7.HONG Y Q, ZUO X D. A summary of personal information protection standards[J].Information Technology &Standardization, 2016(6): 7.