代佳欣,高 凡
(西南交通大学公共管理学院,四川 成都610031)
如何实现政府数据的长期保存,是全球数字化和开放科学迅速发展背景下,各国共同关注和普遍重视的问题。英国、澳大利亚、法国等国均采取不同方案,推进政府数据长期保存的治理实践。具言之,英国制定《国家数据战略》,通过建立数据监护和存储的合作关系[1],实施政府数据长期保存;澳大利亚联邦政府投资建设ANDS和RDSI等数据存储设施[2];法国档案馆和文化部进行“数字信息长期可持续性”研究,构建了数字保存过程模型[3]。
近年来,在我国政府开放数据快速推进过程中,数据可持续性利用的风险加剧,政府数据长期保存的紧迫性日益凸显。《促进大数据发展行动纲要》《科学数据管理办法》等国家政策都明确提出:“加强互联网信息采集、保存和分析能力建设,构建互联网信息保存和信息服务体系”[4],要求“规范进行科学数据长期保存”[5]。可见,我国政府已在有意识地推动数据长期保存这一治理工具发挥作用。然而,各级政府的实践经验反映出政府数据长期保存仍然面临内涵与标准界定不清、价值功能定位模糊、实施机制不健全等多重挑战。同时,学界也缺乏针对政府数据长期保存而展开的系统的基础性研究。有鉴于此,本文旨在通过讨论政府数据长期保存的缘起、内涵、价值、经验、风险防控等重要基础性问题,以引起学界对该领域研究的关注,同时为政府数据长期保存的治理实务提供参考。
政府数据长期保存是政府回应多元利益主体对政府数据的需要、满足政府数据科学管理需求的产物。一方面,进入21世纪以来,政府数据成为政府、市场和社会依赖的重要公共资源,不同层级政府、商业机构、社会组织、公众等主体均要求政府数据实现长期保存,确保对政府数据的长期利用。从这个意义上讲,回应多元利益主体对政府数据的长期利用需求,是政府强化数据长期保存的外部驱动力。另一方面,在全球大数据时代,政府面临的公共问题逐渐呈现出数字化特征,化解公共问题的方法和决策越来越倾向于基于数字展开量化分析。因此,数据科学管理成为政府现代治理的必然要求,数据长期保存作为数据全生命周期科学管理的关键环节,也是政府满足数据科学管理需求的内生产物。
在内外因素驱动下,多国政府开始制定公共政策、实施政府项目,从实践层面探索政府数据长期保存问题。例如,澳大利亚和美国将数据长期保存嵌入政府开放数据平台管理中。具体而言,澳大利亚政府在开放数据平台(Data.gov.ua)管理的“过程处理”和“数据完善”阶段,制定了数据开放获取政策,要求“受资助的研究项目产出的出版物必须存储到开放获取机构的知识库中”[6]。美国联邦政府强调数据开放平台(Data.gov)的数据存储功能,提出平台要能对数据本体和元数据实现存储和管理。英国和荷兰等国主要通过项目制方式实施政府数据长期保存。英国建立政府网络存档项目(The National Digital Archive of Datasets,NDAD),保存政府数字文档和元数据集。荷兰政府则开发了数字保护试验(Digital Preservation Testbed)项目研究,解决政府电子信息记录长期保存的技术难题。从国际案例看,政府数据长期保存实际上已成为一种重要的政府治理工具。
数据长期保存理念的发展沿革历史漫长。在图书档案学领域,数字长期保存是一个具有独立知识系统的研究范畴。从政府治理工具的视角看,本文认为数据长期保存经历了“早期孵化”和“快速推进”两个主要阶段。
早期孵化阶段(1984~2007年)。在现代信息技术革命席卷下,图书档案领域数据长期保存研究与实践快速发展。在此背景下,政府成为这一阶段推进数字资源长期保存的核心主体,通过建设国家级项目、制定法律法规与公共政策、支持科学研究等有效机制,大力推进国家图书馆、档案馆、政府公共服务机构数字资源长期保存。欧盟于1984年在第六框架计划(The Sixth Framework Programme for Research,FP6)下资助了PLANETS和DELOS等国家级数字长期保存项目的研究,重点突破国家图书馆数字资源长期保存技术、标准和管理难题。此后,美国、澳大利亚、英国等国迅速开启数字长期保存项目,如美国空间数据系统咨询委员会(CCSDS)构建了开放档案信息系统(Open Archival Information System,OAIS),为数字长期保护和存取建立了参考模型和基础概念框架。英国联合信息系统委员会(JISC)资助了“ JISC数字资源持续保存策略”“数字保存和财产管理计划”以及CEDARS等多个网络档案资源长期保存项目。同时,多国政府通过制定法律法规和公共政策,为数据长期保存体系的运行提供制度保障。以美国的实践来看,1996年美国国会颁布《健康保险可携性和责任法案》(Health Insurance Portability and Accountability Act,HIPAA),该法案针对医疗服务数据长期保存,规定“研究人员可获得必要的医疗信息进行研究。数字医疗记录至少保留7年,慢性病或需要长期观察的病历,数字数据必须保存数十年”[7]。紧接着,2000年美国国会提出《国家数字信息基础设施与保存计划》(National Digital Information Infrastructure and Preservation Program,NDIIPP),要求国会图书馆制定详细的数据保存实施方案。德国2006年发布《Nestor准则:可信数字仓储准则目录》,规定了数字资源仓储式保存的组织框架、认证标准和基础设施等。除此之外,政府还大力支持科学研究,以破解数字资源长期保存的理论与技术难题,美国国家空间科学数据中心(NSSDC)、英国数据保存中心(DCC)、英国数据档案中心(UK Data Archive),以及澳大利亚国家数据服务中心(ANDS)等均为国家财政拨款支持建设的科学数据研究中心。其中,英国是首个开展数字科学“ e-science”研究的国家,支持数字资源长期保存科研项目,英国研究信息网络(RIN)高等教育拨款委员会(HEFCE)、英国研究理事会(RCUK)、惠康基金国家图书馆(MRC)围绕数据保存期限、存储机构库和数据中心等问题展开研究。在联邦政府资助下,美国研究图书馆协会(ARL)出版《数据影像保存技术》,并与国家科学基金会(NSF)合作发表《科学与工程领域数字科学数据长期保存》研究报告。此后,美国数字归档工作小组发布《保存数字信息:数字信息档案特别工作组报告》,形成了一系列具有代表性的科研成果。
快速推进阶段(2008年至今)。自2008年起,以英国为首的多国政府开启政府开放数据改革。在改革实施过程中,越来越多的国家意识到,如何超越数据开放、进而实现数据全生命周期的科学管理关乎政府数字改革的成败,数据长期保存作为数据科学管理的核心环节就尤显关键。此外,随着“大数据元年”的到来,世界进入超级文本时代,许多公共问题(医疗、交通、教育、政民关系等)裹挟着政府数据而来,政府面临着数据如何长期存储和取用的巨大挑战。在此背景下,该阶段呈现出政府通过强化法律保障和寻求多主体合作、快速推进政府数据长期保存的特征。一方面,政府加大数据长期保存的法律保障力度,牵头制定相关法规与制度。如英国2014年出台《数据保存与调查权力法》(Data Retention and Investigatory Powers Act,DRIPA),规定了“保存通知书”制度,将数据保存内容、期限和权力监察情形法定。2017年,英国国家大英图书馆发布《维持价值:2017-2020年大英图书馆数字保存战略》(Sustaining The Value:The British Library Digital Preservation Strategy 2017-2020),进一步保障国家图书馆数字资源保存。澳大利亚信息管理办公室制定《公共服务大数据战略》,专门强调“实现数据完整性和程序的可复用性”[8]。随后,澳大利亚政府制定“数据保存计划”(Data Preservation Project),聚焦科学数据长期保存与获取问题。另一方面,政府主动寻求数据长期保存的多边合作。典型的如美国联邦政府主导制定的“可持续数据保存与获取网络伙伴计划”(Sustainable Digital Data Preservation and Access Network Partners,DATANET),该计划投入1亿美元财政资金,建立了一批示范性数据保存和共享伙伴关系[9]。基于此,白宫科技政策办公室被要求针对数据长期保存加大向社会团体和公众征求政策建议的力度。
政府数据长期保存的基础性概念是数据长期保存。数据长期保存的研究与应用由来已久,但数据长期保存概念在学界尚存争议,亟待形成共识。目前,基于不同经验视角,可将数据长期保存的概念界定方式分为如下3类。它们对数据长期保存的概念本质作了不同指向的解读。
表1数据长期保存的三类概念界定
如表1所示,围绕数据长期保存概念目前主要有数字保存、数据管存和数字资源长期存取等3种主流的界定视角,各自形成了一些经典的观点。数字保存视角将数据长期保存界明为确保数字信息未来可获取的活动的总称,以数字信息未来可获取为目标的法律活动、管理活动和技术活动等活动形式,都可被归纳为数字保存,这类观点显然是对数据长期保存概念的广义阐析。而从数据管存视角看,数据长期保存被认为是贯穿于数据全生命周期的管理活动,具体管理环节包括数据筛选、维护、保存和价值测度等,日本和英国偏向于从“管理”维度解读数据长期保存。与之相异的是,数字资源长期存取的概念视角强调按照一定标准实现数字资源存储,以满足数据长期取用的需求,认为数字资源长期存取包括存储(storage)和可用(access)两个方面。美国侧重从“存取”角度开展数据长期保存应用。综观之,数据长期保存概念的三类界定方式对推进数据长期保存研究和应用都具有一定贡献,但也存在不足:首先,数字保存视角的界定方式过于宽泛,不利于形成内涵收敛的理论概念;其次,数据管存的概念视角将数据长期保存中的“长期”等同于数据收集、编译、整合、分析和使用的全生命周期,这显然未能凸显数据保存这一具体阶段的特征。从概念辨析的意义上讲,本文认同从数字资源长期存取视角出发来界定数据长期保存,尤其是“存取观”中将数据长期保存解读为“保证数据资源可长期维护和内容可长期获取的管理活动”之观点,既将长期保存拆解为长期维护和长期获取两个构成维度,又本质性地指出数据长期保存是一种组织管理行为。基于此,本文认为数据长期保存的内涵是组织为实现数据资源长期维护与获取而进行的一系列管理活动。界明数据长期保存的内涵,对分析政府数据长期保存的概念特质具有重要基础意义。本文在阐释政府数据长期保存概念时,也是将数字资源长期存取视角作为重要依据。
对数据长期保存概念的不同解读,为分析政府数据长期保存概念提供了基础。然而,政府数据长期保存所具备的特质属性,使其既联系又区别于数据长期保存。本文认为政府数据长期保存的概念特质主要体现为公共性、合法性、治理性和多元性,这些特质共同决定了政府数据长期保存概念的本质。
1.公共性。央地政府及公共部门通过制定公共政策和规范性文件,动用公共资源(包括配置公共财政和人力资源、行政官僚组织权责分工与协同、建设软硬件基础设施等),实现政府数据长期保存。从该角度观之,政府数据长期保存是具有显著公共属性的组织行为。此外,政府数据长期保存的对象是以政府为行政主体、以政府职能为核心范畴的公共数据,必然具有非营利性、权威性和公共服务性,这在数据类型上就与商业数据、私人数据等形成本质区别。
2.合法性。政府数据长期保存作为一种公共组织行为,其合法性权力来源是央地政府制定的法律法规、公共政策、规范性文件等,这些政策法规也是政府及公共部门识别数据长期保存的标准、类型、期限的最重要依据。从行政合法性来源的公众认同维度看,政府数据长期保存的价值指向是通过实现政府数据长期保存与取用,以创造公共价值。若政府数据长期保存能够为公众长期利用政府数据、办理公共服务事项、进行数据问责和公民参与等提供方便,则会进一步促使政府数据长期保存更具行政合法性。
3.治理性。政府数据长期保存具有强烈的政府治理目标导向,保存数据并不是目的,而是旨在通过对政府数据的长期存储和保管,延续政府数据生命,并实现数据价值的再创造,进而服务于政府、公民、市场和社会多元主体对政府数据的长期利用需求;有效保存的政府数据也将有助于化解跨时跨地的公共问题。从这个意义上讲,政府数据长期保存便成为达成政府治理目标的工具,具有显著的治理属性。
4.多元性。政府数据长期保存会形成一张巨大的治理网络,不单需要政府及其职能部门参与,从广义上看,政府数据的使用主体(用户)和供给主体都属于政府数据长期保存的参与者。一方面,地方政府还未设立数据长期保存的专门机构,专业人才和技术也尚匮乏。基于此,政府通常采用委托、行政外包和购买服务等方式,将政府数据长期保存的一系列技术性事务外包出去。另一方面,政府也可在现有的官僚行政系统中通过增设机构、岗位及规定相应职责,内化政府数据长期保存的部分事务,这便需要政府调整行政组织架构,使其在权责和功能上相互协同。
社会科学概念应当对既定对象作内涵收敛、特质明确和内部结构完整(包括概念本质、维度及质性指标)的整体性抽象。通过比较数据长期保存的三类概念视角,借鉴“存取观”的主要观点分析政府数据长期保存的概念特质,本文认为,政府数据长期保存本质上是一种以法定规范为据、为实现用户对政府职能数据的存储与取用、多主体参与的公共组织行为(见图1)。
图1政府数据长期保存概念的分析框架图
由本文构建的概念分析框架可见,政府数据长期保存具有公共性、合法性、治理性和多元性等特质属性,其本质内涵与数据长期保存有所区别。政府数据长期保存的概念结构由4个维度构成:其一,政府数据维度,对应的是政府数据长期保存中“谁为对象”的关键问题。以政府职能数据为核心范畴进行数据长期保存,体现了政府数据长期保存的公共属性。其二,长期保存维度,实质上是对政府数据长期保存中“何为标准”问题的凝练。政府数据保存的内容及类别、期限和载体等标准,应以法定规范为据,这表明了政府数据长期保存具有合法性。其三,公共组织行为维度,指向政府数据长期保存这一公共组织行为“如何实现”的问题。政府需要通过制定公共政策、配置公共资源、调动行政官僚组织系统等多种手段,实现政府数据的长期保存。其四,多主体参与维度,涉及政府数据长期保存“谁来参与”的问题。政府数据长期保存有内外参与系统,既需要政府及公共部门的分工协同,亦需要商业机构、社会组织、公众等利益相关主体,通过代理、接包和问责等途径广泛参与。
政府数据长期保存在实践层面的发展历程虽不漫长,但多国政府通过制定政府数据长期保存战略、建立合作机制和打破技术壁垒,形成了一些具有借鉴意义的政府数据长期保存实践经验。通过总结提炼这些实践经验的共性内容,可为我国政府数据长期保存治理实践提供参考。
一些国家政府着眼于数字连续性战略布局,推进政府数据长期数字化保存。2007年英国政府首先启动数字连续性项目,持续提升政府信息长久可用性能力,国家档案馆有责任向核心政府部门提供开展数字连续性项目的配套指南、工具、服务和咨询[17]。随后,美国奥巴马政府也在2012年签署政府数据永久保存方案,要求联邦政府以电子形式管理政府文件,实现数字连续性保存[18]。澳大利亚政府在制定数字连续性战略上表现突出,澳总理办公室和内阁授权国家档案馆最新发布的政府数字连续性政策(The Digital Continuity2020)规定,政府机构信息、数据、记录以及系统和流程需以数字形式保存和管理。其中,联邦记录(Commonwealth records)是由政府创建、使用和接收的所有数字和非数字格式信息,国家档案馆对此均有权进行长期保存。除此之外,国家档案馆还负责发布联邦档案标准,向政府机构提供档案资源[19]。部分国家政府还实施数据长期管理基础设施项目。如德国教育和研究委员会提供80万欧元财政资助,启动“数字资源长期存储项目”(The Network of Expertise in Long-term Storage of Digital Resources,NESTOR),建设数字资源长期存贮和利用的信息网络。而荷兰政府则授权国家图书馆推进“书目记录计算机化行动”(Networked European Deposit Library,NEDLIB),以致力于破解数据保存的标准和接口、电子文件技术数据、查询控制等基础技术问题,保证电子数据的长期保存和利用。美国国会2000年通过PL-544法案,实施“国家数字信息基础设施和保存项目”(National Digital Information Infrastructure Preservation Program,NDIPP),研发国家数字保存战略[20]。罗莱纳大学教堂山分校通过“ DATANET联盟”,负责建立国家数据基础设施联合体,开发数据系统开源管理软件,促进数据长期管理。
以英美政府为典型案例,多国政府通过构建合作机制,推动政府数据长期保存。具体而言,2001年英国政府正式成立数字保存联盟(Digital Preservation Coalition,DPC),标志着英国数据资源长期保存合作组织机制的形成。随后,英国政府与商业财团合作建立数据策展中心(Digital Curation Center,DCC),面向英国高等教育研究界和图书馆领域工作人员,提供数据长期保存的政策制定、科学管理规划、操作指南、案例研究和在线咨询等多类服务,策展中心也与其他不同性质数据保存培训机构合作,分享和推广培训资源,提升政府机构的数据保存管理技术与能力[21]。同时,由英国政府联合监委会资助,爱丁堡大学图书馆牵头与牛津大学、南安普顿大学合作成立的英国数据信息专家委员会(Data Information Specialists Committee,DISCUK),旨在建立数据存储开发模型[17]。美国也积极推动建立各类合作机制,联邦政府通过国会牵头,成立由政府、文化遗产保护机构、科研院校、图书馆和商业组织等多主体构成的国家数字管理联盟,致力于政府数字信息长期保存,实施国家数字信息资源收集和保存战略。例如,国会和图书馆合作执行“国家安全网络信息保存项目”,围绕总统选举、911事件、107届国会会议等国家安全事件,收集并保存相关数据。此外,美国自然科学基金会联合国家图书馆和博物馆,激励政府数据长期保存的合作研发。密歇根大学、印第安纳大学和伊利诺伊大学等高校合作,建立活动内容存储库、研究网络和虚拟存档,夯实了数据科学保存的基础设施[22];康奈尔大学成立校内虚拟合作组织,开发了研究数据缓存库。这些合作项目为政府数据长期保存提供了研发成果和实操方案。
政府数据长期保存的标准、策略方法及载体等是掣肘数据长期保存的关键技术性因素,因此多国政府着力打破技术壁垒,推动实现政府数据长期保存。日本国家议会图书馆开展数字资源长期保存项目(Web Archiving Research Program,WARP),确定了NDL元数据保存标准,规范了数字信息资源收集的工作流程。瑞典政府通过The Kulturarw3实施以域名为标准的政府数据“选择性保存”策略,只收集域名为“.se”(瑞典)的站点网络信息,从数据保存策略上节约了政府收集和保存数据的财政支出。数据保存方法一直是影响政府实施数据长期保存的重点因素,欧洲国家图书馆联盟已建成LOCKSS,NDIPP,PA-DI,OAIS,PREMIS,NLNZ,METS,CAMILEON等长期保存系统,形成元数据保存方案。其中,英美合作建立的CAMILEON项目,比较了仿真和迁移技术在数据长期保存中的用户使用评价和成本效益。美国国家数字化管理联盟研究了数据库、网页、视频、音频等具有长期保存价值的政府数据采用地理拷贝存储和云存储方法的可行性。
我国政府数字治理的发展经历了电子政务、互联网+政务、开放数据等主要阶段。在阶段演变过程中,我国围绕政府数据长期保存进行了一些实践探索,在法规制定和地方运行模式方面初步形成了亟待梳理总结的实践经验。
自2020年至2021年,我国已制定关于政府数据长期保存的中央法规共104部。其中,行政法规2部,部门规章14部,部门规范性文件49份,部门工作文件39份,涉及的职能部门包括国家发展与改革委员会、工业和信息化部、海关总署、财政部、农业部、食品药品监管总局、交通运输部、国家税务总局等。从政策文本内容来看,行政法规对建立数据长期保存制度、健全数据长期保存功能提出了要求。部门规章、部门规范性文件及部门工作文件的政策文本则重点围绕政府数据长期保存的实现机制作出相关规定,涵盖监测数据保存、数据长期保存期限/标准、数据保存与稽查轨迹、元数据保存、数据保存介质管理、数据备份制度、数据保存路径、数据保存管理环节、数据保存方法等问题(如表2所示)。这些政策文本构成了我国政府数据长期保存中央法规的基本架构。
表2政府数据长期保存的中央法规文本分析
我国地方政府依托开放数据平台,对政府数据长期保存展开了实践探索,初步形成了“平台依托、元数据保存、多维共治”的运行模式。从典型案例看,浙江省建设“浙江·数据开放平台”,设计数据长期保存的功能模块。在平台“历史数据集”模块,按照数据来源单位、提供者、数据领域和保存格式,将海量省级政府元数据分类存贮,向用户开放长期取用。通过设计“接口申请”“接口预览”功能,鼓励用户参与程序开发和编写,提高政府数据长期保存和取用的编程质量。此外,“浙江·数据开放平台”还专门设置了“互动交流”板块,公众可以在此就如何实现政府存储数据的下载和长期使用等问题,与平台服务者实时沟通,推进了政民互动①。近年来,深圳也探索形成了以开放数据平台为载体、以元数据保存为策略、多主体共同运维的政府数据长期保存治理方案。深圳市政府数据开放平台已初步形成14个数据领域的元数据保存模式,存储了2456个政府数据资源集,包括商事主体信息、城市图书馆分布、预报预警数据、建筑物信息等,这些数据信息按照职能部门、数据领域、数据保存格式分类存储,以供用户检索和取用。此外,深圳市政府与社会组织、个体和公司合作创建了政府数据长期保存的各类载体,包括APP应用、小程序和WEB应用。例如,“简单购房APP”是政府和市场组织合作设计的一款应用程序,能够根据房市数据和主体的购房能力,帮助制定合理的购房计划。“开放式银行-大数据风控应用”是深圳市与华夏银行深圳分行合作开发,运用政务、工商、征信、银行交易、金融行为特征等跨部门的政府存储数据,依托大数据筛选、模型分析、人工智能、交叉验证等手段,建设而成的小微企业大数据风控体系。在风控体系中生成的风控数据又再次被存储起来,用于进一步的数据挖掘和分析。除政企合作外,个人也参与到政府数据的保存和取用程序设计中,如“我的都市天气”和“预约挂号”小程序②。
在我国政府数字治理发展演变过程中,政府数据长期保存嵌入其中,业已建立了中央法规基本架构,地方政府也探索形成了“平台依托、元数据保存、多维共治”的运行模式。然而,对标政府数据长期保存的国际实践经验,我国的治理实践还面临一些亟待破解的重点问题。
1.加强政府数据长期保存的国家顶层设计。国家顶层设计是政府数据长期保存的基础制度保障。目前我国尚未制定一部针对政府数据长期保存的国家级政策、规范性文件或规划方案,现有的央级法规主要以公共职能部门内部业务数据的长期保存具体办法为主。缺乏上位法保障,不利于地方政府开展数据长期保存实践。英美新日等国的实践案例都表明,国家顶层设计通过正式制度形式规定政府数据长期保存的权力、公共财政、国家级项目等合法性资源的权威配置方案,既能合理规划政府数据长期保存的宏观方向,又能有效激励地方政府开展数据长期保存实践。有鉴于此,我国应尽快组织研究并制定政府数据长期保存的国家“十四五”规划,为政府数据长期保存提供顶层设计支撑。
2.研究界定政府数据长期保存的内涵及标准。政府数据长期保存的概念内涵及标准还亟待深入研究和明确界定。从国际经验看,如何界定政府数据长期保存内涵概念和标准,直接影响政府制定数据长期保存的实践方案。例如,美国联邦政府从狭义视角解读政府数据长期保存,重点关注数据长期存储;而英国政府则将政府数据长期保存视为整个数据生命周期的科学管理,因此两国采取的具体保存方案就有所差别。我国政府应结合数据长期保存的供给和需求特性,界明政府数据长期保存的概念及其构成维度,确定“政府数据”“长期保存”的标准和边界。同时,我国还可借鉴欧盟的政府数据长期保存标准,制定元数据保存方案,为政府参与国际事务和项目合作奠定基础。
3.完善政府数据长期保存的组织架构与权责分工。我国政府数据长期保存工作主要由业务部门、档案局和公共图书馆负责,缺乏正式组织体系保障运行。建立政府数据长期保存的组织架构,既有利于地方政府围绕核心职能及政府数据存储和取用两大维度,明确横向职能部门线上线下的分工协作关系,又能推动上级政府对数据长期保存的监测与考核。虽然我国地方政府已经探索形成了多主体参与的数据长期保存模式,但外部主体参与主要围绕具体项目展开,短期特性明显;而内部主体间存在权责分工不清晰问题。政府数据长期保存的“元主体”是公共职能部门,其权责范畴应由法规和公共政策明确界定,其他参与数据长期保存的“结构性主体”的权责则应基于合同、契约和协议等具体规定履行。
4.探索政府数据长期保存的多边合作机制。我国政府数据长期保存多边合作的形式和内容还较为单一。探索政府数据长期保存的合作机制可着力于以下几个基本点:一是政府行政机构内部合作。政府数据长期保存是一项系统的公共组织行为,牵涉的职能部门范围较广,可通过建立跨部门的线上合作平台,逐步实现部门职能数据相互授权、识别、传输、存储、流动和取用。二是探索政企合作模式。地方政府在实施数据长期保存过程中,可尝试采用购买服务方式,将技术性业务和非涉密数据外包给数据公司,同时借鉴英国政府数据策展中心的方案,向专业公司购买数据资料包,并由专业公司向政府数据管理一线工作人员提供数据长期保存相关培训和咨询服务。三是创新政社合作方案。地方政府可开展各类社会性竞赛,激励公众和社会组织为政府数据长期保存提供公共政策建议、调查数据和技术方案等。
5.突破政府数据长期保存的方法桎梏。我国省级数据开放平台普遍采用元数据的数据保存策略,显示出地方政府数据长期保存的方法和工具比较单一,而目前关于数据长期保存的国家级实验室、社会科学基金和自然科学基金数量不多,未能有效助力政府数据长期保存方法实现突破。对此,我国可拨付专项财政资金,资助在该领域有长期研究基础的科研机构、高校、公共图书馆等组织机构开展国家级试点项目,围绕政府数据长期保存的标准、存贮和取用方法、存储载体、数据垃圾处理和数据存储保密等问题进行科学研究,重点突破我国政府数据长期保存的技术障碍。
政府数据长期保存是政府数字治理时代的典型治理工具,具有“目标-成本-伦理”三重治理价值。
其一,政府数据长期保存能助益政府达成内外部数字治理目标。从内部治理目标看,我国科层制行政管理组织体系是通过“纵向分权,横向分工”的结构实现运转的,不同部门间既相互依赖又相对独立,在数据保存上存在以各自业务数据为阵的避责空间,这种部门主义的张力会导致政府数据链断损。而政府数据长期保存能够针对政府职能数据,统一数据传递、存贮的标准、格式、载体和平台[23],从技术上破解数据共享的体制性难题。再从外部治理目标观之,政府开放数据的基础前提是数据长期保存,缺乏科学有效的数据长期保存,政府数据开放的可持续性和质量便无从保障。进一步地,数据长期储存和取用作为政府开放数据的前提,能够助推政务数据、行政审批和公共服务信息更好地向社会公开,促进用户充分利用政府开放数据。
其二,政府数据长期保存可优化数据存储与取用的成本效益。一方面,数据长期存储能够产生数据规模效应,进而降低政府数据管理的固定成本。Nakanishi曾指出,大数据意味着规模效益和范围效益[24],政府大数据同样具备数据资源规模效益递增的特性[25]。伴随着政府数据规模的扩大,实施数据长期存储,能够减少因购置、运输、包装和安装数据存储固定资产而产生的单位成本。相较于短期无序的数据保存,政府数据长期存储能够发挥规模效应对成本的减控力。另一方面,长期储存的政府数据是典型的动态面板数据,关系到政府数据资源的积累。长期保存的政府数据不仅作为静态信息资产存在,还反映了数据累积、整合集成和开发利用[26],政府大数据长期存贮有利于政府对税务、就业、执法、国家安全等相关数据的深入挖掘,分离出数据噪音及有价值的情报[27],辅助化解一些棘手的公共难题。在政府数据挖掘过程中,亦能催生政府数据取用的附加商业价值和公共价值。
其三,政府数据长期保存承载着效率与责任的价值追求。政府数据保存的类别、期限和载体等标准以法定规范为据,也就是说,长期保存的政府数据要按照一定的标准和程序筛选评定。Faundeen和Oleson主张“将我们的资源付诸在最有价值的数据上,对于衍生数据等没有必要投入成本进行长期保存”[28],政府只保存规定标准下高质量的政府职能数据,体现了政府数据长期保存的效率价值。进一步讲,政府对效率的追求本质上也反映出政府的责任伦理。从政府责任价值视角看,政府数据不仅包括职能部门业务数据,还关涉到多源异构的公民个体数据,后者容易触发公权侵犯私权的问题,其中以个体隐私权保护问题最为突出。而政府数据长期保存意味着数据来源、利用过程和保存载体等一系列信息均可追溯,这为政府数据治理中的权力监管提供了可能机制。可以说,政府数据长期保存一定程度上承载着政府数据治理的责任价值。
风险和价值是政府数据长期保存的一体两面。政府数据长期保存是为实现用户对政府职能数据的存储与取用、多主体参与的公共组织行为,在数据长期存储过程中,存在数据保存成本高、数据垃圾处理复杂等不确定因素;而在数据长期取用过程中,则易产生侵犯隐私、数字公共服务不公平等风险。
首先,政府数据长期保存具有公共财政承载力风险。政府数据保存策略、保存类型、保存要求、保存主体、质量控制标准、保存载体的选用等,都会影响数据长期保存的成本。也就是说,政府数据长期保存的各个环节、各类不同保存策略,都涉及长期成本问题。作为一种公共组织行为,政府数据长期保存产生的成本费用本质上是公共财政支出,若在属地管理原则下实施政府数据长期保存,可能造成公共财政承载力风险,尤其是对于经济欠发达地区而言,这一风险发生的概率极高。
其次,数据垃圾处理复杂,数据冗余风险增大。当政府数据失去公共职能属性和用户需求属性时,无用和无法用的政府数据应不再被长期保存,转而成为数据垃圾。只有保持政府数据从长期保存到合理废止的有序性,才能确保政府数据在全生命周期的有效价值。但判定数据废止的标准尚未确定,处理数据残渣、清扫数据痕迹、数据废止导致数据链断损等一系列数据垃圾处理问题,都为政府数据从保存有序转换到废止增加了不确定性。如此一来,政府数据长期累积,易形成海量冗余数据和无效信息。
再次,数据长期取用存在侵犯隐私的潜在风险。公民、社会组织和商业机构等不同用户在长期取用政府数据过程中,会输入大量重要隐私信息,也会产生海量的个人访问痕迹、收藏记录、文件等结构化和非结构化数据,含有公民和其他机构组织隐私的数据保存在网络平台上,一旦成为数据垃圾,或网络平台遭到黑客和网络病毒攻击,隐私信息就有可能遭到泄露和侵犯。
最后,政府数据长期保存或将加剧数字公共服务不公平。地方财政资源数量、社会资本状况、数据产业发展水平、公众数据使用能力等方面的客观差别使得政府数据长期保存具有地域差异性,诸如浙江省、深圳市等政府数字治理先发省市,已经提供了政府数据长期存贮、取用和API服务,开展了数据竞赛并打通了政企民合作渠道,数字公共服务水平较高,而一些欠发达省市在政府数据长期保存方面的公共服务水平相对较低,这或将加剧数字公共服务供给不公平的潜在风险。
注:
①参见:浙江·数据开放平台,http://data.zjzwfw.gov.cn/jdop_-front/index.do,访问日期:2021年6月18日。
②参见:深圳市政府数据开放平台,https://opendata.sz.gov.cn/,访问日期:2021年6月18日。