陈 展/上海大学图书情报档案系
档案数据开放是“将档案机构收集保存的所有原始数据,向公众开放”[1]。大数据环境下,档案数据开放不仅是档案信息化建设的必然趋势,也是档案部门创新档案服务的重要举措。2016年国家档案局发布《全国档案事业发展“十三五”规划纲要》,再次将档案信息化建设列为重要议题,明确提出“建立开放档案信息资源社会化共享服务平台,制定档案数据开放计划,落实数据开放与维护的责任;优先推动与民生保障服务相关的档案数据开放”[2]。遗憾的是,当前档案学界对档案数据开放的理论研究落后于实践工作,对数据开放的讨论也大多集中在政府数据开放上。在“政府数据开放运动”进程中,档案部门作为重要的信息管理部门和公共服务部门,有责任也有义务为社会提供高质量的档案数据开放服务。
我国档案数据开放实践处于档案信息公开阶段,并未达到档案原始数据开放存取的程度,档案部门内部所存的大量档案数据以及档案部门日常工作中产生的数据也并未列入档案数据开放范围。
国外档案机构在推动政府数据开放过程中发挥了重要作用。英美两国“开放的数据集以统一的数据标准和通用的数据格式发布在各自国家级的政府数据开放平台,即英国的Data.gov.uk.和美国的Data.gov.”[3]。美国国家档案与文件署(NARA)在国家档案馆网站首页设立了针对开放政府计划的链接“Open Government”,公众可以通过NARA提供的路径直接下载政府数据,对开放政府计划添加问题或进行编辑并给出反馈[4]。英联邦及爱尔兰档案与文件协会、苏格兰国家新档案馆、英国埃塞克斯大学国家数据档案馆等档案机构对英国内阁办公室2011年发布的《促进开放数据成为现实:公共咨询》[5]中关于提升数据权、设置开放数据标准等问题做出了答复。除参与政策建设外,英国档案部门还为政府数据开放平台提供档案数据支持,自2010年起,英国国家档案馆为Data.gov.uk.提供了近50条档案数据集供公民下载。俄罗斯联邦档案署于2016年发布《2018年前俄罗斯联邦档案署贯彻和实施开放机制计划》[6],提出实施信息透明原则,要求开放27类档案数据集,并明确2016年至2018年每年的数据开放指标。新西兰国家档案馆通过政府数据开放平台data.govt.nz.发布4个可用数据集,旨在推动档案数据集的可供利用[7]。
档案数据开放的最终目的是实现“任何人对档案数据自由、免费地访问、获取、使用和分享”[8],目前不论是国内档案信息的公开还是英美等国数据的开放获取,都没有真正实现档案数据特别是原始数据的开放。我国积极推进档案“信息化”向“数据化”转变,是对未来档案数据开放趋势的准确把握。
当前我国档案数据开放政策关注宏观上的制定与把控,对档案数据开放涉及的具体问题并未做出明确规定,关于档案数据开放的相关法律法规也并不完善。如在2016年《中华人民共和国档案法》修订草案(送审稿)[9]中,关于档案数据管理的内容并未出现相关说明。以隐私权的保护为例,我国法律体系关于隐私权的相关叙述并不包括关于数据隐私权的内容。对于档案数据开放涉及的隐私权、版权问题,我国目前还没有明确的权责划分和开放范围界定,哪些档案数据涉及个人隐私,应保密的档案数据如何加密以保障数据安全性,都是值得探讨和亟待解决的问题。
国际上已将档案数据开放政策制定的关注点转移到档案数据开放与隐私权保护等具体问题上。法国档案工作者协会2018年会围绕“开放数据和个人数据保护:我们在哪里?”主题,探讨档案数据开放与保护的辩证关系,思考档案人员在归档、保护个人数据与公开数据等工作中应扮演的关键角色[10]。美国通过《信息自由法》《阳光下的政府法》《隐私权法》等一系列完整的个人隐私保护法律法规,搭建起数据开放和个人隐私保护的平衡机制[11],为其他国家关于隐私权的法制建设提供参考。
对于社会公众来说,公众对档案部门已开放的档案数据内容需求较小,且存在获取难度大、使用技术要求高等问题,公众对档案数据的利用需求难以得到满足。近年来NARA已经开始注意到这个问题,在《美国国家档案与文件署2018—2022财政年度战略计划》[12]中明确提出将“公共访问”作为核心工作,通过提高档案处理效率加快数字化进程和解决技术限制,帮助公众开放获取海量数字化档案资源。以社会需求为导向的档案数据开放能够帮助不同群体构建集体记忆和实现身份认同,彰显档案数据开放工作中的人文关怀。
要推动档案数据开放进程,需要国家颁布配套政策和相关法律法规、开放标准、执行程序等。只有政策先行,相关法律法规和标准建设渐趋完善,后续数据开放才能有序进行。国务院于2015年印发的《促进大数据发展行动纲要》[13],从国家高度提出数据开放的目标和时间节点,即“将于2018年底前建成国家政府数据统一开放门户”。国家档案局也抓住档案事业发展新趋势,在《全国档案事业发展“十三五”规划纲要》中明确提出要“制定档案数据开放计划”;2016年国家档案局科技项目立项选题指南中也多次提出档案数据开放问题,并将“档案数据开放与维护的计划与责任”[14]纳入选题范围。但是,在2017年和2018年国家档案局的科技档案项目立项选题指南中,没有出现档案数据管理和档案数据开放的内容。国家宏观层面上对档案数据开放的关注度降低一方面是对“档案数据热”的降温,有利于档案界冷静地对档案数据开放理论进行深度思考;另一方面是缺乏宏观政策性文件指导和支持,不利于档案数据开放的实践。国家层面是否存在关于档案数据开放的顶层设计,以及顶层设计的质量是否满足要求,直接影响档案数据开放是否能顺利进行;相关法律体系的完善程度也直接影响档案数据开放进程。
档案部门的数据观念直接影响档案数据的采集、管理、分析、利用、开放和档案部门内部再生产,并决定了档案部门向社会提供档案数据的格式、种类、数量和质量。社会组织的数据观念一方面决定了其能否将自身产生的数据向公众开放和向档案部门移交,另一方面决定了其能否能够通过应用接口采集档案部门提供的数据并提供再利用。个人档案数据观念影响个人利用档案数据的方式和途径,个人对档案数据的认识如果局限于电子政务产生的数据或是数字化的档案,忽视对电子档案及其元数据的利用,就会导致对档案的利用仅满足表层档案需求,自身的深层档案需求无法通过档案部门提供的服务得到满足,进而导致档案部门的公信力降低,反过来阻碍档案部门数据开放的开展。
档案数据质量和档案数据处理技术是决定档案数据开放质量的关键因素。档案数据处理技术的对象主要是电子档案和元数据,档案部门的档案数据包括存量档案数据和增量档案数据,存量档案数据主要来自现存的电子档案和档案数字化成果,增量档案数据的来源一方面是各业务系统产生的各种电子文件,另一方面是档案部门在日常业务中产生的各种数据。这些数据的质量会直接影响后续档案数据开放的质量,低质量的档案数据极易在用户查询时产生差错,并在用户使用过程中产生其他问题,引发用户的不满情绪,甚至产生纠纷。“将自用数据变为开放数据要跨越一道质量鸿沟(如同由产品升级为商品),对这种质量升级的难度有关部门应有思想准备。”[15]开放数据的质量升级对资金和技术都有一定要求,资金是引进先进技术的重要物质保证,先进技术是档案数据开放质量的技术保证。如何选择、引进、推广最具性价比的技术完成档案数据开放,需要档案部门认真思考。
首先,推动顶层设计。优质的顶层设计能够为法规政策的执行提供保障,并减少试点和重复实践的成本。除英美俄外,多个国家或组织都针对数据开放制定了相关政策。如2003年欧盟颁布的《公共部门信息再利用指令》是欧盟各国开放政府数据的重要驱动力,2010年丹麦颁布的《开放政府创新策略》和2012年日本颁布的《电子政务开放数据战略》都从国家战略高度推进了数据开放[16]。要进一步加强我国档案数据开放的顶层设计,制定长效性、综合性、指导性、基础性的档案数据开放计划,出台促进档案数据开放的相关政策,明确档案数据开放平台、财政资金支持、档案数据技术人才和管理人才培养等方面内容,从国家层面支持档案数据开放工作。
其次,完善档案数据开放的法律法规体系。现今档案数据来源不再单一,档案数据多元形成者和档案数据的易得性使档案数据权归属模糊;个人隐私权保护是档案数据开放中一个不容忽视的问题;档案数据开放秩序和公民对档案数据再利用时的档案数据安全问题应予关注。国家在档案数据管理相关法律法规体系建设中,应围绕上述档案数据权、隐私权、数据再生产和数据安全等内容完善档案数据开放相关法律法规,为档案数据开放提供法律保障。
最后,制定档案数据开放的质量标准与管理规范。如英国和德国将开放政府许可OGL(Open Government Licence)作为模型,对公共部门信息提供者的哪些数据可以被再利用做了明确规定,使数据开放拥有统一标准和规范,避免数据开放和再生产的混乱。
完善档案数据开放平台建设是实现档案数据资源有效整合、改善用户获取档案数据服务体验的重要路径。档案部门要加强对信息基础设施的投入力度,引进、优选和推广先进技术,设计档案数据开放平台,使用RDF、SPARQL与RDFS等语义技术定期发布档案数据存储目录和数据开放政策等相关信息,并使用HTML5等技术完善门户网站建设。在提供数据集的同时提供应用程序接口和详细元数据,使用户可以更全面地获得所需档案数据。此外,可建立国家和地方统一的档案数据开放平台,整合各级档案部门的档案数据,并开发APP等服务工具,为用户提供一站式服务。
档案开放数据的质量是档案数据开放平台建设的基础,也直接影响档案数据的价值挖掘。做到档案开放数据“保量”,就要在相关法律法规指导下,对用户需求度高的档案如涉民档案进行数据化和开放,通过云技术实现用户在线访问和下载。做到档案开放数据“保质”,就要提高档案部门的数据处理能力,包括数据清洗、数据挖掘能力,在提供元数据和高质量、低错误率的原始数据的同时,也针对用户需求深度挖掘档案数据内涵,激活档案数据潜在价值,面向用户提供档案数据产品和基础的档案数据处理服务。
档案部门一要树立“开放”理念,培养“数据”思维。“正视社会信息化进程对于文件领域的深刻改变”[17],结合历史条件和特定背景对档案数据进行理解和认识,更好地实现档案数据的开放。二要转变服务理念。注重与用户的互动和用户信息的反馈,了解用户需求和开放效果,及时调整档案数据开放策略。三要进行档案数据开放的责任主体及职能划分。明确各机构的职责和分工,避免出现资源浪费、互相推诿、效率低下的情况。四要强化宣传教育,提高社会档案数据意识。鼓励社会参与档案数据的再利用和再生产,带动社会创新,体现档案数据的社会价值。
社会公众首先要积极主动参与档案数据开放,如积极参与北京市政务数据资源网面向企业和个人开展的“建议增加的数据类型”活动,向档案部门提出档案数据利用需求,并对档案部门的数据开放服务予以反馈,与档案部门形成良性互动和友好交流。其次要提高自身利用数据的能力,如数据获取和数据处理的能力,从简单地查询信息到使用数据,再到进行档案数据再生产,让数据真正发挥出其内在价值。
档案部门、企业、社会组织、个人等多元主体间要突破传统的单向关系,建立基于档案数据服务的双向甚至多向互联,在大数据时代共同推动档案数据开放进程。