梅振荣 裴 丽 王海伶
(1.黑龙江中医药大学图书馆 哈尔滨 150040;2. 黑龙江省政法管理干部学院 哈尔滨 150087)
当前,数字经济已经成为推动经济高质量发展的新型驱动力。在大数据时代,数据量激增,面对如此庞大的数据集合,如何管理数据、消除数据孤岛、挖掘数据价值成为政府和企业进行数字化转型的关键。2022年12月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(又称“数据二十条”)发布,提出大力激活数据要素潜能,充分实现数据要素价值,坚持数据共享共用和安全保护[1]。“数据二十条”从数据流通交易及安全治理等方面对数据治理进行了详细的阐述,完善了我国数据治理体系。数据治理正以一种全新的视角融入社会治理的各个领域,用以解决数据管理难题[2]。在我国推进“智慧中国”“国家大数据战略”建设的大环境下,智慧图书馆建设也迈上了新台阶。数据作为促进智慧图书馆发展的重要资源,数据治理的成效对智慧服务的开展起到了关键作用[3]。合理恰当的图书馆数据治理机制不仅能够拓宽图书馆数据资源的利用渠道,提高数据资源服务质量,还可以有效兼顾数据开放共享与数据安全合规之间的平衡,为用户提供个性化的服务,促进图书馆智慧服务和数据价值的实现,推动智慧图书馆长期可持续发展。
随着大数据、物联网等技术的发展,全球数据资产管理能力飞速提升,面对成员国内部数据市场的变化,欧盟政府逐渐提高了对数据主权的关注度[4]。针对数据缺乏流动性及开放性的现状,欧盟政府出台了《数据治理法》,旨在通过数据共享促进数据的可用性,营造可信的数据使用环境。欧盟《数据治理法》通过公共部门数据再利用、数据共享服务、数据利他主义三种数据共享模式以及提供相应的组织、技术保障来拓宽数据来源、促进数据开放,在保证数据安全的基础上,实现数据的有效共享和再利用。智慧图书馆提供高质量智慧服务的前提正是实现了对数据的广泛共享和深度利用,激发出了图书馆数据要素的潜力,释放了用户数据价值,最终保护了数据安全。鉴于此,本研究拟对欧盟《数据治理法》的内容进行深入解读,归纳欧盟数据治理的成功经验,以期为我国智慧图书馆数据治理提供借鉴。
现阶段,学者们对数据治理的概念并没有形成统一的表述,笔者通过文献查阅及内容分析,将比较有代表性的观点列举如表1所示。
表1 “数据治理”的代表性观点
总而言之,数据治理是对数据进行综合管理,是通过一系列数据管理活动和流程,确保数据处于一个稳定有序的环境中释放价值并获取最优效益[9]。
近年来,数据作为基础性战略资源,在社会各个领域备受关注。数据治理作为一种新兴治理模式,成为学术界和业界共同关注的热点,学者们和研究机构对数据治理高度重视,相继开展了大量的理论研究和实践探索。国外学界关于“数据治理”的认识[10]始于2004年,此后,学者们对数据治理的研究开展得如火如荼,比较有代表性的有D. Power[11]、S. Kim[12]和S. Joo等[13]探讨数据治理在企业、医院及高校等机构的治理模式等。在图书馆领域,国外学者也开展了极为丰富的研究,如W. Bentil等[14]针对加纳大学图书馆用户参与度实践,探讨了数据治理路径;J.Wang[15]提出运用智能技术挖掘用户数据,以提供精准的智慧服务;美国康奈尔大学实施了嵌入式科研数据治理,提高了图书馆科研数据服务能力[16]。
与国外开展数据治理研究的火热程度相比,国内对数据治理的研究还处于大胆探索的初级阶段,理论和实践研究都有待深入。韦景竹等[17]构建了重大突发文化事件下智慧文化数据治理的理论模型;李题印等[18]针对企业运营建立了数据治理体系;孙红蕾[19]介绍了图书馆公共数据治理的主要问题及概念框架;李琳[20]探讨了基于数据治理的高校图书馆电子教材资源的建设路径;慎金花等[21]阐述了图书馆数据治理的构建原则和流程。
综上所述,国外学者对数据治理的研究多元且深入,无论是在政府、医院、高校等机构,还是在数据流通频繁的银行、通信等行业,数据治理都受到了高度重视。而国内对数据治理的研究大多集中在理论探索方面,图书情报机构、图书馆界对数据治理的研究更为鲜见。欧盟《数据治理法》在拓宽数据来源和促进数据再利用方面发挥了重要作用,构建了一个数据治理的全新环境,在数据治理研究领域具有较高的影响力。因此,本研究专注于理清欧盟《数据治理法》的核心思路,结合立法的具体内涵及数据治理模式,学习域外经验,探讨其对我国图书馆数据治理模式的启示,以期打开我国智慧图书馆数据治理的新局面和新视角。
欧盟《数据治理法》是《欧洲数据战略》(A European Strategy for Data)中的首项立法,目的是通过设置数据共享主体及提供完善的组织和技术保障,建立健全欧盟数据治理机制,确保数据在安全可信的环境中实现流通和共享。
2.1.1 公共部门
《数据治理法》中所提到的公共部门机构(Public Sector Bodies)是指在某一国、地区或地方政府当局中受到公权力约束的机构。公共部门负责数据的产生、收集和存储,聚集了大量的数据信息[22]。公共部门机构共享数据时,需由一个或多个具有类似职能的机构或由机构组成的协会予以重复利用和共享,该机构开展数据共享及数据再利用要受国家、地区及地方当局的管理与监督,抑或是在公共机构内部设立行政、管理部门或监督委员会负责监督数据共享活动。
2.1.2 数据共享服务提供商
“数据共享服务提供商”(Providers of Data Sharing Services)这一概念在《数据治理法》中首次被提出,其又被称为数据中介服务机构,以公平信任的运维机制,在数据提供者和数据使用者之间建立联系,确保数据在安全的环境中实现共享和利用。数据共享服务提供商为数据交换共享提供了一种全新的数据治理渠道,负责欧洲数据空间内可信赖数据的共享,并为数据持有者与使用者提供中立的数据交换服务,从而推动欧盟成员国内部对数据的访问与共享[23]。
2.1.3 数据利他组织
《数据治理法》对“数据利他组织”(Data Altruism Organizations)给出了明确的定义,即个人或企业等数据主体或者其他数据持有人因科学研究或其他公益服务事项,自愿将相关的数据提供给某些组织,以实现数据的再利用,这些数据综合组织即为数据利他组织。数据利他组织在使用数据的过程中,必须遵守透明度原则和公益性原则。欧盟任一成员国都可注册成立数据利他组织,以在不同领域内实现数据交换共享。针对数据不同的使用场所和目的,欧洲委员会须制定不同的“利他同意表”(Data Altruism Consent Form),建立数据共享框架,向数据持有人收集数据利他共享的意向,并告知他们数据利用的目的,以维护数据主体的权益。
2.2.1 基于公共部门的数据共享
基于公共部门的数据共享主要是指数据利用者基于社会目的获取公共部门持有的数据并对之进行再利用的过程。《数据治理法》第二章对公共部门数据再利用方式给出了明确的规定,并设置了数据共享的具体制度。同时,《数据治理法》还拓宽了数据适用类型,针对以往不得共享的数据,通过立法重新规定其利用范围,以推动这些类型数据的再利用。
基于公共部门的数据共享将原有公共部门持有的、难以为市场主体所用的部分数据(如医疗健康数据、金融数据等)重新予以利用,推动了数据的重复利用,提高了公共部门数据服务质量,增强了公共决策能力,发挥出其巨大的潜在价值。同时,公共部门将发达的信息技术和完整的通信系统作为强有力的技术支撑,降低了数据共享面临的泄露风险,保障了数据的安全流通。
2.2.2 基于数据共享服务提供商的数据共享
在欧盟各个成员国之间共享数据的过程中,常常存在数据被误用的现象,有时甚至无法保障数据主体的权利。基于此,《数据治理法》提出了基于数据共享服务提供商的数据共享服务,制定了数据中介服务制度,为数据持有者与数据使用者提供中介服务,协助他们进行数据资产交易。这些数据中介机构共同形成了一个数据生态系统,有力促进了数据共享[24]。
立法规定,数据共享服务提供商可以提供三种中介服务,为数据持有者和数据用户提供法律和技术援助,降低数据流通共享的成本,提高数据再利用的频次,优化数据能效,保障数据供需关系的平衡。
2.2.3 基于数据利他组织的数据共享
随着欧盟内部经济往来的日益频繁,数据的有效流通和广泛共享成为推动经济社会发展的关键因素。立法显示,现阶段数据共享不通畅主要是由数据共享渠道狭窄导致的,而《数据治理法》提出的基于数据利他组织的数据共享恰恰解决了此难题。数据利他组织工作的核心思想是数据主体基于改善公共服务质量、提高数据利用水平、便于政府统计数据等公共目的向公众提供数据,从而实现数据的跨区域共享并充分释放出其价值。
基于数据利他组织的数据共享以建立数据共享池为主要途径,可使更多的数据通过数据治理被用于社会公共利益,扩大数据的共享渠道和使用范围,从而提高数据的经济价值和社会价值[25]。数据利他组织建立的数据共享池覆盖了欧盟内部多个成员国,可根据数据的产生和使用方式,分别匹配与之对应的数据共享池,并通过数据利他同意表收集和保护数据,扩大了数据共享范围。
2.3.1 组织保障
组织保障是推进组织制度建设的基础,是落实各项立法条款的根本保证,良好的组织架构具有强大的凝聚力和约束力,有利于推动组织内部各项工作的顺利开展。《数据治理法》建立了欧盟内部各成员国之间的组织框架,对人员和主管机构的职责、工作流程和行为规范进行了规定,确保立法制定的数据共享机制得以有效运转。针对基于数据共享服务提供商的数据共享和基于数据利他组织的数据共享,立法规定成员国必须指定数据共享服务主管部门和数据利他主义机构登记主管部门,这些组织机构应独立于数据共享服务提供商和数据利他组织,负责对相关部门提交的信息进行验证,制止数据不合规程序并监督其改正或给予惩罚措施。同时,《数据治理法》第六章授权欧盟委员会设立“欧洲数据创新委员会”(European Data Innovation Board),以为欧盟委员会提供数据咨询和协助,制定数据安全规范,并确定欧盟委员会的职责范围[26]96。
2.3.2 技术保障
《数据治理法》在扩大欧盟成员国内部共享数据渠道的同时,也在技术层面针对数据安全及数据泄露隐患提出了相应的治理措施。数据在流通的过程中,采取数据安全协议或者必要的数据安全控制技术(如数据加密技术、口令保护技术及存取控制技术等)对数据进行保护,安全地实现数据共享。如数据共享服务提供商采用相应的技术手段(如运用差分隐私技术对数据添加噪声或匿名化处理敏感信息)实现数据的安全交易,以提高数据主体对数据共享服务提供商的信任度,从而增强其交换数据的意愿。数据的流动推动了数据的增值服务,数据的安全流通与数据的广泛利用具有同等重要的意义,在这一点上,欧盟《数据治理法》的立法目的明确且清晰。
智慧图书馆数据治理是指在宏观战略及法律制度的指引下,遵循一定的数据标准和规则,通过数据开放获取及高速流通,促进图书馆数据再利用,实现馆际数据共享,充分释放数据价值,进而为用户提供优质创新的智慧服务。通过上述对欧盟《数据治理法》内容的解读,笔者分析了欧盟在数据治理领域的创新机制,我国智慧图书馆数据治理体系建设可以从以下几个方面入手。
欧盟政府以立法的形式确定了数据治理的战略定位和整体谋划,要求加强成员国之间的协同治理,以促进数据流通共享。智慧图书馆数据治理法律体系是图书馆数据治理的科学指引,是一切智慧活动的指南针和标杆。在国家层面,政府应大力发挥统领作用,强化智慧图书馆数据治理顶层设计,推进数据治理专项立法与制度建设,制定智慧图书馆数据分享利用规则,实现智慧图书馆数据治理活动的制度化、规范化和系统化。
智慧图书馆是一个集人员、资源、工具和空间于一体的综合体,是智能技术和人文智慧的融合[27],其数据活动复杂多样,需要多方数据主体协同参与、群策群力。因此,构建智慧图书馆数据治理法律体系的重点在于通过一系列法律法规和规章制度,厘清不同数据主体围绕图书馆数据资源产生的权利和义务关系[28]。目前,在数据安全、数据主体权益保护方面我国已出台了一系列法律法规,如《中华人民共和国数据安全法》(以下简称《数据安全法》)、《中华人民共和国国家安全法》《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》《信息安全技术 大数据安全管理指南》及相关配套规定,构建了数据保护及数据风险评估等制度,明确了数据主体的权利和义务,保障了个人信息安全。这些法律法规既是图书馆开展数据治理活动的基础与依据,同时还能为图书馆保驾护航,为其提供安全有序的环境。然而,我国现阶段这种“重保护,轻利用”的法律制度建设模式却疏忽了为数据共享利用提供法律支撑。《数据安全法》虽然提出了数据安全与数据开发利用协同发展,但我国目前尚未针对数据治理颁布相关立法,仅仅是从政策文件的角度(如“数据二十条”)及地方数据规章制度(如天津、山东、上海、海南等地先后出台了地方数据条例)对数据产权、流通共享及安全治理进行规定,这就在一定程度上限制了我国数据治理的发展。纵观图书馆领域法制建设,《中华人民共和国公共图书馆法》《数字图书馆安全管理指南》《数字图书馆服务政策指南》《国家公共图书馆管理条例》等不同层级的法律法规及规章制度的出台和施行,为智慧图书馆数据资源利用和用户数据安全提供了有力的制度保障。下一步,我国应制定数据治理专门法,使我国智慧图书馆数据治理活动有法可依,实现图书馆数据资源流通共享,加快制定智慧图书馆数据基础制度的步伐,进一步完善我国智慧图书馆数据治理法律体系。
图书馆开展智慧服务的核心驱动是数据共享和利用,而数据共享和利用的前提是数据开放和流通。现阶段,我国智慧图书馆在数据流通共享方面存在很大的局限性[29],数据资源规模庞大且复杂异构,“数据孤岛”现象普遍,数据管理及数据安全问题突出,这些都严重阻碍了国内图书馆馆际之间的数据流通和共享。另外,由于缺乏专业数据馆员[30]及存在资金配置不当等问题,导致“关起门来自己做事”的现象较为普遍,一味求稳求安全,只能按部就班地发挥图书馆的基本功能,却忽略了智慧服务的升级与创新。数据的复用性和流动性等属性不能被扼杀,而是应得到充分挖掘和利用,在这方面,欧盟《数据治理法》发挥了极大优势,其不仅提高了数据再利用的频率,还促进了数据流通和共享。
3.2.1 重视数据开放获取
智慧图书馆数据治理的基础是数据的开放获取,长期以来,智慧图书馆在运行过程中积累了大量的数据资源,包括文献数据资源、用户数据资源、管理数据资源等。由于海量多样的数据在组织、管理等方面无法统一,导致国内各图书馆之间的数据极度封闭,数据开放服务的案例更是寥寥可数。如何开放获取这些宝贵的数据资源,丰富馆际之间数据利用的来源是数据治理的根本出发点。欧盟《数据治理法》使欧盟政府持有的公共数据再利用的想法成为现实,欧盟公共数据库中的诸如医疗数据、金融数据及智慧运输数据等都在政府部门的监管之下适度开放,便于公众获取,还可被应用于医疗、科研及产品创新等活动中,发挥出了数据的最大价值。
借鉴欧盟开放政府公共数据的突破性思路和做法,我国图书馆数据开放可以从以下几个方面着手:①开放本馆数据资源。每个图书馆都有自己的特色资源和发展优势,将之适度对外开放,可以发挥数据的最大价值,最大化提高数据资源的利用率。例如,我国国家图书馆免费对外开放数据库及古籍全文影像资源,此举不仅方便读者访问数据库获取数字资源,还便于其他图书馆和古籍研究人员利用古籍影像数据开展古籍保护与开发研究,大大促进了数据的共享和利用。②吸纳外馆数据资源。应合理利用国内其他图书馆的数据资源,加强馆际合作,激活本馆的数据潜力,以拓展智慧服务的广度和深度。如公共图书馆开展档案研究工作可以利用上海图书馆面向公众开放的手稿和家谱档案等数据[31]。③设置图书馆数据开放专门机构。如成立图书馆数据开放委员会,负责对图书馆馆际之间的数据开放活动进行监督和管理,同时对数据开放过程中遇到的问题给予咨询建议和协助。
3.2.2 加强数据流动再利用
流动性是数据的基本属性,是实现数据再利用的前提。图书馆数据流动并非局限于单个图书馆内部的封闭环境,而是在多个图书馆之间的开放环境中相互转换,最终进行价值创造和价值传递[32]。当前,图书馆数据流动面临的一个重要问题是不同图书馆数据主体的数据要素利用能力具有明显差异,这就导致了某些图书馆在数据流通方面存在“不敢流通”“不愿流通”“不许流通”等想法,严重阻碍了图书馆数据资源的再利用。
欧盟《数据治理法》对公共数据再利用机制进行了详尽的阐释,从程序和实体两方面构建了数据流动的约束机制。反观我国图书馆领域,笔者认为可根据数据资源的类型分别制定不同的数据流动及再利用机制。一方面,围绕图书馆差异化的数据权益主张、数据利用形式及安全需求,设置数据再利用申请程序,结合本馆的实际情况,探寻可重复利用的数据作为流动数据资源;另一方面,图书馆数据资源种类多种多样,可针对数字资源和实体资源分别制定不同的数据流动机制。数字资源存在于图书馆智能设备、智慧终端及网络平台中,实现数字资源在馆际之间的流动需要搭建专门的数据调用通道,由专人负责管理和执行;可流通的实体资源主要指成功的实践案例等数据,如阅读推广经典案例、医学图书馆诊疗案例等,这些数据的流通应结合具体的应用场景,案例负责主体须承担相应的责任并达成共识,真正形成数据的集体行动[33]。
3.2.3 建立数据共享池
欧盟《数据治理法》强调数据在共享过程中最大限度地坚持公平、透明、非歧视且客观合理的原则,确保更多数据能够按照公平的方式被社会高效利用[26]96。在数据公平利用方面,智慧图书馆数据共享需要全国图书馆机构协同参与,各方主体应坚持数据公平利用原则,按照数据管理中心化、数据利用去中心化的思路和模式,统筹公共图书馆之间及高校图书馆之间的数据资源,打破“数据孤岛”及“数据壁垒”,扭转馆际区域发展不平衡的局面,重建图书馆数据互联互通系统,共建智慧图书馆数据共享平台。
欧盟《数据治理法》的出台促进了数据共享池的建立,这一数据治理的思路和做法可被应用到我国智慧图书馆数据治理中,以解决数据资源开发利用不足的问题。按照我国现有图书馆服务职能划分,可以将图书馆划分为公共图书馆和高校图书馆两大类,为此,可分别建立不同功能的数据共享池,以支撑构建各级图书馆的数据共享和利用体系。根据我国智慧图书馆的规模及区域现状,应分两个阶段建立数据共享池。第一步,建立省级及区域图书馆数据共享池。目前,国内以省为单位已产生不少省级图书馆数据共享池应用实践,公共图书馆层面有首都图书馆联盟、湖南省图书馆联盟等;高校图书馆层面有粤港澳高校图书馆联盟[34]、陕西省高校图书馆联盟等。可通过设置门户网站及特色数据资源库等方式,从组织机构、人才培养、资源利用机制及信息服务等角度汇聚各个图书馆的数据,以促进数据共享并发挥数据价值。第二步,将省级图书馆数据共享池有机结合在一起,建立全国图书馆数据共享池。搭建全国图书馆数据共享池是未来图书馆事业发展的方向与目标,需要多方主体积极参与、协同治理,这是一个循序渐进的过程。不仅要考虑共享池建立、管理方法、组织架构、技术支撑及成本费用等方面的问题,还需要建立统一的数据专项授权机制及明确的数据利用规则,制定标准化的合同文本并开展模式化的数据交易,从根本上解决“数据冗余”“数据完整性”“数据互操作”“数据一致性”等问题[35]。
智慧图书馆数据治理的开展离不开完善的治理结构和过硬的治理技术,需要在组织和技术上提供强有力的支撑。欧盟《数据治理法》强调通过组织中立和技术优势等来增强数据共享制度的可行性和信任度。针对我国智慧图书馆数据治理环境,笔者分别从组织层面和技术层面予以阐述。组织上要建立类似于欧盟数据治理委员会的组织结构,从省级图书馆到地方图书馆,明确各个机构的权利义务及职责范围,同时,参与数据治理的管理机构必须保持组织中立性,以提升数据治理的透明度和安全性;技术上要加大对数据安全保护的资金投入,运用先进的技术手段和技术设备,设置图书馆数据安全保护系统,加强对敏感数据及重要数据的实时保护,以提升应对风险的能力[36],打造智慧图书馆数据安全治理环境。
数据作为智慧图书馆发展过程中必不可少的新元素,发挥着至关重要的作用。图书馆数据治理作为新时期智慧图书馆数据管理的重要手段,可以有效解决智慧图书馆在数据互联互通、数据开放共享、数据价值释放等方面的问题。欧盟《数据治理法》充分体现了欧盟在数据治理方面的特点与创新,有效支撑了欧洲公共数据空间的发展。笔者认为我国应合理借鉴欧盟数据治理的成功经验,探寻我国智慧图书馆数据治理的整体思路和发展路径,探索数据治理的新模式、新业态、新技术,以推动我国智慧图书馆数据治理实现跳跃式发展。