美国Civic Switchboard项目获奖图书馆开放数据服务实践及启示

2021-01-30 18:45吴予晨许春漫
数字图书馆论坛 2021年11期
关键词:数据服务图书馆

吴予晨 许春漫

(福建师范大学社会历史学院,福州 350117)

开放数据是所有人都可以免费访问、使用和共享的数据[1]。这一概念自2007年在国际语义网会议上提出后,便得到了各界的广泛关注。图书馆拥有海量的数据资源,具备数据收集整理的专业知识,是开放数据服务的重要提供者之一。国际图联指出,图书馆是开放数据计划天然的合作伙伴[2]。图书馆开放数据服务是图书馆以开放数据为核心要素所开展的一系列服务的总称,包括将馆内已有的数据资源开放、对馆外开放数据的研究与开发利用以及指导用户合理使用开放数据等,其宗旨是发挥开放数据的最大价值,造福社会。对于图书馆而言,开展开放数据服务不仅能够提高数据资源的利用率,提升图书馆信息技术的应用能力,而且可以优化图书馆的内部管理,拓展服务的广度和深度;对于全社会而言,图书馆开展开放数据服务意味着可访问数据量的增加,也意味着更加公平的数据获取[3],图书馆在服务过程中深化了与社会各类机构之间的伙伴关系,有助于增进多方合作,共同利用开放数据激活城市潜能,构筑智慧城市。

美国是世界上较早将数据进行开放的国家,前总统奥巴马于2013年开始陆续签署了一系列开放数据法案,此举掀起了美国国内开放数据运动的热潮,许多机构纷纷围绕开放数据的现实需求开展服务。众多美国图书馆也积极参与其中,2019—2020年,旨在促进图书馆开放数据服务发展的Civic Switchboard项目授予15家在开放数据服务方面表现出色的图书馆“实地项目奖”(Field Project Awards),这些获奖图书馆所开展的开放数据服务针对性强、重点突出,具有代表性,较为全面地展现了美国图书馆开放数据服务的多样化,对我国图书馆有良好的参考价值。因此,本文以Civic Switchboard项目获奖图书馆为研究对象,采用网络调查法对这些图书馆开展的开放数据服务进行全面调研,具体了解其开放数据服务的内容,分析特点,以期为我国图书馆开展开放数据服务提出建议。

1 Civic Switchboard项目概况

Civic Switchboard项目的全称为“城市的转换机:连接图书馆和社区信息网络”(Civic Switchboard:Connecting Libraries and Community Information Networks),其目标是鼓励和推进图书馆开展多样化的开放数据服务。项目秉持合作共赢的理念,帮助公共图书馆和学术图书馆确定当地开放数据的需求和环境,探索图书馆在开放数据服务中的角色、机会与实践方式,预测并应对图书馆开放数据服务中面临的问题与挑战,从而提高图书馆的组织能力和应变能力,最后根据图书馆成功的实践案例编制指南、开发工具包,为全国性开放数据共享网络提供参考,完善城市开放数据建设体系[4]。项目始于2017年,由美国匹兹堡大学图书馆系统(the University Library System at the University of Pittsburgh)、匹兹堡卡内基图书馆(Carnegie Library of Pittsburgh)、西宾夕法尼亚州区域数据中心(Western Pennsylvania Regional Data Center)和国家邻里指标合作伙伴(National Neighborhood Indicators Partnership)四方合作共建,同时,项目也得到了美国博物馆和图书馆服务研究所(Institute of Museum and Library Services)的认可与支持[5]。

Civic Switchboard项目启动后,于2018年和2019年分别面向全美广泛征集图书馆开放数据服务的实例,并从中评选出表现优秀的图书馆,评选的依据是:图书馆开放数据服务计划、时间、预算的可行性;图书馆开放数据服务主题与项目主旨的契合程度;图书馆开放数据服务所体现的多样性、公平性和包容性;图书馆开放数据服务对当地经济社会建设的贡献度。该项目于2019—2020年共评选出15家优秀的图书馆,并授予“实地项目奖”[6-7]。

2021年4月,Civic Switchboard项目举办公开讨论会,对后续发展进行商议,项目经理、获奖图书馆馆员、图书情报教育者及地方政府工作人员等25人参会,会议明确了未来图书馆的开放数据服务将在以下三方面做出努力:第一,在数据的开放收集方面,进一步开放数据,加强不同图书馆之间数据的交换共享,培养图书馆与社区之间的合作伙伴关系;第二,在开放数据的保存方面,明确数据资料的版权归属,做好开放数据归档整理工作;第三,在数据素养教育方面,倡导数字公平,加强对馆员的培训教育,使其具备数据素养,为图书馆开放数据服务提供决策支持[8]。

2 Civic Switchboard项目获奖图书馆开放数据服务的实践

本文以获得Civic Switchboard项目“实地项目奖”的15家图书馆为调查对象,笔者从Civic Switchboard项目的官网和博客、各获奖图书馆网站以及相关新闻报道等渠道收集这些获奖图书馆开放数据服务的相关信息,分析其实践内容。

2.1 在开放数据生态系统中扮演不同角色,任务各有侧重

开放数据生态系统是以开放数据为核心,由数据提供者、数据赋能者、数据中介等组成的动态有机体系[9]。Civic Switchboard项目从开放数据生态系统构成主体的角度思考图书馆进行开放数据服务的方式,鼓励图书馆在生态系统中扮演不同角色,提供重点性服务,促进数据的交互,增强数据的流动性,从而发挥数据的作用,展现图书馆的优势。总体而言,获奖图书馆的开放数据服务实践展现了其在开放数据生态系统中扮演的3种角色。

2.1.1 开放数据资源的提供者

图书馆是知识的中心、数据的宝库,有学者指出,数据将成为未来图书馆综合资源体系中一大重要的组成部分。而其拥有的用户数据、馆藏数据就是潜在的开放数据,获奖图书馆的开放数据服务首先将目光着眼于自身,挖掘已有资源,在开放数据生态系统的供给端发挥力量。例如,全美访问人数排名前三的皇后区公共图书馆(Queens Public Library)在“数据统计”(Data Counts)社区项目中利用Excel等可视化工具将馆内用户数据进行开放共享,重点补充当地人口普查中缺失的部分统计数据(如0~5岁儿童、低收入群体、少数种族群体、无证移民等),协助纽约市长数据分析办公室全面了解居民信息,与政府部门共同完成人口统计工作,图书馆此举有利于日后惠民政策的制定[10]。

高校图书馆则对本馆特藏资源进行创造性转换后开放共享,北卡罗来纳州中央大学信息科学学院图书馆(the School of Library at North Carolina Central University)对馆内珍藏的北卡罗来纳州房产契据进行数字化转换,建立开放获取的房产契据数据转录集,并以物理和数字形式共享。该项目将手写文件转化为机读数据,为专家、学者和民众了解当地种族问题的历史提供了重要资料[11],同时,这些公开的史料数据资源也为当地经济适用房问题提供了背景信息[12]。芝加哥大学图书馆数字奖学金中心(the University of Chicago Library’s Center for Digital Scholarship)利用馆藏中与当地治安相关的犯罪数据、庭审数据建立库克县刑事司法系统的开放数据记录集,为库克县治安管理和司法干预的调整提供了必要的数据参考,有助于城市刑事司法系统的优化完善[7]。

2.1.2 开放数据利用的指导者

数据只有付诸应用才能真正发挥价值,获奖图书馆在提供数据的基础上也积极引导各方利用开放数据,让数据“活”起来,提高开放数据的利用率,释放数据的能量,为社会带来福祉。例如,印第安纳州南本德市的圣约瑟夫县公共图书馆(St.Joseph County Public Library)利用南本德市数据中心提供的先进设备、各种处理软件对城市开放数据的现状进行分析,构建“图书馆—城市”合作方案模型(Library-City Partnered Programming),阐明图书馆在城市数据生态系统中的作用,并针对存在的不足探讨改进方法[13],此举不仅能明确图书馆的主体责任,而且有助于城市其他机构主体了解开放数据,提供恰当的服务。

纽约西部图书馆资源委员会(Western New York Library Resources Council)同样也开展了区域数据生态扫描工作,随后编制白皮书报告,将其对当地开放数据环境的调查、对开放数据来源、类型、范围和差异的分析以书面文本的形式向全社会公开,供决策者、教育者、社区组织者使用[14]。该调查得到了布法罗州立大学巴特勒图书馆(Butler Library at SUNY Buffalo State)、分析公司rprt和LLC以及专门参与开放数据计划的组织Open Buffalo和InfoTech的大力支持。

在数据保存方面,匹兹堡大学图书馆系统为西宾夕法尼亚州区域数据中心的开放数据管理提供指导,图书馆重点关注存储库平台中元数据的安全等问题,并为西宾夕法尼亚州区域数据中心的开放数据管理保存计划提供若干建议,有助于片区内数据的合理存储[15]。

2.1.3 开放数据交流的中介

图书馆因公益性和大众性得到社会各界的信赖,是不同主体之间沟通交流的桥梁。部分图书馆通过举办数据交流活动,承担数据中介的身份,将社会民众、政府官员、企业领袖、非营利性机构代表聚集在一起,让他们通过面对面交谈消除误解、构建信任,共同为本地数据应用出谋划策。阿拉斯加州图书馆(Alaska State Library)利用其与民众间紧密联系的优势,举办阿拉斯加社区创新峰会(Alaska Community Innovation Summit),邀请社区民众和企业代表参会,共同确定开放数据的来源、数据的访问渠道和数据的使用方式。阿拉斯加州图书馆的举措吸引了民众对开放数据的关注,增强了民众的社会参与,也增进了政府、企业及其他社区组织之间的关系,作为联系不同开放数据机构的纽带,图书馆促进了利益相关者之间的信任[16]。

纽约州安大略县的先锋图书馆系统(Pioneer Library System)为应对当地药物滥用问题,专门举办大型数据生态系统制图活动,图书馆作为安大略县预防药物滥用联盟的有机组成部分,发挥桥梁作用,引导心理健康、教育和灾害预防等领域的参与者同全体民众和机构部门分享相关数据,构建本地药物数据生态图,参会者在了解影响社区民众健康问题的重要数据(如警方和市长公布的烟草数据)基础上,进行数据分类和优先级确定。这一活动使当地药物数据更加直观,增强了数据的公开与双向互动,有利于深化各方的理解,促进社会问题的深入研究,净化社会用药环境[17]。

2.2 吸纳多方力量,跨界合作建设开放数据管理机构

为应对开放数据的孤岛问题,提高数据传输效率,获奖图书馆吸纳政府、企业、高校、民众的力量,通过跨界合作的方式组建数据管理机构,畅通开放数据的共建共享。

阿拉斯加州图书馆在举办创新峰会的基础上又开展数据和数字资产管理计划(Data and Digital Asset Management Program),与阿拉斯加管理和预算办公室、信息技术办公室共建全州范围内的数据中心,整合数据目录服务和工具,使数据用户、生产者和中介能够共享、使用和转换阿拉斯加州的数据,以便能对其下属各级地方政府产生的数据进行集中访问和管理[16]。

与阿拉斯加州图书馆做法相同的还有夏洛特梅克伦堡公共图书馆(Charlotte Mecklenburg Public Library),该馆与北卡罗来纳大学夏洛特城市学院(UNC Charlotte Urban Institute)合作建立数据委员会(Data Council),召集政府议员、企业管理者、社会组织领导者、民众代表等成员定期就数据报告机制混乱的问题进行磋商,最终在开放数据的调查审核、元数据标准的集中建立、开放数据的合作利用等议题上达成一致。图书馆的举措有效协调了当地复杂的开放数据环境,成功解决了因数据报告机制不同而困扰当地多年的数据孤岛问题[18]。

2.3 精心设计数据素养教育课程,强调课程的针对性和实用性

数据素养是一种阅读、理解、创造、交流数据信息的能力[19],拥有良好的数据素养是正确合理使用开放数据的前提和基础,许多获奖图书馆自觉承担社会文化教育的责任,设计多样的数据课程,向用户提供数据素养教学,提高用户的数据意识,拓展用户的数据思维,有助于数据更好地被利用。

获奖图书馆对开放数据教育课程的设计非常用心,根据服务对象的特点制定专门的教学目标和教学计划,并根据实际培训情况进行适当调整,确保民众能够真正学有所获、学有所成。例如,莱斯大学方德伦图书馆(Fondren Library,Rice University)在对民众进行数据素养教育前,向参与者发放调查问卷,了解他们的文化程度和感兴趣方向,评估他们对数据的认知水平,根据调查问卷分析的结果补充NBA球星数据和Fortnite、Apex Legends两种电子游戏中的球员数量数据,正是由于增加了参与者感兴趣的数据元素,首次培训后参与者的数据素养评估分比原先高出34.5个百分点。为了进一步提高参与者的数据应用能力,该图书馆在第二次培训中增加了社区街道安全数据,鼓励参与者运用已有数据处理技能为社区发展进言献策[20]。又如普罗维登斯公共图书馆(Providence Public Library)在对青少年进行数据素养教育前,全方位了解服务人群的学习需求,开设的课程内容涉及编程、营销、健康等多方面,每门课程有特定的受众类型和专门的使用工具,便于学生根据自身兴趣选择课程。在数据素养教育期间,先后有600余名青少年完成学习,获得了学校官方课程认可的数字证书或行业认证,说明普罗维登斯公共图书馆取得了可喜的实践成果[21]。

明尼苏达州的圣保罗公共图书馆(Saint Paul Public Library)和佛蒙特州的弗莱彻免费图书馆(Fletcher Free Library)分别通过制作《开放圣保罗》手册(Open Saint Paul Brochure)、举办共享数据项目(BTV Share Data Project)的方式为图书馆和社区非营利性组织的工作人员进行数据素养培训[22-23],以提高工作人员的数据安全意识以及对当地开放数据门户的认识,培养良好的数据处理能力。

3 对我国图书馆开展开放数据服务的启示

数据是推动数字经济发展的核心要素,而现阶段我国数据开放和共享的程度仍不够,需要加快政府和公共部门的数据开放进程,促进数据无偿共享[24]。图书馆作为公共文化机构,应积极开展开放数据服务,助力我国数字经济快速发展。目前,我国已有图书馆开展开放数据服务实践,例如:国家图书馆将馆藏古籍、民国藏书的全文影像数据作为公共数据对外开放;上海图书馆对外开放家谱、手稿档案等数据。但整体而言,我国图书馆囿于资金、技术、安全等问题,尚未大规模开展开放数据服务,且已有服务的影响力还可继续提升。对比而言,美国图书馆开放数据服务得到了多方支持,取得良好成效,值得我国图书馆学习。因此,笔者根据我国具体国情,综合Civic Switchboard项目获奖图书馆开放数据服务的实践与特点,为我国图书馆提出如下建议。

3.1 找准图书馆在城市开放数据生态系统中的定位

开放数据生态系统由政府、社会组织和公民共同构成,通过各要素之间的相互配合,运用数据和信息技术解决城市问题[25]。我国图书馆可参考Civic Switchboard项目获奖图书馆的做法,着眼于城市开放数据生态系统,找准图书馆在生态系统具体领域的定位,深化服务内容。

(1)在政治领域,充当政府数据开放平台的建设助手。当前,我国部分省市已建立了政府开放数据资源网、政府开放数据平台等专门网站,向社会公开各领域的数据集,便于社会公众查阅、利用与监管数据,落实透明政府的建设要求。笔者通过对这些平台调研后发现,与图书馆相关的数据集内容以地理位置、开放时间等基本要素为主[26-27],而将馆藏文献数据、用户借阅数据等图书馆重要数据公开的平台较少[28];同时,政府开放数据平台中,数据的关联与可视化分析较为缺失。对此,图书馆一方面需要密切与政府部门的合作,扩充政府数据开放平台中图书馆的资源,利用平台优势提高图书馆数据的利用率;另一方面,图书馆可以运用各种技术,参与政府数据开放平台的建设,协助数据整理,增强数据集之间的关联,提高数据的可视化程度,为居民查找和利用各类数据提供便利,推进我国数字政府的建设进程。

(2)在经济领域,成为企业提升竞争力的助推器。对于企业而言,善于洞悉开放数据中的经济价值,可以在激烈的市场竞争中抢占先机。如今,众多社会机构都将自身数据公之于众,越来越透明的开放数据成为企业提升竞争力的有力武器。我国图书馆可以先从国务院、网信办或当地政府网站、各类银行官网、各大开放专利数据库等渠道采集有利于企业经营的政策、金融、科研等方面的开放数据,结合企业自身目标和竞争对手背景,为企业制定有针对性的战略规划,如根据不同银行或融资公司所公开的历年信贷数据选择性价比较高的贷款方式,利用有限的资金提高产品质量,赢得市场。

(3)在文化领域,扮演文化遗产开发利用的孵化机。现代信息技术的发展为图书馆文化遗产的数字化保护、开发、利用提供了契机,目前国家图书馆、上海图书馆都已对馆藏珍贵的史料数据进行开放共享,用户可以获取和重用RDF、XML、JSON等格式数据。笔者认为,我国图书馆在已有实践基础上还可以和博物馆、美术馆、档案馆、出版社等机构合作,利用开放关联数据将各单位珍贵藏品的一系列数据关联,使文化遗产的历史脉络更加清晰、完整,实现我国优秀历史文化的创新利用。

3.2 群策群力,打造图书馆开放数据服务联盟

美国图书馆积极开展开放数据服务,并取得良好的成效,这与Civic Switchboard项目对内的支持和获奖图书馆对外的跨界合作密不可分。当前,我国图书馆有限的开放数据服务以“各自为政”居多,大部分图书馆不了解开展什么服务、怎样开展服务、为谁开展服务,这对我国图书馆而言是不利的,若能像美国图书馆一样有专门的项目组织对内提供指导,评选优秀的服务案例进行物质层面和精神层面的鼓励,则有益于促进越来越多的图书馆加入服务的行列之中,加快我国图书馆开放数据服务的进程。笔者认为,此类组织可以以开放数据服务联盟的形式开展,由中国图书馆学会、中国高等教育文献保障系统等机构统一领导,国家图书馆、上海图书馆、北京大学图书馆等在开放数据服务方面有成功实践的先行者作为联盟中的指导者,号召各类图书馆参与其中,加强联盟内部的对标学习、临近学习、跨地区学习,图书馆之间互帮互助,共享经验,相互促进。联盟可以定期表彰具有先进性、典型性的实践项目,出台指导文件,使我国图书馆的开放数据服务有方向、有目标、有计划、有安排,切实提高服务的效果。同时,联盟中的图书馆也需要积极走出去,结合当地实情,与政府、企业、高校等机构密切合作,使服务内容和形式更具多元化和针对性。

3.3 基于不同年龄段需求制定数据素养课程,全面提升民众“数商”

纵观Civic Switchboard项目获奖图书馆的实践不难发现,其对民众的数据知识培育极为重视,通过多种形式对不同群体提供针对性教育,力图全面提升民众对开放数据的认识与应用能力。我国图书馆也应该大力发挥在数据素养教育方面的作用,提升民众的“数商”。

(1)作为未成年人的“数据引路人”。对于未成年人群体,由于其仍处在大脑发育阶段,对开放数据的概念比较模糊,图书馆应重点培养其对开放数据的整体认识,如学习普罗维登斯公共图书馆的做法,通过益智游戏和嵌入教学等方式带领未成年人踏入开放数据的大门,领略其中的奥妙。

(2)作为中青年人的“生活锦囊”。对于中青年人,由于其已具备一定的数据思维和数据意识,对于学习有更强的自主选择性,图书馆应关注中青年人的现实需求,将数据素养教育与其生活紧密联系,可以教授上班族如何自主获取、分析居住片区的开放道路交通数据,选择合适的出行工具和路线,缩短通勤时间。

(3)作为老年人的“智慧数据助手”。对于老年人,他们是数智时代的弱势群体,图书馆对老年人开展数据素养教育首先应努力改变其对信息技术抗拒和排斥的态度,从退休金补助、医疗保障等方面入手,引入政府数据开放平台、医疗数据开放平台,在得到老年人认可后,以手把手教学的方式,循序渐进,帮助其逐步掌握智能设备的使用方法,进而学会从正规渠道获取开放数据,最后能在开放数据平台上得到疾病科普、用药指南等服务,从中受益。

3.4 构建知识元库,创新数据的共享与使用

知识元是知识控制与处理的基本单位,呈现了文献作者对特定学科问题的最新发现,是知识结构的基元[29]。对知识元模型的建设与应用能更加直观地展现图书馆文献知识的价值和知识之间的关系,将其以开放数据的方式呈现给用户,可以缩短其科研创新的时间,提高研究效率。图书馆应利用自身在信息资源建设与组织方面的优势,成为知识元的创建者,对文献所包含的知识元进行描述、组织、形式化表述和共享。首先,图书馆界应对知识元描述的词表进行统一,确定共用的词汇体系;其次,抽取馆藏文献中的创新知识元内容、支持信息与来源信息,补充自身的创建者信息,并采用RDF/XML格式对知识元进行形式化表示,使之成为机器可读、可交互处理的数据;再次,利用本体对知识元进行语义组织,形成知识图谱,呈现知识元间的联系,并存储为知识元库[30];最后,将数据进行开放,成为任何人都可以无条件使用、重用的开放数据。国家图书馆还可以在此基础上整合各馆知识元库,为用户查找知识元提供一站式检索平台,提升知识元开放与共享水平。

3.5 在开放数据环境中捍卫隐私数据安全

在开放数据环境中,作为海量数据存储库的图书馆应承担隐私数据捍卫者的职责,切实保护个人数据,与全社会一道维护数据安全的良好环境。首先,我国图书馆界在处理个人信息的过程中要贯彻落实我国《个人信息保护法》和《数据安全法》,履行数据安全保护的义务,避免因操作不当导致用户数据的泄露、篡改、丢失,损害图书馆信誉和社会形象。其次,中国图书馆学会与国家图书馆可以牵头制定适用于本行业的行为规范和标准,与信息保护、监督管理部门通力合作,为馆员正确处理开放数据提供参考依据。再次,图书馆在利用用户个人信息进行自动化决策的过程中,应该根据《个人信息保护法》第二十四条的规定,提供不针对其个人特征的选项,或者向个人提供便捷的拒绝方式。最后,我国图书馆还可以在做好本馆数据安全规范的同时,效仿Civic Switchboard项目中获奖图书馆的做法,为社会其他数据存储机构提供隐私保护建议,确保个人数据未经允许不得公开。

4 结语

开放数据为智慧城市建设提供了有力的资源支撑,也为图书馆改善、创新服务提供了丰富的燃料,以Civic Switchboard项目获奖图书馆为代表的美国图书馆发挥在开放数据收集、整理、利用方面的长处,将图书馆的发展与社会紧密联系在一起,实现了图书馆与社会的共同进步。我国图书馆应认真分析当前国内环境,明确图书馆在开放数据服务中的定位,抓住机遇,承担服务社会的责任与使命,推动图书馆的发展,彰显图书馆的价值,实现图书馆的转型升级。

猜你喜欢
数据服务图书馆
大数据时代高校图书馆数据服务的困境及优化路径
地理空间大数据服务自然资源调查监测的方向分析
基于数据中台的数据服务建设规范研究
NetApp将提供无缝混合多云体验
图书馆
面向科研用户的嵌入式智慧数据服务模式研究*
时间重叠的图书馆
图书馆
数据服务依赖图模型及自动组合方法研究
去图书馆