基于国际图像互操作框架的数字特藏资源建设研究*

2022-02-08 13:07程静
数字图书馆论坛 2022年4期
关键词:特藏浏览器图书馆

程静

(华东师范大学图书馆,上海 200062)

国际图像互操作框架(I nter nat ional I mage Interoperability Framework,IIIF)是由图书馆、博物馆、档案馆等机构联合推出的一项技术标准,用于解决数字图像的兼容性及互操作问题,促进异构平台和资源库对图像资源的交换和共享。对于用户来说,IIIF能够实现图像的高级交互功能,如图像的快速缩放、旋转、平移、标注,以及对任意来源的图像进行比较、策展、构建虚拟资源集合、引用、共享等。对于图书馆来说,IIIF能够为数字特藏资源建设提供统一的图像发布服务,促进数字特藏图像资源的跨机构共享和重用,还能从开源社区获得丰富的开源软件,鼓励用户生成内容。数字特藏资源建设是图书馆一项非常重要的工作。越来越多的图书馆尝试利用特藏资源来确立自身的独特性,数字特藏资源建设也与图书馆的精神内涵紧密相连[1]。图书馆在过去的十几年,积累了很多以数字图像为载体的特藏资源,将图像发布为IIIF资源,同时整合外部IIIF资源,能够实现数字特藏资源的集成与统一,推动数字特藏资源的开发与利用。

1 国际图像互操作框架概述

2015年,牛津大学、大英图书馆、斯坦福大学、法国国家图书馆等29个非营利机构宣布成立IIIF联盟,旨在确保全球图像存储的互操作性和可获取性,对以图像为载体的名人手稿、字画、卷轴、古籍、碑帖、地图等在线资源进行统一展示和使用[2]。IIIF既是一组围绕数字图像资源共享与重用的通用应用程序编程接口(API)标准,也是一个由美术馆、图书馆、档案馆、博物馆、公司和开发标准与互操作软件实现的其他人员组成的不断发展的社区[3]。

1.1 国际图像互操作框架标准

IIIF标准是一套通用的应用程序编程接口标准,用于数字图像资源库的互操作,以及互联网图像资源的开放收割。IIIF API包括图像API、展示API、认证API、搜索API、发现API和内容状态API。其中,图像API和展示API是核心API,已经升级到3.0版本,其他4个为扩展API(认证API、搜索API和发现API为1.0版本,内容状态API目前为测试版本[4])。

(1)图像API:通过Web服务返回图像以响应标准HTTP或HTTPS请求。通过构造参数化URI以获取一幅图像的特定区域及尺寸,支持传送缩略图以及深度缩放查看。图像API指定了获取有关图像信息以及该图像支持的图像衍生品和图像操作功能的方法。图像API主要作用于服务器端,用Web服务器或图像服务器的专用应用程序来实现。

(2)展示API:用于共享资源并使描述性元数据随图像一起传输。虽然图像API可以传送图像,但不会携带任何描述性元数据。例如,一本古籍书图像,需要使用展示API对其进行排序。展示API通过创建展示清单(Presentation Manifest)的JSON文档,向用户展示整个资源所需的信息。

(3)认证API:帮助管理工作流,授权对IIIF资源的认证访问权限,对可以在何处或由谁查看数字对象进行定义。例如,认证API可以限制对资源的访问或在某些情况下提供资源的降级版本。

(4)搜索API:允许在资源内部搜索。首先它并不帮助查找资源,而是在用户发现资源后才帮助其在资源内进行搜索。例如,需要搜索API帮助用户搜索有多页资源的全文。客户端图像浏览器,如Universal Viewer和Mirador都支持搜索API。

(5)发现API:提供发现及利用IIIF资源所需的信息。图像API和展示API提供的资源只有在可被找到时才有用,用户不能直接与分散的、去中心化的生态系统交互。发现API用于描述新发布和更新的IIIF数字对象,以帮助跨机构发现IIIF资源。

(6)内容状态API:目前为测试版本,用于在兼容的环境(如浏览器、注释工具或其他IIIF兼容的软件)中打开找到的资源。内容状态API提供一种标准化格式,共享一个或多个展示API资源的特定视图,例如收藏、清单或清单的特定部分。

1.2 图像服务器

IIIF图像服务器指数字资源对象所在的计算机或服务器。IIIF社区提供了11种图像服务器软件以实现数字图像资源的管理。典型的如Cantaloupe,这是用Java编写的开源动态图像服务器,能够按需生成高分辨率源图像的衍生物;IIPImage Server,是用C++编写的高性能图像服务器,用于流式传输高分辨率图像;Loris,是用Python编写的IIIF图像服务器,支持JPEG和TIFF以及JPEG2000格式的图像资源。IIIF社区对于图像资源访问控制的实施建议是在条件允许的情况下部署两个图像服务器,一个用于服务内部的用户,提供更广泛的资源访问权限;另外一个用于服务互联网的用户,仅提供开放的内容。例如,一个部署在阿里云上,提供云端的服务;另一个部署在图书馆内,提供内部访问服务。

1.3 图像浏览器

IIIF图像浏览器用于在站点查看IIIF资源,分为仅支持图像API和深度缩放的浏览器,以及支持用于显示元数据和多个图像的展示API浏览器。用于深度缩放图像的浏览器,如OpenSeadragon和Leaflet IIIF,只需实现图像API即可工作,其功能有限,只能用于查看单个图像,而不能显示有关图像资源的元数据。支持展示清单的浏览器,如Mirador和Universal Viewer,需要同时实现图像API和展示API,可以把图像资源及其元数据作为整体加以显示,具有为单个页面图像提供标签以及下载等功能。这些富客户端浏览器也可以嵌入其他站点并可实现在图像上查看和创建注释。

1.4 国际图像互操作框架的功能与应用

IIIF有4个主要功能:①图像展示功能,能展示超大规模高分辨率的图像,支持高精度图像的流畅缩放、旋转和平移;②图像对比功能,提供众多的图像浏览器,能够支持不同图像同时在一个浏览器中比较,甚至可以跨越不同资源机构与平台进行比较;③图像的标注、引用和分享功能,能够对图像局部细节进行标注,并将图像的特定部分作为网络链接进行分享;④图像的资源整合功能,解决图像的存储问题,实现跨机构资源整合。

IIIF在数字特藏资源建设中的应用主要体现在3个方面:①为用户提供高精度图像的访问和丰富的图像访问功能,提升用户体验;②对图像的内容特征、视觉元素等进行细粒度的描述及语义组织,用以支持基于图像的数字人文研究;③用以资源整合,在不同机构或平台之间实现图像资源的共享和重用。

2 国际图像互操作框架在数字特藏资源建设中的应用

2.1 国外应用现状

国外参与IIIF研究与应用的机构包括大学、图书馆、博物馆、艺术中心、软件公司等。其中,哈佛大学图书馆、梵蒂冈图书馆、日本人文开放数据中心(Center for Open Data in the Humanities,CODH)以及欧洲数字文化遗产平台(Europeana)在IIIF应用上较有成效。

自2012年以来,哈佛大学图书馆已采用IIIF作为与世界共享其数字图像内容的标准。哈佛大学图书馆使用Mirador作为IIIF内容的主要传递系统,提供来自哈佛大学图书馆、档案馆和博物馆5 000多万幅数字图像的访问。虽然哈佛大学图书馆的大部分数字内容仅供哈佛大学内部使用,但是哈佛数字馆藏库(Harvard Digital Collections)免费向公众开放,提供古代艺术、现代手稿以及音视频材料等超过600万种数字对象资源。该平台所有图像内容均采用IIIF发布,并且每个项目都提供IIIF URI链接,通过哈佛大学图书馆云API(LibraryCloud Item API)将来自多个图书馆目录和数据源的信息与高分辨率数字图像结合在一起,允许用户并排平移、缩放和比较多个图像[5]。

梵蒂冈图书馆于2014年开始在其馆藏数字建档项目DigiVatLib中试点IIIF,2016年宣布正式采用IIIF技术[6]。DigiVatLib项目面向全球提供对梵蒂冈图书馆数字化馆藏的免费访问,包含手稿、古物、档案材料、库存以及图形材料、硬币奖章、印刷材料等[7]。DigiVatLib的图像浏览器提供图像缩放、浏览和翻页等功能,并允许学者对来自其他数字图书馆的不同IIIF存储库的数字对象进行比较;在线目录中的描述和参考书目信息被编入索引并链接到数字资源,利用完备的元数据来缩短或优化搜索查询,便于搜索和发现[8]。

日本利用IIIF支持人文研究的成果较为显著[9],从2017年起已有CODH、日本国会图书馆、京都大学等30多家机构在使用IIIF进行资源揭示[10]。CODH采用IIIF技术,建立了日本古籍数据集[11]、日本古籍字形数据集[12]和江户料理配方数据集[13]等。2018年9月,CODH建立“IIIF Curation Platform”平台[14],从世界各地的IIIF内容中收集有趣的图像,并重新提取、排序,从而创造出新的研究利用价值。如平台的“容貌收集”功能可以对各类图像资源中的人脸部分进行提取和分析。平台开发了“IIIF Curation Viewer”浏览器和“IIIF Curation Finder”检索发现系统,还有专门对应JSON-LD文档的JSON文件保存应用软件“JSON keeper”以及画布索引器“Canvas Indexer”,可建立起基于爬虫机器人自动收割的资源更新系统。

Europeana鼓励其合作伙伴(图书馆、档案馆、博物馆)采用IIIF提供高质量图像的访问。自2016年以来,机构可以通过欧洲数据模型(EDM)中的IIIF配置文件将其IIIF资源提供给Europeana,以促进图像共享。共享后的资源可以在Europeana Collections上获取。Europeana Collections提供了一整套IIIF API以帮助用户更加高效地利用其数字资源。任何人只要在Europeana网站申请即可下载和使用所有开放资源。Europeana Collections使用IIIF插件实现了Leaflet.js来显示资源;可以将清单(JSON-LD文档)复制到本地图像浏览器中并进行注释,创建自定义集合和展示,用于教学或研究[15]。

此外,大英图书馆、法国国家图书馆、美国国家艺术画廊、威尔士国家图书馆等也采用了IIIF来发布大量的馆藏资源[16]。

2.2 国内应用现状

从2015年IIIF框架成立以来,国内已经有部分图书馆和研究机构陆续尝试使用IIIF进行资源揭示。

厦门大学图书馆是国内较早将IIIF技术应用于馆藏建设实践的图书馆之一。厦门大学图书馆的特藏资源系统于2016年开始使用IIIF调用特藏文献的影像资源,以Omeka S作为特藏数字资源管理平台,采用基于IIIF的Loris图像服务器实现IIIF的影像接口以展示高清影像,并在前端配置IIIF浏览器Open Seadragon,提供特藏资源的在线浏览、比对及缩放等服务[17]。

上海图书馆于2017年开始对IIIF在家谱数据库的应用进行尝试。经过近年来的发展,上海图书馆已逐渐将IIIF应用于更多的特藏资源建设中。截至2021年底,上海图书馆已实现IIIF框架的数字人文服务知识库共有6个,分别是中国家谱知识服务平台[18]、中文古籍联合目录与循证平台[19]、中国近代文献资源全库(全国报刊索引)[20]、华语老电影知识库[21]、革命(红色)文献服务平台[22]、碑帖知识库[23]。上述平台通过同样的IIIF框架及服务器组建,以实现数字资源对象的集成。整个框架分为文献层、数据层、接口层和服务层4层,其中文献层和服务层采用IIIF框架进行支撑,数据层和接口层使用RDF和REST API技术将所有种类的数字资源对象联通集成在一起。

复旦大学图书馆于2019年底引入IIIF展示印谱特藏资源。复旦大学印谱文献虚拟图书馆数据库是以金石学者林章松先生松荫轩所藏印谱为基础,整合其他私人收藏形成的数字化印谱文献资源数据库。用户在馆藏目录中查找记录或访问“印谱文献虚拟图书馆”时,支持IIIF的数字图像资源会带有IIIF图标,用户可以通过点击IIIF图标打开IIIF浏览器来访问图像[24]。目前数据库的建设主要集中在印谱图像的呈现上,采用Mirador实现图像的呈现、标注及对比研究。复旦大学图书馆收藏大量以图像为基础的特藏资源,希望以印谱数据库的建设为试点,探索IIIF在整个图书馆图像资源服务和管理上的全面应用。

抗日战争与近代中日关系文献数据平台[25]是国家社会科学基金抗日战争研究专项工程的阶段性成果,由中国社会科学院近代史研究所、国家图书馆、国家档案局牵头开发,在2019年底网站发布的第二版中也引入了IIIF。平台主要致力于汇集所有与抗日战争以及近代中日关系相关的文献,借助开放便捷的互联网技术,向全球用户免费提供学术服务。平台资源包含书籍、报纸、档案等史料超过3 000万张图片,通过IIIF实现大规模数字资源对象的管理与呈现。后台采用图像服务器Cantaloupe,前端浏览器采用Mirador和Open Seadragon。Mirador负责提供图像资源的阅览界面,Open Seadragon主要用于线上著录系统的图像展示。此外,平台提供众包方式以实现元数据的采集与更新。

“简牍字典-史语所藏居延汉简资料库”[26]是我国台湾地区“中央研究院”数位文化中心和历史语言研究所在2019年联合开发的,以IIIF API为标准的文字型图像资料库,用以辅助简牍研究学者进行文字释读研究。资料库共收录包括竹简和木简在内超过1万件简,以1930—1931年考古发掘的居延汉简为主。由于字迹潦草或字形罕见等原因,史学研究者需要一个可供文字识读的文字型图像研究平台。平台采用图像浏览器Leaflet IIIF,运用IIIF规范中的展示API、图像API、搜索API等达成图像展示、标注、检索等功能。平台提供简牍整枚文物与单字等不同层次图像粒度比较及阅读、简牍集成虚拟式组织与编排、释文内容关键字标记等功能。

由武汉大学数字人文研究团队和敦煌研究院信息中心联合实施的数字敦煌项目[27]也用到了IIIF技术。数字敦煌项目是有关敦煌石窟文物的数字化资源库,包含大量的图像信息资源。数字敦煌项目基于IIIF实现了图像的深度语义标注,它的图像管理采用了文化遗产图像深度语义标注框架,将图像分成图像层、元素层、标引层和组织层4个层级。图像层负责图像的基础元数据录入,元素层负责图像内部特定文化元素的提取和标注,标引层负责将图像的主题与元素做精准对应,组织层负责实现图像故事情节的结构化表达。

3 国际图像互操作框架应用于数字特藏资源建设的启示

3.1 促进跨社区学术交流与共享

目前数字特藏资源环境多为封闭式资料库,同质化资源无法彼此互通,无法检索到不同机构的数字特藏资源内容及图像。IIIF是国际通用图像互操作框架,能够与任何参与IIIF的机构合作,以标准的方式实现图像资源的互相传递。对于以图像为主的数字特藏资源,如碑拓、舆图、古籍等,将图像发布为IIIF资源,并利用IIIF集成外部的、使用IIIF的数字特藏图像资源,以图像为契机实现数字特藏资源的交流与共享,进而与全球机构共享合作,汇集分散于全球的以图像为基础的数字特藏资源,发掘潜在的合作机构,实现跨社区的学术交流与合作。全球越来越多的图书馆、博物馆、档案馆等机构使用IIIF标准发布数字特藏资源,这使得在使用IIIF机构之间进行特藏资源文献集成非常便捷和高效,无须对图像进行加工即可直接链接成资源联合目录,以轻量级的方式在互联网上共享,实现跨机构和平台低成本集成资源。

3.2 支持数字人文基础设施建设

数字特藏资源建设是数字人文研究的重要内容。数字人文领域典型的研究范式,如知识检索、量化计算、文本分析、社会网络关系分析、时空分析等,都离不开图像资源的支持。数字特藏资源中的图像包含人文研究的历史原照及各种数字化后的图像文献、文物照片、绘画扫描件等,是数字人文研究中一种重要的资源。数字特藏图像基础设施的建设将改变实现人文研究范式的全面变革,为新文科建设提供有力的支撑[28]。以IIIF为支撑的图像基础设施,首先是提供数字特藏图像服务,包括多格式数字图像的发布、展示及共享,如碑拓、古籍等;其次是地图服务,数字特藏资源中地图的发布与展示、IIIF资源地理定位、GIS工具整合等,如在地图上对数字特藏图像资源的地理位置进行标引,将不同时期舆图叠加在真实的地理信息系统上进行对比研究等;最后是音视频服务,最新的IIIF 3.0标准支持扩展至音频、视频类,允许在静态图像的基础上增加时间维度,同时允许用户将注释添加到图像的特定时间或时间维度部分,帮助听、读、看、欣赏、标注、检索,如实现乐谱图像和乐曲的对照阅览。此外,结合关联数据、众包、机器学习等技术还可以实现多种类多媒体特藏资源的集中展示,文本、图像及音视频的对照及在线内容标注和情感标注支撑,3D资源的发布、展示与共享等。

3.3 实现多源图像的细粒度关联聚合

随着技术的发展,数字特藏资源中图像的管理正在由数字化管理阶段进入关联化管理阶段。数字化管理阶段通过建设图像数据库与文献库,借助各种元数据标准规范对图像资源进行管理;关联化管理阶段注重使用关联数据和本体技术,实现图像的语义化管理。徐芳等[29]对基于关联数据的文化遗产数字化保护进行了研究综述,发现基于关联数据的对象化知识标识手段是下一步文化遗产内容揭示的有利途径。很多图书馆、文博机构已经借助IIIF标准或其他API对数字特藏图像资源进行开放,也有一些如AAT(Art and Architecture Thesaurus)、DBpedia、Wikipedia等外部开放数据资源,为实现多源异构数据的采集和聚合提供了方便。利用IIIF,结合CIDOC-CRM、Schema.org、RDF/SPARQL等通用本体词表及关联开放数据规范,获取来源于不同国家/地区、不同机构的数字特藏图像资源,经过数据加工与处理、知识提取与重组,提供统一的关联开放数据及IIIF数据开放接口,实现大规模跨机构、跨领域的多源数字特藏图像的细粒度关联聚合。

3.4 推动数字特藏图像智能化应用

IIIF是以图像为基础的数字特藏资源智能化建设的重要支撑。IIIF对图像内容细节的组织与管理能够实现数字特藏图像资源的细粒度揭示,为进一步实现数字图像资源管理、图像语义标注、语义关联与重组、交互数字叙事及数据可视化等提供了基础。首先,在现有数字资源图像及研究文献资源的基础之上,通过构建图像的相关主题词表、关联数据以及本体模型,借助知识组织的基本工具,提供统一的IIIF Manifest URL,完成数字特藏资源的集成、关联和发布;然后将IIIF技术与众包、机器学习相结合,实现数字特藏图像资源的半自动目标检测、深度语义标注与知识关联,构建与数字特藏资源相关的多模态语义知识图谱[30];最后,将IIIF与图像智能计算相结合,借助人工智能技术揭示数字特藏图像内部的语义特征、内容元素、文化属性甚至背后的文化知识,实现数字特藏图像文化元素的智能化理解与对象提取,用于支持推理、知识问答等智慧化服务,从而更好地支撑人文学术研究[31]。

4 总结与展望

IIIF为图像资源的组织与互操作、图像语义特征与文化内涵的揭示提供了重要支撑。不同于图像的元数据标准,IIIF技术标准用于图像整体以及图像内容细节的组织、呈现和发布,以实现图像的细粒度知识关联及文化内涵的揭示。IIIF的广泛应用确保了全球图像资源的互操作性,并且极大提升了它的可获取性,提高了人文学者在网络环境下的研究能力。为实现特藏资源中图像资源的保护、传播与研究,IIIF应成为文化遗产保护机构共同遵守的标准与规范。人工智能、虚拟现实、知识图谱等技术的发展,为图像资源从数字化向智慧化的转变提供了技术基础。未来利用IIIF技术实现数字特藏图像的智能化理解、多源图像内容的细粒度关联聚合等将是今后图书馆在文化遗产图像管理中的重点研究内容。

猜你喜欢
特藏浏览器图书馆
图书馆特藏建设研究*
——基于读者接受维度的理论探索
高校图书馆特藏数字人文开发初探
微软发布新Edge浏览器预览版下载换装Chrome内核
反浏览器指纹追踪
高校图书馆特藏建设工作探微
图书馆
图书馆特藏服务模式研究:服务策略和价值创新*
去图书馆
浏览器