钱琴 张毅
摘 要:红色文献是老一辈无产阶级革命斗争的真实记录,大力发展建设红色文献数据库对于提升民族凝聚力,弘扬爱国主义精神有着重要意义。华东师范大学图书馆采用基于国际图像互操作框架IIIF的开源特藏资源管理系统Omeka技术,对馆藏红色文献进行加工整理,通过功能和特点的具体分析,结合具体案例,探索红色特藏资源数据库建设之路。
关键词:红色文献;特藏;IIIF;Omeka
引言
2021年是中国共产党成立100周年,习近平总书记在党史学习教育动员大会上强调:“加强新时代大学生党史学习教育,对于引导大学生大力发扬红色传统、传承红色基因,赓续共产党人精神血脉,增强开拓前进的勇气和力量,具有重要战略意义。”各高校通过一系列红色主题展览,红色故事经典诵读,让红色基因根植于青年一代心中。红色文献作为先进文化思想的精华是我们研究红色文化的重要资料,图书馆对于红色文献应做好收集、整理、记录、展示和传承,建立特色数据库,可以使珍贵的红色文化遗产得到长期有效的保护。本文将系统梳理总结高校图书馆红色文献研究动态,研究摸索图书馆自建红色文献数据库共享展示平台,为红色文化建设与保护提供借鉴。
一、文献调查分析
笔者通过在中国知网调研检索,时间从2000年1月至2021年9月,主题为:“红色文献”并含“数据库”,“红色文献” 并含“数字”,“红色文献”并含“图书馆”为条件,检索得到共计104篇文献,其中包含红色文化29篇,红色文献20篇,数据库建设11篇,文献资源数字化3篇,图1从文献的发表年度可以看出,红色文献的保护与研究得到越来越广泛的共识。
二、高校图书馆红色特藏资源数据库调查分析
1.背景与调查
新中国成立前,红色资源广泛认可界定范围为:中国共产党成立至新中国成立前,中国共产党机关以及根据地出版的各种书籍和杂志等。由于年代久远,以及当年的印刷技术,纸张质地等,很多文献出现破损毁坏,纸张非常脆弱等现象,已不适合借阅浏览,不能发挥其历史价值和教育意义,如何让红色文献“活起来”,发挥其文明传承价值成为亟待解决的问题,因此,图书馆对于红色文献数据库的开发刻不容缓。
目前,各馆藏机构特藏数据库主要集中为:民国时期资源库、地方历史文献库、古代地方志、古籍库、书画库等,新中国成立前,紅色文献数据库并不多。整理红色文献对于高校思想政治教育、科研教辅、校园文化建设具有重要意义。笔者调查到有红色特藏数据库的高校分别有:中国石油大学发布的红色文献数据库、井冈山大学图书馆建立的“井冈山特色文献资源库”、延安大学图书馆发布的“延安时期中共中央机关报全文数据库”、上海市委党校图书馆发布的“晋绥日报”数据库,此外还有如万方数据开发的《红色文化专题数据库》以及陕西人民出版社开发的《红色档案——延安时期文献档案汇编》等。
2.存在的问题
通过调研发现,各馆藏机构以及认识到红色资源开发的重要性,但现有资源平台在功能设计、开放共享方面仍存在以下几个问题。
(1)现有的数据库功能单一,平台利用率低。目前,现有的数字资源平台资源尚不全面,一部分数字平台仅支持简单的浏览,或不提供图像浏览,大部分特藏资源只对本校读者服务,红色文化辐射力和影响力甚微。
(2)缺乏多元异构数字资源共享利用平台。各馆藏机构采用的技术框架、资源格式和应用程序各不相同,由于没有统一标准,这些已经进行数字化处理的资源被封锁在信息“孤岛”里,不同平台数字资源难以交换共享。
(3)少有图像资源深入挖掘功能。注释对于相关学术数据库具有很大的推动作用,目前,大多数库仅提供简单浏览、缩放等操作,缺乏图像资源研究者和提供者沟通的桥梁,无法支持与资源互动,对原始文献挖掘的深度不够,鲜有能够实现内容注释、添加评语等功能。
三、华东师范大学新中国成立前红色文献数据库实践
1.新中国成立前红色文献资源现状
华东师范大学目前有专门的红色文献资料库,文献室中的一些资料由于年代久远,存在着不同程度的破损,纸张非常脆弱,为更好地发挥红色文献的历史价值和教育价值,图书馆已对部分图书进行数字化处理,以便从标题、分类、出版社,作者等方面进行检索。目前已数字化105本,总计10895页,其中最早为1926年5月出版的《中国共产党五年来之政治主张》,其中不乏老一辈无产阶级革命家毛泽东、朱德等著作如《在延安文艺座谈会上的讲话》《论解放区战场》经典红色文献以及一些外国记者如詹姆斯·贝特兰、斯诺等一批外国著名作家、记者的著作。
2.设计与创新
华东师范大学新中国成立前红色文献数据库采用Omeka发布平台,结合国际图像互操作框架(IIIF),对于馆藏资源和海量红色资源进行统一整理收割与共享,建立多元异构数字图像资源一站式整合平台。
(1)Omeka发布平台。Omeka是一个免费开源的网络发布平台,基于Omeka图书馆、博物馆、档案馆等机构可以实现数字资源收集、展览、网络发布等。具有强大的可扩展性和灵活性,对于特藏资源集成化展示建设有着广泛的应用。华东师范大学新中国成立前红色文献数据库采用资源管理与发布的Omeka系统,下载omeka classic版本,上传安装所采用的Apache服务器,并下载安装Finalshell服务器网络管理软件,连接已设置的主机和端口。完成Omeka的安装部署之后可在后台进行系统一般信息的设置,如管理员邮件地址、站点名称、站点描述等信息。Omeka 作为支持IIIF的资源管理系统,可在其官网PLUGINS选项中下载安装所需的插件Universal Viewer浏览器作为IIIF的功能实现。
(2)国际图像互操作框架技术。国际图像互操作框架(IIIF)基于HTTP技术,提供各类应用程序编程接口(Application Programming Interface,API)以实现对互联网图像资源的开放收割与处理。各机构可以加入全球共享同盟(IIIF-C)来实现本机构的资源共享,只要下载安装相关API,将自身资源在这些成员单位上进行共享展示。用户只需安装专门浏览器(Universal Viewer)即可使用这些数字资源。Universal Viewer浏览器在文化遗产机构中较为流行,它可以演示不同类型的媒体资源,如数字图像、音频、视频等。本库采用 Universal Viewer浏览器实现电子书的深度缩放浏览,旋转、分享、注释、保存,还可以对图片进行转化修改。任何通过IIIF方式发布的红色资源,都可以通过IIIF-manifest连接,使读者可以浏览全球的红色资源。
(3)数据库框架设计。新中国成立前红色文献数据库设计一共分为4层,底层为数据层:数据来源主要是馆藏红色资源,以及采用IIIF发布的红色资源。第二层为Omeka特藏资源管理发布平台,主要负责元数据的接入、处理、图像数据的上传、图像资源发布等,第三层为IIIF层,在Omeka系统插件区中通过下载安装IIIF专用浏览器UnivesalViewer,在浏览器中添加manifest地址,可以实现IIIF资源无缝连接,以此收割海量红色资源。顶层为展示层,红色资源可以实现深度缩放、平移、搜索、比较、分享等功能,页面右侧有元数据查看功能。
3.新中国成立前红色文献数据库系统实施
经过系统的前期部署,新中国成立前红色文献数据处理主要分为两个部分,图像数据和元数据的处理与导入,以及网页主题设计。
第一部分为图像数据的上传,在上传之前首先用图像批量处理软件DjVuToy将所有的DjVu文件全部转换成TIF图像文件,此部分转换图片时需将每个文件按序建立文件夹,将不同书籍转换的文件放入不同文件夹中,共计105个文件夹,本机存放路线,例如:D->zhuanhuan。
Omeka系统的所有图片资源设置为4个文件夹,分别为:fullsize,original,square_thumbnails,thumbnails,其中original文件夹用来存放所有图片的源文件,打开finalshell,将此前批量转好的105个文件夹复制至路径finalshell->omaka-main->files->original-> D->zhuanhuan中。
此外图片的处理还涉及两个部分:
一、做缩略图。本网站采用的Universal Viewer浏览器在左侧使用缩略图预览模式,使得读者浏览阅读时更为便捷。缩略图的处理如下,使用命令行调用ImageMagick對目录图片进行处理,使用到的ubuntu命令行为:for file in*/*.tif;do convert-thumbnail 164x200^-quality75%$file ${file%%.*}.jpg;done,在同一目录下生成,源图片和缩略图可以同时然后复制到fullsize,square_thumbnails,thumbnails三个文件夹中去。
二、图片加学校图书馆水印。首先将水印文件:logo.png提前放在:/var/www/sy/目录下,再次使用ubuntu命令行:find -type f -exec bash -c ‘[[ -n “$(file -bi “$1” | grep tif)” ]] && composite -gravity center -geometry +1+1 /var/www/sy/logobig.png “$1” tif:”$1” - {} \; 即可将所有源文件加上水印,使得水印和源图片融为一体。
第二部分为元数据的导入。此部分共建立6张表与Omeka数据库的批量导入,分别为omaka_element_texts.xlsx,omeka_files.xlsx,omeka_items.xlsx,omeka_records_tags-ok.xlsx,omeka_search_texts.xlsx和omeka_tags.xlsx。其中omeka_files.xlsx为每张图片存放的物理地址,omeka_tags.xlsx为每篇文章的标签分类,有出版年份、出版社等。6张表做好后打开navicat,连接IP地址,在omeka_main目录下先复制备份,然后再导入表。
第三部分为网站主题选择。Omeka官网上可以下载不同风格的主题页面或者可以自己设计主题,Omeka官网提供了12种不同风格的主题页面,通过下载源文件,然后存放在omaka-main/themes目录下即可使用。本网站采用的“ The Daily”风格,用户可以自由配置该主题,通过改变页面颜色、logo文件,以及设置页面图片尺寸和页面显示设定等操作。本网站最终页面展示12本书,每行4本,一共3行。页面布局简洁大方,读者使用时一目了然,非常适合小型网站书展模式。此外网页采用终端自适应设计,在各类移动设备上也能轻松展示,随时随地获取资源。
四、结论与展望
当前,开发共享各类特藏资源的学术研究、文化教育以及文化遗产的保存得到广泛共识。IIIF提供了一个统一的收割和管理分布于世界各地的不同数字资源的协议,通过IIIF的使用,可以使得图像资源存储机构突破自身资源限制,经过IIIF发布的图像可以极为方便地进行互操作,实现和其他馆藏机构之间的图像资源的共享利用,最终形成全国高校图书馆红色资源共建,优势互补的共享平台。
参考文献:
[1]贾翠玲.延安时期红色文献搜集整理与数字化建设[J].延安大学学报,2016
[2]付跃安.国际图像互操作框架(IIIF)及在数字资源集成中的应用[J].图书馆论坛,2020
[3]吴加琪 基于Omeka的专题数字文化资源小型收集网站建设研究[J].现代情报,2017
[4]张 毅,陈 丹.基于Omeka与IIIF的特藏资源库建设研究与实践[J].大学图书馆学报,2020
(作者单位:华东师范大学图书馆)