艾金勇
摘要: 为了保证藏学文献特色数据库的标准化和规范化,更好的实现藏学文献数据的共建共享思路,本文在对藏学文献数据库建设的实际情况全面调查分析的基础上,重点讨论了藏学文献数据库各子库的建设标准和重要模块的建设方法,并通过实例验证了其可行性。
主题词:藏学文献;特色数据库;发布
中图分类号: G356.7 文献标识码: A
Abstract: In order to ensure the standardization and normalization of Tibetan literature characteristic database, and to build a better realization of Tibetan literature data sharing ideas,this paper made a comprehensive analysis of the actual situation of Tibetan literature database construction. After that,the paper mainly discusses the Tibetan literature database construction of each library standards and methods for the construction of key modules. Finally, its feasibility is verified by examples in the paper.
Key words: Tibetan literature;characteristic database;release
1 研究背景
藏族是我国的重要少数民族,其聚居地区分布在西藏自治区以及青海、甘肃、四川、云南等多个地区,经过多年的积累发展,积淀了丰厚的文献资料,统称为藏学文献,可以说藏学文献是记录有关藏族及藏族地区的知识的一切载体[1]。这些文献记录反映了关于藏民族生活习性、文化特点、社会状况的知识,记载内容囊括了政治、宗教、经济、文化、军事、历史、语言文学、天文、历算、工艺、地理、体育等多方面的内容,对我国藏族社会、经济、文化、科学等方面的发展具有不可估量的价值和作用。
近年来随着信息化的发展和国家对于西藏文献建设的大力投入,西藏各图书馆也开始关注藏学文献资源的收集和科学化管理,这些都使得藏学文献在收藏质量和数量上均已获得可观的发展,但是由于西藏所处地理位置的限制,在信息获取和技术交流上与内地保有天然差距,所以藏学文献管理方式在整体上还是稍显落后,而且藏学文献收藏机构在观念、体制、资金等方面还存在诸多因素的制约,使得藏学文献资源的共享检索还未能切实做到真正全面的实现。虽然目前已经有些藏书机构建成了可检索查询的藏学资源库,但是资源库建设中缺乏系统性和完整性[2],且未形成统一的规范和标准,因此在资源的全面性和标准性上都亟待改进和发展,既没有实现共享检索,也没有实现数据资源的异地共建,所以对于其他藏学研究者来说藏学文献的获取比较困难,更遑论直接满足西藏经济发展和读者的实际需求。因此,越来越多的藏学研究者希望能够通过现代化技术,制定藏学特色资源库的建设标准,完善藏学特色资源库的管理开发系统,利用网络技术实现资源内容的共建共享。
2 构建思路
将藏学文献实行数字化管理,使得读者使用方式多元化,是藏学研究和发展的必然方向,更是网络环境下各藏学收藏机构的首要任务。藏学文献数据库的共建共享首先需要符合所有藏学研究和西藏爱好者的要求,通过对所有藏区和藏学文献收藏机构的全面调研分析来确立藏学文献特色数据库的建设方案。其次,若要提升藏学文献的影响力和利用率,还需要对显示界面进行美化和调整,使其更加快速、灵活、高端,为检索、使用和阅读提供方便。此外,还要保证数据库建设的质量和先进性,就要在建库过程中采用成熟先进的数据库和网络技术。最后,需要对产品、应用技术、设计方案的可行性进行检验,降低风险,提高系统的稳定性和可靠性。严格遵循科学、合理、有效的基本原则,切实保证方案的可行性和未来可扩展性。
结合藏学文献特色数据库建设的实际需求,为了切实保证数据库系统能够达到预期目标,保证技术指标符合标准要求,本文在对藏学文献数据库建设的实际情况全面调查分析的基础上,重点讨论了藏学文献数据库各子库的建设标准和重要模块的建设方法。
3 藏学文献特色数据库的建设
3.1 藏学文献数据库的子库构成
藏学文献数据库由一系列子库构成,目前包括有7个子库,分别是:藏学图书、藏学期刊、学位论文、西藏图片、西藏视频、西藏音频和藏学网页资源。针对各个子库,给出综合分析如下。
藏学图书库主要收集了关于藏学方面的研究、藏族生活习俗和历史文化等方面的藏文和汉文图书。藏学期刊库主要选择了《中国藏学》、《西藏研究》、《西藏民族大学学报》、《西藏大学学报》、《西藏教育》、《西藏经济发展论坛》等藏学期刊创刊以来的全部论文的电子版,还通过建立基于藏学主题词和其他检索项联合检索获取的各大门类刊物藏学的研究论文,期刊论文来源于中国知网和维普期刊网。学位论文库收集的是作者学校的学位论文数据和其他有藏学相关专业研究的高校学生的可参考、借鉴学位论文等。西藏图片库目前收集的主要是关于西藏风景、藏族人物、壁画、宗教画像等相关的图片资料。西藏视频库重点储存的则是关于藏学研究的教学性视频、西藏风土人情的介绍性视频、藏族传统艺术以及现代艺术的表演视频等,是藏学专家学者进行藏学研究的可视化信息资料库。西藏音频数据库收集的内容有藏族歌曲、藏族传统艺术的音频形式以及西藏宗教的音频资源。藏学网页资源即是通过搜集、整理中国藏学网、中国西藏网、西藏新闻网、新华网西藏频道、西藏文学网、西藏藏语言文字网、西藏文化交流中心网等权威性的藏学网站有关藏学研究方面特色文献信息资源,采用信息资源加工与发布系统进行著录及全文加工与发布而建成的数据库。
3.2 藏学特色文献数据库的元数据
本项目建设采用国际通用标准DC元数据元素集[3][4],兼容CALIS《特色库项目本地系统 技术规范》以及科技部的相关标准[5],同时遵循CALIS元数据的扩展规则,设定了特殊类型文献的资源处理方式,具有优异的一致性、兼容性和拓展性。
3.2.1 各类型资源的元数据
通用元素、资源类型通用元素和专属元素共同构成每种资源的元数据集。其中,通用元素反映的是所有资源对象的共同描述元素,例如所有的资源都有“标题”这一通用元素,通用元素有利于统一检索的实现。资源类型通用元素特指某一类型的元素可以使用,比如藏学期刊库和学位论文库都是描述论文的类型,就可以成为通用论文的特有元素。专属元素则仅适用于其中的一个库的特别属性,其他资源可能不具有,比如藏学图书库中的“ISBN”属性。
3.2.2 字段类型和属性
各类型资源的元数据在数据中对应的是不同的字段,字段的类型和属性是数据库与用户交互的主要方式,同时也是资源类型确立的重要依据。因此在字段类型和属性的确立上,一方面要参考已有的标准,制定统一的属性确立规则,另一方面要分析用户的类型和需求,获取用户的检索习惯。比如“题名”、“主题词”都是可以模糊匹配的字段;而“语种”、“ISBN””ISSN”等字段则必须是精确匹配。
3.2.3 各子库中元数据的关联
在藏学文献数据库数据标引过程中,各个子库是独立的,但是各个子库的内容是有关联的,考虑到以后各数据库内容的联系,对各个子库的字段内嵌了关联,比如在藏学图书库里,点击浏览某一图书的责任者可以关联浏览该责任者发表的论文,进而查找到在论文库中的作品。
3.3 藏学文献特色数据库的设计原则
藏学特色文献数据库的建设是为了满足所有藏学研究和藏学爱好者的需求而开启设定的,有特定的用户群和用户范围,而且文献建设的地域特性也决定了特色数据库系统建设应该满足如下一些设计原则:
1)实用性和便利性。实用性要求平台的设计以应用功能需求为龙头,选择合理的设备配置,系统平台易学易用、界面简洁明了,保证系统的运行效率和使用效率。注重应用的可操作性,内容的易读性,采用人性化的设计,突出个性化的服务;同时,平台应该是使用方便、维护简单。网络系统等硬件系统应配备有高新性能的管理软件,以便进行系统检测、监控和系统维护。
2)先进性和成熟性。特色数据库建设,避免重复建设是第一要务,因此整个系统设计上充分考虑未来发展,最终实现面向所有用户的资源优化,而不是简单的信息管理;因此要充分吸收成熟而先进的建库技术,在构成体系和整体发展思路上要有较高的起点,所有使用的产品采用业界领先且发展完善的技术和设备,且在国内外的同类项目中经受过严格的考验,同时具有良好的信誉。此外,在平台设备配置和架构设计方面,采用面向服务、面向组件的先进技术和理念,保证未来应用的扩展要求和设备性能提升扩充的各类需求。
3)标准化和规范化。标准化、规范化是数字资源实现共享访问的基础,而建设特色数据库的一个重要目标就是为了推进资源的广泛利用。所以在建库过程中整个平台的设计、实施过程中严格按照国际标准控制执行,运营建设总体框架支持开放的且符合业界主流技术标准的资源系统平台,该平台独立于网络、硬件环境、通信环境、软件环境和操作系统;用户可以根据工作的需要,方便增加新的功能应用。同时,在资源采集、资源加工、资源描述、服务提供等方面都要求严格 按照全国信息技术标准化技术委员会教育技术分技术委员会的各种标准规范或其他规范标准。
4)安全性和稳定性。系统具有完善的系统安全性管理及权限管理的设计,保证资源可靠、安全的传输和共享;通过对不同用户的权限设定和分级别授权等手段实现资源访问的安全性和数据发布的准确性。
系统的稳定性是指系统具有长期连续运行的能力,因此在特色数据库建设时要细致考虑特色数据库中不同资源的访问特点,对缓存控制、静态页面控制、存储控制等方面都应做重点统筹部署,保证系统的可靠性与稳定性;还要建立完善的安全保障体系确保软件系统的正常运行、故障恢复和数据资源的容灾。
3.4 藏学文献特色数据库的主要模块
3.4.1 资源采集模块
课题采用先进的网络爬虫技术(WEB Crawler)和多媒体信息感知技术(Information Perception),基于以图形用户界面为开发环境,透过IDE、VCL工具与编译器,配合连结数据库的功能,构成的以面向对象程序设计为中心的应用程序开发工具Delphi7和SQL Server 2008数据库支持构建的资源采集模块,需优势实现对图书馆已购商业数据库和相关网络资源的批量采集,并对这些资源进行收集、整理、转换及迁移至特色数据库平台当中。该模块主要完成对采集的数据库配置工作;然后依据相关设定条件进行资源的采集;再利用一定的规则实现对采集到的资源的收集、整理和转换;最后将转换后的标准数据导入到特色数据库当中。
3.4.2 文献数字化加工模块
数字化加工制作模块主要是针对纸质文献的加工。该模块是把纸质文档如书籍、报纸、期刊等通过书页扫描、书页图像处理转换成JPG格式的电子图片;然后再通过图像识别编改、目录加工、书页图像与目录树合成等技术处理过程将这些JPG电子图片制作成PDF格式的电子书;电子书籍也可以针对已有的扫描图像文件通过格式转换和目录树加工等功能制成;最后通过元数据著录规则实现电子书的元数据标引。模块中包含有古籍、图书、图像、学位论文、手稿、收藏品、期刊文献与论文、民国文献、网页、舆图、视频、音频等12个基本的著录模板,同时用户还可以根据需求定制需要著录的源数据项。
3.4.3 数据库管理模块
数据库管理模块包括资源管理和用户管理。其中,资源管理实现的是资源库的创建、资源的录入和数据的批量导入工作、待发布资源的审核和发布工作。同时基于资源库的特殊性,数据库管理中还包括已有资源的藏文化描述。不仅如此,数据库管理模块还包括对整个系统的资源维护功能。包括资源的编辑、删除;设置资源的评论开关,是否支持用户进行评论;设置资源的显示开关,是否允许该资源在前台显示;系统管理员可查看每条资源的评分及浏览次数,并可对资源进行推荐;资源的查重等。
3.4.4 用户检索模块
检索模块为用户提供方便的资源检索功能并提供相关主题内容的资源推荐服务。为了方便用户检索和查看所需要的资源,系统推出了丰富的知识检索功能,如:一键检索、高级检索,以及资源智能关联,方便用户通过多种途径找到目标资源。同时,为了方便用户查看和找到需要的资源,系统还定制了丰富的资源导航功能,如:学科分类、语种、文档类型、最近更新,方便用户通过多种途径找到目标资源。系统自动分析资源的使用情况,生成“热门资源”。通过分析Tag,筛选得到热门Tag。还可以查看到管理员推荐的优秀资源。
4 结束语
藏学文献特色数据库的共建共享是实现藏学资源的广泛传播和交流的基础,但是由于藏学资源分布的广泛性和藏区发展的局限性,使得当下对于藏学资源的收集整理都比较麻烦,藏学文献特色数据库的建设更是一项艰难复杂的长期工作,所以在特色数据库的建设过程中要积极联系其他藏学文献收藏机构,切实确立资源建设的一些规范和标准,充分利用现代技术进行操作,并在实践过程中不断地完善藏学文献特色数据库的建设。
藏学文献特色数据库需要更多的藏学文献收藏机构的参与和建设,保证统一标准下文献资源的共建共享,立足为更多的藏学研究者提供数据资源的同时,还要面向公众普及藏族的风俗文化知识,让更多的人了解西藏、了解藏族,更好地发挥藏族传统文化和知识的魅力。
参考文献
[1]吕桂珍. 藏学文献及藏学文献学刍议[J]. 西藏民族学院学报(社会科学版),1993(2):33-39.
[2]李子. 关于西藏高校图书馆藏学文献资源建设的实践与思考[J]. 新世纪图书馆,2013(5):70-73.
[3]任瑞娟,朱立平,柏丽娜. 网络信息的MARC:都柏林核心集[J]. 情报杂志,2001(12):36-37.
[4]张宏伟,许慧. 基于DC元数据仓储的数字资源整合研究[J]. 图书馆学刊,2014(6):32-34.
[5]周明华,谢春枝,洪正国,等. CALIS“十五”全国高校专题特色库建设情况综述[J]. 大学图书馆学报,2006(4):36-41.