曾朝辉 王俊杰 刘晓丽 夏晓飞 程晓 李健文
摘 要 北京自然博物馆结合生物分类系统与数据字典技术开发出生物分类字典,运用到藏品信息管理系统中,并以其在数据录入、物种统计等方面的实际应用为例,探讨生物分类字典在自然类博物馆中推广的可行性。
关键词 生物分类字典 自然类博物馆 藏品信息管理系统
0 引言
藏品是博物馆业务活动的物质基础,所有社会教育和服务、陈列、研究都离不开藏品。藏品的数量和质量决定了博物馆的规模和地位。对自然类博物馆而言,馆藏标本的种类和数量尤其重要,必须及时、准确地获取馆藏物种丰富度,掌握馆藏空白物种情况。目前,自然类博物馆的藏品信息管理系统中,信息录入的工作量相当大,且不能直接生成馆藏标本名录。因此如何运用数据库技术提高工作效率,是我们迫切需要解决的问题。
数据字典是用于保存数据元素(数据项)和数据特征的说明文件。通過数据字典可以生成有关数据规模、类型、格式以及含义的报告。它实际上就是“关于系统数据的数据库”。最初用于数据库管理系统,在系统开发过程以及系统运行后的维护阶段起着重要作用,如确保数据在系统中的完整性和一致性;实现系统内部数据模式、代码与图式图例标准化,进行信息交换、数据共享以及集成化统计、分析等综合处理工作;相互参照,便于系统修改。
数据字典技术在数据处理方面具有明显的优势。自20世纪80年代开始,经过多年发展,这项技术取得了很大的进步,广泛应用在多个领域,诸如网络渔业词典、地质灾害数据库等。北京自然博物馆将数据字典技术与生物分类系统结合,引入到藏品信息管理系统,实现馆藏物种种类、数量和空白物种情况在不同分类阶元层级上的直观展示和统计。
1 生物分类字典的概念
生物分类系统是阶元系统,由界、门、纲、目、科、属、种七个分类阶元组成。根据生物之间相同、相异的程度与亲缘关系的远近,使用不同等级特征,将生物逐级分类。目前,生物分类学上使用较广的是五界分类系统,由美国生物学家魏泰克(Robert Harding Whittaker)于1969年提出,把生物界分成了原核生物界、原生生物界、真菌界、植物界和动物界。如表1所示,以动物分类系统为例,任何一个已知的动物均可无例外地归属于这些阶元之中。
生物分类字典从数据字典演变而来,并针对自然类博物馆的藏品特点进行开发。生物分类字典中的内容具有相关性,其中的每一条记录都有与其相关的父记录或子记录。这也是生物分类字典与数据字典的本质区别。也就是说,数据字典只能在字段的根项下扩展子项,而生物字典则可以组合多个字段,并设定这些字段的上下层关系。通过把每个字段下的某一项与其上的某一项进行关联,形成一组有关联关系的指标组,当实际调用任意一层的内容时,与其相关的字段也会自动带入。
2 生物分类字典的建立和实现
生物分类字典是在分析借鉴现有的生物分类学研究成果和已公布的中国生物物种信息名录的基础上,利用现代信息技术建立的一套基于Web的生物分类系统。其由软件工程师编写程序,预先导入分类系统数据。如表2、表3所示,在生物分类字典的建立过程中,分类阶元的层次关系通过关系数据库实现。
在实现数据检索时,我们选择了适用于中小型数据库的Windows 2000+Internet Information Services+SQL Server配置,并采用目前比较流行的ASP语言动态读取客户端页面,对后台进行实时更新及维护。如图1所示,整个数据库由后台管理模块和前台检索模块组成。后台管理模块主要负责阶元的添加、修改、删除和校对;前台检索模块主要负责阶元的展示和统计。
3 生物分类字典的基本功能
3.1 自动调取藏品分类信息
过去在登录藏品信息时,编目中的分类信息需逐条输入相应的字段里,录入速度慢,且容易出错。如图2所示,在新的藏品信息管理系统中,借助生物分类字典,一旦录入物种名称后,便可直接从后台调用其对应的学名、界、门、纲、目、科、属、种以及保护级别、濒危等级等信息。
3.2 快速查询和统计馆藏标本
生物分类字典凭借多层级分类阶元,实现了馆藏标本信息的可视化展示。通过点击分类系统树,便可查看本馆物种的种类、数量以及藏品的详细情况。同时,还能生成某一门类的馆藏标本名录,并支持文件导出和在线打印,为馆内外科研人员开展学术研究与交流提供方便。
3.3 动态显示馆藏物种总数
根据生物分类字典的统计结果,在藏品信息管理系统的首页动态显示馆藏物种总数。这种方式同样也适用于属、科、目等层级。另外,我们可以通过查询数量为0的物种来了解馆藏空白物种,为今后的标本采集、征集和馆际交换工作提供参考。
4 生物分类字典的优势
4.1 提高存储效率,节省存储空间
数据字典的主要目的是实现关系数据库的共享、重用、交互。数据字典在整个数据库管理系统中独立形成一个文件,以指针映射类型将内容对应到不同管理对象的记录中。这样通过数据字典的继承关系和标准化描述,运用分层式树状结构调取数据,减少了同质信息,避免数据库中大量数据的重复存储。
4.2 简化数据库系统的维护
基于最新的研究进展,生物分类系统要对一些物种的分类阶元进行调整,如拆分或合并物种、提升物种地位、整理物种名称(包括同物异名)等。不同于以往的繁琐流程,现在我们通过修改生物分类字典,即可快速更新相应馆藏物种的分类地位和从属关系。笔者建议每年统一修订一次生物分类字典,以保证内容的科学、准确。出于数据库安全的考量,必须由专业人员负责数据的批量修改,并及时进行备份,以防止因操作不当造成的数据丢失。
5 生物分类字典的应用前景
自然界生物门类众多,数据量庞大,建立哪些门类的分类系统,主要取决于本馆的馆藏情况。北京自然博物馆的收藏以动物、植物、古生物、古人类为主,因此在《GB/T 15628.1—2009 中国动物分类代码第1部分:脊椎动物》和《GB/T 14467—93 中国植物分类与代码》的基础上,我们查阅了近些年发表的新物种记录,建立了动物界脊索动物门、节肢动物门昆虫纲和植物界被子植物门、裸子植物门的生物分类字典,其他门类之后也将视情况陆续录入。
经过三年的实际运行,北京自然博物馆开发的面向自然类博物馆的生物分类字典功能模块取得了良好的效果。在开发过程中,我们将国家标准分类术语代码引入建模系统,使用标准术语来辅助设计。因此,生物分类字典是一个标准化的数据字典,可以移植到各个不同类型的藏品信息管理系统。同时,若将全国自然类标本登录到同一平台,在标本查询、物种统计等方面能起到统一和规范的作用。
参考文献
[1]北京博物馆学会.博物馆藏品保管工作指引[M].北京:中国书籍出版社,2012.
[2]吴维宁.网络渔业词典中水生生物分类系统的建立和实现[J].上海水产大学学报,2003(1):56-60.
[3]吴林寰,刘翟,杜晓萌,等.生物信息数据库通用数据字典标准化研究[J].科技创新导报,2009(26):10,13.
[4]赵新颖,汤卓炜.从古生物标本的整理分类及其检索看自然博物馆的库房管理[J].博物馆研究,1996(1):82.