张 洋,张方钢,范忠勇,张晓红,周 昕
(1.浙江自然博物馆,浙江杭州 310014;2.杭州市市区河道监管中心,浙江杭州 310008)
自然博物馆植物标本数字化平台的构建与思考
张 洋1,张方钢1,范忠勇1,张晓红2,周 昕1
(1.浙江自然博物馆,浙江杭州 310014;2.杭州市市区河道监管中心,浙江杭州 310008)
根据馆藏植物标本的特点,制定出一套适合的数字化工作流程,包括完善采集信息、分类鉴定、粘贴条形码、拍摄照片及图像处理及录入信息等。数字化工作面临工作量巨大、难度高、专业技术人才不足等问题,需要资金及时间保证,应通盘考虑、稳步推进。
自然博物馆;植物标本;数字化;数字化平台
文献著录格式:张洋,张方钢,范忠勇,等.自然博物馆植物标本数字化平台的构建与思考[J].浙江农业科学,2015,56(9):1520-1523.
DOI 10.16178/j.issn.0528-9017.20150959
“数字化”从英文Digitize翻译过来,是“使数字化”的意思。我国学者陈宏京在其论著中对“数字化”的定义做出阐释,数字化是“把信息用电磁介质,按二进制编码的方式加以储存和处理,把原先用纸张或化学感光材料记录和存储的事物藏品信息,转变为用计算机存储和处理的信息”[1]。植物标本是植物学工作者长期从事科研活动的积累和人类自然遗产的永久记录之一,是研究物种的分布及其历史、现状、系统演化的证据[2]。植物标本作为保藏植物资源和植物信息的一种基本手段,为植物资源管理和利用提供了重要的科学依据,是其他各种单纯的文字记录所不能取代的[3]。目前,国内针对植物标本数字化的研究主要集中在高校及科研院所,专门针对自然博物馆的植物标本数字化的研究几无报道。本文分析自然博物馆数字化工作的意义和必要性,介绍工作流程,思考和总结数字化过程中的问题与经验,旨在为国内其他自然类博物馆构建植物标本数字化系统起到参考作用。
植物标本数字化工作的起始可以追溯到20世纪,澳大利亚走在前列,20世纪70年代中期开始了标本馆标本的数字化工作[4]。20世纪八九十年代,数字技术和网络信息技术兴起并在短时间内飞速发展,一批植物标本数字化平台在构建。由美国阿拉巴马大学牵头的美国东南部地区各小型标本馆的植物标本信息系统SERFIS起始于80年代末;由美国加利福尼亚州大学Berkeley分校牵头的美国西部地区加利福尼亚植物标本馆标本管理系统SMASCH起始于90年代初,都致力于建立中小标本馆共享数据库,以及致力于数据库的标准化及网络化的工作。英国爱丁堡皇家植物园的PANDORA于1986年开始研制,经过十多年不断的改进,现已成为可包含由标本采集到文献资料几乎无所不包的应用软件[5]。
进入21世纪,全球植物标本数字化工作空前发展。据粗略估计,保藏在世界各大标本馆和研究机构的标本达25~30亿份,估计有5%~10%已被数字化[6];互联网的发展,使大量数字化的标本信息可以被访问。著名的哈佛大学植物标本馆收藏的生物标本现已超过500万份,是目前世界上收藏标本数量最多的十大标本馆之一。截至2015年3月,馆藏标本数据库系统中包含超过526 467份植物标本档案信息和10万份维管植物、苔藓植物模式标本的相关文献资料。除美国外,欧洲许多国家的标本数据库也具有相当规模。荷兰国家植物标本馆在组建后不久,在实体标本馆的基础之上又建立起荷兰虚拟植物博物馆(NHN),目前NHN中已有350 000号植物标本完成了数字化[7]。全球生物多样性信息网络(GBIF)作为全球最有影响、最大的生物多样性信息数据库和服务机构,目前有超过100个国家和机构作为成员加入,超过4.6亿条(截至2014年7月)数据在全球免费共享,其中有经纬度记录的有花植物标本信息达2 700万份。
据粗略估计,我国数百个标本馆共保存植物标本约1 700万份,涵盖中国全部植物物种和世界物种约5万种[8]。在国家自然科学基金和美国科学基金的资助下,我国中山大学植物标本馆于1994年与美国阿拉巴马大学合作研制植物标本数据库; 1997年,在国家自然科学基金的资助下,中山大学又与广西植物研究所标本馆联合研制共享标本数据库,数据库当时已录入近1万份标本资料[5]。2004年,以中科院标本馆为主体,包括部分高校共同参与的“中国数字植物标本馆”(Chinese Virtual Herbarium,简称CVH)开始启动。2007年,最新的中国数字植物标本馆建成,人们通过网络就可以查询到植物的标本、生长地、图像、鉴定信息等相关内容。截至2015年3月,从CVH网站上了解到,数字化标本库已经收录有约331万份植物标本,其中167万份标本带有照片,180万份标本带有地标数据。
2.1 目的
2.2 意义
2.2.1 对博物馆标本深入研究有重要意义
全球化是当今社会的发展趋势,博物馆馆藏资源属于社会共有财富,需要实现全球化共享以发挥其最大作用。这是时代赋予博物馆的新的使命——将珍贵而又丰富的文化种子播散到世界的每一个角落[8]。标本数据输入网络平台,不仅能实现世界植物研究的资源共享,更能使馆藏标本与国际国内研究接轨。数字化使这些标本得到更加广泛的应用,如传统分类学修订,名录和鉴定手册的编辑,植物志的编纂,地理分布图的绘制,物种多样性空间格局和动态的分析,生活史和物候学的研究,珍稀濒危物种的保护生物学,外来入侵物种的管理等[4]。
2.2.2 对博物馆标本的管理有重要意义
平台建立之后,可对馆藏植物标本进行详尽统计和科学管理,能将各个科、属包含的标本数量的数字精确到“个”。对于馆藏标本较少的科可重点采集或征集,提高馆藏标本的存储量,弥补馆藏植物标本的不足,提升藏品质量。同时,采自不同地区的标本数量也可统计,以便对不同地区植物标本有针对性地采集或征集,也可增加标本的地域丰富性。此外,有翔实的数据为依据,选择那些与其他单位进行交换的复份标本将不会盲目。
2.2.3 是博物馆数字化的重要组成部分
进入21世纪,国内各类博物馆的数字化建设发展迅猛。早在“十五”计划期间,我国政府已经将标本资源作为国家重点自然科技资源,并立项对生物标本资源进行标准化采集、整理整合,在此基础上构建国家级虚拟博物馆,实现资源的社会共享。藏品的数字化能推动博物馆的数字化进程,扩大博物馆的服务功能,为博物馆标本收藏与管理研究开辟新的领域,并为这一领域的拓展提出新的思路和途径。
3.观察组和对照组患者病情复发情况:2组CP患者定期随访1年,观察组复发2例,复发率1.4%;对照组复发15例,复发率10.9%。观察组CP患者病情复发率显著低于对照组,差异有统计学意义(P<0.05)。
3.1 浙江自然博物馆植物标本馆现状
浙江自然博物馆植物标本馆建立于1929年,馆藏标本6万余份;被国际植物分类学会注册认可,国际代码为ZM。所藏标本主要为浙江省内高等植物蜡叶标本,以及江西、四川、广西、云南等省份的标本。本馆馆藏的蕨类植物标本采用秦仁昌分类系统,种子植物标本采用恩格勒系统,置于密集柜存放。浙江自然博物馆自2004年起用至今的藏品管理系统,为“亿博”博物馆综合管理信息系统。主要栏目有藏品搜集、藏品登录、综合信息、文档管理、账务管理、资料查看、变动申请、库房管理、综合统计、物种信息等。
目前,本馆植物标本管理面临一些问题:蜡叶标本属于易损易耗藏品,频繁的查阅使用,会导致馆藏标本不同程度受到损坏,研究价值相应降低。此外,我馆的“亿博”藏品管理系统也有不足之处。比如,“亿博”统计的是每个“号”的标本情况,但是一个“号”内标本的份数是没有记录的;再如,采集信息不全和缺乏照片给管理者与使用者造成不便。这些问题的存在使得构建植物标本数字化平台,成为目前本馆非常必要的工作。
3.2 植物标本数字化平台构建的方法
“浙江自然博物馆植物标本数字化与共享”项目是科技部“国家标本资源共享平台”项目(NSII)支持下的“植物标本资源共享子平台”(CVH)课题之一。于2014年初开始,根据馆藏植物标本的特点,制定出一套适合的工作流程(图1)。
图1 植物标本数字化平台构建流程图
3.2.1 完善采集信息
一份合格且有保存价值的植物标本,应包括植物标本本身、标本馆标记、采集记录、鉴定记录等4大方面。采集信息包含采集人、采集号、采集日期、地点、生境、海拔、习性、植物高度、叶、花、果等简单特征及科名、种名、用途等重要信息,完善采集记录成为数字化工作中首要的、必需的前期工作。
3.2.2 分类鉴定
先由植物分类学专家将所有标本逐一、无遗漏地进行分类鉴定,保证绝大多数标本鉴定到种的水平。
3.2.3 粘贴条形码
条形码可谓每份植物标本的身份证,也是数字化平台建成后用于标本管理、查找的有效编码。
3.2.4 拍摄照片及图像处理
照片拍摄是标本数字化中关键的步骤,影像信息在数字化平台构建中具有非常特殊的价值。拍摄植物蜡叶标本所用的器材包括:数码相机、变焦镜头、翻拍架、闪光灯等。
拍照采用RAW格式,得到最原始的照片,可作为原始图像文件的永久性备份格式,以便日后之需。照片拍摄完成后需要后期处理,利用photoshop或者faststone viewer软件,将RAW格式的照片转换为JPG格式(图2),并用条码号重命名照片,使照片与录入信息相对应。
图2 已经拍摄的植物蜡叶标本照片
3.2.5 信息录入电脑
标本信息的录入由专门的录入人员完成,采用中科院北京植物所的Ginko V 3.0系统,实现信息录入电脑。
标本数字化工作任务繁重,需要一定财力支持。一般自然类博物馆的馆藏植物标本总量庞大,导致了工作量的巨大。如馆藏植物标本数量为6万件,仅拍摄照片一步环节为例,以每天拍300张照片为平均值,6万份标本需要拍摄200 d。加上前期准备、后期图片处理、录入电脑,平台初步建成至少需要2~3年。期间,聘请分类专家、拍摄人员、录入人员等,劳务支出较大。时间的投入,经费以及人力物力的保证,是构建好平台的基础。
标本数字化工作是一项有难度、要求严的长期性工作,应通盘考虑,稳步推进。浙江自然博物馆保存的6万份植物标本,采集时间从1929年至今逾85年的跨度,采集地点分布全省乃至全国不同地区;标本采集人员所做的原始采集记录的方式各有不同,一些历史较久远的标本,其标签上大量的手写字体不仅需要辨认,更需依赖于植物学背景知识,这大大增加了标本信息完善工作的难度,对信息转录工作人员及后续的录入人员有较高的要求。其他自然类博物馆也面临同样问题,所以在平台构建过程中,不能贪多求快,应该在保证质量的前提下,稳步推进。
数字化平台建设离不开人才队伍的建设,掌握分类学知识的专家和信息技术的人才是标本数字化的强有力支持。工作中要进行标本鉴定,首先需要专业的植物分类学鉴定专家。标本照片拍摄,图像后期处理、保存、管理,信息录入等工作环节涉及多方面的技术,如摄像技术、灯光控制技术、图像处理技术、图像格式转化技术和保存技术等等,需要信息技术人才。合理利用各类人才,标本数字化工作才能顺利开展,同时,平台构建也需要各类人才通力合作才能完成。
植物标本数字化工作可为其他馆藏藏品的数字化提供借鉴。自然类博物馆馆藏标本门类齐全,珍品荟萃,一般除植物标本外还包含兽类、鸟类、鱼类、两栖类、爬行类、昆虫及其他无脊椎动物标本,以及古生物化石、矿石标本等众多类别。植物标本数字化平台的构建,不仅为国内其他自然类博物馆构建植物标本数字化平台起到表率作用,而且能够为其他门类标本的未来数字化工作提供经验与参考。
[1] 陈宏京.数字化博物馆的原理与方法[M].单机版.上海:复旦大学出版社,2002.
[2] 林春蕊,刘演,何成新,等.广西植物标本馆标本数字化信息统计与分析[J].广西植物,2008,28(2):278-284.
[3] 孙权,周广柱,李竹林,等.蔷薇科(Rosaceae)植物标本及其数字化处理技术研究[J].沈阳农业大学学报:社会科学版,2014,16(3):353-357.
[4] 王利松,陈彬,纪力强,等.生物多样性信息学研究进展[J].生物多样性,2010,18(5):429-443.
[5] 李鸣光,繆汝槐,Xu Zhaoran.植物标本数据库与生物多样性研究[G]//面向21世纪的中国生物多样性保护.北京:中国林业出版社,2000.
[6] Soberon J.Linking biodiversity information sources[J]. Trends in Ecology and Evolution,1999,14:291.
[7] 矫贵松.关于我国自然博物馆生物标本数字化的方法研究[D].长春:东北师范大学,2008.
[8] 傅立国.中国植物标本馆索引[M].北京:中国科学技术出版社,1993.
(责任编辑:张瑞麟)
S 184;S 126
A
0528-9017(2015)09-1520-04
2015-07-12
张 洋(1983-),女,河北保定人,馆员,硕士,主要从事植被生态学和植物分类学研究工作。E-mail:zhangy@ zmnh.com。