浅议高校图书馆人物库资源建设

2014-09-22 10:18杜晶双
河南图书馆学刊 2014年7期
关键词:元数据信息采集

关键词:名师库;信息来源;信息采集;元数据

摘要:文章总结了北京师范大学图书馆《名师库》建设中有关名师划分范围和标准、名师库元数据结构、名师信息来源的选择和甄别以及建库过程中信息构建的一些经验和体会进行了阐述,并结合北京师范大学的特色和优势进行了讨论。

中图分类号:G250.74文献标识码:A文章编号:1003-1588(2014)07-0032-03

收稿日期:2014-06-19

作者简介:杜晶双(1966-),北京师范大学图书馆馆员。1概述

1.1人物数据库的现状和意义

人物数据库是对在某一乃至多个领域对人类社会做出特殊贡献的典型人物相关信息的集中收录[1]。而高等院校名师库则是对在高等院校的教学、科研以及高等院校发展过程中做出特殊贡献的科学家相关信息的集中收录。从2011年3月开始,在国家CALIS项目的支持下,许多高校开始了各自的学术名师(人)数据库的建设。高校名师资源具有重要的保存和利用价值,整理和总结这些信息对于弘扬历史具有重要的指导意义。如何收集、归纳和整理这些信息,是决定这些信息准确性和可利用性的关键。以往在理论层面曾就高校名师数据库构建有过很多报道[2-3],然而有关名师数据库建设中名师的界定尤其是近代名师和“文革”前名师的划分标准,学术名师信息的来源选择、甄别等工作的报道却较少。加之每一所高校的属性、地理位置和发展历史不同,每一所高校对学术名师库的建设和信息来源筛选标准也各具特殊性。科学、规范收集和整理这些学术名师信息资源,不仅可以扩大高校图书馆的社会影响,突出学校的学术特色,吸引名人资源,同时也可以更好地为教学和科研一线服务。

1.2人物数据库建设面临的问题

北京师范大学肇始于1898年晚清时期的京师大学堂师范馆,是戊戌变法失败后唯一保存下来的高等学府,1900年因庚子之役而撤销,1901年清政府管学大臣张百熙受命重建京师大学堂,迄今已有百余年历史。期间先后有一大批名师先贤在这里弘文励教。这些专家既有驰名海内外的各科大师、学者和专家,也有关心教育事业的政治家。然而,如何从这些名人中筛选学术名师却缺乏一个统一的标准。另外,以往的人物介绍主要以传记方式平面展示学者的生平、生活和学术贡献,缺乏全方位、立体展示名师生活和学术历程的资料信息库[1]。同时针对数据库的信息资料来源选择、信息库结构建设等方面也缺少可资参考的资料。

2元数据设置

2.1人物选取

数据的搜集和采集取决于名师库的元数据结构。在进行数据搜集和整理之前,首先设置名师库的结构。每个学术名人信息都具有生物属性、社会属性和精神属性。这些属性与时空等元素结合,在人的生命周期中构成了以时间、地点和行为活动为主的个人活动三维空间[1]。根据《名师库》建库的需要,首先制定北京师范大学图书馆(以下简称北师大图书馆)名师数据库的人物收录范围和收录标准。北师大图书馆《名师库》建设主要依托于机构知识库的平台,侧重该校自建校以来的名师,包括曾在京师大学堂、北京女子师范学校、辅仁大学以及1952年院校合并后曾在北师大任教的名师。其中,对“文革”后名师的划分标准主要参考以往的划分标准(姬秀丽,2010;申细秀等,2009)进行筛选。主要包括:中国科学院、工程院院士(原称学部委员)和资深教授;曾在北师大学习或者工作过,在国内外其他单位获得院士荣誉的专家;长江学者奖励计划获得者、国家自然科学基金委杰出青年基金获得者、教育部跨世纪优秀人才获得者;高等学校教学名师奖获得者;国家重大基础科学研究项目比如973项目首席科学家;国家批准有突出贡献的中青年专家等。

对“文革”后学术名师的界定和筛选相对比较容易,而对京师大学堂成立伊始到民国时期再到“文革”前名师的界定则相对困难。一是参考资料缺失现象严重,二是该历史时期各类学术头衔和荣誉的设立不像现代那么明确和清晰。三是学术名师的划分标准与学校特色和发展历史息息相关,缺少可以直接参考的标准。为此,建库过程中曾与学校校长办公室、人事处、档案馆等部门多次协商和讨论。同时参考北师大校史和年鉴,确定京师大学堂成立以来至“文革”前的学术名师划分标准。即首先参考北师大确定的《世纪名人》名录,确定世纪名人17人。其次,根据文献中记载或提及从京师大学堂到“文革”前曾在北师大任教并有过重要学术贡献(不论是在北师大还是外单位取得)的专家、学者信息,然后再辅以北师大校史和年鉴佐证后确定是否入选。

2.2元数据的设置

基于上述的收录范围和标准,根据北师大特色和教师特点共设置了20项元数据:即个人基本信息、学习经历、学术科研论著、学术科研项目、学术影响、学术生涯、学术评价、年谱、图片、视频、延伸阅读、曾任职机构和参考文献等,每一级栏目下设多个子栏目,目的是全方位展示每一位名师的个人信息和学术造就。个人基本信息中包含有:姓名、曾用名、生卒年月、性别、国籍、民族、籍贯、最终学位、最终学历、职称和头衔,内容详尽。这不仅要求人物的详细个人信息,还要求围绕着名师在各个方面的成就进行揭示和挖掘,以及后人对已故名师的研究,体现在延伸阅读栏目中。年谱包含生平年谱和学术年谱。这样就构成一个学术名师人物数据库,供读者网上查询和全面了解名师的成就。

3人物信息的搜集和收集

杜晶双:浅议高校图书馆人物库资源建设杜晶双:浅议高校图书馆人物库资源建设人物信息由人物自身信息和人物相关信息组成。信息类型包括文字、图片、音视频。载体上表现为个人主页(或网站)、电子期刊、图书(或电子图书)、知识库、博客、相关网站等。人物信息的搜集与整理,主要通过手工搜集和自动搜集整理模式[4]。鉴于北师大历史名师信息的特殊性,信息搜集和收集主要以手工搜集整理完成。信息搜集采用两种方式:一是搜索引擎检索和数据库检索[5-6],范围由小到大,途径由简到繁。对所检索结果进行再分析、挖掘,延伸到其他资源检索,环环相扣。即依据网络进行跨媒体素材检索,获得少量的人物信息特征,然后通过逐步调整搜索策略迭代搜索,最终获得搜索对象的全部真实人物信息以及信息分析的复杂检索过程[7]。二是收集传统的图书和期刊中有关的人物信息。这种信息完全依赖于北师大图书馆丰富的馆藏资源。此外,为保证信息的可靠性和准确性,信息收集过程中均选择官方、正式出版的或个人发布的信息来源为准。同时,基于开放获取(Open Access)学术资源正成为主流学术信息资源,将名师的学术论著以全文的形式收集保存,并提供相应名师信息的参考文献。

4人物信息的来源

名师信息是人物的真实写照。人物信息的质量,与信息的来源密切相关。在当今的网络时代和信息爆炸时代,人物信息资源遍布每个角落,数量大、来源广泛、传播快等特点,但使用过程中需要加以仔细分析和甄别。纸制载体中拥有的人物信息资源较少,通常隐藏在附录以及回忆和旁注中,但是都为正式出版物,准确性优于网络资源。在建库过程中将这两种信息来源结合使用,信息量大,可供分析的余地大,获得的资源也就更加准确和有效。

4.1纸质载体

借助于图书馆丰富的纸本资源,可以获得准确和较全面的名师生平简介和学术成就,这部分内容可以通过图书馆的OPAC检索,检索点选择姓名、院系名称,范围是书名、作者、关键词等。以获得相关图书馆藏目录,获取索书号,然后入库查找(北师大《名师库》所检索的纸质资料)。

4.1.1传记类文献。是一种记载人物生平事迹的书籍,包括人物传记、生平事迹、自传、访问记、年谱、日记、书信、照片等,清末、民国和建国初期曾经在北师大任教的教师,几乎都有此类图书的出版,内容详尽,既可以成为名师库的基本素材,同时也可以作为搜索网络资源的起点。通过点线的连接,编织名师库的网状信息库。例如:《陈垣传》和《高步瀛传略及传略后记》等。

endprint

4.1.2评论性文献。即对人物的评价,包括学术评价。通过评价性的文献,可以获得一些学术成就方面的检索词,以便网络和数据库检索时使用。

4.1.3学术文集。是名师所有在正式刊物上发表的论文、著作等的全文集成或目录。这部分内容能全面反映名师的学术成就以及学术方向,为以后查找全文带来方便之门。

4.1.4纪念文集。为纪念某一重要人物或重大事件而编撰的文献集。一些名师在学术界成就斐然,后人为了怀念和重温他们的感情和成就而发表的纪念性文章。在这类文集中可以找到并梳理出一些个人信息,比如名师的弟子以及师徒关系谱系。

4.1.5回忆录。记录自己所经历的生活或所熟悉的历史事件,可以是个人回忆录,也可以是集体的回忆录,都是围绕着人的叙述和描述。

4.1.6校史。反映的是一个单位的发展史,其中包含有历史发展过程中的很多重要人物。很多学校都非常重视自己的历史,编辑并出版,校史也是人物数据极好的素材和来源。

4.1.7年鉴。是全面、系统、准确地记述上年度事物运动、发展状况的资料性工具书。是汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书。它博采众长,集辞典、手册、年表、图录、书目、索引、文摘、表谱、统计资料、指南、便览于一身,具有资料权威、反应及时、连续出版、功能齐全的特点。常设的栏目有:文献 (包括文件和法规)、概况、文选和文摘、大事记、论文集要、统计资料、人物志、机构简介、附录等。根据年鉴中人物志部分信息为名师库提供的人员名单的确定有一定的帮助。

以上均可以作为人物生物属性信息的主要来源,然后手工录入到EXCEL表单中,发布系统统一收割入库,这样获取的名师内容信息翔实,并具有很强的可靠性和准确性。

4.2网站/网页载体

在纸本载体的成果下,进行网络资源搜索,利用搜索引擎,并不断调整搜索策略,选择搜索词,可为我们提供上万条的信息,而后采取链条式和切入式,对得到的各种信息进行缜密的梳理,获得较完整的信息搜索结果。不过,在北师大《名师库》建设中,对大部分的现代名师,采用的是网站/网页载体的检索和信息收集。

4.2.1学术团体官网。许多教师都是行业的学术团体或者学术刊物的会员或者编委。在这些学术团体或者学术刊物的网站上,通常会有这些教师的基本情况介绍。

4.2.2个人网站。网络的发展为人们提供一个平台,以展示自己的学术经历和工作经历,以及个人的观点和看法。许多教师都有自己的个人网页或其所在单位有每一位教师的个人简介,其中包括学术兴趣、著作和联络信息等。

4.2.3学术圈、博客。此载体主要涉及现代的一些名师活动轨迹和学术观点。

4.2.4百度百科和维基百科的人物栏目图文并茂,有很强的参考价值。不过,在引用过程中,需要注意信息的真实性。

4.2.5论坛、在线购物网站。这些网站对商品有一些描述,可以查找到人物著作的出版信息。

4.3数据库载体

数据库的查找,首先要充分了解数据库的特性和功能,直接进行检索查找,在节省时间的同时可以高效地获得所需信息。

4.3.1CNKI数据库/万方/维普/ISI,期刊数据库中保存的是名师曾经和近期发表的文章,有些期刊附带著者的简介,提供出生年份和所在单位名称等,由此可以勾勒出人物的职业生涯和学习生涯。

4.3.2读秀知识库。是由海量图书文献资源组成的大型知识库,集文献检索、试读、传递功能为一体,是唯一可以实现内容检索的数据库。可综合采集各种文献中与名师有关的资源。

4.3.3大成老旧期刊数据库(或晚清/民国期刊全文数据库),提供晚请和民国时期的期刊全文。对于收集晚请和民国时期人物的信息和论著的收集有很大帮助,而且提供全文服务。

4.3.4大学数字图书馆国际合作计划 (CADAL),该数据库包含的年代全、范围广,在北师大《名师库》的学术论文栏目的建设中起到重要作用。

4.3.5北京师范大学学位论文库。名师库中有一个栏目是学生和导师,论文库可以清晰查找到名师毕业的年限、学科背景、导师姓名、研究方向,以及学术弟子/导师等信息。

4.3.6北京师范大学图书馆OPAC馆藏目录库,名师已出版的著作的基本信息都可以在图书馆的馆藏目录库中找到答案。

4.3.7中国高等教育数字图书馆(CALIS),期中的网络资源导航提供学科导航,有学科背景的名师所在的系别和个人的网站,在这个数据库中得到体现,以减少搜索引擎带来的排查过程,事半功倍。

4.3.8超星学术视频站。可以填补人物影视频的需要,例如课件、演讲、课程等。

在北师大《名师库》的建设过程中,依照北京师范大学的特色和优势,确定了名师的划分标准和范围,并对名师信息资源进行了甄选,采用理论和实践相结合,自动和手动检索相结合,对人物进行完整、详细、全面和准确的揭示。希望本文能够为其他兄弟院校人物数据库的建设提供借鉴。

参考文献:

[1]张晓源.人物数据库人物收录标准研究 [J].图书与情报,2006(1): 69-79.

[2]吴桂金.东北林业大学名人数据库的建设 [J].大学图书馆学刊,2006(1): 42-43.

[3]张文华等.基于B/S的临川文化名人数据库的设计与实现 [J].科技情报开发与经济,2009(30): 3-4.

[4]漆良藩.数字图书馆网上信息的搜集与整理 [J].江西图书馆学刊,2009(2): 31-32.

[5]严亚兰.因特网上信息搜集初探 [J].网络资源与建设,2001 (1): 52-54.

[6]徐连芳.社会科学文献检索与利用[M].成都: 四川教育出版社,1990:232-282.

[7]沈阳等.社会性人物搜索研究 [J].图书情报工作,2009(2): 66-68.

(编校:马怀云)

endprint

猜你喜欢
元数据信息采集
基于来源的组织机构元数据构建研究
基于Internet的网络化交通信息采集系统
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
如何提高卷烟零售市场信息采集的有效性
财会信息资源元数据标准的研究
基于隐语义模型和用户信任的个性化推荐模型