中国东北民族史论文数据库的建设

2010-02-09 13:26
长春师范大学学报 2010年12期
关键词:东北检索论文

韩 钢

(长春师范学院图书馆,吉林长春 130032)

1 建库缘起与研究现状

自先秦以来,中国东北地区就是多民族聚居地,是中华民族多元一体大家庭的重要组成部分。生活在这里的人们,通过血缘、文化和政治上的不断渗透、融合,逐渐形成了秽貊、东胡和肃慎三大族系。这些民族的产生与活动,对中华民族的历史产生了深远的影响,因此,历代统治阶层和文人学者都给予充分关注。但历史发展到近代,东北民族史的研究工作却一度陷入歧途和低谷。

中日甲午战后,日本开始觊觎朝鲜半岛和中国东北。为配合其“大陆政策”的推进,以白鸟库吉、内滕虎次郎为代表的一些御用文人,在满铁株式会社的资助下,开始了“满鲜”历史研究,以所谓“满鲜一体”为宗旨,在文献研究上大做文章,割裂部分东北民族与中华民族的密切关系,为其侵略战争张目。我国的一些爱国学者如金毓黻、傅斯年、凌纯声等人对这种肆意歪曲历史原貌的行为予以反击。在这种情况下,一大批关于东北民族历史的研究成果相继出现,掀起了东北民族史地研究的第一次热潮。

第二次世界大战结束后,日本对中国东北民族历史研究逐渐降温,但朝鲜半岛的学者在批判日本军国主义扩张理论的同时,也继承了日本学者的错误观点,开始了满鲜历史的研究。由于历史原因,我国在相当长的一个时期内,对于东北民族历史研究中的一些敏感问题采取回避政策,在一定程度上抑制了学术研究工作的展开,只是日本军国主义的遗毒没有得到有效的肃清。

20世纪80年代以来,随着学术研究氛围的不断宽松,我国对东北民族历史研究不断加强,研究成果大量涌现,形成了中国东北民族史研究的第二次热潮。此间出版的与东北民族史有关的论文索引主要有:中央民族学院科研处1982年编印的《中国少数民族史论文资料索引》;孙进己等编,四平市博物馆1985出版的《东北古代民族史论著索引》;黄定天主编,黑龙江人民出版社1987年出版的《东北史论文资料索引》;中国社会科学院民族研究所图书资料室1988年编印的《中国民族研究报纸资料目录索引》;任万举、乔钊编,长春出版社1992年出版的《九十年东北地方史研究资料索引大全》;刘浦江编,上海辞书出版社2002年出版的《二十世纪辽金史论著目录》等。2002年以来,我校图书馆致力于东北民族史研究成果的搜集和整理工作,已经编印了三种索引,分别是郭淑琴主编的《高句丽历史研究论文索引》、曾宪丽主编的《渤海历史研究论文索引》和笔者编写的《中朝韩关系史论文索引》,以上三种索引均由吉林文史出版社出版。

尽管近来年陆续出版了一批论著索引,网络技术的发展也使知网、万方、维普等网络数据库成为学者手中越来越重要的工具,但由于种种原因,这些已有的检索方式仍然存在着诸多不足。首先,覆盖面不够宽。各种索引编成之后没有进行补充和扩充,无法及时反映学术研究工作的进展,而大陆各网络数据库关于1982年以前和港台出版的论著仍付诸阙如。其次,检索效率不高。现有的大多数索引或网络数据库,都是面向范围较广的读者编写的,专业性不足,其检索结果中必然包含着大量与东北历史民族问题无关的数据,无法使从事专门史研究的专家学者高效地利用。最后,数据加工不够深入。由于人名、地名以及其他专有名词具有多样性和复杂性,如果不能建立相应的对照词表,则不能在一名多人、一地多名等复杂情况下,提供行之有效的检索方式。

在当前情况下,要将学术研究不断推向深入,有必要对20世纪以来东北民族史研究成果进行充分的搜集与系统的整理。因而我们建设了中国东北民族史论文数据库。

2 数据采集

数据采集工作看似简单,但其完成的质量,却直接决定着一个数据库的实用性和有效性。[1]因此,应该花大气力,广开渠道,采取灵活多样的方法对这一学科的研究成果进行深入挖掘,更为全面地反映东北民族史研究的发展脉络,切实体现最新的研究成果。为此,我们采用了多种手段开展数据采集工作。

第一,编写关键词表和重点作者表,使其成为我们开展网络检索和手工检索的重要依据。为了保证论文收录的广泛性,我们专门编写了关键词表,其内容主要包括与中国东北民族史有关的人名 (含字、号、别号、室名、斋名等异称)、地名、事件和书籍等专有名词,力争达到覆盖全面的目的。同时,为了更高效地反映该方向最具代表性的论著,保证数据库的权威性,我们也编制了“重点作者表”,涵盖了百年来从事这一方面研究的中国、日本、朝鲜、韩国、俄罗斯以及欧美诸国的主要专家学者,以免在建库过程中遗漏这一部分学者的成果。

第二,整合知网、万方、维普等网络数据库和已出诸索引的数据,辅以手工检索馆藏过刊等方式,保证20世纪80年代以来国内大多数期刊、报纸和学位论文数据的完整性。对于手工检索所得的论文,自行制作PDF文档。

第三,充分利用港台网络数据库,广泛搜集相关研究成果。在检索过程中,我们有针对性地选用了部分台湾网络数据库来补充台湾、香港的研究成果。其中,台北“国家图书馆”的“台湾期刊论文索引系统”和“中华文化研究论文目录”、华艺数位股份有限公司的“中文电子期刊服务”(CEPS)用于检索台湾地区出版的期刊;台北“国家图书馆”的“台湾文史哲论文集篇目索引系统”用于检索港台地区出版的论文集细目;台北“国家图书馆”的“台湾博硕士论文系统”、华艺数位股份有限公司的“中文电子学位论文服务”(CETD)和台北中山大学的“OAI博硕士论文联邦查询系统”用于检索港台地区发表的博硕士学位论文。

第四,加大文集论文的搜集整理工作,扩大特色数据库覆盖范围,使其更具专业性。在期刊论文和学位论文方面,现有的网络数据库都做得比较好,需要我们补充的范围并不大,而文集论文则没有得到他们足够的重视,需要我们自己去补充的内容较多。为此,我们采用网络采购和走访专家学者与各高校图书馆相结合的方式,搜集了一批针对性较强的论文集,并扫描、制作成PDF文件,同时著录入库。通过这项工作,使数据库条目数量上升了接近30%,极大地丰富了数据库内容,也使得该数据库获得了不可替代的优势。

第五,挖掘论文注释,扩大收录范围。指定专人详查“重点作者”发表于核心期刊的论文,寻找为其引述而数据库失载者。有的论文或因发表时间较早,或因所载出版物流传不广,所受关注不多,以致各种索引、数据库都未著录。而专家学者往往毕生浸淫东北史研究,常见他人所未见,为其引述者,必有其存世价值。

3 架构与分类

建库前,我馆在选题策划、设计开发、采集建库等方面制订了详细的计划,确立“精品意识”,坚持“实用价值”。在建库方式上,突出标准化、规范化,确保数据库运行状态稳定、检索功能强大、网络连接通畅。建库软件采用微软Access,该软件的通用性强,无论在校园网上架设单独的网站或将来整合入TPI都能方便、快捷地实现。为显示、检索大量的非常用字,数据库编码选用Unicode(又称统一码、万国码、单一码),该编码采用十六进制编码,包含了中、日、韩汉字六万余个字形[2],能够基本满足需要。

我馆建库人员在框架结构的设计开发上,综合了从事专门史研究的多位专家的意见,经过长时间的研究和讨论才最终确定。对于东胡族系,虽然以孙进己先生为代表的一批学者不赞成将其纳入东北民族史范畴[3],但我们认为,要更全面地反映东北民族史的研究状况,仍应部分采纳金毓黻先生的观点[4],将蒙元灭宋前有关东北史的内容收入。至于清入关后的内容,则已经脱离东北民族史的范畴,不予采录。

目前该库下设秽貊族系、东胡族系、肃慎族系和其他民族四个子库,在子库基础上,又以各族系在不同时代的民族政权为线索,延伸出次一级共14个版块,从而形成了较为完整的“中国东北民族史论文数据库”,具体结构如下图所示。数据库的著录项目主要包括:题名、责任者、责任者单位、出版物、年、月、卷期、另见、译自、起止页、备注等项。

图1

由于数据库收录论文众多,受人员、资金等方面条件的限制,目前该库仅提供题名、责任者和出版物三种检索方式。在电子论文制作方面,统一采用PDF格式,分辨率定为300dpi。对于发表多次的论文,在制作电子论文时统一选用其最终版本。

4 结语

在拟定之初,我们就确定了两种成果应用形式,即在校园网架设网站和整理出版《中国东北民族史论文索引》。

建成后的“中国东北民族史论文数据库”收录20世纪初以来中国、日本、朝鲜、韩国、俄罗斯以及欧美诸国公开或内部出版的中国东北民族史论文一万五千余篇,其中包含大量的知网等网络数据库未收数据。课题结项后,在校园网建立相关网络检索平台,面向校内用户提供题名、责任者和发表出版物三种检索方式。为保护知识产权,网络检索平台暂时不提供全文下载服务。

《中国东北民族史论文索引》已经完成初稿,全书分为总论、东胡族系、秽貊族系、肃慎族系和其他民族,共五大部分。各部分又以民族政权为脉络分为若干章,每章下设总论、政治、经济、文化、军事、地理、对外关系、民族与民俗、人物、考古、书评等11大类,每类下设若干细目。条目依发表年代和题名汉语拼音为序。后附作者索引和题中所见人名地名索引。

特色数据库的维护与更新,是确保数据库生命力,保证数据库正常运行,获得社会效益和经济效益的前提。数据库建成后,数据的修正、维护和更新是一项长期的工作,不可轻视。[5]对于数据库建设中出现的一些错误必须给予更正,而学术研究的不断发展,必然会有更多的成果陆续涌现,必须对数据库进行定期更新。只有这样才能保证数据库的及时性、有效性和权威性,否则数据库将成为数据孤岛或死库。

[1]杨昌顺.基于OPAC的图书馆馆藏资源整合[J].贵州教育学院学报:社会科学版,2006(5):102-104.

[2]王玉然.图书馆信息采集数字化处理的基本技术[J].农业图书情报学刊,2008(7):25-26.

[3]孙进己.关于东北民族史研究的一些问题[J].民族研究,1999(5):70-80.

[4]金毓黻.东北通史[M].长春:社会科学战线杂志社,1980:23-32.

[5]于丽滨.关于高校图书馆自建特色数据库的探讨[J].图书馆建设,2007(5):44-46.

猜你喜欢
东北检索论文
MADE IN CHINA
Make ’Em Laugh
每到冬天,东北就变成了“冻”北
大东北的春节
专利检索中“语义”的表现
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文
国际标准检索