段晓林
(上海师范大学图书馆 上海200234)
民国文献是指1911至1949年在中国国内出版的图书和报刊。据《民国时期总书目》统计,民国时期我国出版的中文图书达10余万种,期刊2万多种,报纸1.3万多种。这个时期的历史、文化都凝结在民国文献中传承了下来,其文献价值亦不在古籍善本之下,学术界有“新善本”之说,极其珍贵。近年来,民国文献的保护和利用越来越受到重视。各大中型图书馆及出版机构都在积极开展以保护为目的的民国文献整理与开发利用,并取得了卓著的成绩。
2011年,依托上海市教委085内涵建设项目,上海师范大学图书馆启动馆藏民国文献整理,开展“馆藏民国教育文献全文数据库”(以下简称“民国教育库”)的建设,在对民国文献的保护、整理,对专题文献的开发、利用方面,取得了一些成绩。
国内图书馆界近年来比较重视民国文献的整理和利用,目前已有许多大型综合性民国文献数据库,比如国家图书馆的“民国中文期刊资源库”、上海图书馆“民国时期期刊全文数据库”、大学数字图书馆合作计划(CADAL)的“民国期刊全文数据库子库”以及“大成老旧刊全文数据库”等。专题性数据库的建设则有国家图书馆“民国法律文献库”、上海图书馆“近代民国中医药专题库”、南京图书馆“中国近代文献图像数据库”、北京师范大学图书馆的“馆藏解放前师范学校及中小学教科书全文库”、人民教育出版社“中国百年中小学教科书全文数据库”及广西图书馆“广西民国照片数据库”等。
较之综合性数据库,目前国内专题数据库开发还存在选题少,开发深度不够等缺点,但专题数据库在主题标引、类目设置、检索点配置等方面更加细化和专业,可以为相关学术领域提供更全面而专业的文献导引服务,也更能满足相关领域研究者的学术需求。因此,以特定选题汇集某一学术领域期刊和论文的特色专题数据库,应该是图书馆民国文献特色数据库建设的一个发展方向。
从期刊藏刊量、种类及数据库建设力量上来说,上海师范大学图书馆肯定无法与国图、上图等大型图书馆相比,但上师大馆藏民国期刊中的教育类、文学类等文献,则有着自己的特点及优势,而这些种类的民国文献,尚没有图书馆开发及整理。同时,教育学作为学校重点优势学科,文献需求强烈,教育类文献的借阅率明显高于其他学科。因此,根据对国内数据库建设现状、馆藏优势的分析及学校学科发展的要求,上师大图书馆确定了以馆藏教育类文献为主要的数据源,自主开发民国文献专题数据库,开展民国教育文献全文数据库的建设。
上师大馆藏解放前出版的报刊近千种,期刊合订本两万余册,其中,民国教育类文献有着比较丰富的馆藏,有关教育的专业期刊140余种,收藏数量和种类较多,涉及民国时期教育的各个方面。比如《教育杂志》《教育研究》《职业与教育》《教育论坛》等民国时期一些大型或重要的刊物,《江苏教育》《福建教育》《上海教育》等反映地方教育的刊物,《民众教育通讯》《辽宁教育公报》《北平市教育行政周报》等刊载教育新闻的刊物都有收藏。
值得一提的是,上师大图书馆还珍藏了一批清末及民国时期的教科书,各类中小学教材达数百种、近3000册,这些老教材是民国时期中小学生学习的教科书,从中可以反映当时的教育理念和价值取向,对研究民国中小学教育、民国教育理论,具有重要的价值。
为了既提供利用,又很好地保护民国珍贵的文献资料,上海师范大学图书馆从2009年起即开始尝试民国期刊数据库的建设。2009年建成“馆藏解放前报刊题录数据库”,2010年起开展“馆藏民国期刊篇名数据库”建设。通过初步的文献开发整理,实现了民国期刊信息检索数字化,同时,也摸清了家底,为全文数据库的建设,积累了经验。2011年,依托市教委085内涵建设项目,“民国教育文献数据库”的建设得以开展。
“民国教育文献数据库”的软件设计完全依靠馆内技术力量自主研发,数据库建设之初,数据库使用者与技术人员就图片存储格式、上传方式、目录著录等进行多次循环往复的讨论和修改,软件设计逐渐得以完善。目前软件的后台通道,可以提供全文图片的传输、存储、目录编辑、工作量统计、权限设置、检索点配置等操作功能;而用户界面,则通过自动化查询系统为用户提供快速访问、查询、阅览、下载等服务。为方便读者使用,系统配置了内容导航、作者导航、刊名导航和虚拟资源导航等多个版块。
近年来,民国期刊的影印出版整理取得了卓著的成绩,从建国以来单刊影印形式,逐渐过渡为专题期刊的汇编,并且已经有一些文献深层开发的专题论文影印汇编本出现,如国家图书馆出版社2009年以来陆续出版的《春秋学研究》、《敦煌学研究》等。但就图书馆的全文数据库建设而言,几乎都是综合数据库,专题的民国期刊数据库非常少,而进行深层次论文挖掘整理的数据库则几乎没有。论文汇编形式的文献整理,能全面反映民国时期的某领域的学术成就,也更能体现文献整理水平和学术水平。“民国教育库”在文献深层次整理开发方面借鉴了国内近年来出版整理的经验,进行了有益的尝试,不仅汇集了民国时期出版的教育类刊物、民国时期老教材,还深入到文献的知识单元层面,析出了发表于其他大量的各种非教育类刊物中的教育学相关文章,整合于一个数据库内,这在民国专题数据库建设中,尚属首次。
目前国内几大民国文献全文数据库在检索信息的设置上存在缺陷,国家图书馆和CADAL的民国期刊库都没有篇名、作者信息,导致读者只能查到期刊卷期,无法从篇名、作者角度来查找期刊,大大影响到全文库的使用效率。针对这一不足,“民国教育库”在设计之初,就把篇名、作者、主题词、内容提要的著录,作为与刊名、卷期、出版信息及全文图片同等重要而必须的著录项目,尽量多地揭示文献信息,让读者获取更多的检索途径。同时借鉴古籍整理的经验,建立民国教育文献分类表和主题词表,为教育文献提供更加细化、更加专业的规范主题标引。
(1)页码 民国期刊的页码编排方式可谓五花八门,有些期刊页码每期顺延,有些每篇文章或每个栏目一个页码,有些期刊同时存在总页码和分期页码两种形式。在数据库建设中,我们采用了以卷期为单位,系统自动排定流水号以记录文献排列顺序,同时设置页码著录字段,照原书标识著录页码,如实保留原刊页码形式,保证了图片与相应文章做链接时不会出错,避免读者全文阅览时出现著录页码与图片标识页码不符而带来误解。
(2)卷期号 民国期刊的卷期标识,也多种多样,比如有“第1卷第1期”、“复刊第1号”、“春季号”、“创刊号”等多种形式,为避免自行编号给读者带来误解,数据库建设中,严格按照期刊封面或版权页所标识卷期形式著录,以使图片和著录文字两相对应。
(3)广告与图片 民国期刊大多都会有广告插入,而教育期刊中的广告,通常以教育类新书、教科书的发布为主要内容;期刊中所附的图片,则大多是一些学校的老照片或教育界人士的影像。这些广告和图片,也是民国教育史、近代教科书研究的重要史料。“民国教育库”在建设过程中,很注重广告和图片材料的采集,设置了专门的“广告”、“图片”选项,并为这些广告和图片编辑文字说明,进行题名、主题标引,为读者的检索和查阅提供尽可能多的信息。
(4)年代 民国期刊大部分是以民国纪年,在数据库中,一律转换为公元纪年。
(5)繁简字转换 大多数的民国期刊都是繁体直排本,在著录时,一律改为简体字著录,对其中的一些异体字,如果出现在篇名,一律改为正字,出现在作者,则尽量保留异体形式,对一些不能录入的生僻汉字,采用组合字。
利用高校学生资源丰富的优势,大量招募研究生以勤工助学的方式参与到数据库的建设中。研究生主要负责书刊扫描、图片上传和目录著录等工作。书刊扫描虽然是简单的重复劳动,但短期内接近30万页的扫描量,工作量非常大,图片上传过程中,需要利用图片编辑软件对扫描图片进行必要的修整和裁剪。而在进行目录著录时,因为民国期刊一般都是繁体字,要有一定的繁体字识别能力。同时,著录事项还要与相关图片进行关联并编辑页码,这一系列工作,有一定的技术和知识含量,研究生因为接受过比较系统的学术训练,文化素质及计算机操作能力都比较强,经过培训基本都能胜任。因此,“民国教育库”的建设,只用了很少的在职图书馆工作人员负责管理及监控数据质量,大量研究生的参与,保证了数据库在短期内完成数据的采集和编辑工作。当然,这样的工作模式,也为学生提供了很好的勤工助学岗位,让同学们在工作中得到了社会实践和工作能力的锻炼。
数据库完全依靠自己的力量自主研发,“民国教育库”建设人员与技术人员配合密切。因为有后方技术力量的支持和保障,软件使用过程中的任何问题和要求,都能得到及时的沟通和解决。比如,软件开始设计时,并没有工作量统计的功能,但是随着数据库的进展,工作人员发现一些研究生经常在扫描和上传图片的电脑上看电视剧、聊天,不仅占用机时,还影响工作进度,因此,在与技术人员协商后,增设工作量统计功能,使工作量得到及时监控,工作效率明显提高。随着数据的逐渐增加,工作人员发现图片在编辑和上传过程中,链接错误或录入文字错误时有发生,如果不对数据进行审校,数据库质量将很难保证,因此,技术人员对软件再次进行修改,增加了“验收”功能,同时对帐号实行分级管理,除软件初始设计的“管理员”、“worker”外,增加了具有验收权限的“superworker”,以方便审校验收工作的分工及开展。
目前“民国教育库”已完成第一期140余种民国教育专业期刊,近30万页图片的采集、上传,7万余条目录的加工及篇名、作者的著录,第二期非教育期刊中教育文章的选取及扫描也已启动,相信随着数据库的进一步完善和面向校内广大师生的推出,可以在很大程度上提高上海师范大学自有资源的社会影响力,提高图书馆馆藏民国期刊和老教材的利用率,提升图书馆数据资源的品质和文献服务质量。
作为师范大学,教育学一直以来都是上师大的优势重点学科。民国时期的教育文献,尤其是教育期刊在教育思想的引进、教育思潮的兴起、教育制度的建立、教育内容与方法的革新等方面发挥着重要的作用,对中国近代教育理论、教育史以及教学法等的研究,具有极其重要的文献参考价值,但学术界对于民国教育的研究却相对匮乏。形成这种现象的原因与民国时期文献相对珍贵,缺乏系统整合的民国教育文献数据库,研究者获取原始文献相对困难有很大的关系。因此,“民国教育库”的建设,对教育学学科建设具有深远的意义,为学者开展民国教育研究提供重要的文献保障,为中国近代教育理论、教育史以及教学法等研究提供便捷的一手材料。
民国时期的老期刊,由于印刷质量不高,纸质比较脆弱,许多文献现在已经不堪频繁翻阅,通过对这批文献的全文数字化,不仅可以有力地保护历史文化,抢救珍贵文献,而且有效地解决了藏用矛盾。
数据库的建设过程中,馆员们直接参与并负责数据库选题设计、馆藏清点、软件调试以及学生管理,在不断的探索中,逐渐摸索出有效的数据库建设模式。而这一系列工作的开展,为馆员创造了施展才华的空间,馆员们的参与意识、业务能力和管理协调能力,都得到了很大提升,培养了一支具有丰富数据库建设经验人才队伍。同时,数据库建设所营造的良好科研氛围,为馆员们开展学术研究提供了明确的方向,以民国文献为主要研究对象的文献整理与保护、数字化开发、出版等方面的学术研究,正在逐步开展。
1 中国国家图书馆.中国国家数字图书馆·民国期刊.[2012-7-20].http://mylib.nlc.gov.cn/web/guest/minguoqikan.
2 CADAL项目统计表(4月).[2012-7-19].http://www.cadal.cn/zydt/index1204.htm.
3 全国报刊索引.民国时期期刊全文数据库(1911~1949).[2012 -8 -1].http://218.1.116.100/shlib_tsdc/product/detail.do?productCatId=6.
4 大成老旧刊全文数据库.[2012-8-1].http://www.dachengdata.com/tuijian/showTuijianList.action.
5 南京图书馆.特色资源.[2012-8-1].http://www.jslib.org.cn/pub/njlib/jslib_njtsgtszy/
6 北京师范大学图书馆.特色资源.馆藏解放前师范学校及中小学教科书全文库.[2012-8-1].http://digi.lib.bnu.edu.cn:8080/digilib/search?channelid=40816
7 人民教育出版社.中国百年中小学教科书全文数据库.[2012-8-1].http://www.pep.com.cn/rjs/rjdt/rjdt/201011/t20101103_944912.htm.
8 廖晓云,冼育华.广西民国照片数据库建设与思考.四川图书馆学报,2009(4)