朱青青 高凌云(国家图书馆 北京 100081)
新版民国总书目编制研究
朱青青 高凌云(国家图书馆 北京 100081)
民国时期出版书籍的学术价值与其书目编制现状并不匹配,故针对过去民国书目编制在收录范围、数据梳理、总目分卷、目录索引方面存在的问题,提出基于新版民国总书目编制流程的相应解决方案。
民国总书目 书目编制 书目数据
1.1 编制民国总书目的必要性
民国时期是指从1911年辛亥革命爆发到1949年新中国成立这段历史时期,前后三十八年。这一时期是近代中国社会剧烈动荡、内忧外患不断的时期,但也是西学东渐和中西文化碰撞、学术高度活跃发展的黄金时期。据不完全统计,民国时期出版的书籍超过二十万种,其中含有大量学术珍品和艺术精品,还不乏一些流传稀少却具有较高价值的地方文献类书刊资料。民国文献在一定程度上可以如实地反映民国时期我国政治、经济、文化、思想的全貌,具有重要的史料价值、学术价值和社会功用。
整理民国文献、编制民国总书目具有重要的历史意义和现实意义。一方面,民国总书目是掌握民国文献家底的基础,也是分析各馆各机构民国文献馆藏特色的重要依据,为进一步研究民国时期社会历史与文化全貌提供重要保障。另一方面,由于民国文献分布广泛、破损严重,及其纸张酸化、老化过快而不便于直接提供阅览服务等因素,用户在查阅、利用民国文献方面存在诸多障碍,编制民国总书目可以为用户提供便利,也为民国文献的进一步开发利用奠定良好的基础。
1.2 早期民国总书目编制概述
现有的《民国时期总书目》是一部大型多卷本的回溯性国家书目,由北京图书馆于1978年着手编辑,并由书目文献出版社于1986年开始陆续出版,1995年全部付梓。这版总书目主要收录北京图书馆、上海图书馆和重庆图书馆收藏的中文图书,并补充了一些其他图书馆的藏书,力求反映从1911年至1949年9月这段时期我国出版中文图书的面貌。
这部总书目,按照学科共分17卷21册,包括哲学•心理学、宗教、社会科学(总类部分)、政治、法律、军事、经济、文化科学•艺术、教育•体育、中小学教材、语言文字、文学理论•世界文学•中国文学、外国文学、历史•传记•考古•地理、自然科学•医药卫生、农业科学•工业技术•交通运输、综合性图书。
由于这版民国总书目是以三大图书馆的藏书为主,只少量补充了其他图书馆的藏书目录,并且受限于当时联合目录的建设情况,难免有遗漏,未能较为全面地反映全国图书馆民国图书的收藏状况。通过对比,仅南京图书馆就有约2万种图书未收录在《民国时期总书目》中[1]。同时,该版书目并未包括线装书、外国驻华使馆等机构印行的图书、国内出版机构印行的外文图书、我国少数民族文字图书等[2]。
1.3 当前民国总书目编制概况
2012年,国家图书馆针对民国时期文献损失严重、面临断层的情况,设立“民国时期文献保护计划”,全面开展民国时期文献普查工作,对全国图书馆民国图书的收藏状况进行摸底和梳理,依托全国图书馆联合编目中心,对民国时期文献保护试点单位(下文简称试点单位)上传的民国书目数据进行查重、质检后灌装到民国时期文献联合目录系统。目前系统已汇聚国家图书馆和部分地方图书馆书目数据近30万条、馆藏数据50余万条。在此基础上,国家图书馆策划编纂《民国时期文献总目》。
这是一部收集、整理民国时期文献的大型工具书。根据文献普查进度,国家图书馆拟先期编纂完成《民国时期文献总目(图书卷)》,并实现按学科分册出版。仅这一部分书目,在收书数量与收录文献种类上与已出版的同类书目相比就将实现显著突破。
2.1 收录范围的确立问题
新版民国总书目拟收录1911年至1949年9月这一时期我国出版的中文图书。1911年之前印行,之后又连续出版的多卷本图书以及1911年之前出版,1911年之后重印的图书亦全部收录。总书目依然以北京、上海、南京、重庆、广东等几大民国重镇的公共图书馆的民国书目为主。与此同时,拟收录国家图书馆民国书目14万余条和部分地方图书馆书目16万余条,并且还收录部分中国社科院近代史研究所、大学数字图书馆国际合作计划(China Academic Digital Associative Library, 简称CADAL)等机构的民国书目。
与上一版民国总书目相比,新版总书目具有如下特点:一是书目总量显著增加:新版总目收录中文图书达30余万种,而过去是12余万种。二是补充了不少地方特色馆藏书目:南京图书馆馆藏的民国文献主要由江苏省立国学图书馆、国立中央图书馆以及解放后接收的国民政府旧机关、团体的相关文献构成,以官书(即政府机构出版物)和革命文献为其特色,仅馆藏民国中文图书就有7万余种[3]。重庆图书馆民国文献以二战期间的各类抗战文献为特色馆藏[4]。广东省立中山图书馆所藏民国文献含有丰富的南海诸岛历史资料及孙中山文献。浙江图书馆以新文学民国馆藏为其特色。三是补收了外国驻华使馆等机构印行的中文图书。
尽管如此,本版民国总目仍然是以国家图书馆、公共图书馆及部分高校图书馆的民国藏书目录为主,党史馆、博物馆、档案馆、研究机构及一些私人藏家手中可能还有一定规模的民国藏书量,只能寄望将来收录于总目的补编之中。
2.2 数据的梳理问题
相比民国丰富的文献资源,民国书目所呈现的数据质量显得难以与之匹配,主要存在如下几方面的问题:
一是现存数量庞大的民国文献分散在不同的图书馆与机构,但各馆各机构对民国文献编目投入的人力、财力不同,导致民国书目数据的质量参差不齐。另外,不少地方图书馆对主题分类标引工作不够重视,致使大量民国书目数据缺失主题词和分类号。
二是民国文献的编目多年来一直缺乏统一的机构进行规划与管理,导致缺乏统一的规范标准。从试点单位先期提交的数据样例来看,各馆在数据制作格式上还存在较大差异。不同图书馆在对编目规则、细则、机读格式的制定与应用上,也存在或多或少的差异。差异较大的会导致大量编目数据不一致,造成书目数据重复建设、重复上传等问题。
三是由于民国图书本身的特点,使其与现代图书的编目工作相比具有更高的难度。民国图书与现代图书在印刷方式、装帧设计、出版发行信息记载等方面都存在诸多差异,其版权页虽然已基本包含了现代图书版权页涵盖的主要项目元素,不过在当时尚未形成统一的版本记录格式及相关标准,每一个版权页的项目元素不一定完整[5]。这种特点要求数据制作人员既要坚持标准化的编目操作,又要根据文献的特点,具体问题具体分析,灵活运用规则和格式。与此同时,由于当时的印刷和存藏条件有限,不少图书还存在损毁现象,导致著录信息源缺损,给民国文献编目工作带来诸多困难。
2.3 总目的分卷问题
新版民国总书目拟参照《中国图书馆分类法(第四版)》,按照学科类目分类编排,各类分册编辑出版。收录书目数量多的,一个学科编成一册或数册;收录书目数量少的,由几个学科合成一册。但各图书馆和机构在对民国文献编目时采用的分类法体系不尽相同,主要有四种情况:一是采用中国图书馆分类法(简称中图法);二是采用刘国钧分类法(也称中国图书分类法);三是采用中国科学院图书馆图书分类法(简称科图法);四是采用中小型图书馆图书分类法等其他分类法。采用不同分类法编制书目数据给基于学科类目进行分卷造成了一定的困难。
另外,由于分类法或分类规则本身的缘故,比如中图法的A大类是依人列类的类目,并未按照学科属性为标准编排,所以对于A大类书目需要补增互见学科分类号。还有不少同一文献的不同版本、同一主题及相似主题的文献,因为编目实践的差异,并未能归入相同的类目。
2.4 目录索引的编制问题
编制一部数量庞大、体例完备、具有较高质量和较大参考价值的民国总书目,其目录索引是一个必不可少的重要组成部分。准确性是一切目录索引的共同要求:一方面要求著录准,即书目的各著录项目必须准确且标准化;另一方面要求编排准,即条目组织准确,每种索引除提供主要的检索途径外,还应尽可能增加一些必要的辅助性检索途径。如以分类为主要的检索途径,应该再编制题名索引和著者索引,便于读者从各个角度、多种途径快速查获他们所需要的书目。除此,不少书目仅从题名上看不出其主题内容,这就需要尽量撰写内容提要或提供目次。
目录索引不仅体现在所收书目的“全”和“准”、结构严谨、符合客观的真实和科学的分类排列等方面,还需要对书目进行分析和鉴别,判断取舍,确立类目和解决交叉等问题。也就是说,编制者要进行搜集整理、分析研究、分类编排、题解和注释等一系列复杂的思维劳动[6]。概括而言,目录索引的编制是一项专业性、学术性较强的工作。新版民国总书目因为收录数量庞大,各馆对民国图书著录和标引揭示的深浅程度不一、书目数据质量参差不齐等客观原因,其目录索引的编制注定也是一项艰苦卓绝的工作。
解决上述民国总目编制中存在的问题关键在于基础数据的制作和梳理,因而我们首先需要制定统一的数据制作规范,对民国书目建立科学有效的查重机制。下文将基于新版民国总目的编制流程,从数据查重、质检、整合、索引等各个环节逐一提出解决方案。
3.1 数据查重
新版总书目的整体数据是以民国时期文献联合目录数据库为蓝本,由试点单位补充联合目录库没有的民国书目数据。通过将收录来的试点单位的民国数据与全国图书馆联合编目中心的民国文献书目数据库(包括缩微转换、普通古籍转换数据)的数据进行查重比对,确定是否为原缺文献。如果判定为新数据则进入下一步数据质检环节,若判定为重数据则直接进入馆藏挂接环节。
根据笔者的实践经验,数据查重环节的关键在于需要辅助大量人工核查才能完成,干扰查重的问题主要集中在试点单位提交的数据与联编库数据存在如下几点差异:(1)题名著录错误造成差异,如题名著录存在错字、别字、漏字、多字,题名的子字段著录位置错误等;(2)题名选取差异,如合订书、交替题名著录差异;(3)集中著录与分散著录差异,如多卷书的总记录与分册记录的差异;(4)版本著录不规范造成差异,如2版与再版的著录差异,是否为影印版等差异;(5)出版年月著录差异,如有的数据出版时间只著录到年,有的数据著录到月;(6)存在推测信息或信息著录不完整造成差异,比如出版年是推测,其余信息相同;页数相同,其他信息为推测或不详等等。
因此,在查重环节一方面需要运用多种检索方式和检索路径将数据信息进行组合查重,寻求科学合理的查重方法与技巧,才能将试点单位提交的部分不规范数据和错误数据准确剔除,并为下一步的数据质检打下良好基础。另一方面,也需要制定合理的但富有一定弹性的判重规则,才能保证新增书目的准确性。比如,当试点单位提交的数据为多卷书的分册记录,而联编民国数据库中已存在总记录,那么将试点单位提交的分册记录视为重复数据。再比如,只是因推测信息造成的数据差异,应尽量视为重复数据。
3.2 数据质检
为了规范民国数据的编制,国家图书馆先期组织业内专家对民国图书编目制定了统一的著录、标引、馆藏描述标准,对题名、著者、版本、出版年、出版地、内容提要、收藏机构等信息进行统一规范,并建议试点单位回溯民国编目时采用统一的分类体系,即民国图书的分类标引依据《中国图书馆分类法(第四版)》。与此同时,国家图书馆于2012年开始陆续对全国各试点单位开展民国时期文献编目培训,组织编写了《民国时期文献——图书数据制作资料》提供给试点单位使用。
但在大量审核试点单位进入质检环节的数据过程中,笔者发现几家试点单位提交的数据依然有待改进,存在的突出问题主要是版本项与出版发行项的信息著录比较混乱,有试点单位将所有版本和出版沿革信息都著录在210$h、出版和发行信息混淆著录、年代换算错误等等。
造成其混乱的原因主要有如下几点:(1)民国图书版本多样化、版次印次关系复杂。首先,民国图书的版本较多,具体包括:初版本、油印本、铅印本、誊印本、毛边本、土纸本、手写本、题签本、批注本、伪装本等各式各样的版本。此外,还有国难后X版、胜利后X版、沪版、渝版、桂版、粤版、汉版等民国时期特有的版本说明。其次,许多民国图书当年即再版,甚至出现一年之内重印若干次的现象,有时版权页标明的X版实际上是该书的不同印次。(2)出版发行主体的记载方式多种多样,容易混淆出版发行信息。民国图书的版权页上很少看到“出版者”,频繁出现的是“发行所”、“发行人”、“XXX印行”等字样,对出版者和发行者的准确著录需要适度的分析和判断。(3)难以确定出版地、发行地信息。民国图书中没有注明出版地、发行地的情况比较常见,同一机构还经常存在多个出版地或发行地。另外,出版地在抗战时期还有国统区、沦陷区、解放区之分。(4)民国图书的出版年代繁多。除民国纪年外,还有公元纪年、清朝纪年、西历、日本的明治纪年、昭和纪年等,有些图书甚至几种纪年同时并用。
此外,民国图书字体简繁异并存,题名和著者姓名经常使用繁体字或异体字,而书目记录除了必须使用的繁体字和异体字,以现代简体字为准,在繁异体字和简体字转换过程中容易出现差错,造成著录错误。
为此,国家图书馆组织专人逐条审核试点单位提交的民国书目数据,并依据质检情况出具相应的质检验收报告,如不符合要求会将数据退回试点单位修改再质检直至合格。最终,质检验收合格的数据将汇总灌装进入民国文献联合目录数据库之中。
3.3 数据整合
数据整合是将不同来源的民国数据信息进行收集、整理、合并的过程,也是进一步处理不规范、不一致、不完整数据的过程。数据整合的核心内容涉及:进一步剔重、修改数据中的错误,处理不统一问题 ,全套总记录与分册记录书目数据与馆藏数据的保留、去除、合并以及不同版次记录的整理等。
这包括进一步修改著录数据中的错别字、简繁体错误、标点符号错误以及因各种原因造成的乱码等。当确定书目题名、出版者等各著录元素相同,著者实为同一人,只是使用名称(如笔名、译名)不同时,在满足合并为同一条目原则的基础上,首选记录中使用最多的名称合并为同一条目。同时,对多卷书进行进一步整理合并。当全套总记录和分册记录都存在时,保留全套总记录,删除单册记录,并将单册的馆藏信息移至全套;当全套记录不存在,各分册记录缺卷或不完整时,在整理民国总目的印刷本数据格式时合并分册记录,建立一条相应的总记录。
另外,当数据只有2版和再版的差别时,删除“2版”记录;当版本逻辑关系混乱,与其他版次产生冲突时,可根据附注信息修改版本项,也可以进行版本合并;月份都相同的两条记录,其中之一漏著版本项,保留有版本项的记录;也可根据判重数据,对只有出版年的数据增加月份,以示区分无版本项或初版记录。
3.4 著录项目与索引
新版民国总书目拟包括以下八个著录项目:(1)流水号:用于检索的顺序编号,每一学科单独排序。(2)题名:包括正题名、副题名、分卷册题名以及说明题名的文字。两种及两种以上著作合并成一册出版而又没有共同题名者,依次著录各书题名。按照现有国际ISBD标识符转换。(3)责任者:包括著者、译者及点校、编辑等责任者。三人以上合著、合译的,只著录第一人姓名,后加“等”字。(4)出版:包括出版地、出版者(或发行者、印刷者)、出版年月和版次、印制方法等。(5)形态:包括册数和页数、开本、装帧等。(6)丛书:包括丛书名、副丛书名、丛书编号等,采用ISBD标准显示格式。(7) 馆藏信息:为便于用户查找获取原始数据与馆藏,在各书目数据基本信息后标注馆藏地点。(8)附注与目次:包括对于揭示本书内容有意义的目次信息。目次结构复杂时,取主要内容,以及图书的相关题名说明、试用范围、性质、特点等。
为进一步提高书目检索的深度和检索效率,解决著录项偏向宏观与客观的不足,本书目拟编制总索引和分卷索引。其中,各卷都附有以拼音字母和笔画为序的题名索引,全书附有题名的拼音索引和笔画索引,以及责任者的拼音索引和笔画索引。由于民国书目数据普遍未采取名称规范控制,因此著者索引和题名索引着重要考虑同人异名、同作异名的编排问题,为便于读者查阅,笔者建议应尽量改变过去单独编排的做法,可以参照规范控制的做法,编制“见”或“参见”条目,从而起到进一步导引读者的目的。
[1] 陈希亮,余红玲.民国文献开发的新尝试[J].江苏图书馆学报,2001(2):36-37.
[2] 陈晓莉,严向东.民国文献的整理与开发问题研究[J].图书馆,2013(4):94-97.
[3] 全勤.南京图书馆馆藏民国文献源流、建设及特色[J].图书馆史研究, 2013,3(87):91-96.
[4] 张丁,王兆辉.浓墨重彩 沧桑厚重——民国文献的价值及馆藏现状[J].图书与情报,2011 (2):139-141.
[5] 李丽芳,宋晶晶.民国图书出版发行信息的CNMARC格式著录[J].国家图书馆学刊,2013, 5(89):74-77.
[6] 刘秀媛.论书目索引编制者的素质——编制《魏晋南北朝史论索引》《隋唐五代史论索引》的体会[J].山东图书馆季刊,1987(2):10-14.
朱青青副研究馆员,国家图书馆中文采编部书目数据组副组长。
高凌云国家图书馆中文采编部书目数据组馆员。