李春新
(中国国家图书馆,北京 100081)
首先是两岸文献出版形式不同,大陆出版物出版形式较为正规,封面、题名页、书脊等上的信息比较全面,包括ISBN号、出版社、正题名、副题名、英文题名、著者、主编、出版年、开本、价格、在版编目(CPI)数据等,这些信息是编目员制作数据的重要依据;而台版文献出版形式比较开放,致使著录信息往往存在不确定性,有相当一部分图书没有题名页或版权页。在编文献中提供的信息源位置往往与大陆使用的《中国文献编目规则》出入较大。ISBN与之相对应的出版社为异地出版社,这在大陆中文图书中是不会出现的问题,但在台版文献中却屡见不鲜。有些信息需要编目员在文献中仔细辨认、寻找。以上这些都给台版文献的编目工作带来极大困扰,增加了编目员的工作强度,进而影响到编目质量、效率和进度。
其次,大陆出版物均为简化字,编目员认、读、录入不存在障碍,而台版文献基本都是竖版繁体字,在一定程度上影响编目员的认读。
由于两岸编目规则存在差异,导致在格式著录上的不一致。目前大陆使用《中国机读目录格式使用手册》,台湾使用《中国机读编目格式》,虽然二者都是以UNIMARC为蓝本制定的机读目录,但却存在某些差异。例如:在文献外部特征的描述上二者存在不一致,以出版年(2000年)的著录来说,台版文献中的出版年信息有2000、89、民89、民国89、民国八十九年、中华民国八十九年6种之多。大陆2005年之前的台版文献,无论在编文献中出版年信息以何种形式出现,一律直接换算成公元年(2000),将其著录在215字段的@d子字段中。这不仅忽略了客观著录的原则,也使得在使用ALEPH系统后,很多不规范的问题凸现出来。作为权宜之计,目前国家图书馆将非公元纪年著录于“()”内,以表示客观著录,(在编文献提供的出版年信息),公元年著录于“[]”内,以示编目员提供的信息,即215@d[2000](中华民国八十九年)。但无论以上何种著录方式,都谈不上客观著录,也更谈不上标准化。
联合编目发展到今天已经是非常成熟的编目形式,且成为信息编目的主流,基本实现了书目数据的共建共享,而大陆的台版文献书目数据在全国的书目数据中还仅限于数据库状态且相互独立,缺乏共建共享。这样就为制作书目数据带来了一定的困难。时至今日两岸资源共享已是大势所趋,两岸MARC又属同宗同源,都以UNIMARC为蓝本制订了各自的机读目录格式,为资源共享打下了坚实的基础。
1980年台湾成立了“图书馆自动化作业规划委员会”,标志其正式开始研究制定中文机读编目格式。同年5月成立了“中文机读编目格式工作小组”,开始制订符合国际标准的MARC格式,以便于在本岛及国际间交流与共享文献资源。
1981年1月,《中文图书机读编目格式》(CMARC)第1版问世,同年7月出版了修订第2版及其使用手册。随后,做出两个重大调整:①扩大CMARC的适用类型,除原有的普通图书外,还包括了连续出版物、地图、乐谱、视听资料等。②作为书目数据交换的通用格式,不受数据文种的限制,适用的范围扩大到中文以外的文字。1984年再次修订出版《中文图书机读编目格式》(CMARC)第2版,依照国际上MARC发展趋势调整了内容,增加了对善本书和拓片的适用字段。
1988年,基于新信息媒体的涌现,参酌1987年出版的国际机读编目格式手册和美国国会图书馆书目服务部发表的美国机读编目格式修订建议书,以及“台湾图书馆”历年来的实践经验,历经一年多的修订,于1989年出版CMARC第3版。
大陆机读目录研制于20世纪70年代。1979年成立了全国信息与文献标准化技术委员会和北京地区机读目录研制小组,1982年中国标准总局公布了参照ISO2709制订的大陆标准《文献目录信息交换用磁带格式》(GB2901-82),为中文MARC格式的标准化奠定了基础。
1986年UNIMARC中译本问世。在此基础上,大陆根据实际情况,编制了《中国机读目录通讯格式》讨论稿,1992年2月正式出版《中国机读目录通讯格式》,即CNMARC。1995年12月又出版了《中国机读目录格式使用手册》。
1996年2月6日,《中华人民共和国文化行业标准·中国机读目录格式(CNMARC)WH/T0503296》作为国家标准在大陆诞生,并于1996年7月1日予以实施,2004年出版《新版中国机读目录格式使用手册》。至此,CNMARC格式为大陆机读目录实现标准化并与国际接轨,从数据结构方面提供了保障。
MARC是推进书目数据规范与统一,加速文献信息网络建设,实现国内外图书馆间书目信息交换与共享的重要工具。目前,大陆、台港澳和世界其他一些国家和地区图书馆著录中文文献的MARC主要有两种:一种是大陆版的CNMARC,另一种是台湾版的CMARC。虽然两种MARC分别由大陆和台湾编订而成,但因为从编订的主要依据(均以UNIMARC为蓝本)到各个具体环节,它们采用的标准大同小异,所以记录结构完全相同,主要字段、子字段基本一致,这为整合二者打下了良好的基础。
二者的字段和子字段都是由标志块(CMARC为识别段)、编码信息块(CMARC为代码资料段)、著录信息块(CMARC为著录段)、附注块(CMARC为附注段)、款目连结块(CMARC为连结款目段)、相关题名块(CMARC为相关题名段)、主题分析块(CMARC为主题分析段)、知识责任块(CMARC为著者段)、国际使用块(CMARC为国际使用段)组成,字段定义都大同小异。
记录结构遵循ISO2709规定,都是由记录头标区(CMARC为记录标区)、地址目次区(CMARC为指引)和数据字段区(CMARC为书目资料登录栏)3部分组成。
从语种看,两岸MARC均用LC语种和语种代码修订表。
从分类法看,CMARC使用台湾《中国图书分类法》(赖永祥增订7版),西文分类采用杜威十进分类法(DDC)和美国国会分类法(LCC)。CNCMARC采用《中国图书馆分类法》(第4版)。CMARC的681、682、686、687字段分别用于记录台湾《中国图书分类法》、《台湾农业科学情报中心分类法》和《美国国家医学图书馆分类法》、《美国国家农业图书馆分类法》的分类号。CNMARC的690、692、696字段分别著录《中国图书馆分类法》、《中国科学院图书馆图书分类法》和国内其他分类法分类号。
汉语拼音方面,CMARC采用韦士杰罗马系统,CNMARC采用汉语拼音。
地理区域代码方面,CMARC采用LC1980地理区域代码,国家代码采用 ISO3166(1974)。
CNMARC采用ISO3166—1981国名代码表和GB2659—81世界各国和地区名称及代码。
字符集方面,CMARC在处理中文图书时,采用台湾的字符集标准“中文资讯交换码”,这个字符集的标准是繁体字的字符集标准。另外,CMARC还采用了LCMARC的年代范围代码和IFLA1977年订的读者代码。而CNMARC采用GB2312—80信息交换用汉字编码字符集(基本集)及第1、3、5辅助标准集。
综上所述,既然两种MARC存在相同和不同的地方,要达到共建共享则必须将二者进一步整合,使其逐渐趋于一致。
整合的首要工作是整合概念与术语,只有这样才不会使用户、编目人员、软件开发商等由于概念与术语的混淆而产生理解与使用上的分歧。下面是两种MARC中内涵相同但名称不同的主要概念与术语。
例如:CNMARC中的“块”对应CMARC中的“段”
CNMARC中的“字段”对应CMARC的“栏”
CNMARC中的“子字段标志符”对应CMARC的“分栏识别”
CNMARC中的“字段分隔符”对应CMARC的“栏间符号”
CNMARC中的“记录投标”对应CMARC的“记录标志”
CNMARC中的“地址目次区”对应CMARC的“指引”
CNMARC中的“数据字段”对应CMARC的“书目资料登录栏”
CNMARC中的“字符集”对应CMARC的“内码”
CNMARC中的“数据”对应CMARC的“字元”
统一二者字段和子字段,其中包括字段的名称、子字段的名称、具体内容、指示符等。从0字段到9字段有大量的不同点,以下仅举几例说明。
例如:009字段,在CNMARC中没有,而在CMARC中有
014字段,在CNMARC中为“论文标志号”,而在CMARC中是“篇章识别号”
016字段在CNMARC中没有,而在CMARC中有
091字段在CNMARC中有,而在CMARC中没有
094字段在CNMARC中有,而在CMARC中没有
CNMARC采用《中国文献编目规则》等标准进行著录,而CMARC采用CCR2r《中国编目规则》、AACR2等标准进行著录。编目规则不同导致著录结构不同,所以必须对编目规则进行整合以确保记录一致。
例如:交替题名的著录
天下才子必读书,又名,才子古文/(清)金圣叹评注
CMARC著录为:
2001#$a天下才子必读书,又名,才子古文 $f(清)金圣叹评注
CNMARC著录为:
2001#$a天下才子必读书$a又名,才子古文$f(清)金圣叹评注
CMARC采用《中国编目规则》,交替题名视为一个整体著录在200字段的$a子字段;而CNMARC采用《中国文献编目规则》,交替题名分别著录在200字段的两个$a子字段中。
目前,大陆图书馆采购的港台中文图书日渐增多,数据加工量也逐年增加,对台湾CMARC数据加以利用将是今后大陆图书馆的一个趋势。
“全国图书书目资讯网”是台湾地区图书馆专用的书目性网络,也是台湾目前唯一的合作编目机制。包含了台湾77家高校及公共图书馆的馆藏目录,数据达620万条之多。其中,中文书目360万条,西文190万条,其他语种70万条。此外,还包括连续出版物、多媒体、电子资源以及网络资源等各种资料类型。如此丰富的中文书目数据资源,并且免费下载,将这些开放的资源加以利用,对实现资源共享将大有好处。
其一,可以减少重复性编目,减少编目流程,最大限度地提高编目效率,降低编目成本,使新书以最快的速度进入流通环节,提高时效性。
其二,可以提高书目数据的整体质量,促进台版文献书目数据的标准化、规范化进程。
其三,为资源共享创造条件。通过网络技术可对书目信息进行实时在线检索与利用,达到“一馆录入,多馆使用”。
其四,联合编目使其书目数据上传或下载,供成员馆交流与使用,使其书目信息更加公开透明,有利于交流馆藏信息,合理配置馆藏资源,最终实现编目工作理想境界,即资源共享。
联合编目与规范控制是编目工作发展到一定程度的必然结果,也是编目工作的重要组成部分;是实现文献信息著录规范化与标准化的重要措施,也是确保书目数据质量、检索效率、完善数据库功能的重要保障。我国两岸三地图书馆界应进一步加强合作,在CNMARC和CMARC的基础上制订出一部既能与二者兼容又能被国外图书馆汉语文献著录共同接受的MARC格式,以便更加广泛地实现文献信息资源的共建共享,最大限度地提高书目文献资源的利用率。
[1]王维纳.国家图书馆台港书目数据的规范化与质量控制.图书馆论坛,2007(2).
[2]陈富良.大陆和台湾的中文MARC比较.图书馆工作与研究,1994(1).
[3]谢蓉.USMARC与CNMARC的比较研究.现代情报,2005(4).