数据套录编目主要是指编目员为一种图书编目之前,先对从外部获取的编目数据进行必要的编辑加工,而后转换为本馆数据库记录的过程。由于套录编目不仅能节省大量的人力、物力,大大提高工作效率而且还能有效地促进和提高本馆的编目质量,使书目数据朝着标准化、规范化方向发展。因此,套录编目这一工作方式,越来越受到各馆的欢迎。我馆从2003年评估以来采用书商提供CNMARC数据,充实馆藏书目数据库。本人在从事套录数据工作中,发现了编目数据存在一些的问题,在此愿与各位同仁探讨。
一、图书馆套录数据的来源
(一)书商提供的书目数据。近些年来,书商为了吸引客户,采取了随书配送书目数据的方式推销图书。书商配送的数据,主要是聘请编目人员对图书馆所采购的图书进行编目,其编目质量与其聘请的编目人员的编目水平密切相关。由于编目人员的水平参差不齐以及人员的经常更换,造成书目数据质量良莠不齐。另外,书商提供的数据有的是从网上联合编目中心下载的,使得所有数据能够一次集中转换入库,保证了图书和数据的及时性和统一,书商一般不会对这些数据进行审核,这些数据差错率极高,所以书商提供的数据相对来讲质量不高。
(二)大型图书馆的OPAC数据。对于一些书商不能提供的书目数据,图书馆工作人员可利用大型图书馆的OPAC数据,如国家图书馆的编目数据。编目员访问一些大型图书馆的联机书目公共查询系统即可获取有关编目数据。这些数据主要提供了文献的主题词、分类号以及文献内容提要等,可供编目人员参考。
(三)图书在版编目数据。在版编目工作对出版社编目人员的专业知识水平要求较高,因为涉及图书分类、主题标引、编目知识等。而出版社的编目人员,不一定都是经过专业培训,因此整体素质参差不齐,所以提供的分类、主题标引、著录项等数据就不够准确,因此,在版编目的数据只能作为编目人员的一种参考。
二、套录数据存在的一些问题
由于我国各图书馆对各种套录规则和中国机读目录格式的理解不同,且数据规范尚未完善,导致数据质量上的不标准、不规范,要对套录到的数据仔细校对,结合本馆著录规定进行完善,以提高书目数据质量。修改书目数据的两个重要依据是编目规则和CNMARC书目格式。以下对套录中的一些问题做分析。
(一)数据不全。我馆CALIS的数据进行套录时,发现有相当一部分没有编目数据,粗略统计约占35%左右,从而使编目人员要进行原始编目,这就降低了套录编目工作的效率。比如农、林、建筑类的图书,套录的数据就比较少。
(二)分类问题。面对套录数据应对其中分类不当,如有的书商将《中国电子工业年鉴》分入TN-54。按照《中图法》(第五版)规定:无线电电子学、电信技术归入TN,其实此书主要是介绍电子工业经济方面的内容,正确的分类应入F426.6-54。同一类图书,归入不同的类目中同类书被分到不同的类目中。书商的编目人员对文献内容的理解差异导致相同内容的图书归入不同的类目中。如有的书商将《胡敏读故事记单词雅思(IELTS)词汇》一书归入H310.4l;有的书商将它归入H310.4。《中图法》(第四版)规定:总论英语水平考试的书入H310.4,专论英语水平考试某一方面的著作入有关各类,此书正确的分类号应为H313。分类级次不统一主要表现在同一类书,有的数据有复分、仿分号,有的未加复分、仿分号。如《现代VLSI电路设计》(影印版)和《现代VLSI电路设计——芯片系统设计》(影印版)两本书,给的分类号分别是TN47、TN470.2。同一种书前者未加仿分号,而后者有仿分号。
(三)著录问题。本人在套录数据的过程中发现,图书的著录存在着各种各样的问题,主要表现为著录标准不统一,不规范,各编目员根据自己的理解以及不同的标准,随意性较大,为各图书馆的套录工作无形中增加了工作量。现就此问题作如下一些分析。
1、正题名的著录。对题名的理解错误。例:由徐仲,陆全编《线性代数(同济.第四版)导教.导学.导考》一书,其题名页、封面、书脊形式均为《线性代数(同济.第四版)导教.导学.导考》记录著录为:
2001#@a线性代数@e同济.第四版@e导教.导学.导考@f徐仲,陆全编,在这条记录里,编目人员把“同济.第四版”“导教.导学.导考”错误地理解为副题名,人为地分隔成若干个@e子字段进行著录,简单的事情复杂化。我们知道,“200”字段是识别文献的最重要字段,正题名要遵循著录规则中的客观著录原则,否则,因书目数据标准不一致,格式不规范,读者就可能查不到所需的图书,因此,正确的著录应该是:
2001#@a线性代数(同济.第四版)导教.导学.导考@f徐仲,陆全编
2、责任者著录。多个责任者的著录过于简单。著录多个责任者时,应根据题名页上的信息客观照录。(1)两个责任者的照录,超过两个的只著录第一个,后加“等”,并列责任者超过三个,只著录第一个,后用“#[等]#编著”表示,其余责任者在304字段作附注。如果题名页上责任方式后已标出“等”字,则“等”不用加方括号,也不用省略号。但套录的源数据忽略了对其他责任者在编目数据的701字段做相应的著录形式检索点。套录数据中,有一些数据有三个责任者的,往往只著录一个著任者,也不加304这段。
例:2001#$a电子商务法$ Adian zi shang wu fadIn-troduction to E-commerce law$f杨路明……[等]编著
701#@a杨路明编著
正确的著录应该是:
例:2001#$a电子商务法$Adian zi shang wu fadIn-troduction to E-commerce law$f杨路明……[等] 编著$zeng
304 #$a题名页其他责任者为:罗裕梅,吴彦艳,杨竹青,徐玲
701#@a杨路明@4编著
701#@a罗裕梅@4编著
701#@a吴彦艳@4编著
701#@a杨竹青@4编著
701#@a徐玲@4编著
3、附注项的著录。附注项是对题名与责任说明、版本、出版发行信息、载体形态、丛编等信息内容的附注与补充说明,在CNMARC中本信息块有30个字段,一般情况下,各馆可以根据自己的具体情况做出规定,并不要求面面俱到,各馆一般选择相对较重要的项目进行著录,但一旦有了明确的规定就必须严格按规定著录,这样有利于不同编目人员套录工作的统一,也有助于各馆工作的前后一致性。而套录的来源数据对于附注项的著录存在的问题也较多,主要表现为著录项目的不确定性,即没有明确规定哪些项目必须著录,哪些项目可省略不录,造成套录数据凌乱无章。比如许多教材封面存在“某教材”、“系列教材”等字样,其文字描述是为了说明教材性质以及读者对象,对这类图书的著录就存在不一样的地方,有的入300字段,有的入225字段。笔者认为,对于教材类的著录虽五花八门,但考虑到我馆教材著录的连续性和便于读者检索的角度则将系列教材入300字段,将该系列丛书放在一起以方便检索。因此入丛书项“300”字段比较合适。
4、并列题名的著录。所谓并列题名,题名页有两种或多种文字的题名,未被选作正题名的其他文种题名应作为并列题名著录于正题名之后。200字段@a正题名@d是正题名的外文并列题名而有些数据源对并列题名的著录理解不一致。如《一分钟销售员》=The One Minute Sales他们将@d正题名的外文并列题名作为@a正题名,这种著录很不规范。
5、丛书著录不标准。套录数据中有的将丛书题名著录成了正题名,而正题名著录成了分册题名。
类似上述这样不规范的数据源在套录编目中出现较多,给套录编目工作带来了很大的麻烦。
三、提高套录书目数据质量的方法
(一)选购优质的数据源
套录数据源质量的好坏,不仅直接影响本馆的书目数据质量,而且还影响与其他馆之间的资源共享和馆际互借。数据的质量主要是从可靠性、规范化、标准化、完整性和准确性等方面加以考察,确保外部数据源的质量。
(二)完善图书编目规则
书目数据的规范化与标准化是文献资源共享的前提,由于各家参照的著录标准不同,导致数据的混乱。在套录数据时,不能照搬照抄,应当根据本馆所制订的分类使用本、著录规则等适当加以修改,建立本馆书目数据库。各馆在实际工作中,根据需要制订一系列适合本馆软件系统的著录细则,在数据套录工作中,我们也应以细则为依据修改源记录。如并列书名中首字母的大小写问题,我馆为了著录的统一,以及检索的方便,制订了并列书名的著录规则应遵循惯例,首单词的首字母以及专用词的首字母大写,其余一律小精辟。著录同一责任方式的多个责任者,如三个或三个以上,我馆规定三个并列责任者照录,三个以上责任者,只著录第一个,其后加“#...#[等]#表示,规定在计算机著录时,为了方便检索和著录的方便,题名中的数字,空格都采用半角照实录入。题名页如有方括号著录为圆括号,无法照录的图形及符号或其他内容,可用相应的文字代替,置于方括号内,同时在附注项说明。因此,加强各编目机构联系与协调,制订统一的著录条例和MARC格式使用手册,不断完善计算机编目规则,中文图书书目数据质量才能不断提高。
(三)严格控制质量审核
虽然套录获取数据容易,但并非数据套录下都能直接利用,需对源记录进行认真、仔细核对,保留适用的、增加必要的、剔除无用的,使之改造成适合本馆编目体系、质量规范的新记录,才有助于资源共建共享。
(四)加强数据库维护
尽管数据入库前经过严格的核对和复审,但数据中还会存在一些错误,有些错误可能是机器运行中产生的。因此,应该采取必要的措施,对数据库进行经常性维护,将错误控制在最小的范围内。定期对书目数据进行检查,把发现的错误分别记录下来,然后逐一改正,并提醒编目人员对以后类似问题加以重视。
(五)重视文献的查重工作
在套录过程中不仅套录的数据本身存在着问题,如归类不统一及与本馆归类原则不统一等。查重就是要检查在编图书以前有无馆藏记录,以便在著录文献时能保证本馆归类前后的一致性。丛书、多卷书或成套的通俗读物、配套出版的教材及其题解等往往不是一次到齐,各个编目员的观点不同,就会出现不同的处理方法。有时会出现一套丛书既有分散著录又有集中著录;有的单独以分卷题名著录,有的又按总题名著录(二者均为分卷题名有独立意义的多卷书或丛书)。因此在查重的时候要从ISBN、题名、责任者和丛书名等多个途径进行检索,并遵循本馆的一贯原则进行分类并著录,避免出现同一类书两个分类号的现象,保持数据处理的前后一致性。
(六)制定适应各馆的分编细则和著录细则
图书馆的编目室一般应必备的工具书有《中国图书馆分类法》,根据本馆的馆藏特点、服务对象,制定出本馆的《图书分编工作细则》和《图书著录细则》这样,编目员可依照《细则》,对馆藏书目数据著录的详简级级次,分类与主题标引的深度,索书号的分配等掌握统一的标准,为建立高质量的适合于本馆的书目数据库打下良好的基础。过粗或过细的情况根据本馆实际进行修改。关键是各馆要制订一本符合本馆实际情况的分类使用本,保持自身分类与管理的科学性、实用性和一致性。目前我馆也制定了一套中文图书的著录规则,同书名不同作者及计算机语言且根据专业图书利用率的分类等都做了详细的规定。
例:《20世纪中国民族家庭实录》这套丛书的各个分册放入K892.3并依中国民族表分,用丛书名关键词检索看出本馆之前到的分册已经集中在K892.3下,因此应按照以前的分类号集中归类。
(七)提高编目员的素质
编目人员的素质(包括知识面、专业化程度以及对MARC格式和著录规则的熟悉程度)直接影响到本馆数据库质量。编目员要做到:掌握机编规则、标准、格式和数据转换技术,严格把好审核套录数据这一关,根据本馆需要决定取舍,否则盲目套录数据将影响本馆数据库质量。
总之,套录工作是文献建设中一项重要的工作、是编目工作的有力手段,是建设书目数据库的核心内容、也是书目数据质量控制的关键点,只有数据质量提高了、规范了,才能达到真正的文献资源共享。
参考文献:
[1]张维乐.中文图书编目中的套录数据问题[J].农业图书情报学刊,2006,(7).
[2]喻亚琴.浅谈图书编目工作[J].科技情报开发与经济,2010,(12).
[3]董向荣.中文图书编目数据套录问题新探[J].国家图书馆学刊,2002,(2).
[4]国家图书馆《中国文献编目规则》修订组。中国文献编目规则[M].北京图书馆出版社,2005,(4).
[5]纪昭民.机读目录文献著录图解[M].华艺出版社,2001,(8).
[6]李艳芳.中文图书套录编目若干问题探讨[J].图书馆论坛,2000,(5).
(作者简介:拉烈卓玛,青海大学图书馆采编部,副研究馆员。)