廖大蓉,李 渡
(重庆图书馆,四川 重庆 400037)
套录编目主要是指编目员为一种图书编目之前,先对从外部获取的编目数据进行必要的编辑加工,而后转换为本馆数据库记录的过程。由于套录编目不仅能节省大量的人力、物力,大大提高工作效率,而且还能有效地促进和提高本馆的编目质量,使书目数据朝着标准化、规范化方向发展,因此套录编目这一工作方式,越来越受到各馆的欢迎。
1.1.1 套录数据的优点
采用完全著录级次。一些图书馆虽已实现了计算机编目,但由于多种原因,对书目数据的编制,仅局限于目录状态下著录单元的内容,著录级次较低。而套录的数据采用的都是完全著录级次,对每种文献所提供的信息源都尽可能地进行全面的、准确地著录。如对于影印版的图书,除了在205字段进行著录外,还在305字段作相应的说明;著作者的著录,除在200字段的$f、$g进行著录外,又在7-字段进行了详细的著录,完善了书目数据的质量,满足读者多途径检索的需要,充分地发挥书目揭示文献的作用。
重视MARC格式中的连接对应。连接对应是机读目录的一个最明显的特点,也是最能体现机读目录的优势之处。套录的数据,重视了MARC格式的连接对应,如头标区与225、4字段的连接,105与215、320字段的连接对应。通过这些字段的连接对应,既使MARC的结构变得清晰有序,又保证了数据的前后一致,而且还能充分发挥计算机的检索功能,在文献检索中为用户提供更多的信息。
各字段、指示符和代码著录的准确率高。套录的数据,不仅比较准确地理解和使用了MARC格式中的各个子段、指示符,而且还特别注意对代码的准确著录。在MARC格式中,代码部分的头标区和编码信息中的每个字母都代表着文献的一个特征,如头标区中的第5字符位,c代表经修改的记录,d代表被删除的记录,n代表新记录;又如105字段中的0-3字符位为图表的代码,其中a代表图表,b代表地图,c代表肖像、画像,g代表乐谱,k代表表格,y代表无图表等等。对于习惯于传统编目的工作人员来说,代码部分的著录往往容易被忽视,致使这些字段的填充混乱不堪,影响了机读目录的检索效率。而在套录的数据中,编目员对文献的特征都进行了认真的分析,给出了正确的代码,使书目数据的质量上了一个新的台阶。
加强了文献标引的标准化程度。文献标引包括分类标引和主题标引两方面。分类标引:套录的数据,在分类标引上使用《中国图书分类法》(第四版),统一了分类标准,所给的类号能比较准确地揭示文献的学科属性,对于那些涉及多个学科内容的文献,仅用一个分类号难以揭示其完整内容,除了给主分类号外,还作了附加分类,这样既保证了分类规则对文献分类一致性的要求,使同类和相关的文献得以集中,又充分地揭示了文献的学科内容,便于读者检索。主题标引:许多馆在建库时,由于工作量大、时间紧等原因,缺少对主题分析字段的著录,形成有缺陷的数据,而套录的数据,加强了对这一字段的著录,使每一条记录都有主题分析字段,通过多个主题能从不同学科、不同时空、不同类型等角度去揭示文献的内容,比分类法更直观、更有专指性。
1.1.2 套录数据存在的问题
题名著录不规范。由于对题名的理解错误,使200字段中的$a子字段与$e子字段在著录时内容相混淆,造成某些数据在题名著录上的不规范。
例:由文贯中等主编的《WTO与中国:走经济全球化发展之路》一书,其封面、书名页、书脊及版权页上均以“WTO与中国:走经济全球化发展之路”的形式作为题名,但源记录著录为:
2001$aWTO与中国$e走经济全球化发展之路
在这条记录里,编目人员把“走经济全球化发展之路”错误地理解成是副题名,而根据文献编目规则规定:普通图书题名著录的主要信息资源应以书名页和版权页为准,因此,“走经济全球化发展之路”是正题名的组成部分,应著录在正题名各项里,不能作为副题名来著录。正确的著录方法应该为:
2001$aWTO与中国:走经济全球化发展之路
责任者著录比较混乱。在套录数据中,责任者著录所存在的问题是最多的,由于采用的标准不同,其著录形式也五花八门。当责任者超过三个时,有的只著录第一责任者,后面用“等”代替,如×××等编;有的只著录前面三个,后用……连接;还有的则采用责任者全部著录的方式。此外,在对责任者进行著录时,有的数据使用[ ],有的则不用。对于这些套录数据的处理,各馆可以根据实际情况采用某一标准,对不符合这一标准的数据进行逐条修改。
分类号错误:例《青少年团体治疗》分类号错标为:G913.5 应为:C913.5;《社会救助学》G913.7 应为:C913.7;《秘书基础》分类号错标为:G931.46应为:C931.46
因此,外部数据也难免存在这样或那样的问题,所以在使用外部数据时应该认真分析和严格审验,辨别对错,不能盲目使用或套录外部数据。
除了套录下载联机编目中心的数据和书商提供的数据,还有一部分图书没有数据,这些书有的比较新,有的是赠书或教材、标准、地方资料之类的图书,只能由分编人员自己进行原始编目。
原始编目存在的问题:
著录内容不规范。由于图书馆在不断地发展,在不同时期对著录的标准要求不同,导致对著录的级次也各异。随着网络的发展,现时期的著录的级次要求比较高,著录细致,使用了很多字段和子字段,做了较详细的著录;在回溯建库时著录粗浅,用简易编目,字段相对少,也许连225,410,702等必备字段也无从著录;有的使用了字段之间的连接和内容摘要,只进行必备的字段著录,对字段间的连接很少进行考虑,内容摘要更是没有著录;另外,对于作为主要检索点的主题词和关键词的标引,有的进行较深的标引,有的却没有作相应的标引。
著录标准不统一。在实际工作中发现馆藏数据库中的数据在著录上存在着不统一的现象。主要表现为:第一,多卷书分散著录和集中著录不同。有的集中著录作了一条记录,有的分散作了多条记录。第二,分散著录时正题名选择不同。一种做法是把总题名作为文献的正题名,与分卷题名共同组成文献的题名信息,另一种是把总题名作为丛编题名,把分卷题名作为文献的正题名。第三,3个及3个以上责任者的著录方式不同,有的所有责任者同时全部著录,有的只著录第一个责任者,其余的用“等”表示,在304字段说明。第四,对副题名、并列题名是否作检索点不统一。有的就在5—字段著录检索点了,有的就没著录,有的没有检索意义,由于编目员的水平和理解不同,也做了检索点著录。以上问题是由于受本馆编目传统、所用软件系统的影响及编目人员对编目规则理解不一致等原因造成,也是目前普遍存在的问题。
著录信息不准确。在馆藏数据库中存在着同书异号的,没有归类的数据;书名和作者录入有错字的;分类不准确及分类和主题标引不对应的,主题标引没有轮排的;字段和子字段使用不准确,以及字段的指示符录入错误等问题。有些是由于使用的系统软件的局限性,如我馆使用的韩国软件ECO,刚开始使用时因系统不稳定,造成一段时间编目员之间互相不能查重;有些是由于编目员工作态度不认真,只使用一种途径查重。而使用多种途径查重,确定无误后,再编目,就会减少同书异号现象的发生。
一个称职的编目人员不仅应具备广博的知识储备和精湛的专业技能,还要有严谨细致的工作作风和岗位意识,这是评价编目员业务能力的重要指标。面对当前学科的交叉、文理的渗透,分编人员要有足够的耐心,运用相关知识认真辨别、准确归类,决不能模棱两可妄下定论。对于联机下载来的数据还需要编目员去甄别、修改,才能转化成自己的数据。
选择优质的编目软件是做好计算机编目工作的前提,它直接关系到书目数据库及编目工作的水平。不同时期,编目软件有其各自的优缺点和局限性。且随着计算机自动化程度和机读目录编制工作的开展和深化,在实际运用中就会出现许多新问题。因此要求更新编目软件,不断修订和完善编目规则,增加新字段。在系统软件更新时,对原馆藏数据库的转换由于软件相互之间的不兼容性,也会造成编目数据质量的许多问题,如有的字段转换不过去或不完整,出现乱码等现象。
原始数据都是由分编业务人员掌握的,相关性也是他们最清楚,但他们不懂计算机程序。而编程人员大多数不熟悉业务,对相关性也难于理解,很难编写出业务人员使用方便、适应面宽、又很灵活的口径调整工具。一些领导对数据的认识缺乏严肃性和远见性,将手工处理时的随意性带到计算机处理中,长远下去工作肯定会受到影响。应用需求不明确,影响数据完整性和准确性。在系统开发之初,管理者说不清应用需求,设计目标难明确;系统开发中,不断冒出新要求,计划赶不上变化;系统开发完后,为了适应众口难调状况,修改、完善周期拖得很长。这样的系统,可利用的程度自然不高。
由于多数检索系统没有进入实际应用阶段,数据质量的控制和监督往往被人们忽视。绝大多数单位在数据准备、录入阶段缺乏审核等质量控制、监督措施。著录标引的检查,一般采取自己审核或互相审核的方法,少数单位也设专人负责质量检查,但实际上由于种种原因,不能将著录卡片与文件一一对应起来审核,有些问题也难发现。还有一些单位,由录入人员看着图书或仅仅看着预订目录往计算机中输入数据,质量就更无法控制和监督了。上述诸因素影响了数据质量的提高。
在应用程序范围,必须保证正确无误地输入和记录数据。应用程序的数据质量标准包括:保证数据的正确录入,信息没有因为自由形式的字段而被掩盖和飘浮不定。用于探测数据差错的程序是很重要的,这样可以确保错误的拼写不会导致重复的客户或产品条目的正确维护。
对于拥有大量客户记录的众多企业,或者甚至是对于那些只拥有普通客户数据库的企业来说,常规的数据库清理对于维护客户关系都是至关重要的。
数据质量提高后,在原有信息系统的基础上,通过数据挖掘对业务信息进行深加工,从中抽取知识或规律,并从不同的角度进行分析研究,将所发现的知识运用到信息管理、查询处理、决策支持、过程控制等许多领域,以构筑自己的竞争优势,扩大自己的营业额。将这些来自于不同部门的历史遗留数据进行分析、匹配,从而得到关于该客户详细、全面、一致而不重复的记录,并且将其存储到公司统一的中央客户数据库中。跨部门综合分析时,数据的相关性也很明确,可以按维划分、分簇、分类、分层、旋转,为今后的数据挖掘奠定一个良好的基础。
信息资源的多样化,导致信息资源渠道的多样性。只有编目技术才能把杂散的信息资源有序而系统的整合起来,全面而深入的给予揭示。我们未来的编目工作应该从传统的文献编目转向对信息资源的整合,从揭示馆藏转向对信息资源内容和完整知识体系的全面、深入的报道和揭示。
在网络环境下,编目工作除要保留原有职能外还应兼顾对多样化的信息资源的揭示、报道与提供。不能单一地处理信息资源的书目数据,还应多层面地处理文献和信息资源,包括:书目、目次、条目、规范名称、数据库、网站信息、全文信息、相关知识等。
目前的状况是:成熟的编目工作已经陆续被相关领域应用着,编目工作不再是图书馆的专利。如书商承包编目工作,编制简单书目数据,Library Thing之类的图书网站利用图书分类和主题标引整序图书,甚至链接到各个大型的图书馆获取或查询馆藏书目;图书馆资源的数字化和非MARC格式元数据的出现,都利用了编目技术和标准。编目工作孤军奋战的结果只能是自我消亡,唯一出路是与相关机构合作,与GOOGLE合作就意味着图书馆与相关机构携手的有力尝试。只有这样才能更好地整合信息资源内容,从而实现对知识体系全面深入的报道和揭示。
[1]方微,凌丽君.变革时代的文献编目——第二届全国文献编目工作研讨会论文集[G].北京:国家图书馆出版社,2010.
[2]张云瑾.数字化环境下编目工作的变革[J].科技情报开发与经济,2006(8).
[3]姚锦芳.浅析影响机读书目数据库质量的因素及解决对策[J].科技情报开发与经济,2006(22).