我国源书目信息发展现状研究
——基于图书在版编目(CIP)的分析
李 霄
论文立足于我国CIP领域的研究和实践,明确了CIP信息的生产和应用对出版发行、图书馆等社会各领域发展的重要意义,正面探讨了CIP数据中存在的质量问题并分析其原因,由此提出通过强化CIP数据在出版行业管理中的作用,改革推动建立服务导向型的数据管理体制,发挥源书目在发行领域的作用和筹划建设ECIP等措施,以顺应信息科技和体制改革的趋势,优化CIP数据链并推动CIP信息在多领域中的应用。
CIP数据信息源书目信息发展
图书在版编目(Cataloguing in Publication,简称CIP)处于出版业末端,但同时又位于图书馆业前端,是书目信息的源头。CIP数据信息与图书供应链上的出版机构、发行机构、零售机构、图书馆和终端消费者都密切相关,能为科学管理出版行业提供支撑性信息共享和服务。在文献共享和信息科技不断进步的推动下,CIP数据资源将广泛应用于出版、发行、书目、图书馆和网络信息服务等行业,发挥其独特的源信息资源优势,并产生更好的社会效益和更大的经济效益。
实施CIP的主要目的就是通过国家权威机构及专家对在版图书的著录和标引,产生相关图书通用性的、规范化的书目记录,使之能应用于各类文献信息部门和各种书目文献产品之中,从而实现图书著录和标引的标准化。作为源头和基础编目,它被要求能够“高屋建瓴”,兼容并包地发挥书目数据共享作用。
CIP的作用在于:一次编目,多次利用。出版发行部门和图书馆共同使用CIP数据可以减少重复编目,提高编目效率;图书馆采用通用、统一、权威的书目数据,可以推动文献编目工作标准化、规范化,促进书目数据资源共享;可以提高国家书目的完备性与及时性,促进国家书目控制的实现。其理想目标是“书源一次编目,多次复用共享,杜绝重复劳动,提高社会效率”。然而,要真正实现这一目标却绝非易事,在版编目工作任重而道远。
2.1 理论研究结构不合理,需拓展信息管理学科领域进行多角度的探索研究
近30年来,CIP一直是理论界较为关注的研究领域。从检索中国期刊全文数据库的结果来看,自1980年至2014年,以“在版编目”为主题的文献超过1000篇,每年都有该主题的文章发表,且随着CIP工作的推进和发展,论文数量也在不断增多。如图1所示,自1992年新闻出版总署在北京开始试点,发表的文献数量就呈上升趋势,至1997年正式成立在版编目CIP中心,并向全国范围内全面推广开来,其研究文献数量增加的速度也在加快,涉及的学科范围也越来越广。
据统计,到目前为止,虽然关于CIP的研究性文献涉及到图书馆学、出版学、情报学、计算机等学科领域,然而研究结构不够合理,主要表现在以下几个方面。①近半数的论文虽有关于论述CIP数据中的著录和标引等错误,但鲜有实质性的解决方案,低水平重复研究较为严重;②20%左右的论文围绕“CIP工作现状”,多数提出了问题,但在文中缺乏行之有效的对策;③10%的文献谈了CIP的意义和作用,但多数是关于其对图书馆采购、分类、编目的影响和作用,而探讨CIP影响和作用于出版行业管理、图书流通发行方面的论文却不多见;④极度缺乏关于ECIP与信息技术应用于在版编目的研究论文。
虽然对于在版编目的研究表现出基础理论薄弱,针对我国客观情况的原创成果不多,但其中仍有少量论文在CIP的利用、共享机制、管理体制以及相关服务中做出了一些有益的研究探索,如一些学者呼吁加强利用CIP数据、优化CIP共享机制,还有学者踊跃提出了改革目前CIP管理与服务体制的对策建议,大胆提出构建CIP数据集成服务,在一定程度上开拓了在版编目的研究视野。
2.2 出版管理体制改革优化了源书目数据的生产链
随着出版行政管理体制的不断推进,2010年,新闻出版总署整合中国版本图书馆与条码中心两家直属事业单位的职能,合并成立中国版本图书馆(新闻出版总署条码中心),首次将书号实名申领、条码制作、图书在版编目(CIP)数据制作、馆藏样书编目数据制作和样书收藏管理等业务一并整合起来,客观上串联了图书从印前信息一直到样书管理的完整工作链和数据链,具备了为政府、行业和社会提供出版物信息服务的基础资源优势[1]。机构整合之后,组建了出版物标识部,尝试整合ISBN、CIP的一体化运行,试图对出版社从申请书号到获批下载条码提供一站式服务,改变出版单位重复递送图书信息所造成的资源浪费现象。虽然,ISBN、CIP两者在功能上各有不同,在元数据兼容上需要较长的过程,但机构的整合已经在一定程度上优化了源书目数据生产的链条。
2.3 CIP工作的发展
我国的CIP工作从1993年起步至今已经取得了长足进展。出版社加入到CIP的数量由1993年的41家到已覆盖全国所有出版社;工作方式从手工编目加邮寄、传真到今天的网络编目;CIP数据从最初年编制上千条发展到现在数十万条。目前,图书上是否印有CIP数据已经成为出版物标准化、规范化的重要标志之一,同时经过20年的积累,版本图书馆已经建立起一个全国唯一的、信息最全的图书印前书目数据库[2]。
CIP作为一项国家标准在全国范围内推行多年,每年发布的CIP数据量有增无减,客观上反映出CIP的规模不断扩大,数据资源日益丰富。根据全国图书在版编目业务系统内的数据统计显示,2013年发布的数据量比2001年增长了3倍多,年平均增长率为10%(具体增长趋势见图2)。就目前情况来看,2014年已核准发布数据180 584条,预计至2014年底,该数据库将有书目数据近300万条。
数据量增长的同时也带来了质量问题,对此版本图书馆采取一系列措施狠抓数据质量,并一直将此作为CIP工作的重点。首先,自2006年起,版本图书馆每年开展一次全国性的CIP数据质量抽检工作,通过对比一定数量的法定呈缴本来评估CIP数据的差错率,从而发现和总结问题,以便更好地解决问题。其次,完善联系人制度,要求出版社CIP申报由专人负责,并加强对出版社CIP申报人员的业务培训,建立岗前培训制度,做到从源头上规范数据,从而确保CIP数据质量的稳步提高[2]。最后,在内部建章立制,培训新上岗的标引人员,并在内部开展业务交流和探讨。
3.1 数据质量控制问题
3.1.1 CIP数据的制作由多部门人员参与,难以实现著录统一控制
一本书的信息著录项目包括“正书名、交替书名、合订书名、正文语种、责任人、责任编辑”等等共57项,所有信息都是由出版社来提供。虽然CIP数据的制作是由各出版社CIP申报人员与版本图书馆的
CIP编目员共同完成,但出版单位数据申报环节是影响CIP数据质量的关键所在[2]。出版社将每一本图书的相关CIP数据信息提交“全国图书在版编目业务系统”后,CIP中心的编目员根据此进行分类标引和主题词标引,随后由系统生成可排印的CIP数据格式再供出版社下载发排。在这一过程中,如果出版社负责填写相关信息的工作人员、数据审核加工人员、CIP标引人员及编辑排版人员,在专业技能、工作态度上稍有不足都会导致数据在内容和格式上的差误。
多次质检抽查显示,数据申报人员对字段的含义不理解或误解以及对相关规则的不掌握,是造成漏报、错报的主要原因之一。再加上目前出版社人员流动频繁,对CIP信息在图书销售中的作用认识不足,由此容易造成申报环节的错误。为此,CIP中心虽然不断加强和各家出版社的联系,但由于双方没有行政隶属关系,很难对全国多家出版单位的CIP申报工作进行统一管理和控制。
此外,在成书出来之前还存在一段信息不可控的空间,一些图书在下载CIP数据后还会改动信息,例如书名、出版时间都有变动,如果出版社不及时通报CIP中心进行相应修订,就会造成CIP数据与成书信息的不一致,降低CIP数据的正确率和权威度。3.1.2 关于标引的误差率问题
CIP数据中一直存在的分类和主题标引项的错误问题,影响了图书馆采分编业务的开展,图书馆界的专家和同仁们已做出诸多批评指正,客观上给我们的工作起到指导和督促作用,版本图书馆也尽力采取了一些措施来改善这一问题。
标引的错误包含客观和主观原因,一方面CIP的标引工作在强度和难度上都要大于一般的图书编目。CIP标引依据的不是清样,更不是成书,而是出版社提供的简略数据,CIP编目员所能获取的图书信息量很有限,若想进一步获取图书信息只能通过电话与责编联系沟通以确保信息准确。另一方面存在一些无法控制的情况。例如,一些图书出版后在内容和题名上有较大的改动,那么之前制作的CIP数据中的分类和主题词就会必然出现谬误;还有少数出版社存在对部分图书信息不报、漏报,甚至自制和伪造CIP数据并印在图书上的情况;盗版盗印的非法图书也会将粗制滥造的CIP数据印在图书上。诸如此类情况所产生的差错率全部计入在内,就不能客观评估CIP数据质量,从而不利于在根本上提高数据质量[3]。3.2 目前的数据管理体制难以满足信息服务的需求
在我国,CIP的主要任务是推行国家标准、实现书目信息标准化,客观上也具有出版物信息登记备案的功能。CIP中心在数据的制作上一方面要保证管理部门登记审批,另一方面要不耽误出版社的正常出书,但目前数据的运行机制却呈现明显的生产导向特征。因此,在目前的CIP工作体系下,各界都有“CIP数据质量不够高”的反馈,这也侧面反映出不符合各类用户的质量标准[4]。针对这一问题,我们在不断推行CIP数据跨行业应用的进程中,特别是为不同行业和对象提供信息服务和咨询服务时,例如,向行政管理部门提供相关行业数据来支撑管理、向出版发行部门提供预印信息发布行业趋势、向图书馆优化馆藏编目、向科学研究团体或个人提供定制服务等等,就必须考虑不同用户的需求差异,逐步将服务用户融入业务管理体制之中。
3.3 关于公益产品亦或信息商品的性质问题
目前,关于CIP数据产品及服务产品的社会性质理论界和业界都存在争议,焦点集中在是“公益产品”还是“信息商品”。争议的存在说明性质复杂。从CIP工作资源配置的角度看,CIP中心的上级单位是中国版本图书馆,属于差额拨款单位,可以通过开展增值服务来补贴工作经费;从CIP数据产品及服务产品生产或服务层次的角度看,基本的、普遍的、简单的CIP数据产品及服务产品必须具有“公益产品”的性质,应提供均等化普遍服务,但是高级的、个性的、复杂的CIP数据产品及服务产品必然具有“信息商品”的性质,应进行市场化供给服务[4]。
4.1 加强CIP数据的利用和挖掘,推动出版行业科学化管理
在版编目(CIP)属于“金版工程”之一,对其在出版管理中的重要地位需要充分认识与发挥,不断提高CIP数据的利用和挖掘,才能推动出版行业实行科学化的管理。首先,通过CIP数据记录(连同随后的法定呈缴本记录)不仅可以了解各单位漏号、重号、错号、一号多书等书号使用状况,规范出版社对书号的使用,还可以了解漏缴样书,保证催缴补缴的工作。其次,通过数据的统计分析,可以了解各年出书情况,掌握图书出版的历史轨迹和发展趋势。第三,与出版社上报的选题对比还可以了解每年的选题计划执行情况、选题外出书比例。此外,根据陈源蒸同志提出的“电子底账+联网核查”管理方法[5],即建立包括出版单位的印制委托书、书刊印刷许可证、跨地区印制的批件、图书发行经营许可证、图书发行销售合同等文件在内的原件扫描文本组成的“电子底账”与CIP信息联合起来,将出版、印刷、发行每一环
节的内容和相关数据都记录在案,实行有效监督和科学管理,在打击盗版盗印等非法活动、保护出版者和作者的合法权益方面有重要意义。
4.2 探索建立服务主导型CIP数据管理体制
目前,我国的CIP工作是一种国家发展目标导向的发展模式,即由政府关注、出资和推动,旨在加快书目标准化、规范化和社会化,减少全社会重复编目,提高社会书目工作效率,实现出版书目信息资源共享。在CIP数据跨行业应用与信息共享的背景下,我国CIP数据制作必须考虑各行业的不同需求特点,逐步建立起服务主导型的业务管理体制。随着CIP工作标准化、自动化和兼容化等技术的发展,今后的CIP工作可能会逐步形成更加强调满足业界和相关领域的目录用户需求的“国家目标—用户目标”复合导向发展模式。
4.3 努力发挥源书目信息资源的基础性作用,推动CIP信息资源在发行领域的应用
图书发行单位为赢得更多的订单数,占有最大的市场份额,获取较好的经济收益,会尽可能让读者在图书正式出版之前就了解到相关信息。然而发行领域采用的数据标准不一,新华书店和各类民营渠道呈现各自为政的状态,发行部门没有采用《中图分类法》,还无法与CIP数据实现兼容互通等等问题阻碍着CIP源书目信息基础性作用的发挥。因此,我们需要努力发挥CIP源书目信息资源的基础性作用,推动CIP信息资源在发行领域的应用。目前,网络书店和综合性网络零售商日益占据销售主流,就在于书目信息对于线上销售渠道发挥了基础性作用。而以实体书店为主的线下渠道所编制的征订目录,其传递的图书信息明显滞后于线上的图书信息。为实现图书数据链上游的出版信息与下游的销售信息完整对接,必须由CIP信息资源为图书发行书目信息铺底,在标准和技术上加快推进CIP源书目的标准化、规范化和社会化。
4.4 研究筹划建设ECIP
ECIP是图书在版编目自动化、网络化建设的战略性目标和手段,就是在出版过程中,用数据库方式对图书的印前电子文本进行处理,将图书有关数据元素录入相应的字段、子字段,再通过计算机编目软件处理产生目录卡片和机读目录。美国国会图书馆1995开始实施ECIP,到2007年自动编目已成为主要手段。根据美国的实施经验,ECIP项目能够极大地丰富CIP的数据项目,扩充提交内容,有利于提高CIP的准确性和完整性,还可以缩短制作周期,极大提高效率。对于我国行业发展更具意义的是,ECIP能促使出版业、发行商与图书馆采用共同的元数据格式与统一的数字化书目产品,有效改变社会性重复劳动的局面,对电子书(EBook)的规范出版和数字图书馆(e-library,或D-Library)的发展有着举足轻重的作用。
ECIP是我国CIP发展的必由之路。我国目前已开始进行理论探讨,但在实际发展中还存在管理上和技术上的障碍。例如,CIP所申报备案的项目中没有图书的电子文本(清样),再加上我国图书出版中普遍使用激光照排技术,现有的录入排版软件所产生的文本型文件(而非结构型文件),不能进行属性检索,还不能产生计算机可读的书目记录[6]。
顺应图书在版编目工作的深层发展,网络技术的不断完善,以及各行业各部门的发展需求,ECIP计划已提到议事日程。因此,我们将会立足于自身,通过完善出版物信息管理来丰富CIP的信息内容,通过修订国家标准来规范信息格式,通过应用现代化的科学技术来优化CIP的生产手段。我们也呼吁业界的专家同仁们加入ECIP的筹划建设中来,早日实现我国书目事业的现代化。
[1]左晓光.在2011年度全国书号、条码、图书在版编目管理工作会议上的报告[R].2011.
[2]左晓光.在2012年度全国书号、条码、CIP管理工作会议上的报告[R].2012.
[3]郝志平.CIP数据差错原因分析及解决对策:从图书责任编辑开始关注CIP数据质量谈起[J].全国新书目,2000(10):8-9.
[4]雄伟.图书在版编目数据集成服务体系构建问题研究[D].西安:西北大学,2010.
[5]陈源蒸.尽快实施ECIP计划[J].出版经济,2001(12):43-45.
[6]杨兰芝,田昊,曾照云.CIP存在的问题与ECIP计划的实施[J].现代情报,2007(6):149-151.
李霄中国版本图书馆编辑。北京,100005。
Chinese Source Bibliography Development Research:Based on the Chinese Cataloguing in Publication(CIP)
Li Xiao
Based on the theory and application of the national cataloguing in publication(CIP),this paper gives an explicit target and its value in improving the publishing,library and related industry,discusses about the quality issues and the reasons,and accordingly proposes some measures like enhancing the CIP data mining in the publishing industry administration,building the service-oriented management system through reformation,developing its application in the book circulation and preparing to establishing the ECIP project,in order to optimize the CIP production and improve its application in other fields,which complying with the information technology update and the system reform.
CIP data information.Source bibliography.Information development.
G257
2014-08-30编校:方玮)