王思敏
摘要:为更好的了解纺织院校特色资源馆藏现状,了解各高校馆藏的差异、优势和不足,促进纺织高校图书资源的共知、共建和共享。本文对全国九所纺织院校的纺织服装大类图书OPAC数据进行整理,通过人工清洗加计算机自动匹配的模式,实现了9所纺织高校的联合书目。结果显示,纺织类高校的文献资源异质性高,加强资源的共建有利于提高整体纺织学科资源体系的完善,并总结了资源共建中院校间编目不规范的问题,为今后大范围的联盟和资源共建提供有益参考。
Abstract: In order to better understand the status quo of characteristic resources collection in Textile Universities, to understand the differences, advantages and disadvantages of the collection in various universities, and to promote the co-knowledge, co-construction and sharing of books resources in Textile Universities, in this paper, the OPAC data of textile and garment books in nine Textile Universities are sorted out, and the joint bibliography of nine Textile Universities is realized by the mode of manual cleaning and computer automatic matching. The results show that Textile Universities have high heterogeneity of literature resources. Strengthening the co-construction of textile resources is conducive to improving the overall textile discipline resources system. It also summarizes the problems of non-standardized inter-university cataloging in the co-construction of resources, and provides a useful reference for the future large-scale alliance and co-construction of resources.
关键词:纺织高校;图书馆联盟;资源共建;资源共享;联合书目;馆藏分析
Key words: Textile Universities;library consortia;resources co-construction;resource sharing;joint bibliography;collection analysis
0 引言
图书馆资源的共建和共享,不仅能够极大的提高资源的满足率,而且可以降低资源建设成本[1] [2] [3]。我国作为世界上最大的纺织品、服装生产和出口国,纺织行业在国民经济中占有举足轻重的地位。然而就纺织学科而言,在众多的学科领域中,仍属于小学科,纺织学科相关的专业数据库和专业学会并不多,资源量不够充沛。我国共有近30家纺织类高校,建校时间和规模不尽相同,各有自身优势学科,馆藏也有侧重点,资源存贮异质性很大。然而随着人才和信息的加速流通,各个高校对资源的需求不再仅局限于自身的优势学科,而转变为全面增长,单一高校的资源建设显得势单力薄。因此加强纺织院校资源的共知、共建、共享,势在必行[4]。
东华大学的刘建平,陈惠兰[5]提出在没有共建共享机制与体系的情况下,不仅工作效率和信息利用率低下,而且存在技术、信息资源、人才缺乏以及重复建设等问题;尹方屏,谷秀洁[6]。提出了构建跨区域“大纺织”学科联盟共享域的设想,让纺织行业间能够顺畅的进行沟通和学术交流,强強联合,共同提高。近年来,“中国高等教育文献保障系统”、“中国高校人文社会科学文献中心”等资源共享平台的投入运行,极大的丰富了国内信息资源,提高了信息满足率[7]。然而,纺织学科在全国性的文献信息资源共享平台中,并未达到应有的规模,学科资源不够丰富、学科体系不完整。
为了加快纺织学科的资源共建和共享,我馆联合武汉纺织大学,东华大学,江南大学,北京服装学院,苏州大学,天津工业大学,盐城工学院,浙江理工大学,西安工程大学,国内共九所纺织兄弟院校,对纺织专业图书互通有无,建立联合目录,了解各自馆藏资源优势和不足,加强资源互补,为今后的共建和共享奠定基础,更好的为纺织行业的发展发挥作用。
1 纺织高校馆藏状况分析
1.1 数据来源
本次联合书目的收集、整理工作,共收到来自全国9所纺织兄弟院校的提供的TS1和TS9大类OPAC数据,共计113509条。其中TS1大类书目数据35573条,TS9大类书目数据77936条。具体数量见表1。
各个高校提供的数据略有差异:部分高校提供图书的本数,也有部分高校提供图书种数。
1.2 数据分析
数据的分析和处理,是本次整理工作的难点。原因在于书目数据编目较为混乱,随意性大。各个高校著录的详简级次不同、编目规则不同,质量差别大,给数据分析和匹配工作带来极大的困难。主要问题有以下几种:
①ISBN缺失严重:
ISBN号录入的主要问题有:1)缺失严重,共有3万多册图书没有ISBN号;2)ISBN号写法不一致,有些带连字符“-”,有些采用简写的方式,位数也不一致;3)年代较早的图书没有ISBN;4)系列图书多本共用一个ISBN。
②题目、作者、出版社等字段,书写混乱:
字段著录的随意性很大,同样一本图书,由于著录的问题造成计算机不能准确识别。主要问题有:1)同一责任者没有明确统一的著录形式;2)多个责任者的著录数量有差别;3)对机构名称著录时全称简称并存,且简称程度不同;4)对个人著者名称的附加和复分成分没有优先顺序;5)作者和出版社字段混淆;6)著录中遇到的生僻字,拼写错误或者漏写[8]。示例见表2、表3。
③著录信息、字段严重不足,影响对图书信息的识别;
1)题目著录过于简单;2)上下册及分册未进行著录,并且非全套购买的图书;3)同一书名,有不同年份和版本,且未进行标注的。此类数据基本无法识别图书的真实信息,更不能准确的与其他院校图书进行匹配,对人工处理也造成了困难。为此,项目组设置了统一的处理原则,规范化处理该类模糊数据。
1.3 数据处理方法及原则
鉴于各个高校数据著录不一致的情况,项目组采用计算机自动匹配和手工清洗相结合的方式,完成联合目录的制作。
对于数据录入准确的记录可以直接采用计算机自动匹配;而对录入方式不一致的相似记录,采用先手工清洗数据,后计算机匹配的方式进行。
1.3.1 计算机自动匹配:结合数据实际情况,设计了两种自动匹配算法。
①通过ISBN号匹配:ISBN号匹配的准确度高,但是由于ISBN号著录格式多样的问题,匹配成功概率小,该方法仅用于初次匹配;
②通过题名、作者、出版社三个字段结合进行匹配:作为最主要的匹配算法,用于初次匹配和手工清洗后的数据匹配。当题名、作者、出版社三个字段均相同时,计算机才认为两条书目数据相同。
1.3.2 手工清理数据:通过手工规范题名和作者、出版社,使得相似记录的三个字段完全一致,便于计算机匹配。
我馆投入五名骨干馆员,耗时两周进行数据清洗。为了使清洗结果更加准确,减少个人主观判断,项目组制定了统一的数据清洗原则:
①如果疑难记录来自同一个学校,根据分类号或者ISBN判断是否为副本数据,相似记录尽量不做合并,以免较少馆藏;
②如果疑难记录来自不同学校,且较为相似,可以归为一本书,对各馆馆藏量不会产生影响;
③对于同馆的多条重复记录,参照其他馆的上、下册,或者版本情况,进行手工修正,补全提名;
④日文、俄文等小语种图书,由于语言问题,无法进行人工识别,仅通过计算机进行自动匹配;
⑤将人工判定相同的记录,其题目、作者和地址三个字段复制成一致,便于后续计算机识别。
在数据确实难以辨别的情况下,进行集体讨论,以尽量不减少各馆馆藏为主要原则。
2 结果
2.1 纺织高校馆藏联合目录的实现
按照以上数据处理过程,完成了9所纺织院校的TS1大类和TS9大类图书联合目录。图1是节选的TS9联合目录。如图1所示,联合目录中标注了每一条OPAC数据所在的图书馆,以及各馆的副本量、馆藏共有情况。目前该联合目录已在9所院校内进行共享。
2.2 馆藏分析
从各馆图书的馆藏与联合目录的覆盖率来看,每所高校的图书覆盖率都未能超过联合书目的50%。具体数据如图2、图3所示。
TS1大类图书,江南大学馆藏覆盖率最高,为47.4%,而最低为8.03%,纺织大类图书馆藏覆盖率差别较大;TS9类图书馆藏覆盖率为39.6%,最低为10.57%。主要的原因在于TS9大类不完全为纺织服装类图书,因此各馆差异较大,各有千秋。但总体而言,纺织高校图书馆的馆藏的异质性很高,图书的共建、共享有利于各馆的发展。
3 总结与展望
馆藏的共知是进行共建和共享的前提。通过联合目录进行馆藏分析,可以了解整体纺织类图书馆的馆藏现状,认识馆藏的差异、优势和不足,不仅有利于加强和完善自身馆藏建设,同时也让各个图书馆看到了资源共享的必要性。
然而资源共享并非易事,要准确实现资源的共享需要数据提供方和数据组织单位共同努力:作为数据提供方,在进行数据共享时,尽可能对数据进行预处理,提供规范化的数据,便于对真实信息的识别;而数据组织单位,应提出具体的要求,规范数据的格式。
在信息资源共享這个大趋势下,纺织类高校图书馆应进一步规范编目工作,选择适宜的著录标准、著录详简级次,确保目录质量,便于数据发现和资源共享,加强资源流通,提升资源价值,促进我国纺织行业的发展。
参考文献:
[1]赵伯兴,盛兴军.网络条件下我国合作构建文献储存库的理论思考——兼论低利用率文献的共建共享[J].图书情报工作,2008,52(1):109-111,116.
[2]张红扬.弘扬文化传统彰显个性特色——试论近年来高校图书馆特藏的发展[J].大学图书馆学报,2007,25(2):83-87.
[3]姜爱蓉.21世纪大学图书馆的文献资源共享趋势[J].图书情报工作,2000,44(7):59-62.
[4]王广三.图书馆联盟知识共享影响因素及策略研究[J].图书馆工作与研究,2017(10):37-41.
[5]刘建平,陈惠兰.高校图书馆纺织服装学科信息资源共建共享研究[J] .图书情报工作,2009,53(11):80-83.
[6]尹方屏,谷秀洁.构建跨区域“大纺织”学科联盟共享域的可行性研究——CALIS示范馆建设启示[J].图书馆学研究,2012(10):91-94.
[7]李锦兰.国内区域图书馆联盟研究——基于31个省级图书馆联盟网站的调研[J].图书馆工作与研究,2017(03):56-61.
[8]牛丽莉.高校合并后多校区馆藏文献共建共享的问题[J].图书馆建设,2002(5):93-94.