基于共词分析的编目研究主题与未来热点分析

2016-03-15 01:19
长春师范大学学报 2016年2期
关键词:联机编目规则

王 晓

(广东培正学院图书馆,广东广州 510830)



基于共词分析的编目研究主题与未来热点分析

王晓

(广东培正学院图书馆,广东广州 510830)

[摘要]以CNKI数据库为来源,基于2010-2014年间公开的1691篇编目论文,利用BICOMB和SPSS 20.0软件作为研究工具,在共词分析的基础上,通过聚类分析与多维尺度分析,总结与归纳了编目领域的四大研究主题。这四大主题分别是编目工作管理、编目业务外包及质量控制、编目员与读者服务、编目规则与联机联合编目。并在此基础上,展望了未来编目研究的热点和方向。

[关键词]编目;主题;共词分析;聚类分析;多维尺度 是从论文的题名、摘要和正文提炼出来的,能反映某一学科领域的发展方向,高频关键词更能体现某一领域的研究热点。利用BICOMB对1813篇论文的关键词进行统计,得到了2877个关键词,篇均关键词1.587。其中,频次最多的关键词是“图书馆”,共出现308次;第二位是“编目”,共出现234次;第三位是“编目工作”,共出现186次;第四位是“高校图书馆”,共出现182次。本文选取排名前35位的关键词作为高频关键词,频次大于等于21,累计比例达到了31.0513%,如表1所示。

近几年RDA(资源描述与检索)的研究热潮正推动编目工作进入一个新的领域,编目规则也正朝向国际化、全球化的融合方向发展,不同类型的图书馆也开始受到新理论、新规则的影响,传统编目工作、编目管理产生变革与创新,编目界正面临一场前所未有的冲击与挑战。

随着图书馆外包业务的不断发展,从事具体编目业务与实践工作的人员相应减少,编目研究的论文数量也在减少,这与编目国际化、全球化的发展产生了一些矛盾,即编目规则的统一化意味着需要大量的实践工作去解决中国编目规则与国际编目规则的差异,而编目人员与编目论文的减少意味着统一的过程的漫长,这与网络时代、信息时代快速获取知识的需要存在矛盾。因此,在现有条件下,编目实践者以及研究者应当对近年来的研究主题与未来热点有一个准确、清晰的认识,从而明确自身的研究方向,为我国编目的理论与实践创造有价值的研究成果,进而使编目适应时代需要,为我国的科学技术与综合国力发展提供应有的知识力量。

本文从最近5年的期刊论文中,通过高频关键词、共词分析、聚类分析与多维尺度分析等方法对编目领域的研究主题进行归纳与总结,在此基础上探寻未来的研究热点,以期给编目领域的研究人员与管理人员一个清晰的概念与图谱,从而更好地开展编目工作与编目研究。

1数据来源与研究工具

1.1数据来源

本研究以中国知网(CNKI)作为数据来源,在学科领域中选取信息科技中“图书情报与数字图书馆”, 然后再选择包含期刊、特色期刊、博士、硕士、国内会议、国际会议、报纸、学术期刊、商业评论等数据来源的9个数据库,以“编目”为主题进行检索,数据的起止时间段设为2010-2014年,共5年,检索时间为2015年3月21日,共检索出期刊论文1813篇,论文的时间分布及相关信息见图1。由图中的数据变化可以看出,编目研究呈现持续降温的过程,特别是从2013年开始,论文数量、作者数量以及作者所在机构的数量明显减少。笔者认为这是由于图书馆编目业务外包导致编目人员的减少,从而导致编目研究论文数量减少。

1.2研究工具

要对研究热点及主题进行分析,必须要获得高频关键词的共现矩阵,因此需要采用相关的计量分析软件。

图1 2010-2014年论文数量及相关信息的变化

本文采用BICOMB(书目共现分析系统)软件进行关键词频次的统计、关键词共现矩阵的产生。此外,还要对共现矩阵进行聚类分析与多维尺度分析,所以还需要采用SPSS软件。最后,要对相关数据进行统计分析并产生图表,因此还需要最基本的图表软件EXCEL。

2论文关键词及研究热点分析

2.1高频关键词的统计分析

表1 2005-2014年编目论文高频关键词统计

由表1可以看出,除了前4位关键词外,“业务外包”“质量控制”“书目数据”“网络环境”“RDA”“联合编目”“编目员”“公共图书馆”等也是编目研究领域的主要高频关键词。从这些主要高频关键词中,可以看出编目领域的研究热点主要集中在高校图书馆的业务外包、质量控制以及RDA等领域。另外,“联机编目”“编目规则”“读者服务”“资源共享”“管理”等次要高频关键词也反映了编目研究还关注编目规则、资源共享与读者服务等主题。

2.2高频关键词的共词分析

尽管从高频关键词的变化能对研究热点与重点进行初步估计,但要准确判断5年间的研究热点与主题,还需要科学的统计与分析方法。共词分析方法是一种内容分析技术,即以高频关键词共同出现的次数为基础进行聚类分析,从而将大量的关键词缩减为几个大类,再根据某个大类的关键词来确定研究的热点与主题。

利用BICOMB软件中的共现矩阵功能,可以得到35*35的共现矩阵。表2是关键词共现矩阵的部分数据,其中,对角线上的数字是关键词出现的频次,而非对角线的数字是两个关键词共现的次数,表示两个关键词有多少次出现在同一篇论文中。例如,“图书馆”的频次是308, 它与“业务外包”同时在39篇论文中出现,表示有39篇论文中同时出现过这两个关键词。“图书编目”与“文献编目”的共现次数为0,表示没有一篇论文中同时出现这两个关键词。

表2 编目论文高频关键词共现矩阵(部分)

注:为了节省篇幅,第一行中的数字分别与第一列的关键词一一对应。例如,1代表图书馆,2代表编目,依次类推。

尽管表3给出了高频关键词的共现次数,但还是无法给出这些关键词之间的内在关系,还需要对共现矩阵进行深入处理。由于关键词的频次与共现次数的差异较大,直接利用SPSS软件进行聚类分析难以获得准确的结果。为了消除频次悬殊造成的影响,需要将共现矩阵转化为相关矩阵。在相关矩阵中,相关系数的大小表示两个关键词之间的距离远近,值越接近1,关键词之间的相似度越大,反之亦然。由于在相关矩阵中,自相关系数与相关系数间的差异还是较大,进行聚类分析会产生误差,因此还需要将相关矩阵进一步转换为相异矩阵。在相异矩阵中,数值越大,表明关键词之间的相似度越小;数值越小,相似度越大。表3是关键词相异矩阵的部分数据。

表3 编目论文高频关键词相异矩阵(部分)

2.3高频关键词的聚类分析

在某个研究领域的众多关键词中,通过聚类分析可以把关系密切的关键词聚集在一起形成不同的类别,从而形成研究的主题。本文使用SPSS 20.0对表4中的相异矩阵进行聚类分析。在聚类分析中,使用系统聚类的方法,聚类方法选择最远邻元素,度量标准中选择区间中平方Euclidean距离。聚类分析的结果中会出现冰柱图与树形图,分别见图2和图3。

图2 关键词相异矩阵聚类分析冰柱图

根据冰柱图与树形图的聚类结构,可以把编目领域的研究主题大致划分为四类。第一类是关于图书编目管理方面的问题与对策的相关研究,包含的关键词有对策、问题、编目、管理、图书等。第二类是关于图书馆编目业务外包及质量控制的相关研究,包含的关键词有编目外包、编目业务外包、图书编目、质量控制、高校图书馆、编目业务、外包、图书馆、业务外包等。第三类是关于网络环境下编目员及读者服务的相关研究,包含的关键词有网络环境、编目人员、编目工作、文献编目、编目员、读者服务等。第四类是关于编目规则、编目格式以及联机联合编目的相关研究,包含的关键词有RDA、编目规则、著录、机读目录、CNMARC、西文编目、图书馆编目、联合编目、资源共享、公共图书馆、数字图书馆、书目数据、联机编目、编目数据、中文图书等。

2.4高频关键词的多维尺度分析

多维尺度分析法是一种将多维空间的研究对象简化到低维空间进行定位、分类和归类,同时又保留对象间原始关系的数据分析方法。对相异矩阵进行多维尺度分析,距离设置为“从数据创建距离”,度量标准选择区间中的块,度量水平选择序数。在分析结果中,Stress和RSQ分别表示多维尺度分析的信度与效度估计值:Stress是拟合度量值,值越小表示拟合度越好,一般在0.2以内;RSQ是判定系数,值越大越好,一般在0.6以上。本研究的多维尺度分析结果中,Stress=0.13726,RSQ=0.90668,完全满足多维尺度分析的信度与效度要求。多维尺度分析的可视化结果如图4所示,根据关键词在图中的距离远近,产学研领域的研究主题可以划分为四类。具体来说,研究主题分别为:主题域1——编目工作管理,主题域2——图书馆编目业务外包及质量控制,主题域3——编目员与读者服务,主题域4——编目规则与联机联合编目。将聚类分析的结果与多维尺度分析的结果进行比较,两种分析得到的编目研究主题完全一致。

图3 关键词相异矩阵聚类分析树形图

2.5对三大研究主题域的解读

2.5.1主题域1——编目工作管理

这个主题域中包含的主要关键词有对策、编目、管理、问题与图书。该主题的研究属于一般性业务研究,涉及的范围包括高校图书馆合并后的编目工作问题[1]、网络电子期刊编目的问题[2]、小语种图书建设与编目的问题[3]以及编目数据套录[4]等问题。

2.5.2主题域2——编目业务外包及质量控制

这个主题域中包含的主要关键词有编目外包、编目业务外包、图书编目、质量控制、高校图书馆、编目业务、外包、图书馆、业务外包等。总的来说,这个领域的研究还是集中于高校图书馆编目业务外包的质量控制。质量控制是一个比较大的概念,在这个大概念下还可以细分质量控制模式[5]、绩效评价[6]、评价机制与评价模型[7]等。此外,编目业务外包还涉及外包的决策方法[8]、外包模式[9-11]等方面的研究。

2.5.3主题域3——编目人员及读者服务

这个主题域中包含的主要关键词有网络环境、编目人员、编目工作、文献编目、编目员、读者服务等。网络环境下,编目业务对编目员提出了更高的要求,编目员的素质直接影响到编目质量、读者服务与图书馆可持续发展[12]。特别是编目业务外包出去后,编目员还需要进行角色转换与职能更新[13-14],迎接新岗位的挑战。因此,编目员与编目人员的素质建设[15-16]、角色转换、职能更新以及如何更好为读者服务[17]都是研究的重要方面。

图4 编目论文关键词的多维尺度分析

2.5.4主题域3——编目规则与联机联合编目

这个主题域中包含的主要关键词有RDA、编目规则、著录、机读目录、CNMARC、西文编目、图书馆编目、联合编目、资源共享、公共图书馆、数字图书馆、书目数据、联机编目、编目数据、中文图书等。尽管这个领域有众多关键词,从整体上可以归纳为编目规则与资源共享的主题,即RDA、编目规则、机读目录、CNMARC等关键词侧重于编目规则与编目格式的研究,而联合编目、资源共享与联机编目侧重于合作编目与资源共享的研究。例如,《中国文献编目规则》与RDA在编修机制、地图资源、连续出版物、电子资源著录、乐谱规则等方面的对比、比较、异同分析[18-22]就是学者们对编目规则与实践进行的研究。

3未来研究展望

通过对关键词频次分析、关键词频次的时间分布、聚类分析、多维尺度等方法,可以将产学研研究的主题划分为图书馆编目工作管理、编目业务外包即质量控制、编目员与读者服务、编目规则与联机联合编目。但随着编目规则的标准化、统一化、国际化、全球化的发展趋势,联机联合编目与资源共享范围的扩大,编目领域的未来研究方向很值得探究。

随着编目数字化、网络化的发展,联机联合编目与编目业务外包等合作编目形式的扩大,编目规则与编目格式的修订与统一,图书馆编目会面临很多新的问题与挑战,这也意味着编目管理工作也会不断更新。未来的编目工作管理研究会随着编目业务外包、编目规则、联机联合编目的发展而变动。

联机联合编目在我国已经实践了多年。最早的全国图书馆联合编目中心(OLCC)于1997年10月成立,之后相继出现了CALIS联机合作编目中心(CUCC)、地方版文献联合采编协作网(CRLNet)、上海市文献联合编目中心(SIUCC)、中国科学院数字图书馆联机联合编目服务系统(UNICAT)等联机联合编目机构。尽管这些机构在联合编目与资源共享方面发挥了重要价值与作用,但也带来了标准与规范、质量控制、数据库建设、协作与共享、运行机制等方面的问题。随着联机联合编目的全国化、国际化的发展,未来的联机联合编目研究会在统一标准、云计算、知识管理、数据库建设等方面展开。

随着编目业务外包与联机联合编目的不断发展,编目员会细分为两种类型:普通编目员与专业编目员,普通编目员从事套录编目工作,而专业编目员从事原始编目、著录、标引和上载工作。但不管如何,编目员的素质建设都是编目质量的基础,这也是提高读者服务质量的关键。新的编目规则与编目格式的出现,也对编目员的业务素质提出了考验。如何对编目员素质进行提升,将是未来编目质量与读者服务质量研究的重点与热点。

美国、加拿大、英国、澳大利亚、德国、新加坡、马来西亚、日本、中国台湾等国家和地区已经开展了广泛的RDA实践,我国也开始了这方面的理论研究与实践工作。中国国家图书馆于2012年7月举办了第一次RDA培训班,上海图书馆率先进行了RDA编目的研究与实践。随着RDA在国内图书馆的实践应用,中国编目规则将会持续修订,与RDA进行配合,并尽可能实现标准化与统一化[23]。

[参考文献]

[1]丁羽.合并高校图书馆编目工作的困惑与对策——以南京邮电大学图书馆为例[J].农业图书情报学刊,201(11):103-105.

[2]邱萍,邵晶,周琴.网络电子期刊编目的难点及对策[J].图书馆建设,2011(7):34-37.

[3]李灿元,麦林,钟建法.高校图书馆小语种图书建设的问题与对策[J].图书馆建设,2011(9):18-20.

[4]林迪.中文图书编目数据套录问题分析及对策[J].图书情报工作,2011(S1):93-96.

[5]余恒鑫.高校图书馆编目业务外包质量控制模式——外包组长专人负责制探析[J].图书馆学研究,2011(20):28-30.

[6]陈新洁.图书馆编目外包质量控制与绩效评价研究[J].图书馆论坛,2011(4):132-134.

[7]高源,李亚君,朱淑南,等.图书馆采编业务外包评价机制与评价模型的建立[J].图书馆建设,2011(11):88-91.

[8]莫振轩.基于SWOT和AHP的编目业务外包决策方法探讨[J].图书馆论坛,2011(2):98-100.

[9]曾荣玉.高校图书馆编目业务外包模式探讨及实践——以江西理工大学图书馆为例[J].江西图书馆学刊,2011(4):66-68.

[10]杜欣明.技术干预模式:编目业务外包的一种新尝试[J].图书馆建设,2011(3):108-110.

[11]段鹏莉.网络环境下图书馆编目模式选择探析[J].太原大学学报,2012(2):75-77.

[12]宋芸芳,郑俭华,李雪梅.编目员信息素质与图书馆可持续发展关系探析[J].图书馆界,2010(6):1-3.

[13]董燕.网络环境下编目员角色转换研究[J].农业图书情报学刊,2012(6):204-206,221.

[14]赵红.谈网络环境下高校编目员的职能更新[J].农业图书情报学刊,2010(9):345-348.

[15]徐淑秋,郭晓丹.从古籍普查工作看编目人员的素质建设[J].图书馆学刊,2013(12):24-26.

[16]瞿玲玲.网络环境下西文编目人员素质新论[J].黑龙江史志,2010(9):101-102.

[17]蔡玲.浅议编目质量与读者服务工作的关系[J].科技信息,2012(31):315,367.

[18]吴雷.《中国文献编目规则》与《资源描述和检索》编修机制比较研究[J].图书馆建设,2010(7):69-73.

[19]高红,胡小菁.《中国文献编目规则》与RDA在地图资源著录中的对比分析[J].图书馆论坛,2013(5):130-134.

[20]霍艳蓉.RDA与《中国文献编目规则》在连续出版物著录中的对比分析[J].图书馆杂志,2013(2):34-38.

[21]庄蕾波,胡小菁.《中国文献编目规则》和RDA对电子资源著录的异同分析[J].图书馆建设,2012(11):33-38,41.

[22]胡小菁.《中国文献编目规则》与RDA乐谱规则的对比分析[J].上海高校图书情报工作研究,2013(4):16-20.

[23]周德明. RDA:从理论到实践[M].北京:海洋出版社,2014.

[作者简介]王晓(1979- ),女,馆员,从事文献编目、图书管理研究。

[基金项目]广东培正学院资助项目“基于共词分析的编目研究主题与未来热点分析”(16pzxmyb15)。

[收稿日期]2015-12-20

[中图分类号]G254.3

[文献标识码]A

[文章编号]2095-7602(2016)02-0152-07

猜你喜欢
联机编目规则
多联机安装施工技术探讨
撑竿跳规则的制定
数独的规则和演变
国家图书馆藏四种古籍编目志疑
粤剧编目整理之回顾与展望
让规则不规则
TPP反腐败规则对我国的启示
高温多联机空调系统的控制方式研究
CALIS联机合作编目中的授权影印书规范著录
NAP客户联机VPN测试