国内文献编目研究论文的计量分析:1999-2009*

2010-09-11 09:18侯素芳汤建民虞飞华浙江树人大学科学计量学研究中心浙江杭州310015
图书馆建设 2010年10期
关键词:编目图书论文

侯素芳 汤建民 虞飞华(浙江树人大学科学计量学研究中心 浙江 杭州 310015)

文献编目是图书馆进行信息组织的主要方式,是信息资源服务赖以开展的基础。19世纪60年代开始,随着计算机技术的发展,MARC(Machine Readable Cataloging, 机器可读目录)逐渐取代卡片目录,成为世界上普遍采用的目录格式。然而随着互联网的飞速发展和信息环境的根本性变化, 图书馆已经不是唯一的信息来源,越来越多的用户更习惯使用搜索引擎和社会性网络。因此,以MARC为依托的文献编目方式也被激烈地讨论,编目的未来、MARC的存废及使用Google图书搜索系统代替图书馆目录等话题成为人们关注的焦点。

关于“编目未来”的课题,最早由美国加州大学于1998年提出[1];2005年初,美国国会图书馆副馆长Marcum D B在美国图书馆协会冬季会议上再次提出编目未来的问题[2]。Marcum D B将背景放到了Google时代,她认为,图书馆在编目上花费大量财力,而读者即使查询研究资料也会选择搜索引擎,很少用图书馆专业目录;亚马逊的书内搜索(search inside)及Google大规模数字化图书馆馆藏的图书搜索,其全文搜索所达到的检索效果令图书馆目录望尘莫及。Marcum D B通过4个关键问题对编目的理论与实践提出全面质疑:“①如果普通书刊可以联机访问,我们是否应当视搜索引擎为主要的搜索工具;② 一般图书馆仅致力于编目本馆独特资源而非一般书刊,是否更明智;③ 我们(指美国国会图书馆)向全世界图书馆推广我们的编目规则和MARC格式,如何才能使我们做重大改变不致造成混乱; ④在已经改变很多的环境下,我们是否还需要AACR3(Anglo-American Cataloging Rules ,3rd Edition;英美编目条例,第3版)。”[1]

由于Marcum D B的特殊地位,她的报告引发了图书馆界对编目未来的深层思考,大量研究成果相继问世,或坚守MARC、或主张废除、或预测趋势、或溯源探流,虽争论不休,但皆对图书馆现行编目工作进行了重新思考。笔者由此提出本文要关注的问题:就国内来说,近年来文献编目研究的整体情况究竟如何,其研究力量的分布怎样,主要涉及了哪些方面,如何全面地评价编目研究的成果,等等。显然,对这些问题的回答是相关研究机构和学者所普遍关心的问题。基于上述考虑,本文拟对这些问题从科学计量学的角度,综合运用词频分析、共词分析、社会网络分析、信息可视化等科学计量学方法和先进的计算机数据挖掘技术,对近10年(2009年论文未齐,故视为10年)来国内文献编目研究作以比较系统、侧重于揭示文献编目研究产出模式和主题分布的计量分析,以利于以后编目研究的深化。值得一提的是,这些研究方法都已在相关领域得到了应用[3-5],并取得了很好的效果。

1 研究方法和数据搜集

本文的检索时间是:2010年2月24日,所有论文数据从中国期刊全文数据库(CNKI)中获得。数据搜集的具体方法是:在“关键词”栏中检索含有“编目”一词的所有论文,时间选“1999-2009”,匹配选择“精确”,将获得的所有论文信息经过数据预处理后建成Excel数据库,内容包括论文的题名、作者、机构、关键词、发表期刊、基金、发表时间等信息,然后剔除其中的不属于规范性研究论文性质的信息,如通知、索引、书评以及既无关键词又无摘要的一些文章,最后得到5242篇规范性论文的相关信息。

研究的基本思路是:通过对论文作者、机构、发表期刊等信息的分析来研究论文的产出模式;通过对论文关键词及前后5年高频关键词共现知识图谱的分析来研究论文的主题分布与演进等,最后得出一些基本结论。

2 论文总量及产出模式分析

2.1 论文总量分析

1999-2009年CNKI收录的规范性论文总数为5242篇,历年论文数见表1。由表1可知,产量上国内文献编目研究基本上处于一种稳定的上升状态(偶有起落,可以忽略),且保持在较高的水平,尤其是2001年较2000年激增近百篇,2004年开始突破500篇大关,说明文献编目仍然是图书馆界关注的热点之一。文献编目经过多年的研究依然保持增长的态势,主要是由于文献编目在信息时代出现了新的研究内容、新的研究热点,如传统编目在Google时代遇到的挑战、对编目业务外包的思考等。

2.2 期刊分布统计

经统计,5242篇论文发表在937种期刊上,期刊分布面比较广。其中发表1-4篇的有832种期刊,共发文1220篇,分别占期刊总数的89%和论文总数的23%;发表5-8篇的有36种期刊,共发文220篇,分别占期刊总数的4%和论文总数的4%;发表9-49篇的有40种期刊,共发文836篇,分别占期刊总数的4%和论文总数的16%;发文在50篇及以上的期刊共有29种,共发文2966篇,分别占期刊总数的3%和论文总数的57%。表2列出了发文在50篇及以上的期刊。

2.3 作者分布

按论文第一作者统计,发现共有作者3565位,其中发表1篇的有 2689位,发表2-3篇的有707位,发表4-7篇的有147位,发表8篇及以上的共有22位(见下页表3)。这说明作者队伍来源比较分散,对“编目”问题进行持续深入研究者较少,需要加强研究队伍建设。发文较多的核心作者是王松林与文榕生,前者主要从理论上研究文献编目的条例、规则,有知名专著《信息资源编目》[6];而后者主要从实践上对机读目录进行探讨,二者各有自己的研究特点。同时还可看出,发表论文相对较多的作者绝大多数来自各高校图书馆及其他图书情报机构,说明图书馆与生俱来的信息组织使命使得“文献编目”自然而然地成为业界关注的对象,图书情报界以外的人士因其对信息组织的陌生而使“编目”成为关注的盲点。

表1 1999-2009年间发表的论文篇数

表2 发表论文50篇及以上的期刊

表4 发表论文最多的前20位机构排名

2.4 机构分布

统计论文第一作者的机构,可以得到各机构的论文产出量。全国共有2606个机构关注过文献编目研究,表4列出了发表论文在15篇及以上的前20家机构的名单。由表4可以看出,国内发表文献编目论文较多的机构几乎全是图书情报机构。武汉大学作为图情专业的发源地,在这方面依然独占鳌头。

2.5 基金资助分布

共有208篇论文受到各类基金的支持,约占论文总数的4%,这说明在编目研究领域,只有极少数论文受到各类基金的资助。其中,国家自然科学基金项目、国家社科基金项目、国家973项目、863计划、全国高校古籍整理研究工作委员会项目、985二期工程子项目等国家级项目42个,约占20%;中国图书馆学会、CALIS(China Academic Library&Information System,中国高等教育文献保障系统)、国家图书馆、教育部、中国科学院及科技部项目13个,约占6%;各省市社科规划课题、教育厅课题、自然科学基金项目、图书情报工作委员会项目等77个,约占37%;各高校自立课题约66个,约占32%;其他来源课题10个,约占5%。从各类基金项目的分布看,文献编目研究的课题主要来自省市社科规划课题、教育厅课题及各高校自立课题(占69%),国家级课题占20%,表明文献编目领域高层次的课题也占了一定的比例。整体来讲,各类基金项目偏少,项目层次中等。

3 论文的主题分布

3.1 论文关键词分布

按关键词统计,发现5242篇论文中有4442篇标注了关键词,共计出现关键词3987个,15225个次。下页表5列出了频次在20次及以上的前107个关键词,从这些高频关键词可见文献编目研究关注的主要内容。

为进一步反映近10年来研究主题的结构,下面我们用共词分析法、社会网络分析法对这些关键词作进一步分析并进行可视化识别。具体做法是:取词频4次及以上的关键词,最低共现门槛值也取4次,通过共词计算和可视化展示可得到下页图1。其中点的大小代表论文数量的多少,点越大,说明关于该主题研究的论文越多;线的粗细代表这两个关键词同时出现在一篇论文中的次数,线越粗说明这两个关键词越有关联。图1 关键词共现知识图谱(关键词词频≥4次,共现频次≥4)

表5 频次在20次以上的前107个关键词

由图1可知,这是一个枝繁叶茂的网状结构,各研究主题关联密切。“图书馆”作为其中最大的节点,表明文献编目研究是图书馆作为学术机构的天职,各级各类图书馆承担着各类型文献资源的编目实践和理论研究任务;“高校图书馆”这一节点也相对较大,说明高校图书馆是文献编目研究的重要组成力量。“编目”、“编目工作”、“文献编目”、“图书编目”、“计算机编目”等几个包含“编目”字眼的较大节点直接聚集了文献编目研究所关注的重点主题,又各有侧重:从“编目”辐射开的主要是对西文编目、网络资源、电子出版物、期刊、随书光盘、元数据、MARC、著录、规范控制等各类型文献资源编目及编目技术本身的探讨;从“编目工作”辐射开的主要是对编目业务、编目员素质、编目效率、招标、编目中心等这样一些外围的、相关问题的讨论;从“文献编目”、“图书编目”辐射开的是关于图书分类、CALIS、在版编目等编目操作实践问题;从“计算机编目”辐射开的是对机读目录、质量控制、书目数据库、套录编目、编目规则、主题标引、分类标引等编目格式、规则问题的研究。

在图1网状结构的周缘,有一些较小的、游离于图谱中心的节点,如期刊、电子出版物、光盘、数字资源、古籍、西文图书、西文期刊、影印版图书、虚拟馆藏、光盘管理等,说明对这些类型的文献资源编目的关注相对较少,研究相对薄弱。这些节点虽然小,却应引起我们的重视,它们很可能是一些正在扩展的研究内容,如有关“光盘”、“数字资源”等的编目研究。

3.2 近5年主题演变趋势

图2 1999-2003年关键词共现知识图谱(关键词频次≥10最低共现值≥4)

图3 2004-2009年关键词共现知识图谱(关键词频次≥10,最低共现值≥4)

把1999-2009年间的文献编目研究分为前后两个阶段进行对比,可以了解主题的演变态势。以1999-2003年为前5年,以2004-2009年为后5年(2009年论文未齐,故视为5年),探讨近5年文献编目研究的新动向。我们分别取每个阶段频次在10次及以上的高频关键词,最低共现门槛值取4,通过共词计算和可视化展示,得到图2、图3。仔细比对二图,并结合每一阶段的高频关键词,可以发现:

(1)图3较图2出现了一些新的节点,其中最值得一提的当属“业务外包”(同类小节点尚有“编目外包”、“外包”)。该节点的凸现表明“业务外包”成为近5年文献编目研究的一个热点问题。经查证发现,所有研究论文中有204篇论文篇名中含“外包”一词,时间分布如图4。

由下页图4可见,国内对业务外包较早的关注约始于2000年。通过查阅资料发现,对应的较早研究文献为《大学图书馆学报》2000年刊载的《美国图书馆关于业务外包的得失及启示》[7]与《情报杂志》2002年刊载的《美国图书馆采访业务外包模式与方法研究》[8],二者都是对国外图书馆业务外包的介绍性研究;2003年开始出现介绍国内图书馆业务“外包”的文献《图书馆业务外包在中国——从大音公司说开去》[9]。自此,国内对图书馆业务外包的关注呈现加速增长趋势(图4可证),业务外包日益成为图书馆学研究的一个热点问题,与2004-2009年间“业务外包”成为显著节点相印证。

(2)图3较图2新增的节点还有FRBR(Functional Requirements for Bibliographic Records,书目记录的功能需求)、定额管理、编目员、读者服务、随书光盘等。FRBR是国际图书馆协会和机构联合会于1998年提出的概念,它认为编目不应停留在传统的平面层次上,应根据用户的需求将编目对象分为若干层次;它揭示了隐藏在编目对象中的深层次关系,形成一个立体的元数据模型。该概念提出后几年内,国内鲜有关注者。经查证,1999-2003年间关注FRBR的论文为零(此结论仅为基于CNKI数据库的调查),国内较早关注FRBR的研究始于2004年,对应的文献为《现代图书情报技术》所刊载的王绍平的《音频资料元数据规范与FRBR的应用》[10]、《中国图书馆学报》所刊载的王松林的《从FRBR看编目条例及机读目录格式的变革路向》[11]及《大学图书馆学报》所刊载的刘素清《IFLA书目记录功能需求(FRBR)初探》[12]3篇论文。此后FRBR的研究逐渐深入,有理论研究,有应用研究,但以理论研究为主;关注此主题的学者多为编目领域的专家,如上述3位开先河者;刊载此主题论文的期刊多为优秀的图书情报类专业期刊,如上述3种期刊及《图书情报工作》、《图书馆杂志》、《图书馆建设》、《图书馆论坛》、《图书情报知识》等。凡此种种都与FRBR研究的难度相关。

图4 1999-2009年对“外包”的研究趋势图

“定额管理”作为关键词,在CNKI论文库1999-2003年间出现了4次,之后的2004-2009年间出现了32次,频次明显上升,表明近几年又出现了一个研究的小高潮。编目工作定额管理由来已久,曾经一度被冷淡,为什么近年又成为一个热点问题呢?笔者研究发现,近几年关于定额管理的探讨主要是基于编目环境变化而做出的反思,如网络化环境下如何深化和完善定额管理的建议、业务外包背景下的定额管理对书目数据质量控制的影响、教学评估大背景下如何提高编目效率以及对编目工作进行定额管理的是与非的思考等,研究更具理性和思辨性。

以“编目员”(含“编目人员”)作为关键词,频次从1999-2003年间的19次上升为2004-2009年间的72次,同样也是基于编目环境的变化而做出的反应,说明研究对编目员本身的关注越来越多。网络环境下编目工作的新变化对编目员提出的新要求、编目业务外包与编目员角色转换、信息时代编目员的综合素质、传统编目员的职能转型等成为探讨热点。关键词“读者服务”在1999-2003年间频次为6,2004-2009年间上升为34,充分体现了“以人为本、服务育人”的图书馆管理新理念。编目不再是单纯的业务工作,而与“人”的因素紧密结合起来,在服务育人过程中发挥重要作用。

“随书光盘”作为关键词,在CNKI论文库1999-2003年间出现了3次,之后的2004-2009年间出现了31次,频次亦明显上升,表明近几年对随书光盘的关注亦比较多。主要原因是近些年随着计算机技术和数据存储技术的发展以及计算机使用的普及,随书光盘的比例越来越高,增长速度惊人。如何科学管理随书光盘并方便合理地提供给读者使用,成为一个非常实际的问题,对随书光盘编目、管理及利用的探讨也就水涨船高。但学界尚未就此问题达成共识,相关研究还有待进一步深入。

(3)图3较图2消失的节点有图书馆自动化、电子出版物等。“图书馆自动化”(含“自动化”)在1999-2003年间频次为62,2004-2009年间降为15,说明关于图书馆自动化的研究逐渐式微,这与自动化管理系统在图书馆界的普遍应用有关,曾经的新生事物逐渐淡出研究者视线,成为明日黄花。“电子出版物”频次从1999-2003年间的22降为2004-2009年间的6,表面上好像相关的研究削弱,实际上经查证发现,关于电子出版物的研究并未式微,原因在于近几年关键词的标注习惯有变化,研究者更倾向于标注更具体的关键词,如电子图书、随书光盘、电子资源等。因此,对节点的消长变化要辨证分析。

(4)图3较图2有许多显著变大的节点,如图书馆、编目、编目工作、图书编目、网络信息资源、网络环境、书目数据、联机编目、回溯建库、质量控制等,这些节点多为文献编目研究的常涉主题,随着编目研究的增长而增长。其中网络环境、网络信息资源、联机编目节点的显著变大恰当地诠释了当今编目工作所处的大环境和为了应对网络环境下编目工作出现的新情况、新问题而做出的种种努力。这些努力包括编目业务外包及由此带来的书目数据质量控制、定额管理、编目员自身研究的显著增长。

(5)此外,图3还有一个另类节点“媒体资产管理”,值得关注。该节点与编目有何联系?经查证发现,“编目”在广播电视行业也被广泛应用,主要用于对数字化媒体资产的编目、保存和管理。这是笔者没有预料的,也可说明可视化图谱有知识发现的作用。

4 结 论

本文向学界展示了近10年国内文献编目研究的高产机构、高产作者、高频关键词、关键词共现知识图谱、主要研究内容等。具体来说有如下特征:

(1)从整体上看,国内文献编目研究已经比较成熟,产量基本上处于一种稳定的上升状态,且始终保持在较高水平。

(2)从研究力量看,近10年来国内共有2606家机构、3565位作者关注过文献编目问题,人均发文1.5篇,研究队伍庞大且分散。发表论文相对较多的作者绝大多数来自各高校图书馆,少数来自公共图书馆、图书情报中心或高校院系;发表论文在15篇以上的机构有19个,几乎全是图书情报机构,武汉大学作为图情专业的发源地,在这方面依然独占鳌头。

(3)从研究水平看,北京大学2009年认定的19种图书情报类核心期刊共刊载“编目”类论文1434篇,占编目论文总量的27%,即约3.7篇研究论文中有1篇发表在核心期刊。在受基金资助的极少数的208篇论文中,国家级课题占20%,表明文献编目领域不乏一些高层次的课题。

(4)从研究内容看,几乎所有的文献编目研究都是基于网络环境或现实环境的变化而做出的改变,有很强的现实针对性、实践性。尤其是近几年出现的一些新的增长点,如编目业务外包、FRBR研究、定额管理、编目员自身素质与角色的探讨等,更是编目工作应对网络环境变化的种种举措,同时传统的研究主题依然保持良好的发展势头。

[1]胡小菁.编目的未来[J].大学图书馆学报,2008(3):18-37.

[2]Marcum D B. The Future of Cataloging[J]. Library Resources &Technical Services,2006(1):5-9.

[3]汤建民.学科知识图谱的绘制及在学科发展监测与评价中的应用[J].情报理论与实践,2009(10):55-59.

[4]汤建民.中国高教研究地图:基于CSSCI高教研究论文的计量分析和可视化识别[J].中国高教研究,2010(2):22-26.

[5]汤建民. 近十年来国内民办高等教育的研究足迹: 基于1999-2008研究论文的计量分析和可视化识别[J].现代大学教育,2009(2):27-33.

[6]王松林. 信息资源编目[M].北京:北京图书馆出版社,2005.

[7]朱复成. 美国图书馆关于业务外包的得失及启示[J].大学图书馆学报,2000(1):30-33.

[8]杨 谦. 美国图书馆采访业务外包模式与方法研究[J].情报杂志,2002(5):42-43.

[9]杨 涛, 冯彩芬. 图书馆业务外包在中国——从大音公司说开去[J].新世纪图书馆, 2003(2):52-54.

[10]王绍平. 音频资料元数据规范与FRBR的应用[J].现代图书情报技术, 2004(9):21-23.

[11]王松林. 以FRBR看编目条例及机读目录格式的变革路向[J].中国图书馆学报, 2004(6):91-92.

[12]刘素清. IFLA书目记录功能需求(FRBR)初探[J]. 大学图书馆学报, 2004(6):65-69.

猜你喜欢
编目图书论文
国家图书馆藏四种古籍编目志疑
图书推荐
欢迎来到图书借阅角
粤剧编目整理之回顾与展望
班里有个图书角
CALIS联机合作编目中的授权影印书规范著录
图书馆集成管理系统在藏文图书编目中的比较研究——以ILASII和GDLIS为例
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登