兰开斯特与图书情报学

2014-12-06 05:30:38王明晓
大学图书情报学刊 2014年6期
关键词:词表情报学标引

张 璐,王明晓

(中山大学资讯管理学院,广州510006)

1 引言

2013年8月25日,美国伊利诺伊大学厄尔巴纳香槟分校图书情报研究生院兰开斯特教授[1](Frederick Wilfrid Lancaster)去世,享年 80 岁[2]。作为国际著名的图书情报学家,兰开斯特为图书馆学和情报学的发展做出了巨大贡献。他集学者、教育家、导师和作家于一身,毕生致力于图书情报事业,在图书情报工作和图书情报学教育等领域久负盛名。

兰开斯特于1933年9月4日出生于英国达勒姆。1950-1954年就读于美国纽卡斯尔图书馆学校。1953年担任美国纽卡斯尔公共图书馆高级助理,开始其图书馆职业生涯。曾先后担任美国阿克伦公共图书馆科学技术高级馆员、华盛顿赫纳公司系统评价组常务顾问和组长、美国国立医学图书馆情报系统专家和副馆长特别助理,以及韦斯泰特研究公司情报检索服务部主任[2-3]。1970年,被任命为伊利诺伊大学图书馆学研究生院副教授。1970-1973年担任生物医学图书馆员培训计划负责人,并且是英国伦敦分类法研究小组的成员。1972年,升为伊利诺伊大学图书情报研究生院教授。他教授的课程有信息检索、文献计量学、文献组织、图书馆服务评价等。1986-2006年,他曾担任《图书馆趋势》(Library Trends)的主编。1992-2013年,退休后的他被授予伊利诺伊大学荣誉教授称号[4]。

2 学术思想

兰开斯特以其在联机检索与MEDLARS系统评价和管理方面的成就闻名于世。他造诣深广、著述丰富,研究主题涉及图书馆服务评价、检索系统评价、叙词表构建、图书情报学的研究方法、图书情报服务的技术与管理等多个方面。他毕生创作了15本著作,200多篇期刊论文,部分著作获得国家级奖项,并被翻译成其他语言,如阿拉伯语、俄语、日语、韩国语、西班牙语和葡萄牙语等等[2][5]。其主要著作包括《情报检索系统——特性、试验与评价》《医学文献分析与检索系统查询检索服务评价》《情报检索词汇控制》《联机情报检索》《图书馆服务的测量与评价》《走向无纸情报系统》等。笔者对兰开斯特在图书情报学领域内的重要核心思想进行梳理,发现兰开斯特在情报检索系统、词汇控制、标引与文摘、系统性能评价、图书馆服务与评价等领域的学术思想最为丰富和精彩,具有较强的代表性。

2.1 情报检索系统

1968年,兰开斯特出版了他的第一本书《情报检索系统:特性、试验与评价》(Information Retrieval Systems:Characteristics, Testing, and Evaluation editions)。该书在1970年获“情报科学最佳著作”奖,并被翻译成俄文、日文、中文等多种语言,在国际情报界享有较高的声誉。1978年出版的第二版是他根据八年来在美国伊利诺伊大学图书情报研究生院的教学实践经验、在第一版的基础上增补改写而成。该书主要讨论情报检索系统及其服务的“智力”方面的内容,对图书馆与情报中心业务工作的理论与实践作了全面的阐述。其内容涉及到对系统与服务产生重大影响的用户/系统交互、检索策略、标引及词表控制等因素、机读数据库、联机系统以及未来的发展趋势等问题,特别强调了系统设计与评价的原则与方法。[6]

该书讨论了情报服务、情报中心,特别是情报检索,为这些术语给出了定义和说明。当在最广泛的意义上使用文献一词时,情报检索是查找某一文献库的过程,以便找出有关某一主题的文献。为便于文献查找工作而设计的任何系统,可以合理地称之为情报检索系统。下图以较简单的形式,描绘了许多情报检索系统的主要工作。

图1 多数情报检索系统的主要任务[5]

该图曾在兰开斯特的多本书中出现,尽管现在的计算机技术在不断进步,情报检索系统与当时的检索系统相差甚远,但这些步骤相差不大。这张图表不仅说明了情报检索系统的主要任务,而且能使读者更加形象地理解情报检索的概念。

围绕情报检索系统,兰开斯特对词汇控制、标引和文摘、系统性能的测试和评价、无纸情报系统等领域进行了深入研究。

2.2 情报检索系统词汇控制

如图1所示,情报检索系统由标引和检索两部分组成,在标引和检索的过程中,分别对于文献和用户提问进行概念分析,转换成系统语言,这个过程需要对词汇进行必要的控制,以有效检索出所需文献,这就是词汇控制的目的。早期的情报检索词汇控制主要采用叙词表这种方法,使那些自由的、游离的词得到控制,去除自然语言中模棱两可的本来意思,得到规范化的标引词和检索词。采用词汇控制可以促使标引员和检索者对同一主题事物表述的一致,从而提高查准率;另一方面,通过将纵聚合和横组合关系的词连接起来,可以实现对某一主题进行全面的检索,提高查全率[7]。

《情报检索词汇控制》(Vocabulary control for information retrieval)第一版出版于1972年,但从70年代到80年代的10多年里,情报技术的发展日新月异,电子计算机一代代的更新,联机数据库的蓬勃兴起,检索技术和模型的日趋完善,使得情报检索过程中的词汇控制方法也在不断发展,情报检索语言的一些基本方法中渗入了新的技术。在这种背景下,兰开斯特全面总结了情报检索词汇控制的新成果,精心提炼后熔入到他的《情报检索词汇控制》第二版著作中。该书对情报检索中词汇控制的各方面问题做了更加全面的论述,尤其是对叙词表的原理和方法做了更为详细的阐述,同时分析和述评了情报检索词汇控制的新方法、新问题,如分面叙词表、词表的兼容与互换、自然语言检索、计算机在词汇控制中的应用和混合系统等[7]。

叙词表固然是当时词汇控制的主要方法,但自然语言化已成为一个必然的发展趋势。时至今日,自然语言检索已经得到广泛的应用,那是否意味着我们不需要人工语言(情报检索语言、词汇控制)了呢?兰开斯特和张琪玉教授持同一意见。他们都认为需要将自然语言和情报检索语言相结合,即朝着情报检索语言的自然语言化、自然语言的情报检索语言化的目标前进[8]。自然语言有着许多叙词表不能比拟的优点,例如成本低,标引速度快,适合用户的检索习惯等。但叙词表能增加索引的一致性,增强查准率,相关资源也更容易被汇总,尤其是在某些专业学科信息检索系统中,叙词表显得尤为重要。故在检索语言未来的发展中,关键是要融合二者的优势,取长补短。

2.3 情报检索系统的标引与文摘

《情报检索词汇控制》是关于情报检索中词汇控制的问题,详细说明了叙词表的原理和方法,而与之实践应用相关的便是标引与文摘问题。《标引、文摘的理论与实践》(Indexing and abstracting in theory and practice,1991)说明了标引与文摘问题,该书于1992年获得美国情报学会授予的“情报科学最佳著作”奖。随着当时互联网技术的发展,情报检索系统出现许多新的变化,标引技术也不断变化,书中介绍了标引与文摘的原则和方法,也提及了自然语言在情报检索系统中的运用和自动标引以及文摘的相关程序等。

通过标引与文摘,大量的出版著作就能被收集在一个数据库中,如《化学文摘》,或者其他一些数字化的形式,它们在情报检索系统中的目的可见图1。情报检索系统中,需要通过标引得到文献表示集,然后再通过该文献表示集来检索文献。不过现如今信息检索不再像以前那样简单,它面临更复杂的环境,需要更复杂的文本处理,包括语义分析。关键问题不再是检索出相关文献,而是要对检索结果进行相关度排序。互联网上的信息泛滥,如何过滤出高质量的信息成为一个难题。随着计算机技术的发展,自动抽词以及全文本查询越来越成熟,自动标引和自动文摘的技术也在不断改进,这无疑减轻了人们面对庞大数据量的工作负担。但面对海量的网络信息资源,其效果并没有人工标引好,因为机器并不能识别文章的含义,如果需要使人工智能达到较好的效果还需要很长的一段时间,也需要很多人的努力,在这之前,我们就仍需要大量从事标引与文摘的专业人员,这也是为何仍需要注重标引与文摘的原因[9]。

2.4 情报检索系统性能评价

在兰开斯特所有的研究中,关于情报检索系统性能评价的研究是对情报学领域影响最大的。20世纪50年代后期,他受到克兰菲尔德航空学院克莱弗登(Cleverdon)教授领导的一系列有关系统评价标准和程序研究的影响,开始进入情报检索系统评价方面的研究[10]。1968年,他发表了《MEDLARS工作效率评价报告》(MEDLARS:Report on Evaluation of its Operating Efficiency)。该文被公认为是情报系统调查研究的一个里程碑,在1969年获得了美国情报学会颁发的最佳论文奖,它不仅深刻影响了MEDLARS系统的后期发展,而且还展示了用于测试、分析和评价某个现行情报检索系统运行状况的一系列改进方法。此时,兰开斯特任职于美国国家医学图书馆的高级助理一职,他领导了该馆当时正在研制和完善的MEDLARS系统的全面测试与评价。他在应用、改进和发展英国克兰菲尔德研究计划成果的基础上,提出了情报检索系统性能评价的指标、步骤和方法。文章中的数据严密,分析深入,采用了估计查全率和查准率等评价指标,推导了性能指标。他得出影响检索系统的查全率和查准率主要有四个因素,分别是标引、检索、标引语言和用户/系统交互,而且查全率和查准率呈负相关关系,通过变换检索策略,可以改变查全率和查准率。而基于不同的检索需求,检索者对查全率和查准率的要求不同时,可采用不同的检索策略,达到最佳检索效果。兰开斯特针对检索系统的评价结果提出了一系列的改进措施,例如改进检索请求表达式可以改善检索结果,收集用户对查全率和查准率的需求和忍受度的数据对检索策略的制定会有帮助等[11]。在现今的情报学领域,查全率和查准率仍然是信息检索系统性能评价的重要指标。

2.5 无纸情报系统的预测

兰开斯特始终站在学科发展的最前沿,并对新的动态具有相当强的敏感性。他的观点和思想常常具有革新性,能对情报学和图书馆学理论与实践进行预测和指导。典型的例子是他提出的“无纸情报系统”的预测,他在《走向无纸情报系统》(Toward Paperless Information Systems,1978)一书中提出:“随着电子资源的日益重要和纸资源的日益减少,随着计算机终端在办公室和家庭日渐普及,……图书馆不可避免地走向衰落”的设想[12],引起很多人的争议和探讨。书中兰开斯特大胆地预测随着电子技术的发展,2000年我们将进入无纸社会。某种程度,我们确实实现了电子资源代替纸质读物,但纸质读物远远没有灭绝。兰开斯特以谍报部门为例分析了应用无纸情报系统的情况,探讨其可行性,描述其实现的大致情况,并提出实现这一目的需解决的各种问题。虽然兰开斯特的预测没有完全实现,但是我们也的确注意到他的很多预测在今天已成为现实,如图书馆功能大大增强,处理资料的类型不仅有印刷品还有电子出版物等多种类[13]。

之后他又出版了《电子时代的图书馆和图书馆员》(Libraries and Librariansin an Age of Electronics)。在书中,他描绘了新一代情报系统,展望了图书馆以及图书馆员的前景,不管我们是否喜欢,社会正在从已经存在了许多世纪的以纸上印刷为基础的正式交流,向电子化的正式交流转变,而情报资源也将开始转向电子式的分发和利用,其中的许多设想目前都已成为现实[14-15]。范并思曾对兰开斯特的预测性研究进行评价:“兰开斯特的预测,对后来80年代,乃至90年代持续不断的未来图书馆研究都产生了极大的影响,也奠定了良好的基础。”[16]通过这些预测性研究,图书情报学也许就是在不断证实或证伪的过程中,终究会螺旋式上升的向前迈进[17]。

2.6 图书馆服务与评价

兰开斯特不仅在情报学领域建树非凡,他在图书馆学领域也贡献良多,尤其是在图书馆服务的测量与评价方面。在该领域,他一共出版了两本书,分别是《图书馆服务的测量与评价》(The Measurement and Evaluation ofLibraryServices,1977)、《如果你想评价你们的图书馆……》(If You Want to Evaluate Your library……,1988)。前者填补了图书馆服务研究的空白,于1978年获美国图书馆学会的Ralph Shaw奖。该书讨论的内容初看会觉得过时,但其实,兰开斯特将现代图书馆系统等技术是如何慢慢地融入图书馆各项服务中的过程娓娓道来,使读者易于理解。许多内容到现在仍然具有参考借鉴价值,例如技术服务的评价、图书馆服务的评价标准、图书馆调查的注意事项、调查数据的有效性等。该书的第一版更多的是从一个微观理论评价的视角出发,第二版则多了许多公共图书馆的调查案例,更加生动易于操作[18-19]。第二本书《如果你想评价你们的图书馆……》1989年获得美国图书馆协会的G.K.Hall奖。该书分为三个部分:(1)文献传递服务,(2)参考咨询服务,(3)其他方面[20]。其中书目查询评价和持续质量控制方面的内容值得关注。上述三个部分包含更细的项目,例如文献传递服务的评价包括书目查询评价、可用性分析、期刊评价等。在图书馆的组织控制和服务方面,他更加注重图书馆服务方面的评价,因为对服务的评价结果可以反映出组织管理是否有效[21]。

无论是情报学领域还是图书馆学领域,兰开斯特都强调理论与实践的结合,在研究系统评价时,他一直试图将情报系统中各个不同的部分联接起来。他早期有关词汇控制和系统评价的工作为情报系统设计者提供了理论基础,而后期的工作,尤其是有关图书馆服务的测试和评价方面的成就,则缩小了整个图书馆专业与相关的测量与评价研究团体之间的距离。兰开斯特一直认为,理论研究是有其实际应用价值的[22]。

纵观兰开斯特的论文与著作,他在涉猎的多个领域,无不表现出深厚的学术功底、广博的专业知识和相关学科知识,这与他的长期积累息息相关[23]。他治学严谨,非常注重术语的使用和文献引用,但凡术语的使用,一定会要求自己追本溯源,了解术语的最初定义。

3 著作被引分析

2008年,《图书馆趋势》曾刊登了数十篇纪念文集来表彰兰开斯特卓越的贡献。无论是在联机检索系统、主题分析、叙词表构建、系统评价、图书馆测量和评价,还是对于无纸情报系统的预测,文献计量学的探索,他都享有极高的声誉和影响力[24]。在这些纪念文集中,有部分文章曾对兰开斯特的著作进行文献计量分析和h指数分析。对兰开斯特1972-2006年出版的著作进行引文分析,发现他是一个高产和高被引的作者,其中的六部著作被广泛引用了很长一段时间,并且被认为是图书情报学科的经典教材[25]。下表是他的前20本高被引作品。

表1 兰开斯特的前20本高被引作品[25]

通过 Google Scholar,Scopus和 Web of Science的相关数据可以对兰开斯特的学术成就进行h指数分析。有学者曾对1945-2007年间他发表的文献被引情况进行分析,计算出他的h指数为13。不过Web of Science无法统计作者的书籍被引用情况,所以他们使用其他引用工具,例如CiteSeer系统等来综合计算兰开斯特的h指数,评估得到其h指数在13与26之间[5]。这个数字真实地反映了兰开斯特对于图书情报学界的极大贡献和价值。

4 结语

作为国际知名的图书情报学家兰开斯特,他为促进国际间的图书情报交流与合作、推动世界图书情报工作的发展做出了积极贡献。其学术研究博大精深,思想性、理论性、实践性、指导性都非常强。在情报学专业研究领域,他侧重于情报检索智力与概念结构的基本问题,而不是计算机与系统设计的技术,这也是情报学学科需要侧重研究的领域。他对情报学的主要贡献还在于情报检索词汇控制、系统与用户交流、系统效果评价等方面。其中,影响最大的是他提出的关于情报检索系统性能评价的指标、步骤和方法。图书馆学领域,他提出了许多图书馆服务评价方法和措施,对图书馆的实践有很好的指导作用,同时他还对图书馆和图书馆员的未来发展进行了预测。通过深入研究、努力实践兰开斯特的学术思想,对推动国内情报学的理论创新和图书馆工作的科学发展具有重要的现实意义。

[1]程焕文.一代信息学宗师兰开斯特教授与世长辞(附讣告)(29日凌晨更新)[EB/OL].http://blog.sina.com.cn/s/blog_4978019f0102e4kt.html,2014-03-26.

[2]Professor Emeritus F.W.Lancaster passes away[EB/OL].http://www.lis.illinois.edu/articles/2013/08/professor-emeritus-f-w-lancaster-passes-away,2014-02-09.

[3]Lancaster,F.W.[EB/OL].http://www.dictall.com/indu53/20/53201017D1D.htm,2014-02-09.

[4]Robert M.Hayes.A tribute to F.Wilfrid Lancaster[J].Library Trends,2008.56(4):731-739.

[5]Peter Jacso.Testing the Calculation of a Realistic h-index in Google Scholar,Scopus,and Web of Science for F.W.Lancaster[J].Library Trends,2008,56(4):784-815.

[6]陈光祚,王知津,王津生译.Lancaster,F.Wilfrid.情报检索系统——特性、试验与评价[M].北京:书目文献出版社,1984.

[7]侯汉清,戴维民,陆宝树译.Lancaster,F.Wilfrid.情报检索词汇控制[M].上海:同济大学出版社,1992.

[8]张琪玉.关于自然语言检索问题[J].图书馆论坛.2004,24(6):211-213,145.

[9]Lancaster,F.W.Indexing and abstracting in theory and practice[M].3 rd Edition.London:Facet Publishing,2003.

[10]Estabrook,Leigh S.;Lancaster,F.Wilfrid.Reflections:An Interview with F.W.Lancaster[J].Library Trends,2008,56(4):968-974.

[11]Lancaster,F.Wilfrid.MEDLARS:Report on Evaluation of its Operating Efficiency[J].American Documentation,1968,20(2),119-142.

[12]Lancaster,F.W.Toward paperless information systems[M].New York:Academic Press,1978.

[13]刘彩霞.美国图书馆学家兰开斯特思想初探[J].科技情报开发与经济,2011,21(13):47-49.

[14]Lancaster,F.W.Libraries and librarians in an age of electronics[M].Arlington,VA:Information Resources Press,1982.

[15]Arthur P.Young.Aftermath of a Prediction:F.W.Lancaster and the Paperless Society[J].Library Trends,2008,56(4):843 –858.

[16]范并思等.二十世纪西方与中国的图书馆学——基于德尔斐法测评的理论史纲[M].北京:北京图书馆出版社,2004.106.

[17]周余姣.试论兰开斯特的预测性研究——以《电子时代的图书馆和图书馆员》为例[J].图书馆杂志,2010,29(11):14-17.

[18]Lancaster,F.W.If you want to evaluate your library…[M].Champaign,IL:University of Illinois Graduate School of Library and Information Science,1988.

[19]Lancaster,F.W.If you want to evaluate your library…[M].2nd Edition.Champaign,IL:University of Illinois Graduate School of Library and Information Science,1993.

[20]Lancaster,F.W.,M.J.Joncich.The Measurement and Evaluation of Library Services[M].Arlington,VA:Information Resources Press,19772.

[21]Martha Kyrillidou,Colleen Cook.The Evolution of Measurement and Evaluation of Libraries:A Perspective from the Association of Research Libraries[J].Library Trends,2008,56(4):888-909.

[22]王益明,谢新洲.情报系统与图书馆服务评价专家——兰开斯特[J].情报理论与实践,1995,(1):55-56.

[23]马费成.著名情报学家兰开斯特评介[J].情报理论与实践,1988,(4):45-46.

[24]W.Boyd Rayward,John Unsworth.Preface to Library Trends 56(4)Spring 2008:TheEvaluationand Transformation of Information Systems:Essays Honoring the Legacy of F.W.Lancaster[J].Library Trends,2008,56(4):721-723.

[25]Jian Qin.F.W.Lancaster:A Bibliometric Analysis[J].Library Trends,2008,56(4):954-967.

[26]Hirsch,J.E.(2005).An index to quantify an individual’s scientific research output.Proceedings of the National Academies of Science[J].2005,102(46),16569-16572.

[27]邱均平,周春雷.发文量和h指数结合的高影响力作者评选方法研究——以图书情报学为例的实证分析[J].图书馆论坛2008,28(6):44-49.

猜你喜欢
词表情报学标引
开放与融合:公安情报学进入情报学方式研究*
情报杂志(2022年10期)2022-10-20 03:25:42
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
英语世界(2021年13期)2021-01-12 05:47:51
构建中国特色的情报学
档案主题标引与分类标引的比较分析
本刊对来稿中关键词标引的要求
叙词表与其他词表的互操作标准
本刊对来稿中关键词标引的要求
数据挖掘技术在情报学领域的应用
河南科技(2014年11期)2014-02-27 14:16:48
知识管理视域下的图书情报学研究
河南科技(2014年4期)2014-02-27 14:07:36
本刊对来稿中关键词标引的要求