信息检索相关性研究综述及发展趋势

2012-04-29 04:10王雅坤成全
图书与情报 2012年1期
关键词:理论模型信息检索相关性

王雅坤 成全

摘 要:文章从相关性的基本概念、理论模型、用户认知、影响因素以及当前基于Web的相关性等方面对信息检索的相关性问题进行了系统梳理,并指出该领域研究未来的发展趋势。

关键词:信息检索 相关性 理论模型 用户认知

中图分类号: G250.73文献标识码: A 文章编号: 1003-6938(2012)01-0088-07

Research on the Development Trends and Review of Information Retrieval Relevance

Abstract This article gives a systematic review on the information retrieval relevance from five aspects, such as basic concepts, theoretical models, user awareness, influencing factors and the relevance of Web-based, and raises the future development trend of research in this field.

Keywords Information Retrieval; Relevance; Theoretical Model; User Awareness

1 引言

相关性一直以来都是信息检索领域的核心研究内容之一,其概念的起源可以追溯到17世纪的早期图书馆用户认识到查找相关信息的问题,但由于客观原因,相关性只是作为一种朦胧意识停留在人们头脑中,直到20世纪20年代少数学者(Lotka(1926),Zipf(1949),Urquhart(1959),Price(1965))才陆续从各个领域开始了相关性的研究工作。在信息科学界,Saracevic[1]认为Bradford[2]是最先使用相关性一词的学者,其在20世纪30年代发表的“文献的混沌状态”一文中首次提出“主题相关”的概念。而此后关于“相关性”的探讨并未引起学界更大范围的关注,直到1958年国际科学信息会议(ICSI)的召开,“相关性”(Relevance)才作为信息科学领域的一个重要概念被学术界认可[3],至此“相关性”逐渐成为信息科学尤其是信息检索领域经久不衰的研究课题,甚至知识交流学派的代表人物Saracevic认为信息科学之所以成为独立学科,而不再隶属于图书馆学或文献学的原因就在于它开展了相关性的研究,也在于相关性能够解释科学交流中的诸多问题,足见“相关性”在信息科学中的重要地位。

当前,各国学者已对信息检索的相关性问题展开了深入研究,就其主题领域来看,主要包括相关性的基本概念研究、理论模型研究、用户认知研究、影响因素研究以及当前基于Web的相关性研究新发展等[4]。各个领域在相关性研究的不同时期都有所侧重,本文即就上述五个方面对相关性研究的现有成果进行分析并指出该领域研究未来的发展趋势。

2 信息检索相关性基本概念研究

对信息检索相关性基本概念方面的研究工作始于20世纪50年代末,各国学者借助数学工具及各种概念提取方法从各个角度对“相关性”的含义及内容进行了深入剖析[5]。而相关性的基本概念研究以1976年为边界经历了前后两个阶段。

第一阶段(1959-1976)的主要成果有:Maron和Kuhns(1960)利用概率论定义相关性的概念,提出相关性并非只是简单的是/非选择问题;Rees(1966)认为相关性受文档所包含的信息概念的影响,认为相关信息是对用户原来所具备的知识而言有用的信息;Goffman(1970)和Newill(1967)把相关性当成连接有效性的一种测度,并试图用数学方法证明相关性(Relevance)与关联性(Relation)之间具有等价关系[6];Saracevic(1970,1975,1976)则建议从文档、词与文献引用等各种文献特征上来定义检索的相关性;Cooper(1971)利用数理逻辑给相关性做了一个明确的定义,Wilson(1973)则在Cooper研究的基础上对数理逻辑相关性描述做了进一步扩充,并将“情境相关性”的概念首次引入到相关性的研究中,这些成果成为第二阶段研究工作的基础[7]。

在第二阶段(1977至今),由于相关性各领域研究成果的相继出现,使相关性的概念描述也呈现出许多新的时代特征。首先是从面向用户及认知方法的观点重新审视相关性,认为相关性是个多维的认知概念,在很大程度上依赖于用户个人对信息的理解以及信息需求的情境;相关性是一个动态的概念,它依赖于信息与用户某一特定时间所需信息之间关系质量的评价;以用户的观点来看,相关性是个复杂的、系统的、可测度的概念[8]。其次是一些学者试图给信息检索定义一个逻辑模型来理解相关性概念,这项工作由Rijsbergen(1986,1989)开创,之后又吸引了众多学者的参与。

3 信息检索相关性理论模型研究

从20世纪70年代开始,信息科学界开始尝试建立相关性的理论框架,在诸多理论框架研究的学者当中Saracevic和Mizzaro的研究成果较全面系统。Saracevic(1970,1975,1996)[9][10][11]从直觉、哲学、交流科学以及基本属性等方面阐述了相关性的广义框架,阐述了信息科学框架中的涉及相关性本质四种模型,即系统、通信、情境以及心理模型,在基于信息检索交互的分层模型的基础上,提出了第五种模型即交互式模型,并列举出相关性的所有可能的层次,该模型借用了人机交互研究中阐释理论以及语言学中的分层理论;Mizzaro[12]提出了四维框架以描述相关性,即:①信息资源,包括文献(document)、文献的替代品(surrogate)以及信息(information);②用户信息需求的描述,包括信息问题、信息需求、查询请求以及查询表达式;③时间,时间维非常典型地体现了相关性判断的动态性;④构件,信息资源和用户信息需求的描述以及二者结合中的所有元素都可以分解为主题(topic)、任务(task)和背景(context)等三个组件[12];在近期的研究结果中,Borlund(2003)[13]通过重新引入情境相关性构建了整体的相关性框架;由Bo-Y.Kang,Dae-Won Kim,Sang-Jo Lee(2005)[14]研究的模糊集相关性模型试图利用模糊集理论实现了一种基于文档内容语义理解的检索系统从而提高网络检索的有效性。

Saracevic将这些成果划分成为系统相关、通信相关、情境相关、心理相关和交互式相关这五种类型的相关模型。这些不同种类的相关模型在信息检索相关性问题的描述方法及解决思路上各有优劣。

3.1 系统相关模型

系统模型是出现得最早也是应用最广泛的模型,自上世纪50年代系统模型出现以来,已被广泛认同并逐渐演化为我们所熟知的“传统信息检索模型”。系统模型将信息检索描述成对应的两极元素:系统和用户。系统端将给定的数据信息按一定的数据结构组织起来以便于与用户的信息提问进行匹配,匹配的过程遵照系统预先定义的算法进行;用户端则将信息用户的问题和信息需求转化成系统所能理解的检索提问式;信息检索的过程就是文档与信息需求提问式相互匹配的过程。系统模型对相关性的描述和评价主要依托文档与信息需求提问间的匹配来实现,而系统的相关反馈机制则对于用户信息需求提问式的修正具有良好的指导作用。

系统相关性模型的着眼点集中在检索系统中文档的获取、表达、组织与匹配,关注的是系统内部操作方面的问题。由于检索系统实现的方法多种多样,因而,从系统角度评价信息检索则更多地依赖于寻求与系统构成相适应的不同的方法和算法从而达到提高信息检索相关度的目的。传统的信息检索模型和与之对应的系统相关性模型从最初的布尔逻辑精确匹配开始,一直致力于寻求最优的相关性匹配算法,基于概率的、向量空间的、逻辑的、自然语言处理的相关性匹配在系统模型研究的各个阶段发挥着重要的作用。对于信息检索相关性的评价研究从20世纪50年代末60年代初到1990年的TREC评价一直都植根于系统模型。

3.2 通信相关模型

1975年Saracevic[15]借助香农的信息论提出基于通信的信息检索相关性模型,该模型试图利用信息交流的代码模型来解释相关性问题,模型将信源与信宿之间的信息交换作为通信,同时考虑到通信过程受到噪音的干扰和相关反馈机制的影响。在信息检索的交互过程中,排除这种通信的不确定性,相关性被理解成如何在系统与用户之间建立一种有效的通信方式。相关性在系统与用户之间建立起了某种关联,这种关联的影响因素从系统的角度看包含主题知识、主题文档、系统文件以及文档的表示;从用户的角度看则包括信息需求、需求的表达、用户的认知结构、信息需求的用途及其价值。这些因素所形成的关联Saracevic称其为“相关性的不同视角”,如从主题文档的视角来看,相关性是指查询主题与文档主题之间的关联度;而从系统的视角来看,相关性则成为检索系统中系统文件与文档操作与用户的信息需求表达之间的关联度。

通信相关性模型从通信交流的广义框架层次给相关性作了定位,但对于信息检索相关性的交互性及动态性特征不能给予充分的体现。

3.3 情境相关模型

上世纪70年代末到80年代初的近十年时间是相关性模型研究的冬眠时期,这段时间理论界并未出现新的相关性理论框架模型,学者们大多依赖于原有的模型体系研究检索系统的相关性问题,直到80年代中期相关性模型的研究才开始复苏。1990年意大利锡拉库扎大学的学者Schamber、Eisenberg和Nilan[16]提出了情境相关性模型,该模型将情境关系、用户关联性、多维性、时间依赖性和动态性特征全部纳入到相关性的基本特性当中。考虑到信息交换和信息通信的动态变化特征,相关性被学者们理解为对某一特定时间信息与信息需求之间相互关系质量评价的动态概念。

情境相关模型弱化了相关性的系统主体特征,扩大了相关性的外延,然而情境相关模型也必然存在着自身的缺陷,最本质的缺点是该模型没有将相关性的动态特征及其与情境的关系同信息检索的过程和系统主体联系起来考虑,而只是强调用户在信息检索过程中的核心地位,全然不顾系统对相关性的影响,使得情境相关模型研究由原始的系统相关模型走向了另一个极端,这对相关性的全面系统研究极为不利。

3.4 心理相关模型

由于早期系统相关模型只注重系统不重视用户的弊端,也随着信息科学研究者们对相关性研究过程中用户所扮演角色的逐渐重视,一些信息科学家发现在信息处理与检索的过程中用户对信息的认知状态和认知过程对信息检索相关性的评价产生了重要影响。基于认知心理学的理论基础,1992年信息学者Harter[17]提出了一个新的面向用户的相关性模型,Harter称其为“心理相关模型”,由于该模型注重用户的认知,因而一个更加精确的描述是“认知相关模型”。心理相关模型的出现给主题相关带来了极大的挑战,Harter的心理相关模型从本质上否定了主题相关,认为用户的信息需求来源于自身的研究兴趣,而这种兴趣主要受用户心理所驱动。

Harterz的心理相关模型揭示了信息需求的满足,从认知心理学的角度来看信息需求的满足意味着达到用户的某种认知状态,而用户的认知状态始终是流动和变化的。尽管心理相关模型对用户的心理认知变化进行了很好的揭示,但是对于信息检索交互性而言依然存在其自身的缺陷。针对其他检索相关性模型,心理模型严格孤立于认知心理的相关理论,从某种意义上说视角非常狭隘,只关注用户自身信息需求的表达以及当得到检索答案时认知结构的变化,忽视了检索过程的动态特征和交互性,忽视了情境特征在信息检索过程中的作用。尽管心理相关模型在相关性构成的研究过程中起到了不可替代的作用,但由于其构建的过程只是对信息检索作出一种有效的反应,而并非与检索系统进行有机融合,因而其作用受到了较大限制。

3.5 交互式相关模型

早期的信息检索是一种批处理的静态过程,然而,由于1970年之后联机系统的广泛应用,信息检索的交互性特征得到了鲜明的体现,学术界对交互式领域的研究也逐渐受到重视。Bennet(1972),Belkin、Vickery(1985,1995)与Ingwersen(1992,1996)都从自身的研究角度构建了信息检索的交互式相关模型。其中以Ingwersen提出的认知模型与Belkin交互模型为主要代表。Saracevic(1996)在此基础上提出了信息检索交互性层级模型,该模型试图从下列三个方面解决信息检索过程中的交互性问题:①充分协调及优化信息检索过程中人员与机器的各自优势;②尽可能地减小并解决在以系统为中心及以用户为中心的检索系统中存在的弱势;③在模型的构建过程中创建一个通用的框架来揭示信息科学研究领域的相关性问题。该模型借助了人机交互的理论,而人机交互行为的层级关系则是构成现代语言学的基础。

4 基于用户认知的信息检索相关性研究

相关性的动态理论由来以久,早在上世纪50年代,Vickey等人就指出相关性判断总是随着时间变化,而且因用户不同而不同,1966年Rees和Saracevic指出对于特定用户而言,时间是相关性评价的一个重要指标[18]。但此后一段时间,学术界对这方面的论著甚少,直到1975年,相关性的动态及认知观才再一次进入众多学者的视线。这段时期Swanson等学者的工作对本领域深入研究起了积极的推动作用。Swanson认为,信息检索是一种试验性的动态修正过程,用户提交给信息检索系统的信息需求描述只是对原始问题的猜测性描述,这种描述会随着系统通过反馈从而影响用户对原始问题认知程度的加深而得到相应的修正,由于实验性动态修正过程而导致的用户认知的改变给相关性研究带来了一种全新的认识,信息科学者开始从用户认知的观点来研究信息检索系统的相关性问题。从上世纪80年代开始,围绕相关性的用户认知及动态理论,信息科学界就以下几个方面展开了激烈的讨论:①用户需求、请求与查询提问的动态性研究[19][20];②基于学习的认知理论[21](Regazzi,1988)与心智模型[22][23](Harter,1992;Sutton,1994)研究;③时间是影响相关性评价的一个重要因素[24](Bruce,1994);④用户认知随时间变化的数学模型研究[25][26](Bookstein,1983;Tiamiyu,Ajiferuke,1982)。同时也取得了丰硕的研究成果,Harter[27]认为相关性的评价是动态的,它是用户的一种心理状态,这种心理状态随被检索的客观信息所激发用户心理认知程度的大小而发生相应的改变;Bruce(1994)[28]的研究基于这样一种假设,用户的相关性评价随着信息检索系统与用户的交互过程发生改变,为证明其真实性他利用认知方法建立了捕获与评价用户相关性改变的模型;Spink(1998)[29]与他的同事证实了检索系统反馈给用户的信息能够影响用户对信息需求的认识,并改变用户对原始问题的重新定义。以知识表示(Knowledge representation)等为理论基础的观点认为,用户的判断实际上是在文档信息与头脑中已有的概念知识体系之间寻找匹配的过程,这种观点注意的是用户的内部概念体系与外部世界的相互作用以及内部知识与相关性判断的关系。相关性的动态及认知观念在上世纪80年代被融合于信息检索过程中的人机交互(Ingwersen 1984)以及人工智能中的问题求解(Problem solving)之中(Simon 1981),不过这一时期对相关性这一概念的理论探讨尚不多见,它将成为下阶段相关性理论研究的核心内容之一[30]。

5 信息检索相关性影响因素验证研究

为了弄清相关性判断受何种因素的影响,信息科学界进行了几次卓有成效的实验性研究,分别在上世纪60年代和90年代形成本领域研究的两次高峰。

第一次高峰以Cranfield(1957,1962)、Goffman、Nevill(1967)、Cuadra、Katter、Rees、Schultz(1967)的试验研究为主要标志。Cranfield测试先后进行了两次,开创了相关性影响因素分析的先河,找到了影响相关性判断的多种因素,第一个采用基于相关性的标准,即查全率与查准率进行检索系统评估,引起了相关性研究的争论[31];Goffman和Nevill认为相关性是信源与信宿之间信息传递的有效性的测度。这种观点是从信息交流的角度来考虑问题的。信息交流的目的是减少信宿的不确定性或改变信宿的知识结构。当信宿接收到信息之后要判断其能否满足需求,是否能减少不确定性或增加知识,这个判断过程就是传递过程中信息的相关性判断,也是信息交流的有效性的测度[32];Guadra和Katter认为相关性是两组实体之间关系的一种反映,对相关性的定义就是列举这两组实体中的事物,定义形式为:相关性是由A决定的B与C之间的D的E。其中A表示判定者、用户等;B表示信息、情报、文献等;C表示需求、提问等;D表示相关、一致等;E表示程度、层次、关联等。在信息科学中相关性即是指在一定条件下信息、文献与信息需求、信息提问之间的相似性,并认为相关性判断应随着刺激材料特征的不同而有所变化,也应随着用户状态(包括需求、态度、偏见以及知识储备等)的不同而异;Rees和Schuhz则认为个体差异对相关性判断的影响很大,越是对主题的科学内涵熟悉的个体被判断为相关的文献越少,尤其是当判断者以及文献,文献表示发生变化的情况下,这说明相关性判断依赖于个体知识储备的内在差别[33]。

第二次高峰以Schamber、Park、Barry、Wang(1994)等学者的研究成果为标志,这阶段的研究主要侧重于寻求完善的相关性评价指标,并制定相关性评价体系。Schamber[34]的研究目的是探讨在信息源以及信息表现形式都呈多样性的环境中,用户在其真实的信息查询以及信息利用活动中所采用的相关性标准,将最后确定的标准分成10大类22小类;Park[35]将到1990年为止的所有涉及相关性评估标准的研究归纳为5类,分别是文献、判断情境、检索问题表述、判断者以及文献表现形式。以此为基础,Park[36]以大学教师以及研究生等在内共10人为研究对象,以其真实的信息问题为背景,通过分析实验对象对检索结果(书目记录)的相关性判断发现了影响用户相关性判断的因素,并将其分为三类,即用户的内部情境、外部情境以及问题情境;Barry[37][38]的研究也是基于用户自发的信息需求,评判用户面对真实的信息需求所进行的相关性评估,结论显示用户会使用主题以外的信息进行相关判断,由此可断定在相关判断的过程中,很多情境因素事实上起着相当重要的作用,这些情境因素主要包括用户的经验、背景、知识素养、信仰以及个人喜好等;Wang[39][40][41]则从认知的角度构建了文献选择的认知模型,包括六个组件:文献信息元素、用户标准、文献价值、个人知识、决策标准以及决策自身。

6 信息检索相关性研究的新发展

上世纪90年代以后相关性研究已经逐步走向成熟,理论研究成果也由单一的片面研究向多层次、多角度的研究方向发展。相关性概念被解剖得非常细致,各种新的观点层出不穷,讨论得也更加全面。Schamber(1994)[42][43]等从行为科学的角度诠释信息行为与相关性之间的关系,认为相关性是设计与评估信息检索系统的主要依据,它受控与人们的信息活动过程中的行为,因而相关性应当被应用于人类的整个信息行为中进行研究。以Saracevic(1996)为代表的论述更加深入细致地剖析相关性的概念意义,指出应该在多个层次和角度上研究相关性,包括系统(system)角度、认知(cognitive)角度、情境(situational)角度和动机(motivational)角度等,人机交互已经成为这方面研究的焦点之一;Mizzaro(1998)提出一个重要的观点,认为时间也是相关性的一个维度,在人机交互过程中是无法回避的,这一观点已经得到普遍认同[44];Brajnik,Mizzaro和Tassso(1996)从三个角度来描述相关性,即:主题相关、任务相关、背景相关。即某一信息属于用户所感兴趣的主题范围,或有利于用户解决当前面临的问题,或是适用于当前的环境、条件。在具体情况中可能会是主题、任务、背景相关,或者是主题相关和任务相关,或者是主题、任务、背景均相关[45]。进入网络时代,基于Web的相关性研究再一次吸引了众多学者的目光。Web不是一个纯文本信息的展示平台,而是一个动态交互的多媒体资源融合的平台,同时还可兼容FTP、MailingList、Newsgroups等各类资源,Web强大的发展势头促使着Web信息检索发展为Internet上主流的检索方式,虽然它的发展时间并不长,但是已由功能单一、种类稀少进入到了功能多元化、种类多样的发展阶段,如何在动态的网络环境中研究相关性问题,虽然可以借助现有的不少成熟理论与技术,但终究还有不少悬而未决的问题需要广大信息科研工作者去解决[46]。

近年来,基于Web的信息检索相关性研究吸引了越来越多国内学者的关注,相关的实证研究开始出现。武汉大学何绍华教授针对传统网络信息检索查全率、查准率低下的问题,对Mizzaro的相关性及语义网理论进行融合,指出网络环境下信息检索效率低下的主要原因在于检索算法采用词型匹配而非词义匹配以及对来源信息标引缺乏语义描述信息,在此基础上设计了一种语义信息标引方法和语义查询扩展方法来改善查全率和查准率[47]。南京大学成颖[48]在Saracevic及Harter研究的基础上,提出了将语言学中的关联理论作为相关性研究的理论基础,并利用关联理论验证了信息检索交互模型中的信息生产以及信息标引两项工作。

7 结语

目前,信息检索的相关性研究已经越来越引起人们的重视,其发展也已经取得了一定的成效,但纵观现有的研究成果,主要还是集中于相关性的理论探讨阶段。由于相关性研究领域的技术不成熟而导致的相关性实验验证及判据性的实证研究成果还十分有限,尤其在网络信息资源飞速发展,而网络已成为信息用户主要信息检索环境的今天,基于网络环境、侧重语义视角、面向用户需求、体现用户行为的信息检索相关性实证研究将成为该领域研究的主流发展趋势。

参考文献:

[1]Saracevic,T.Relevance:A review of and a framework for the thinking on the notion in information science[J].Journal of the American Society for Information Science,1975,26(6):321-343.

[2]Bradford,S.C.Sources of information on specific subjects[J].Engineering,1934,(137):85-86.

[3]Mizzaro. S. Relevance:The Whole History[J].Journal of the American Society for Information Science,1997,48(9):810-832.

[4][10][30][44]王家钺.信息检索中“相关性”概念的研究[J].现代外语,2001,(2):181-191.

[5]黄丽红.信息检索中“相关性”的探究[J].图书馆学研究,2006,(2):65-67.

[6][7][8]Schamber,L.,M. B. Eisenberg and M. S. Nilan.A re-examination of relevance:toward a dynamic,situational definition”[J].Information Processing&Management,1990,26(61):755-776.

[9]Saracevic,T.Relevance Reconsidered 1996[A].P.Inguersen,&N.O.Pors.Proceedings of CoLIS2.second international conference on conceptions of library and information science:Integration in perspective[M].Copenhagen:Royal School of Librarianship,1996:201-218.

[11][30]成颖,孙建军.信息检索中的相关性研究[J].情报学报,2004,(6):689-696.

[12]Mizzaro,S.Relevance:The whole history[J].Journal of the American Society for Information Science,1997,48(9):810-832.

[13]Borlund P.Th e concept of relevance in IR[J].Journal of the American Society for Information Science,2003,54(10):913-925.

[14]Bo-Y.Kang,Dae-Won Kim,Sang-Jo Lee.Semantic Indexing and Fuzzy Relevance Model in Information Retrieval[J].Studies in Computational Intelligence(SCI),2005,(2):49-60.

[15]Saracevic,T.Relevance:A review of and framework for the thinking on the notion in information science[J].Journal of the American Society for Information Science,1975,26 (6):321-343.

[16]Schamber,L.,Eisenberg,M. B., & Nilan, M. S. A re-examination of relevance:Toward a dynamic,situational definition[J].Information Processing and Management,1990,26(6):755-776.

[17]Harter,S.P.Psychological relevance and information science[J].Journal of the American Society for Information Science,1992,43 (9):602-615.

[18]Rees,A.M.,&Saracevic,T.The measurability of relevance.Proceedings of the American Documentation Institute[M].Washington,DC:American Documentation Institute,1966:225-234.

[19]Katzer,J.,& Snyder,H.Toward a more realistic assessment of information retrieval performance.Proceedings of the American Society for Information Science[M].Medford,NJ:Learned Information,1990: 80-85.

[20]Ottaviani, J.S.The fractal nature of relevance: A hypothesis[J].Journal of the American Society for Information Science,1994,(45):263-272.

[21]Regazzi,J.J.Performance measures for information retrieval systems—An experimental approach[J].Journal of the American Society for Information Science,1988,(39):235-251.

[22]Harter,S.P.Psychological relevance and information science[J].Journal of the American Society for Information Science,1992,(43):602-615.

[23]Sutton,S.A.The role of attorney mental models of law in caserelevance determinations:An exploratory analysis[J]. Journal of theAmerican Society for Information Science,1994,(45):186-200.

[24]Bruce,H.W.A cognitive view of the situational dynamism of user-centered relevance estimation[J].Journal of the American Societyfor Information Science,1994,(45):142-148.

[25]Bookstein, A.Information retrieval:A sequential learning process[J].Journal of the American Society for Information Science,1983,(34):331-342.

[26]Tiamiyu,A.M.,& Ajiferuke,I.Y.A total relevance and document interaction effects model for the evaluation of information retrieval processes[J].Information Processing & Management,1982,24(4):391-404.

[27]Harter,S.P.Psychological relevance and information science[J].Journal of the American Society for Information Science,1992,(43):602-615.

[28]Bruce,H.W.A cognitive view of the situational dynamism of user-centered relevance estimation[J].Journal of the American Society for Information Science,1994,(45):142-148.

[29]Spink,A.,Greisdorf,H.,& Bateman,J.From highly relevant to not relevant:Examining different regions of relevance[J].Information Processing & Management,1998,(34):599-621.

[31]Schamber,L.Relevance and information behavior[J].Annual Review of Information Science and Technology,1994,(29):3-48.

[32]苏君华.基于信息用户的相关性研究[J].图书馆学研究,2003,(9):57-59.

[34] Schamber,L.Userscriteria for evaluation in a muhimedia information seeking and use situation[D].Unpublished doctoral dissertation,Syracuse University,Syracuse,NY.1991.

[35]Park,T.K.The nature of relevance in information retrieval:Anempirical study[D].Unpublished doctoral dissertation,School of Library and Information Science,Indiana University,Bloomington,IN.1992.

[36]Park,T.K.The nature of relevance in information retrieval:An empirical study[J].Library Quarterly,1993,63(3):318-351.

[37]Barry,C.L.The identification of user releyance criteria and document characteristics:Beyond the topical approach to information retrieva1[D].Unpublished doctoral dissertation,Syracuse University,Syracuse,NY.1993.

[38]Barry,C.L.User-defined relevance criteria:An exploratory study[J].Journal of the American Society for Information Science,1994,45(3):149-159.

[39]Wang,P.A cognitive model of document selection of real users of information retrieval systems[D].Unpublished doctoral dissertation,University of Maryland,College of Library and Information Science,College Park,MD.1994.

[40]Wang,P.,&Soergel,D.A cognitive model of document use during a research project.Study I:Document selection[J].Journal of the American Society for Information Science,1998,49(2):ll5-l33.

[41]Wang,P,W hite,M.D.A Cognitive Model of Document Use during a Research Project.Study II.Decisions at the Readingand Citing Stages[J].Journal ofthe American Society for Information Science,1999,50(2):98-114.

[42]Schamber,L.eta1.A re-examination of relevance:Toward a dynamic,situational definition[J].Information Processing &Management,1990,26(6):755-775.

[43]Schamber,L.Relevance and information behavior[J].Annual Review of Information Science and Technology,1994,(29):3-48.

[45]苏君华.基于信息用户的相关性研究[J].图书馆学研究,2003,(9):57-59.

[46]黄昆,赖茂生.Web信息检索技术及研究进展[J].现代图书情报技术,2004,(5):44-48.

[47]何绍华,宫兆晖.基于语义网的网络信息检索相关性研究[J].情报杂志,2007,(12):120-123.

[48]成颖,孙建军.基于关联理论的信息检索相关性研究——信息生产、标引[J].情报科学,2010,(1):7-12.

作者简介:王雅坤(1974—),女,河北大学期刊社讲师,研究方向:信息管理、编辑出版;成全(1979—),男,国家图书馆博士后,福州大学公共管理学院信息管理系硕士生导师。

猜你喜欢
理论模型信息检索相关性
间接技术进步效应的获得途径和主要影响因素分析
基于Kronecker信道的MIMO系统通信性能分析
小儿支气管哮喘与小儿肺炎支原体感染相关性分析
脑梗死与高同型半胱氨酸的相关性研究(2)
脑梗死与高同型半胱氨酸的相关性研究
医学期刊编辑中文献信息检索的应用
动机和态度对学生考试作弊的影响模型研究
老年生活质量的理论模型构建和验证
基于神经网络的个性化信息检索模型研究
国外沉浸体验研究述评