蒋大平
(绥化学院图书馆 黑龙江绥化 152061)
Web上的充斥着大量信息,我们急需一个有效的信息系统,能够定位和检索与用户兴趣相关的信息。而相关性评价通常基于多个标准的评价,也就是相关性维度,旨在捕获所考虑的文档或文档上下文的不同方面或属性[1]。相关性维度应估计文档对于用户的查询效用,例如,搜索引擎中页面热度概念有效利用了文档相关性评估的评价标准。具体而言,与每个检索到的文档相关联的总体相关性的得分计算,是基于表示评价标准满意度的若干得分的计算。作为直接结果,需要将与单个标准评估相关的得分聚合为表示总体相关性估计的总体得分。尽管这个聚合步骤在文档的最终排名中起着重要的作用,但在一些研究中,并没有引起应有的重视。
传统的平均聚合算子是完全补偿的,即缺乏满意度评价标准,可以通过另一个剩余满足来补偿[2]。这种性质在许多实际应用中并不现实,特别是在信息检索(IR)领域。
为了说明和评估优先级聚合算子,我们使用一个信息检索个性化设置,信息检索IR 的个性化设置使用用户兴趣的正式表示即用户资料,来评估信息检索相关性与用户查询的关系。这种方式特别有效,如果用户经常公式化他的个人资料中固有的兴趣查询,搜索个性化就能战胜传统检索方法,这种方法不考虑用户的背景和检索目的,用相同的检索表达式,面对不同的用户产生相同的检索结果。近年来,越来越多的研究致力于使信息检索技术尽可能地利用上下文因素,以便为特定用户定制搜索结果[3]。
在多准则决策设置中,考虑多维标准之间优先关系是典型的问题。在缺乏更高优先级标准满意度的情况下,不可能用较低优先级的标准满意度来补偿。我们给出下面一个简单的现实生活中的例子,对其进行解释。
让假设李女士正在寻找件羽绒服。她的选择基于两种标准。第一个标准是“保暖”,第二标准是“不贵”。对李女士来说,更重要的是保暖,而不是便宜。因此,他想买一件首先是保暖的羽绒服,然后,如果可能的话便宜一些。我们可以考虑两种情况。
a如果李女士没有找到任何便宜的保暖羽绒服,他可以买到保暖昂贵的羽绒服(因此,廉价标准的不满足可以在某种程度上通过保暖标准的满足来补偿)。
b李女士没有多少钱。她仍然认为保暖比成本更重要,然而,她负担不起巨额费用。在这种情况下,李女士首先会找一件比较保暖又便宜的羽绒服。因此,在这种情况下,廉价标准的不满足不能通过保暖标准的满足来补偿。
要注意到,在这两种情况下,先需要一个优先聚合算子,然而,对于第一个合适的算子不同于对于第二种情况合适的算子。与相对于第一种情况,第二种情况的是,羽绒服是保暖的,但不够便宜,李女士不会考虑;相反,相对于第二种情况第一种情况是,一件便宜但不保暖的羽绒服不会被考虑,因为保暖是最重要的准则。明显看到,这个问题是一个多准则决策问题,从现实生活实例到信息检索语境,所考虑的标准是不同的关联维度。
这里涉及两个优先聚合运算符(‘score’运算符和‘and’运算符),于2009年由佩雷拉等人首次提出,主要是将所提出的算子应用加权,聚合中与所考虑的标准即关联性维数相关的重要性权值基于指定的优先级顺序。这意味着与标准相关的权重取决于更高的满意度[4]。
(一)问题表征。
首先,假设C 集合是评价标准集合,有n 个评价标准组成,即C={C1,C2,…,Cn},
其中,Ci表示对第i个标准的评价函数。
然后,用D 表示文件集合,d∈D 表示文件元素。聚合函数F用于计算文件d的对于给定标准的总评分。
Score F(C1(d),C2(d),…,Cn(d))=RSV(d)
这意味着通过考虑同一组标准,对于不同的用户,给定文档查询的相关性评估,可能会产生不同的分数(不同的RSV)。并且对于同一用户具有不同搜索意图的检索也会产生不同的分数。这是因为标准的优先级顺序是用户依赖的,因此,要对每个标准赋予不同的重要性权值,使得不同的用户有不同的标准优先级排序,尽可能做到对于同一篇文件不同的用户使用不同的重要性权值[5]。
这里,选择用C1表示最重要标准,用Cn表示最不重要的标准,假设Ci重要性优先于Cj,i<j。假设序列“C0,C1,C2,…,Cn”被看做是用户定义的标准序列,对于用户来说,C0是最重要的条件,Cn是最不重要的条件。定义的计算与每个准则Cj相关联的权重数值的方法既依赖于文档的满意度又依赖于用户兴趣。它实际上首先取决于用户表达的标准偏好顺序,并且还取决于文档对标准Cj-1的满意度,Cj-1的权值。
假设对于文件d,标准Ci的重要性权值λi∈[0,1]。对不同的用户,任意的文件d,设λ1=1。Ci,i∈[2,n]。λi=λi-1·Ci-1(d)。Ci-1(d)是由文件d确定的标准Ci-1的满意度。λi-1是标准Ci-1的重要性权值。
(二)优先得分模型。即给出“score”优先聚合算子Fs的表达式和性质。这个聚合算子允许从多个标准评价中计算总体得分,其中每个标准的权重取决于满意度,在最重要的标准上满意度越高,权重越高。更重要的标准是,一个不太重要的标准的满意度越大,对总成绩的影响越大。
(三)“and”算子。2009年由Pereira等人提出的优先聚合算子“and”。此运算符允许建模,总体满意度强烈地依赖于最不满意标准的满意度[6]。这种算子的与传统的“and”算子不同。它的特征在于考虑最不重要准则对用户的满足程度。如果它根本不重要,则在聚合过程中不应该考虑它的满意度,而如果它是用户最重要的标准,则只考虑它的满意度。标准越不重要,代表整体满意度的机会就越低。
聚合算子算法:
RSVa(d)=Fa(C1(d),C2(d),…,Cn(d))=min({C1(d),C2(d),…,Cn(d)})
对于上例中,设C1(d)代表“保暖”,C2(d)代表“不贵”,C1(d)=0.9,C2(d)=0.2,λ1=1,λ2=0.9。
RSVs(d)=λ1·C1(d)+λ2·C2(d)=0.9+0.18=1.08
RSVa(d)=min({C1(d),C2(d)})=min(0.91+0.180.9)=0.213
RSVs(d)∈[0,2]优于RSVa(d)∈[0,1]的结果。
评估信息检索算法有效性的传统方法是基于Cranfield范式的,该范式允许所谓的基于实验室的评估。实际上,当应用优先级聚合策略时,根据所采用的依赖于用户的优先级化方案,针对相同查询评估的相同文档可以产生不同的评估分数[7]。
相关标准的优先级顺序取决于用户的搜索意图。为了进行有意义的评估,基于相关性维度的语义,我们识别出与不同的搜索意图相对应的三个用户类别,在所考虑的相关性维度上归纳出三个不同的优先级顺序,所识别的类别构成了需要考虑到评价目标的评价情景[8]。
第一个评估场景,主要考虑当用户制定仅关注他/她的兴趣的查询时的情况;在这种情况下,假设用户旨在定位首先与他/她的兴趣相关的文档,同时要求搜索的文档do不要关注除了查询所表示的其他主题之外的其他主题。
比如,假设用户正在寻找关于“金”的文档,他/她感兴趣的是化学而不是经济学。这意味着用户正在查找“金”作为化学元素的文档,而不是“金”作为存储的价值。根据这个搜索场景,继续识别第一个用户类别,我们称之为“覆盖搜索器”。使用该用户类别,我们将以下优先级顺序与四个考虑的关联维度关联:
coverage appropriateness aboutness reliability
很重要的一点是,稍微不同的优先级顺序可以与这个用户类别相关联,以及与以下两个用户类别一起指定。
第二种情况,当用户的意图是找到文件,完全适合他/她的兴趣。我们将此第二用户命名为“适当性搜索者”,我们认为它在四种标准中处于最高优先级。
appropriateness aboutness coverage reliability;
我们介绍的第三个用户类别是指优先考虑检索到的文档的信息源的可靠性的用户;我们称属于该类别的用户是谨慎的;这些用户给予可靠性标准比其他标准更大的优先级。使用这个用户类别,我们将以下优先级顺序与四个考虑的关联维度关联起来。
reliability aboutness appropriateness coverage
不同类型的用户,具有不同的搜索意图。优先排序聚合方案特点是,对于相同的查询和相同的用户,可以根据相关维度的不同优先级顺序,获得不同的文件排序。本文提出的聚合模型是通用的,因此可以应用于任何相关维度的集合。实例证明,优先聚合算子的有效性。优先级“score”算子塑造了一种情况,不太重要标准的权值与比较重要标准的满意度成比例。评估实验表明,优先聚合算子“score”,符允许当用户制定与兴趣相关的查询时,以及当用户没有兴趣或制定与用户兴趣无关的查询时,改变与用户兴趣相关的文档优先级排序。文档的排序类似于使用平均算子获得的排序[9]。而优先聚合算子“和”的特性也是它与传统的“和”算子的区别,即最不满意标准程度被考虑在总体满意度中,并且该程度取决于它的满意度和对用户的重要性。该模型适用于当每个标准是必不可少的,并且在不影响用户兴趣目的情况下不能丢弃任何需求时,以及根据这些需求处理用户偏好顺序时,改进文档的排序。所执行的评估表明,当用户制定与兴趣相关的查询时,所提出的操作符提高了与用户兴趣相关的文档的排序,否则该操作符不适合。所提出的算子的优点是,它们允许以简单的方式计算标准的权重。