郑雯译
(电子科技大学,成都 611731)
国外发现系统分面过滤功能比较
——EDS、Summon、Primo
郑雯译
(电子科技大学,成都 611731)
摘要:通过实例对三种国外发现系统——EDS、Summon、Primo的分面过滤功能进行深入比较和分析,包括:分面过滤选项设置、一些主要分面(精炼结果选项、文献类型分面、主题分面、数据库分面、出版日期分面)的比较。
关键词:发现系统;分面;过滤;EDS;Summon;Primo
1分面特点及比较平台的选取
分面(Facet)是指事物的多维度属性[1],例如一本书包含题名、作者、主题、出版社、出版年等分面。分面过滤是指将查询结果按照多个分面来组织和聚类的过滤方式,它实际是查询和浏览的结合,是一种交互式、动态的结果呈现方式。分面过滤可以引导用户在相关的分面中逐层深入,不断调整和缩小检索范围,直至发现适宜的结果,并且分面过滤只展现有结果的选项,避免了结果为空的情况,从而大大提高了检索效率和用户体验。
分面过滤的上述优点使其非常适合海量资源的搜索和过滤,目前在电子商务网站(如淘宝、京东、当当等)和数字图书馆都已日益得到广泛应用。而对于拥有海量元数据的资源发现系统,分面过滤更是其必备功能和重要特征之一,也是图书馆考察发现系统优劣的重要指标之一。
目前,国内应用较多的国外发现系统主要有三家: EDS[2]、Summon[3]、Primo[4]。本文将通过实例对它们的分面过滤功能进行深入比较,比较重点包括:分面过滤选项设置、主要分面过滤选项(精炼结果、文献类型分面、主题分面、数据库分面、出版日期分面)的比较。具体比较平台分别选择它们各自的代表性用户: EDS选择中山大学的智慧搜索[5]、Summon选择北京大学的未名学术搜索[6]、Primo选择清华大学的水木搜索[7]。
2分面过滤选项设置比较
发现系统分面选项的具体设置会直接影响过滤效果,通常,分面选项设置越丰富、越实用,对结果的过滤效果就越好。EDS、Summon、Primo的分面过滤选项均显示在查询结果的左边,其中,EDS有八组分面:Refine Results、文献类型、Subject、Publisher、Publication、Language、Geography、来源数据库;Primo也有八组分面:选择显示内容、主题、作者、来源、出版日期、文献类型、语种、出版物;Summon有五组分面:限定显示范围、内容类型、主题、创建/出版时间、语言。将以上这些分面中相似或相同的分面进行合并,可以看出三种发现系统主要涉及以下这些分面:精炼结果、主题、文献类型、出版日期、出版物、数据库、作者、出版者、语种等。表1中,打“√”的是相应发现系统包括的分面,打“×”的是其不包括的分面。
表1 三种发现系统主要分面过滤选项
由表1可看出,在这些分面中,EDS和Primo的分面选项比较全面,EDS仅没有作者分面,Primo仅没有出版者分面,而Summon的分面选项相对要少一些,缺少出版物、数据库、作者、出版者等四项分面。这就意味着,读者在检索Summon时,不能按照出版物、数据库、作者以及出版者来过滤结果。
3主要分面过滤选项比较
3.1 精炼结果选项比较
通常在发现系统分面过滤选项的最顶端,首先会看到一组精炼结果(Refine Results)的选项,严格地说它们并不是一组专门的分面过滤选项,而是将从不同分面中提取出的一些比较常用的过滤选项集中在一起,以方便读者勾选。
EDS的精炼结果选项主要有以下4个(如图1),这些条件都可以多选,即读者可以将结果限定在:电子全文、同行评议期刊、本馆馆藏目录,并可以选择结果的年代范围。
图1 EDS精炼结果选项
Summon的精练结果选项包括5个(如图2),也是可以多选,可将结果限定为在线全文、期刊文章、馆藏纸本资源、馆外资源,以及是否排除报纸文章等。
图2 summon精炼结果选项
Primo的精炼结果选项包括3个:同行评议期刊、在线全文、本馆收藏(如图3),也是可以多选。
图3 Primo精炼结果选项
纵观这三家发现系统的精炼结果选项,EDS和Primo很相近,允许读者将结果限定在在线全文、同行评议期刊及本馆馆藏,此外,EDS还多一个年代范围选项。Sumon的选项是三者中最多的,仔细分析发现,它比另两个发现系统多的是:排除报纸文章、显示馆外更多结果,但是它也比另两个发现系统少了一个很重要的选项:同行评议期刊。同行评议期刊中的文章质量通常比非同行评议期刊更有保证,在海量搜索中,这个选项是很重要的,而Summon只能笼统地将结果限定在期刊文章,不能不说是一个缺憾。
3.2 文献类型分面比较
文献类型是一个比较常用的分面。读者在搜索到海量结果后,可以根据自己需要的文献类型(期刊论文、学位论文或图书等)对结果进行过滤。下面我们输入一个范围比较大的词“computer”,分别看一下三种发现系统中都包含哪些文献类型。
EDS的文献类型分面有19个选项:Academic Journals、Magazines、Conference Materials、Electronic Resources、Trade Publications、Books、Reviews、News、Reports、Biographies、Dissertations/Theses、Primary Source Documents、eBooks、Videos、Audio、Non-Print Resources、Maps、Music Scores、Audio books。
Summon的文献类型分面有39个选项:报纸、报纸文章、期刊或电子期刊、期刊文章、商业出版物、商业出版物文章、杂志、杂志文章、出版物、出版物文章、书籍/电子书、书籍章节、书评、论文、学位论文、会议录、专利、标准、报告、技术报告、市场研究、政府文献、图书馆馆藏、电子资源、案例、简讯、数据集、图像、视频记录、地图、照片、讲座、学习参考、参考文献、缩微胶卷、计算机文件、抄本、诗歌、其他。
Primo的文献类型分面有20个选项:文章、报纸文章、会议论文集、图书、Dissertations、文本型资料、评论、Technical Report、期刊、音像资料、其它、网站、参考条目、法律文件、地图、统计数据、乐谱、数据库、research datasets、图片。
纵观三家发现系统的文献类型分面,从数量上来说,EDS和Primo很接近,都是20个左右,Summon则要多一倍,接近40个;从文字上来说,Summon全部使用中文,最易懂,Primo以中文为主,夹杂少量英文,次之,EDS全部使用英文,不够直观;从内容上来说,三家发现系统都包含了最基本、常用的文献类型(期刊文章、会议文章、图书、学位论文、报告等);另外,三家都分别包含了一些各自的特色文献类型,如EDS中的Primary Source Documents(原始文档)、Audio books(有声读物),Summon的抄本、诗歌、缩微胶卷等,Primo的统计数据、research datasets(研究数据集)等。此外,Summon和Primo不仅可以选择希望包含的文献类型,还可以选择希望排除的文献类型,比较灵活,而EDS没有排除选项。
三家发现系统中,Summon是文献类型最为丰富的一个,划分得很细,这有利有弊,一方面,它把图书、期刊、报纸和图书章节、期刊文章、报纸文章等区分得非常清楚,这是它的可取之处,但另一方面,它的文献类型有近40个,过于复杂,特别是有些选项有点重复或容易引起歧义,如:报告和技术报告、学习参考和参考文献等。
3.3 主题分面比较
主题分面是发现系统分面导航中比较重要的一个分面,如果主题分面中的主题词设置得精炼、恰当,会帮助读者迅速找到相关主题的结果。下面选择一个大家比较熟悉的词汇“artificial intelligence”(人工智能),分别在三种发现系统中进行检索,从中我们可以看一下这三种发现系统主题分面的具体情况。
EDS的主题分面默认显示的主题词约50个左右,以“artificial intelligence”检索为例,可以看出主题词还是比较相关的,排在前面的有:artificial intelligence、algorithms(算法)、neural networks(神经网络)、computer science、machine learning等,如图4所示。
图4 EDS主题分面示例
Summon在主题分面中默认显示的主题词个数通常为100个左右,以“artificial intelligence”检索为例,会看到排在前面的主题词除artificial intelligence、algorithms比较相关,也有些相关性并不是很紧密或过于笼统的,如:engineering, electrical & electronic、information systems applications,如图5所示。
图5 Summon主题分面示例
Primo在主题分面中显示的主题词通常为20个左右,以“artificial intelligence”检索为例,排在前面的主题词有artificial intelligence、algorithms、computer science、mathematical models等,如图6所示,仔细分析这些主题词发现多数与检索词还是比较相关的。
由以上比较可看出,三种发现系统的主题分面比较理想的是Primo,主题词的数量20个比较合适,并且其主题词的相关性也较好。EDS的主题词相关性也很好,但50个主题词略多了一些。而Summon的主题词有些相关性不是很紧密,并且100个主题词数量过多,因此检索者很难通过其主题分面获得理想的结果。
3.4 数据库分面比较
数据库分面也是发现系统中比较重要的一个分面,它可以帮助检索者将结果限定在特定的数据库中,从而保证检索结果的质量。三种发现系统中,Summon没有数据库分面,下面我们就以“computer”检索为例,分析一下EDS和Primo的数据库分面。
在EDS检索结果页面,点击来源数据库分面可看到如图7所示的列表,笔者将列表中所有数据库浏览了一遍发现,除了几个大的数据库如:Scopus、EBSCO的Business Source Complete、ScienceDirect、SCI、JSTOR等外,几乎看不到国内图书馆和读者所熟悉的那些专业出版社或学会数据库,如:Springer、Taylor、Wiley、IEEE、ACM等等。事实上,EDS最初把这个分面命名为“provider”,准确地说是数据提供商,和我们平时所说的数据库并不完全一致。
图7 EDS来源数据库分面示例
下面我们看一下Primo的数据库分面(在Primo中被称为来源分面),以“computer”检索为例,在来源分面中我们看到如图8所示的列表,仔细看一下这个列表会发现上面的名称多数是我们熟悉的数据库,如:Elsevier、Gale、SpringerLink、IEEE、ACM、Wiley、Taylor等。
图8 Primo数据库分面(来源分面)示例
由以上比较可看出,Primo的数据库分面更接近大家所理解的数据库分面,对中国读者来说也更有实用意义。而EDS的数据库分面,实际上是数据提供者分面,和通常大家所理解的数据库并不完全一致。
3.5 出版日期分面
出版日期分面也是一个非常重要的分面,可以帮助读者按照特定的出版时间段来过滤结果,是读者常会用到的一个分面。下面我们来比较一下三种发现系统的出版日期分面。
EDS的出版日期分面如图9,可精确到年,通过在输入框中输入起止年代或拖动年代滑动条都可以实现对结果年代范围的限定。
图9 EDS出版日期分面示例
Summon的出版日期分面如图10,不仅可输入起止年,还可以输入起止月、日,时间上更精确,并且也可通过拖动年代条来限定结果的时间范围。
图10 Summon出版日期分面示例
Primo的出版日期分面如图11,上面是年代输入框和年代滑动条,下面是一些固定的年代段以及年代查找框。
图11 Primo出版日期分面示例
由以上截图可看出,出版日期分面最灵活好用且最精确的是Summon,它能够将出版日期精确到日而不只是年,而另外两种发现系统都只能精确到年,并且,Summon在年代滑动条上有各出版年发文量的矩形图显示,也非常直观。EDS和Primo都可通过拖动年代滑动条和输入年代范围两种方式来限定出版时间,只是Primo的下半部分(预设的年代段和年代查找框)显得有些多余。
4结语
综合以上分析和比较可以看出,三种发现系统仅就分面过滤功能来说,总体上最理想的是Primo。它不仅分面选项设置比较全面,并且也比较实用,符合中国人的使用习惯和理解,其精炼结果选项简明实用,文献类型分面数量适中(20个左右),主题分面数量也适中(20个左右),主题词也比较精炼、相关,数据库分面设置也较贴切、实用,只有出版时间分面可以设置得更精简一些。
EDS的分面过滤功能总体来说也不错,其分面选项设置比较全面丰富,精炼结果选项也较实用,文献类型分面数量适中(20个左右),其主题词的设置很专业,但主题词数量偏多(50个),降低了其实用性,其数据库分面实际是数据提供者分面,和国内通常所说的数据库并不完全一致,且EDS的分面选项文字显示上多为英文,不够直观。
Summon的分面选项设置比前两家要简单一些,虽然它的出版时间分面是三家中最为灵活好用的,但它缺乏一些重要的分面,如数据库分面、出版物分面等,使得读者无法按照数据库或出版物来过滤结果,而它的精炼结果分面缺少同行评议期刊这一重要选项,主题分面也不是很理想,主题词相关性不是很紧密且数量过多(100个),这些都是Summon在分面过滤选项中需要改进的地方。
参考文献:
[1] 郭力洁,李新叶,宋金浍.分面搜索研究综述[J].电子科技,2012,(9):136-138.
[2] EBSCO Discovery Service[EB/OL].https://www.ebscohost.com/discovery,2015-6-20.
[3] ProQuest Summon[EB/OL].http://www.proquest.com/products-services/The-Summon-Service.html. 2015-6-20.
[4] ExLibris Primo[EB/OL].http://www.exlibrisgroup.com/category/PrimoOverview.2015-6-20.
[5] 中山大学图书馆智慧搜索[EB/OL].http://library.sysu.edu.cn/web/guest/index. 2015-6-22.
[6] 北京大学图书馆未名学术搜索[EB/OL].http://www.lib.pku.edu.cn/portal/2015-6-22.
[7] 清华大学图书馆水木搜索[EB/OL].http://discovery.lib.tsinghua.edu.cn/primo_library/libweb/action/search.do?vid=thu. 2015-06-22.
(责任编辑:傅正)
Comparisons of faceted filtering capabilities of discovery systems abroad:——EDS, Primo and Summon
ZHENG Wen-yi
(University of Electronic Science and Technology, Chengdu611731, China)
Abstract:This paper compares and analyzes faceted filtering capabilities of three discovery systems abroad-EDS, Summon and Primo by examples. Comparisons focus on: faceted options arrange and some important facets comparison such as refine results, document type, subject, database and publication date etc..
Key words:discovery system; facet; filter; EDS; Summon; Primo
收稿日期:2015-07-13
作者简介:郑雯译,女,副研究馆员。
中图分类号:G250.76
文献标识码:A
文章编号:1006-1525(2016)01-0026-05