面向用户的网络叙词表需求调查分析*

2019-05-14 11:54:30陈红艳
图书馆研究与工作 2019年5期
关键词:词表入口检索

陈红艳

(湖北大学图书馆 湖北武汉 430062)

数字技术和网络技术的发展和应用,改变了用户信息资源的供给、需求和环境。在网络环境下,用户利用信息资源的方式发生了变化,一般用户更倾向于使用搜索引擎作为检索起点。伴随信息技术的发展,网络资源正呈指数级别增长,对于一般用户而言,信息利用成本增加,如何快速有效地查询到所需信息显得愈发困难。在用户搜索与信息查找反馈复杂的信息交换过程中,网络叙词表作为一种成熟的语义组织工具,对于联接用户和信息资源发挥着重要的作用。本文在分析影响用户对网络叙词表需求因素的基础上,采用深入访谈的方式调研用户需求,分析其需求特征,以期为构建面向用户的网络叙词表提供参考。

1 影响用户对叙词表需求的主要因素

网络叙词表不仅可以用于纸质文献的组织,也可用于组织网络信息资源。伴随互联网的出现,用户对网络叙词表的需求主要与下列因素有密切关系。

1.1 信息环境的改变

信息环境的改变主要体现在信息资源的网络化和资源数字化两大方面。当前,互联网络是用户获取信息的重要途径。据中国互联网络信息中心(CNNIC)发布的第42次《中国互联网络发展状况统计报告》显示:截至2018年6月,中国网站数量达到了544万个,中国网民规模达8.02亿,互联网普及率达到57.7%,近六成中国人已接入互联网[1]。其中,即时通信、搜索引擎、网络新闻和社交作为基础应用,用户规模保持平稳增长。随着数字出版、预印本、开放获取等新型数字媒体的出现,资源数字化趋势日益明显,数字资源在整个文献信息体系中所占的比例越来越大。以上海交通大学图书馆为例,其在2001—2011年期间,数字资源增长迅猛,电子图书增加了195.9万种,电子期刊增加了267 000种,数据库增加了196个,馆藏资源朝数字化方向发展[2]。目前国内最大OA资源数据库Socolar平台,几乎涉及所有学科领域,共收录11 739种OA期刊,1 048个OA仓储,平台收录文章数达23 894 558篇[3]。由瑞典隆德大学图书馆2003年5月推出的开放获取期刊检索系统——开放获取期刊目录(Directory of Open Access Journals,简称DOAJ),当前可提供12 228种开放获取期刊的访问,其中有9 209种支持文章级检索,涉及128个国家,收集的论文数量达3 457 865篇[4]。由此可见,面对海量信息源,用户需有适合的知识组织工具予以支持,方可节省检索时间和提高检准率。网络叙词表就是其中有效的工具之一。

1.2 用户的现实需求

在检索活动前,用户对于所需查询的问题通常有较为清晰的认识,清楚查询主题的范围。但在构建检索表达式、选择合适的检索词时,往往会遇到困难。国外已有学者对此展开过定性与定量研究。Nielsen曾对29个参与者进行调查,其中有21人表明在构建检索式时,很难限定其信息需求所用检索词[5]。为了限定检索提问式,在未产生更高检索噪音而又获得高查全率的情况下,用户通常需要参考一些同义词和其他类型的等同词汇。比如,借助叙词表等工具。Shiri在《叙词表增强的检索界面》一文中指出,在构建检索式时,通常终端用户在选择词汇时有困难。叙词表通过提供有效检索词,帮助用户顺利完成检索过程[6]。

1.3 网络叙词表具备的功能

网络叙词表具有标引、检索、浏览、导航等多种功能,通过提供多途径浏览方式,帮助用户快速选定目标词,提高词表的易用性。网络叙词表既能标引各种媒介资源,又能实现资源链接,满足终端用户从检索词汇到检索相关信息的连续检索。因此,网络叙词表具有优化用户检索过程及检索效果的功能。

网络叙词表为网络环境下的信息生产者和使用者带来双赢:对网络信息生产者而言,利用叙词表可用同一标准来标引和描述信息,尤其是对同类资源的描述;对网络终端用户而言,作用则更为显著。Shiri和Revie在《叙词表增强的检索界面的可用性及用户认知》一文中曾经指出叙词表:①为用户的具体检索引入相关新概念;②为检索词汇提供语境信息;③为用户构筑提问式提供多种可选建议;④便于用户扩大或缩小检索范围;⑤为用户提供多角度检索;⑥提供叙词之间语义关系的指导说明;⑦提醒用户使用检索最初未想到的词汇[7]。

同时,网络叙词表反映了概念间内在语义逻辑关系,对于促进客观知识体系中的多级语义传递具有正向促进作用。通常,在具有5个相同相邻语义域时,发生多级语义传递的可能性最大[8]。

2 用户对叙词表的认知与利用情况调查

为了探讨不同学科领域的普通用户对网络叙词表需求的差异及特征,笔者于2018年3-5月利用讲授《信息检索与利用》选修课程的机会,对33名选修学生进行分组深度访谈。访谈内容主要包括对叙词表的认知、利用情况,以及在检索过程中遇到的常见障碍和对叙词表功能展望等,深入了解用户对网络叙词表的认知情况与真实需求,以期为面向用户的网络叙词表设计及构建提供借鉴。

2.1 用户对叙词表的认知情况

在33名访谈者中,大一学生有22人,占66.67%,大二学生有7人,占21.21%,大三学生有4人,占12.12%;所涉及的学科分布分别为社会学科9人(27.28%)、人文学科2人(6.06%)、理工学科14人(42.42%)以及信息学科8人(24.24%);专业主要有化学工程与工艺、地理科学、计算机科学与技术、档案学、人力资源管理等。

在访谈之前,笔者首先对受访者进行有关叙词表基础知识的普及讲解。例如,在我国,叙词表与主题词表指代几乎等同;主题与主题词的常见应用场景等。根据用户对叙词表认知的熟悉程度分为“非常熟悉”“熟悉”“基本了解”“从未听说”4个级别进行调查,统计结果见图1。其中,“从未听说”的比例占了66.67%,“熟悉”与“非常熟悉”的为15.15%。由此可见,一般用户对叙词表的认知水平有限。

图1 用户对叙词表的认知情况

通过进一步交谈得知,选择“非常熟悉”的学生专业多集中在档案学。究其原因是因为其开设了《信息组织》等相关课程,故对叙词表非常了解。对于选择“基本了解”的学生而言,对叙词表的了解主要源于对WOS、EBSCO等外文数据库的使用。

2.2 用户对叙词表的利用情况

为了解普通用户使用叙词表的场景,笔者列举了图书馆公共目录OPAC、中文数据库、外文数据库、电子图书、搜索引擎、门户网站、社交网站等不同信息平台。访谈发现,文科类学生使用叙词表时主要是在利用中文数据库(CNKI、维普、万方等)时,选择“主题”项;而在利用OPAC检索图书时,更多地采用“题名”项。理工科类学生则主要是在利用外文数据库(WOS、EBSCO等)时,为扩增检索结果选择“主题”项。

在利用搜索引擎、门户网站检索学术信息资源时,理工科类学生更愿意尝试用多个关键词来输入查找信息;文科类学生则更倾向于用自己熟知的概念、词汇作为首要输入词语,在检索结果不理想的情形下,反复替换多个输入词的意识较弱。

在允许用户自行添加标签的社交网站(如豆瓣等)上,对叙词表认知程度高的学生添加标签积极性很高,标签主题范围更为具体。

在获悉叙词表基本功能后,利用叙词表频率较低者表示,未来在网络检索界面上,若链接有相关叙词表或者主题词表,均表示愿意试用。

2.3 用户信息检索存在的障碍情况

根据检索过程,将用户检索行为分为检索前的检索表达式构建与检索后的检索结果处理两个阶段,列举了6大类障碍,供受访者选择(选项可多选),其结果排序见表1。

表1 用户检索过程中存在的障碍情况统计

从表1可见,用户对检索过程所遇障碍因素的趋同性较高。其中,有超过半数以上的学生选择“不知如何表达信息需求”“想不出恰当的检索关键词”等5类障碍因素。其中,“不知如何表达信息需求”居首位,占81.82%。通过深入交流,发现大部分受访者选择此项最主要的原因是无法精准、快速地提炼自己所需信息的主题,进而找不到合适的词语进行表达。在面对初次检索结果不理想时,“二次检索(精确检索)更困难”“无法及时想到很多关联词语”与主题表达均存在内在关联性。

2.4 用户对网络叙词表服务的期待调查

为进一步普及网络叙词表,推广其应用,在访谈最后阶段了解了用户对网络叙词表平台服务功能的期待,列出多项功能供受访学生选择,结果如表2所示。

表2 用户对网络叙词表服务的期待情况统计

从表2可见,除了“自动标引”以外,其他服务类别期待的比例较高(均超过了半数),反映了用户对这些服务的期待非常强烈。尤其是,“关联词汇提示”“可视化显示”“提供注释”以及“免费获取”四项是用户最需要的服务。用户希望叙词表能够清晰、直观地揭示不同词汇之间的关系,提示同义词、近义词等关联词汇,供自己在确定检索词时选择,提高检准率。“免费获取”“与常用学术资源平台(网站)链接”则从另一角度反映了用户对网络叙词表的迫切需要。

3 用户对网络叙词表需求的特征分析

通过调查用户对网络叙词的需求情况可知,面向用户、面向网络是网络叙词表构建过程中必须遵守的基本原则。此处“用户”既包括信息标引用户和信息检索用户,又包含专业用户和普通终端用户,其对网络叙词表需求的特征如下。

3.1 基于用户自然语言的入口词扩增

在传统信息环境下,叙词表的入口词是指等同(用代)关系中的“代项”,即非优选词,包括优选词的同义词或准同义词;优选词是来源于正式文献和学术术语。由于网络叙词表的使用环境和用户群体发生了巨大改变,入口词的来源、规模及作用亦需作出相应调整。

入口词不应局限于优选词的同义词或准同义词,有关优选词的不同拼写形式、不同的外语缩写形式、不同翻译形式、概念的全称与简称等均可纳入入口词的范围。入口词的规模需要扩增,适当增加入口词数量、扩大入口词形式,提高入口率,增强网络叙词表的自然语言检索能力。入口词作为检索的引导词,虽不用作标引词,但通过词表的等同关系控制也可以检索到相应的信息。由于不同学科领域,对于某一概念的表述词语不尽相同。如果人为规定优选词可能并不能满足使用者的偏好,无法体现入口词在进行高效信息检索时发挥词汇之间的调节作用[9]。当网络叙词表主要应用于网络信息的组织和检索、面向形形色色的非专业用户时,入口词就要收集用户常用检索词作为其重要来源之一。

因此,在遵守叙词表选词基本原理与前提的条件下,网络叙词表需扩大收词规模,增加入口词的数量,使得其选词与用户在检索时所使用的关键词尽量保持一致,适应用户检索习惯。

3.2 词间关系扩展

叙词表词间关系主要有等同关系、等级关系和相关关系三种,基本满足了用户对叙词表的需要。由于网络叙词表的应用环境是面向网络环境下的所有用户,为了更贴近用户的真实需求,这就要求叙词表的编制要根据用户的要求,支持用户自定义词间关系[10]。

自定义是基于三种基本词间关系并结合学科特点作有针对性和适应性调整。例如,对于计算机专业用户而言,希望能将“概念——对象——属性”作为一类相关关系;艺术学科专业用户则希望要充分考虑艺术学科的学科特色,在词间关系设置时,多设立一些“对象”“材料”“空间”“时间”等顶层类别,用不同分面来细分某一具体主题。此外,还可将“学科——学者——研究机构”视为一种相关关系,以此了解某一研究领域概况。

通过词间关系扩展,既能够灵活处理不同的词间关系,又能满足用户的个性化标引和检索需求,提高检准率。为方便用户对词间关系理解和使用,采用可视化技术,形象直观地呈现不同类型的词间关系[11]。

3.3 词表显示多样化

在计算机屏幕显示格式下,网络叙词表能够在一张页面上显示每条叙词纪录的所有信息,给予用户完整的信息反馈[12]。虽然用户记住词汇的语义内容难度增加,但超文本链接使用户在不同显示格式之间跳转,加快了用户在词汇间的移动和定位。由于用户对网络叙词的认知水平普遍较低,为更快熟悉与利用词表,用户希望在显示界面清晰、明了,增强导航功能的前提下,提供多种网络叙词表显示方式,方便其浏览和检索词汇。除了最常见的字母顺序显示方式外,还可考虑等级显示、主题类别显示等。

等级显示直观显示了词汇间的语义关系。通过显示概念间线形、树型等级结构,表达出叙词整体结构和所有等级。网络叙词表应显示词汇不同层次的等级,并对不同等级赋予一定指示标记。不同的等级层次反映词汇间不同的上、下位关系,对用户选择词汇具有导航作用。等级显示将词汇语义关系直观显示,便于用户扩检或缩检来选择合适叙词。

主题类别显示一般按主题范畴集中显示叙词,在一个“语义场”内显示大量相关概念,增加叙词表系统性,方便用户查找。此种显示方式兼具分类、主题两种标引和检索功能,为不同层次和不同需求的用户提供不同入口进行词语概念查询,提高用户检索效率。

3.4 提供多功能服务

信息检索与信息标引作为叙词表的基本功能,为网络叙词表所具备。在用户对网络叙词表服务期待调查中可知,更多用户希望网络叙词表能与常用学术资源平台(网站)进行链接,通过查询叙词来直接获取所需资源,提供“一站式”链接服务。在信息技术的推动下,网络叙词表的功能得到了进一步提升。

一是利用可视化技术,将相关隐性知识进行可视化展示成为显性知识,提高叙词表的易用性,帮助普通用户实现对叙词表的专业化使用,充分发挥叙词表知识组织、知识导航以及知识发现等功能,提高用户对网络信息资源的利用率。

二是实现跨语言检索的功能。网络环境本身就是一个多语种环境,编制多语种叙词表,使其作为一种中介词典,让用户在使用母语的同时,可检索到其他语种同类信息,扩大信息检索范围。

4 结语

在网络环境下,叙词表更多的是适应普通用户更直观的信息检索需求,甚至机器用户的自动标引和检索[13]。网络叙词表设计的基本原则应从适应普通用户和机器用户的应用环境和需求出发,叙词表的编制应更加关注入口词范围扩充、词间关系变革、词表显示等核心内容,包括叙词表自然语言化、控制机制智能化,以及与其他信息系统无缝交换和集成。

猜你喜欢
词表入口检索
基于新一代称重设备的入口治超劝返系统分析
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
英语世界(2021年13期)2021-01-12 05:47:51
2019年第4-6期便捷检索目录
秘密入口
作品三
丝路艺术(2018年3期)2018-06-23 10:12:28
第九道 灵化阁入口保卫战
叙词表与其他词表的互操作标准
专利检索中“语义”的表现
专利代理(2016年1期)2016-05-17 06:14:36
国外叙词表的应用与发展趋势探讨*
图书馆建设(2012年3期)2012-10-23 05:16:30
常用联绵词表
对联(2011年20期)2011-09-19 06:24:36