程树英 杨继红
摘要:碎片化检索是指将用户的需求信息拆分成具有独立含义的一个或多个词语的检索。检索对象主要包括用户需求信息和馆藏资源特征信息。碎片化检索可以提高数字图书馆的服务质量,为优化馆藏资源结构提供支持,提高馆藏资源利用率。基于碎片化检索的数字图书馆知识组织与揭示原则包括科学性、系统性、标准化、特色化、共享性、安全性。建议从用户端、后台管理端及技术支持3个方面对知识组织与揭示系统进行功能设计,进而构建相应模块。
关键词:碎片化;数字图书馆;知识组织;知识揭示
中图分类号:G250.76 文献标识码:A 文章编号:2095-5707(2020)02-0018-04
DOI: 10.3969/j.issn.2095-5707.2020.02.004
Abstract: Fragmentation retrieval refers to the retrieval of needed information of users into one or more words with independent meaning. The retrieval objects mainly include the needed information of users and collection resource characteristic information. Fragmentation retrieval can improve the quality of services of digital libraries, provide support for optimizing the collection resource structure, and improve the collection resource utilization. The principles of knowledge organization and disclosure of digital libraries based on fragmentation retrieval include being scientific, systematic, standardized, distinctive, shared, and secure. It is recommended to design the functional organization of knowledge organization and disclosure system from the three aspects of user terminal, background management terminal, and technical support, and then build corresponding modules.
Key words: fragmentation; digital libraries; knowledge organization; knowledge disclosure
随着互联网技术的不断发展,数字图书馆馆藏资源的种类发生了很大的变化,不仅包括传统的文本信息,还包括了图片、视频、音频等资源,同时馆藏资源知识组织方式也发生了较大变化。同时,数字图书馆馆藏资源不仅涵盖了自身资源的数字化版本,还包括互联网上的电子信息资源。因此,馆藏资源组织成为数字图书馆发展的重要环节[1-2]。
传统的信息检索方式通常为用户输入所要检索内容的关键词,通过关键词与数据库中资源信息匹配来实现检索功能。当前,随着碎片化信息检索方式的逐步推广,在数字图书馆使用过程中,用户使用自定义主题的词组或者短语来开展馆藏资源信息检索,这类检索需求逐渐增多[3]。传统的检索方式已不能很好地适应用户的检索需求。为此本文讨论了基于碎片化检索的数字图书馆馆藏资源的知识组织与揭示,为提高数字图书馆服务水平提供参考。
1 碎片化检索
1.1 碎片化检索的定义
碎片化检索是指将用户的需求信息拆分成具有独立含义的一个或多个词语的检索。通常来讲,用户通过自然语言来描述所要检索的信息内容,这一内容通常是由不同的字或者词语按照特定组合构成的,其中可能包括标点符号或者数字等[4]。数字图书馆馆藏资源在存储过程中,需要提取资源信息的特征,这些特征信息通常是由简短的词语按照特定组合构成。由此可见,用户检索信息的特征和数字图书馆馆藏资源的特征信息存在共同之处,因此,我们可以利用这一特点实现用户碎片化需求信息与馆藏资源信息特征比对,并将匹配结果信息作为用户检索结果进行展示。
1.2 碎片化检索的对象选择
碎片化检索是一种通过将用户需求信息合理拆分,并与馆藏资源特征信息匹配来完成检索的方式。即检索对象的选择主要包括两方面内容,即用户需求信息和馆藏资源特征信息。一是用户需求信息。在传统检索方式中,用户通常是将一个词语作为关键词开展信息检索,通过将此关键词与馆藏资源信息进行匹配比对来实现检索;通过碎片化检索方式开展检索时,用户需求信息通常是以短语的形式出现,需要将此短语信息进行合理拆分,拆分成由一个或者多个词语组成的检索信息,然后与馆藏资源特征信息进行比对,完成检索。二是馆藏资源特征信息。数字图书馆馆藏资源包括图书、期刊、文献、报纸等,在馆藏资源采集过程中,会将整个资源及其关键信息进行存储,通常包括资源题目、内容摘要、关键词及资源特征信息等[5-6]。基于碎片化的检索方式要求数字图书馆对馆藏资源进行特征提取,用以满足检索需要,数字图书馆馆藏资源特征提取及描述过程通常被称为知识的碎片化处理。
2 碎片化检索在数字图书馆中的应用
2.1 碎片化检索内容程度把握
基于碎片化的检索方式可以很好地满足用户多样化的检索需求,提高了数字图书馆服务质量。然而,这种检索方式需要对用户需求信息和数字图书馆馆藏资源信息进行信息拆分,这是数字图书馆开展碎片化检索的最大难点。用户需求信息通常是由一组短语组成,其中包含了几个关键词语,因此只需要将关键词语提取出来即可。然而,数字图书馆馆藏资源数量却是巨大的,其中包含了大量的知识信息,这极大地增加了知识信息拆分的难度和工作量,同时拆分结果是否能够满足用户需求,是否满足检索精准度要求也成为一个重要问题。资源信息通常是用自然语言进行描述的,由于当前人工智能技术不能對自然语言完全理解,因此在资源信息拆分时应当采用充分匹配的方法,也就是说,对于每个语句,首先提取语句中的关键词,这类关键词以名词居多。同时,了解关键词间的语义关系,然后将此类信息作为资源的特征信息进行存储,通过这种方式,可以保证资源信息拆分过程中不会出现信息失真,在降低数字图书馆工作量的同时,提高了碎片化检索的精确性。
2.2 碎片化检索与馆藏资源采集的关系
碎片化检索是数字图书馆信息检索方式的一个创新,它将极大地提高数字图书馆馆藏资源利用率和用户服务水平,同时为改进数字图书馆馆藏资源采集提出了新的要求。碎片化检索是一种基于知识碎片化的检索方式,它在对用户需求信息拆分的同时,需要数字图书馆馆藏资源实现知识碎片化处理,这就要求在数字图书馆开展馆藏资源采集时,要对所采集的资源信息开展全方位的知识碎片化处理和知识描述,也就是说,在馆藏资源采集环节中增加资源信息特征提取和描述环节,为数字图书馆碎片化检索提供数据支撑,碎片化检索与馆藏资源采集的关系如图1所示。
2.3 碎片化檢索对数字图书馆的作用
2.3.1 提高了数字图书馆用户服务质量 对于数字图书馆而言,基于碎片化的检索方式是一种全新的检索方式,它不需要用户在检索时考虑关键词的设定及组合,只需要用户根据自身需求将所要检索的内容输入至检索框即可,为用户节约了检索时间,提高了用户使用数字图书馆的满意度。同时,数字图书馆为了更好地利用碎片化检索方式,将会不断提高馆藏资源知识的碎片化处理进程,同时不断完善自身技术水平,进而提高用户服务质量。
2.3.2 为优化数字图书馆馆藏资源结构提供支持 数字图书馆馆藏知识的碎片化使馆藏资源知识得到充分描述,也就是说,所有馆藏资源在原有资源描述的基础上,通过知识碎片化,会增加更多的资源描述,以满足碎片化检索方式的需要。在碎片化词语的匹配过程中,知识的深层次描述,可以提高知识的匹配度,进而提高馆藏资源知识的利用效率。基于碎片化的检索过程,是一次用户需求与馆藏知识的匹配过程,通过这种检索方式可以真实了解馆藏知识的实际利用情况,使数字图书馆管理人员了解哪类资源受到广大用户喜爱,哪类资源当前处于闲置状态,为以后馆藏资源更新提供数据支撑。
2.3.3 提高了数字图书馆馆藏资源利用效率 随着信息化技术的不断发展,数字图书馆馆藏资源大量增加,部分馆藏资源出现长期闲置状态,如何使这些资源得到有效利用成为数字图书馆发展的重要问题。基于碎片化的检索方式促使数字图书馆对其所有馆藏资源进行特征信息提取,使得所有闲置、非闲置资源描述更加全面,在提高用户检索精准度的同时,使闲置馆藏资源被挖掘并得到使用,大大提高了数字图书馆馆藏资源利用率。
3 基于碎片化检索的数字图书馆知识组织与揭示原则
对于数字图书馆而言,基于碎片化的检索是一种全新的信息检索方式,它将对馆藏资源的知识组织带来重大影响。通过碎片化检索,不仅可以提高数字图书馆用户服务水平,同时可以提高其馆藏资源使用效率和资源管理水平,因此在基于碎片化检索的数字图书馆知识组织与揭示构建过程中,应当坚持以下原则。
3.1 科学性、系统性原则
知识组织与揭示是对碎片化知识的有序化和知识间关联的网络化处理,因此,要做到科学、合理地对知识开展碎片化处理,要科学分析碎片化知识之间的关系,合理分类设计碎片化知识间的层次结构,使知识在存储和表达过程中不会出现失真、缺失等情况。同时,在构建基于碎片化检索的数字图书馆知识组织体系过程中,应当充分考虑数字图书馆馆藏资源结构、组织体系,保证经过碎片化处理后知识间的逻辑层次不受影响。
3.2 标准化、特色化原则
数字图书馆馆藏资源信息数量庞大,因此在开展知识碎片化处理和知识组织时,应当按照统一标准进行,这样不仅方便资源信息的统一存储,而且方便系统调用时知识的统一表达。知识组织的标准化可以有效提高知识调用的效率,有利于数字图书馆馆藏资源的统一管理。在知识组织标准化工作开展的同时,应当注重数字图书馆馆藏资源的特色化发展。随着数字图书馆用户个性化需求的逐渐提高,特色资源受到广大用户的喜爱,数字图书馆特色化不仅提高了知名度,而且满足了用户多样化、个性化的服务需求。
3.3 共享性、安全性原则
数字图书馆的馆藏资源数量是影响其发展的重要因素,数字图书馆通常会定期购买专业数据库资源,会通过网络搜集有价值的网络资源等。随着共享经济的发展,数字图书馆馆藏资源共享成为其发展的一个重要方向,数字图书馆间通过馆藏资源的共享,使得自身资源呈现倍数增长,极大地满足了不同用户的多样化需求,为数字图书馆的快速发展奠定基础。在不断丰富数字图书馆馆藏资源的同时,应当重点关注数据的安全性。对于数字图书馆而言,大量有价值的馆藏资源以数据形式存在,数据安全问题对数字图书馆的运行及发展至关重要,应当受到广泛关注。
4 基于碎片化检索的数字图书馆知识组织与揭示模式
基于碎片化检索的数字图书馆知识组织与揭示是一种新的知识组织方式,利用碎片化知识实现精准检索的目的,在提高数字图书馆馆藏闲置资源利用率的同时,提高了用户服务水平和能力。
4.1 基于碎片化检索的数字图书馆知识组织与揭示系统设计
基于碎片化检索的数字图书馆馆藏知识组织与揭示的系统设计,主要分为3个部分,即用户端、后台管理端和技术支持。用户端主要包括用户个人信息管理模块、用户需求信息拆分模块、用户资源检索模块、用户资源共享模块等;后台管理端主要包括用户信息管理模块、馆藏资源描述存储模块、馆藏资源信息存储模块、资源检索信息匹配模块等;技术支持主要包括用户需求信息拆分技术、馆藏资源存取技术、检索数据运算技术、系统后台维护技术等。
4.2 基于碎片化检索的数字图书馆知识组织与揭示功能设计
该系统的主要目的是实现馆藏资源用户碎片化检索,主要分为3个部分:用户端、后台管理端和技术支持。
4.2.1 用户端 用户端主要功能是用于获取用户的需求信息,向用户显示检索结果,同时可以实现信息浏览、收藏、共享等操作,支持用户多样化高级检索。用户端是系统与用户的信息交互端,实现了信息在用户与数字图书馆之间的传递,同时也是用户评判数字图书馆服务质量的重要部分。用户端的功能好坏将直接影响用户对数字图书馆的使用效果,决定用户对数字图书馆使用的满意度。
4.2.2 后台管理端 后台管理端主要功能是为用户端提供所有资源、技术、信息交互等支持。一是资源信息管理。通常,馆藏资源按学科分类、数据类型、使用频次等来进行存储;二是资源描述信息管理。在馆藏资源存储中,首先需要对资源信息开展特征提取和资源描述,方便资源调用。资源描述信息与资源信息是一一对应的,通常利用元数据管理技术实现管理。三是用户信息管理。后台可以实现用户信息的删除、修改、增加及权限设定等功能。
4.2.3 技术支持 基于碎片化检索的数字图书馆知识组织与揭示系统的运行,需要由多个技术的共同支持,其中包括云计算技术、大数据技术、数据挖掘技术、元数据管理技术等,通过这些技术的综合运用,实现用户端的用户操作和后台管理端的系统操作。
5 小结
随着互联网技术的不断发展,数字图书馆馆藏资源种类逐渐增多,知识组织成为数字图书馆的重要工作。信息检索方式的更新,尤其是碎片化信息检索方式的发展,对数字图书馆检索系统升级提出了要求。本文以数字图书馆知识组织与揭示为研究对象,从功能设计和系统设计2个方面分析了碎片化检索对其的影响,表明碎片化检索可以极大提高数字图书馆馆藏资源知识管理水平,进而提升用户服务水平。
参考文献
[1] 冯园园.基于认知地图的数字图书馆知识组织研究[J].河北科技图苑,2018,31(2):38-41.
[2] 王任栋,宋涛.基于本体的数字图书馆知识组织研究[J].长春师范大学学报(自然科学版),2014,33(12):180-182.
[3] 盛小平,周媛.数字图书馆知识组织策略[J].大学图书馆学报, 2002(2):14-18,21.
[4] 金安.“碎片化”在網站图书检索中的应用——科学出版社网站建设经验谈之二[J].出版参考,2014(27):23-24.
[5] 刘颖.基于语义关联的数字图书馆知识检索系统研究[J].图书馆学刊,2018,40(6):107-110.
[6] 黄容,何杨煜琪,王忠义,等.数字图书馆数值知识元检索系统设计[J].图书情报工作,2018,62(14):125-132.
(收稿日期:2019-09-25)
(修回日期:2019-10-16;编辑:魏民)