俞萌萌
(齐河县图书馆,山东 德州 251100)
1998年Google搜索引擎面世,引起社会各领域的广泛关注,较快检索速度和高效检索效果备受大众欢迎,此类优势同样吸引着图书馆广大用户的注目。以Roy Tennan为首的团队提出了整合检索的方式,随后Google Scholar被研发问世,在此过程中网络资源发现服务体系得到快速的发展。但紧随信息爆炸时代的来临,人们获取信息的方式更加便捷,所以只有少部分人通过图书馆网页进行信息检索,因此图书馆用户的流失是目前较为严重的一个问题。
近年来,知识组织力量快速发展,对于该理论的研究也获得了巨大的进步,更多的学者试图将这种理论与其他领域进行融合。杜君[1]基于知识组织理论,针对大数据背景下高校图书馆馆藏资源知识发现服务内容进行设计,在内容上细化为服务的数据资源层、知识发现处理层级界面展示层几个方面。张凤霞[2]基于知识组织理论,提出当今社会已转型为知识发现社会,人们的知识获取方式开始多元化。图书馆在此背景下也纷纷向着数字图书馆方向转型,为读者提供高效便捷的知识获取服务,直接为知识社会的发展提供了重要的新思路。
知识组织理论下,各领域的相关概念歧义会得到良好的避免,概念间的相互关系变得更加明确,能够实现网络资源的交流、重用以及共享,以达到网络资源的互通性。另外,其能够支持不同系统的相互访问,对构成社会网络资源供应链有着巨大的帮助。知识组织理论中的网络资源仓库能储存网络资源的条目,其中对网络资源的一些相关使用记录都会有所储存,增加网络资源之间的关联性。在知识组织理论下,利用现代先进技术与方法,构建信息化环境下复合型网络资源管理体系,为用户提供一站式网络资源发现服务,对图书馆的可持续发展而言意义深远。
网络资源发现服务体系在图书馆管理运用的时间并不长,国外于2007年才对该系统进行研究,并研发出相应的产品,例如OCLC的World catlocal,Series Solution,以及Summon,Exlibris企业共同推出的Primo Central,EBSCO Discovery Services等,随后网络资源发现服务系统的运用更加广泛。相比于国外,我国图书馆对于网络资源发现服务体系的运用起步较晚。但近几年,网络资源发现服务体系在高校图书馆中颇受欢迎,该系统被各大重点高校图书馆实践运用,例如清华的“土木搜索”、北大的“未名搜索”、上海交大的“思源搜索”、厦大的“学术搜索”。就目前调查情况显示,全球大约有超过1 400家的图书馆及信息管理机构建立了网络资源发现服务体系(见图1)。
我国图书馆所使用的网络资源发现服务系统,大部分都是由外国的数据库生产厂家或图书馆集成系统所开发研制的,国内由于各方面因素的限制,自主开发的图书馆网络资源服务体系存在较多的缺陷,这对图书馆的发展带来一定的制约作用[3]。
网络资源发现一直都是网络资源发现领域的重点研究对象,但由于其在构建上需要具备海量资料以及各个网络资源领域的网络资源库,并且要有一定的学科背景作为支持,当然技术的运用同样至关重要,所以用户很难对其进行得心应手的运用。对于图书馆的网络资源发现系统来说,其各个系统之间的关联性较弱,且所依赖的网络资源都较为局限,导致网络资源的关联与发现都只是在所允许的范围内。另外,由于接口与标准化差异、需求场景的不同都对该系统的进一步发展造成一定的阻碍。
图1 图书馆网络资源发现服务体系
大数据时代,网络资源呈爆炸式增长,大众对知识的了解和渴求欲望也逐渐加大,在行动上主要是借助网络资源检索的形式来实现。但在现存的图书馆网络资源发现服务模式中,用户基本上是使用检索目录、关键词等来进行网络资源的检索,这种方式最大的不足之处在于不能进行语义的检索。检索的结果也往往忽略关键词的语义,检索方式过于浅显,无法提供更深层次的检索结果。另外,由于汉语自身语言结构特点,中文单词没有形式上的分界符,导致中文分词要复杂得多,检索时会产生歧义分词,从而影响检索结果[4]。图书馆没能从语义方面,或关键词的某些具有关联性的网络资源进行检索,导致检索没能达到用户的理想效果,使得用户不得不进行反复检索,却依旧达不到理想的检索效果。同一个关键词可能在不同领域有着不一样的解释,且用户的思想和理解行为的不同,都可能导致相同词汇的含义并不相同。在用户进行检索时,系统完全忽略对其隐喻性的检索,没能进行更深层次的语义理解,导致用户进行无效的检索,从而被迫进行反复多次的关键词挑选工作,极大地降低检索效率和用户体验。
用户在查询同一网络资源主题时,需要到各个不同数据库进行查询,而对于查询的结果是否完整以及是否进行重复查询很难进行准确把握。图书馆虽然利用各种方式宣传、普及,但用户面对海量的信息仍然无从下手,不能满足用户的实际需求。
网络资源系统的开发本身就是一项要耗费大量人力物力的工作,而该过程又较为复杂,所以在图书馆网络资源库的开发中,网络资源共享功能往往被忽略,开发者只对某些特定的网络资源领域进行开发,缺乏一定的普遍和关联性,致使网络资源并不能得到很好的共享利用。即便是在同一个网络资源数据库中构建新的网络资源体系,也很难对以往建好的数据库进行有效利用。因为不同用户的思想和行为并不一样,所以其对于相同网络资源的理解也会存在较大的偏差,导致网络资源的共享很难实现。单个图书馆的网络资源是有限的,馆与馆之间的关联性还不够强,没有实现无缝连接,用户在使用时对网络资源的查找过程过于烦琐。
另外,图书馆为了丰富馆藏网络资源,为用户提供更全面的网络资源服务,购买了大量的网络资源,但是并不能准确地对这些网络资源的总体情况有一个良好的掌握,各数据之间的关系模糊不清,分布情况也较为混乱,使得网络资源服务体系并不能为用户提供最佳的服务体验。如何将图书馆自身构建的数据库与其所购买的网络资源进行有效整合,加大数据的关联,实现数据的全面性是图书馆当前亟待解决的问题。
虽然图书馆经过长年累月的积累,已经储备了大量的纸质网络资源及电子网络资源,但由于各方面的原因,国内外很多的高质量网络资源并不能直接拥有。另外,图书馆的用户较为分散,所以在网络资源开发方面需要加大力度,以此来保证满足用户需求。网络资源发现一直都是网络资源发现领域的重点研究对象,但由于各方面的因素影响,图书馆网络资源发现服务被制约。用户的分散会扩大网络资源的需求范围,各个学科领域的网络资源都要有所涉及,有限的网络资源无法满足用户无限的需求,不能够为不同的用户提供特定的网络资源服务,更不用提为用户提供检索习惯的定制服务。
因此,通过知识组织理论,利用现代大数据技术、网络技术等先进技术,构建一体化图书馆的复合型网络资源管理系统,为用户提供更加规范化、人性化及高效化的图书馆一站式网络资源发现服务体系,具有重要的意义和作用。
元数据是用来定义数据的数据,其主要指能够说明所提出网络资源的特征、内容和结构的数据,是用来管理和组织的网络资源。但图书馆元数据多而杂,对于元数据的管理并不规范,严重影响检索的效果。图书馆过于强调对元数据数量的获取,却忽略了其来源,导致检索结果中有许多相关度较低的信息对高质量信息有所影响,从而影响了用户信息检索的准确度。元数据的规范度低还包括了其字段格式的不统一,元数据的来源多种多样,会导致结果的重复,对数据的分析、整合及挖掘都会产生一定的影响。
解决不同用户对同一网络资源的不同理解行为,最好的办法就是将网络资源子集划分到尽可能小的范围,然后依照用户的需求按特定的顺序将这些细分的网络资源子集进行组合,以形成较大片段的网络资源,将网络资源以主题的形式呈现给不同的读者,如此进行是因为组合形式要比划分方式更为简单方便。
但这种做法的进行前提是,图书馆中的网络资源子集必定要兼备重装的特征。从某种视角来看,网络资源子集是将客观世界中的对象和属性描述为认知领域,或是对客观规律的记录与反思。鉴于形式化本体是客体对象概念之间的关系,所以每个网络资源子集中都包含形式化主体,并且网络资源子集也需要其来进行完整的表达。从大的层面上来讲,网络资源子集是网络资源空间大片范围中的某个区域,所以只要对网络资源子集中的某个点进行定位,就能够大致对网络资源范围进行描述,而这种方式在用户进行网络资源检索中十分重要。
利用网络资源子集的概念构建强大的数据分析系统,让用户体验到网络资源的精准性检索。系统的建立则需要大量的数据来进行支持,在构建时要充分考虑其元数据的覆盖率。根据不同用户所输入的关键词,在网络资源子集内进行关联性搜索,提高用户的检索效率,满足用户的需求[5]。
利用信息时代的各种技术,以馆际互借为基础,实现文献传递,这种服务有着高速快捷的特点,是一种源于馆际互借却又高于馆际互借的服务。另外文献传递能够缓解图书馆网络资源、经费不足的现象,解决人们日益增长的网络资源需求与网络资源不足之间的矛盾。
单个图书馆的网络资源必然有限,但多个图书馆甚至全国的图书馆进行无缝连接,其意义便相当重大,加强馆与馆之间的关联性,便能提高用户对所需网络资源发现的可能性。图书馆的网络资源整合都需要通过元数据的使用,对系统搭建相应的平台,利用网络资源组织中的网络资源门户工具,构建多种多样的网络资源服务平台,从被动的服务状态向主动服务进行转变,构建网络资源门户也是提高用户对网络资源发现服务质量的重要手段。将图书馆中的网络资源进行元数据统一化规范,以便与全国的图书馆检索书录进行无缝连接匹配。该系统能够匹配全国的图书馆馆藏情况,当用户在进行网络资源查询时,发现对网络资源权限无法进行获取时,可以直接通过传递文献申请,或者通过平台发送申请到全国的图书馆进行查询。
网络资源调度系统的构建是在“开放链接”技术标准下进行的,其主要用来描述及管理网络资源之间的关系,能够有效地避免图书馆网络资源服务中出现的复本服务问题,或者其他相关信息问题,从而达到不同的网络资源以及不同的服务方式能够相互兼容的目的,能够在相关的网页上开放动态链接。图书馆网络资源调度系统的构建,能够有效地将不同的网络资源进行关联整合,服务方式同样进行互通,最大程度地做到方便用户,轻松有效地获取更多的网络资源信息,满足用户对网络资源的需求[6]。
图书馆网络资源调度系统的构建,需要对用户、网络资源以及服务这3个方面的关系进行详细解读,同时对系统的服务环境进行有力地描述。首先,对图书馆的基本信息进行描述,比如其IP地址的基本范围,网络资源传递服务接口、查询网络资源系统的反应时间以及网络资源产权保护的基本策略等。其次,对图书馆的网络资源信息进行详细描述,比如网络资源库的基本信息、管理使用信息等。最后,对图书馆与网络资源的关联信息进行描述,并且利用用户的IP地址信息与网络资源信息形成连接关系。当用户在对网络资源进行检索查询时,网络资源调度系统能够按照用户的IP来对其所使用的网络资源机构进行确定,进一步对用户所查询的网络资源进行追踪,发现其访问的数据网络资源,从而构建相应的情感开放服务链接,引导用户向合适的服务商进行定位,将网络资源的各种相关信息或者电子网络资源进行链入,并且接入到其他的网络资源接口或者馆与馆之间的互借系统等。
各大图书馆之间存在着一定的联盟,出版界也同样存在类似的联盟体系。将图书馆的网络资源与出版社即时的元数据网络资源进行有效整合,在原有的网络资源体系基础上,构建集所有网络资源为一体的网络资源集成平台。对原始的书录检索方式进行创新,构建含有海量网络资源书录及用户敏感环境的网络资源调度库,提高图书馆网络资源服务的效率,从网络资源的查询、检索及获取等方面,形成一站式服务,促进图书馆网络资源的整合与共享。
将图书馆中的数据网络资源收集分割、转换,然后全部传送到网络资源库。对于数据的收集分割,可使用基于OAI-PMH协议的收集分割技术,这种方式能够将开放的元数据网络资源集成到网络资源库,随后可将集成的开放元数据构建一个网络资源存储库,并进行有效管理。但是,使用OAI技术有一定的先决条件,图书馆必须拥有为用户开放的Data-Provider端口,在此条件下,才能进行数据的分割收集。而对于不能够使用OAI技术的网络资源库,可另辟蹊径,通过网页分析的spider工具对开放的元数据进行收集分割,集成到网络资源仓库。
对于元数据检测系统的构建,需要对中文及外文的主流元数据网络资源进行整合,构建覆盖范围广、网络资源来源权威、网络资源即时性强的巨大元数据存储库。通过对网络资源的五要素进行更加深入的抽取和指引,形成元数据储备仓库,提高用户对网络资源的检索效率,能够快速地对所需网络资源进行查询。检索系统的功能必须包含对全文的检索、网络资源五要素的限定检索、网络资源的扩展检索、再次检索以及网络资源的检索聚类这5个检索方面。并且能够对网络资源进行浏览、查看其详细的信息甚至所关联的信息,完成网络资源的下载和获取。此外,利用sfx技术,构建虚拟远程检索功能,对其他站点或者附近的网络资源进行搜索,扩大检索范围。
综上所述,图书馆网络服务资源发现体系在实际应用的过程中引入知识组织理论,将对用户的信息行为产生较大的影响,尤其是在5G信息化服务日趋成熟的当下,图书馆网络服务资源发现体系正在成为数字图书馆的重要且不可或缺的组成部分。在加大优化整合数据资源的力度、及时更新信息技术等方面进行更为优化的调整,可以为推进数字图书馆事业夯实基础。