基于LISA的多维度检索分析与推广

2014-08-08 03:37胡大敏张月华王延广
现代情报 2014年5期
关键词:图书情报版本趋势

胡大敏+张月华+王延广

作者简介:胡大敏(1966-),女,研究馆员,研究方向:图书情报,发表论文数篇。•业务研究•

〔摘要〕本文作者力求在现阶段的信息科学业内推介LISA Database。在细致介绍了LISA 3种不同版本的检索特点后,着重分析与探究了“网络LISA”数据库的检索流程与结果揭示,最后对以LISA为代表的外文Database之优势做了简要概括,并指出其未来信息资源整合前景。

〔关键词〕图书情报;LISA Database;版本;检索界面;检索结果;趋势

DOI:10.3969/j.issn.1008-0821.2014.05.030

〔中图分类号〕G25076〔文献标识码〕B〔文章编号〕1008-0821(2014)05-0142-04

Analysis and Generalization of Retrieval Based on Multi Dimension LISAHu Damin1Zhang Yuehua2Wang Yanguang3

(1.Library,Changchun Normal University,Changchun 130032,China;

2.Tonghua Library,Tonghua 130000,China;

3.Library,Beihua University,Jilin 132013,China)

〔Abstract〕The author of this article at the present stage of the information industry to promote the LISA Database.In detail introduced LISA three versions of the retrieval characteristics,analyzed and explored the“retrieval process and result of network LISA database revealed”,at the end of the LISA as the representative of the foreign Database advantage to do a brief summary,and pointed out that the future library resources integration before The king.

〔Keywords〕library and information;LISA database;version;search;search results;trend

LISA英文全称为《Library and Information Science Abstracts》,即《图书馆学和情报科学文摘》,原是英国图书馆学会下的一份专业性质的刊物,是图书馆学信息学领域的权威期刊。自1969年创刊起,一直以印刷版形式(即书本式)发行,90年代出现了光盘版及网络版。LISA Database收录范围非常广泛,其主题覆盖多个相关学科,涉及的领域有图书馆学,咨询科学及新兴的科学技术。它既有电子期刊全文数据库,又含有期刊论文文摘数据库,它的一大亮点即是不仅设置了关键词查询,而且,还特别给出了若干叙词,在外文数据库使用上提升了读者利用率与用户满意度,堪称是一个值得推广和应用广泛的权威数据库[1],是国内图书情报界学者了解国外学术研究热点及动向的重要窗口。对LISA进行评析,不仅有助于用户方便、快捷地利用该数据库,还可以从侧面了解国外数据库产品的特点及发展趋势,为国内数据库的建设提供经验与启示。

13种不同载体的“LISA Database”

11书本式LISA简介

111内容范围

LISA 1969年创刊,是英国图书馆学会创办的一本彩色封面的连续出版物。从1979-1983年是双月刊的形式,直至1984年以后改为月刊的频率出版。摘录440多种各国期刊发表的有关图书馆工作与信息科学方面的文献,每期文摘量为900~1 000余种。内容覆盖:图书馆学、图书馆技术、图书馆利用与用户、图书馆与档案、图书营销与出版、各类书评、信息科学、信息管理、信息中心、信息挖掘、信息存储、信息技术、因特网技术、知识管理、人工智能、计算机应用、万维网、远程通信、技术服务、记录管理、医学信息、联机信息检索等20多个主题。

112检索规则及流程

书本式LISA检索规则执行以下一个流程:索引——文摘——出处——获取原文索引。

检索途径有3条:

Author Index作者索引

Alphabetical Subject Index主题(按字母顺序)索引

Source(Journal)Index出处(来源)索引

期刊的目次页上面有Broad Subject Headings分类(基本大类,标题)。除此之外,每年出版的第12期为年度总索引、总目次。

113检索示例:查询“虚拟参考咨询服务网站情况”(在2003年第一期)

“虚拟参考咨询服务网站”的英文主要有两种表达方式:VRD和Virtual Reference Desk。在主题索引中,按字母顺序查找Virtual Reference Desk,找到主题后就浏览下边的流水号(281)之后便可在期刊中找到“281”字段,于是找到所检文章的出处。笔者认为,无论如何,印刷版LISA对于广大读者而言,它更适用于计算机应用很不发达的国家,但是,业内共识——在查全率上它逊色于光盘版和网络版LISA[2]。

12光盘LISA的简单检索流程

121综合检索界面

在综合检索窗口中,你只要在检索框中输入检索词,然后点击“Search”,系统将自动在T1(标题)、AU(作者)、QL(限定)、RW(研究人员)、PD(方案持续时间)等13个检索字段来进行检索。

122浏览检索界面

在综合检索窗口中点击“INDEX”,屏幕上显示浏览界面。在此界面中,记录被划分为20余个区域。高亮度的(被选中的)区域为检索的设限范围。CT(责任者)、CW(城市研究工作)、FS(基金资源)、PD(项目)、QL(资格)、RF(参考)、RW(研究人员)7项仅在CRLIS数据库中有效。

13网络版LISA的检索原理

网络版LISA是属于剑桥科学文摘数据库(CSA)下的1个子数据库。近年来添加了图书馆学和信息学的LISA(2001年10月加入)数据库,属于社会科学与行为科学大类之下,LISA的数据库信息来自于68个国家的440余种期刊,20多种不同语言。收录年代自1969年至今。平均每2个星期更新1次,并以每次新增500条记录的速度递增。

检索示例:查询“虚拟参考咨询服务网站情况”(2002年以前)

“虚拟参考咨询服务网站”的英文有两种表达方式:VRD和Virtual Reference Desk在检索框中输入VRD or Virtual Reference Desk,做逻辑“与”运算,查询结果为30篇。限制是China或Chinese,检索结果为0。

14网络版LISA与光盘版LISA的区别

141更新时速上的区别

endprint

由于CRLIS没收录某些的图情内容,因此,光盘版承载的内容就有局限;况且,光盘版更新速度为季度更新,而网络版更新为两个星期一更新,一目了然,网络版的内容翻新更快捷[2]。

142检索数量上的区别

正好相反,由于光盘版LISA还收录了CRLIS内的相关内容,而网络版只收录LISA单个库的内容,比较起来,当然是光盘版数据量更完备,查全率在提升。

143检索功能上的比较

光盘版更简便、易行。美国银盘公司出版的光盘数据库,专门设置了浏览检索界面。目的是为某些非检索专业以及不好确立核心检索词的读者能更准确、高效地利用LISA Database在此意义上而言,光盘版要比网络版大众化啦。光盘版的LISA,能够凭借“检索研究工作主题”、“科研基金的项目来源”等附载图书馆学和情报学的数据库,来查询机构特定的攻关课题,但网络版暂时还没有这项服务。

2网络版LISA的检索途径与检索入口及检索界面

21执行布尔逻辑运算检索

NOT、AND、OR 3个运算符,在使用时可以不划分大写与小写,实际操作时的排优顺序为:NOT为首,AND次之,OR为最后,涉及其他运算符也同样不分大小写。

22词组检索

空格,用空格连接的多个单词被当作词组检索,如以particularity retrieval检索,检索出的记录包含这两个单词,两个单词紧密相连,且前后顺序不能交换。

23截词检索

“*”,在词干一加“*”,表示无限制的截词,如输入invent*可以代替invent、inventor、invention等检索词,如果*出现在词汇中,表示代替不确定的字符串。如用nat*on来查寻,可以检索到nation,national等英文词汇;“?”,可用“?”来代替任一个字符,可以使用多个“?”代替多个字符,输入“?”可在词中或词尾出现,如在检索框中输入“ch?n”,能够检索出china和Chinese等。

24改变优先顺序符“()”

用“()”确保逻辑运算的优先顺序,因此,整个系统运算符的优先次序为“()”、NEAR、NOT、AND、OR,当层级等同时按从左到右的顺序进行推进[3]。

25基于字段的检索入口

LISA的可检字段包括任何位置(Anywhere)、题名(Title)、关键词(Keywords)、作者(Author)、叙词(Descriptors)、期刊来源(Source)、文摘(Abstract)、语种(Language)、出版类型(Publication Type)、出版年(Publication Year)、ISSN号、架位记(shelf mark)、更新日期(Update)、以及入藏号(Accession Number)等14个。

26LISA的3大检索界面

LISA目前已开发出了快速检索(Quick Search)、高级检索(Advanced Search)、检索工具(Search Tools)三大检索界面,截至目前还有法语、英语、日语、简体中文7种语言的网络版本,系统默认的检索界面为与网络谷歌相仿的“快速检索”Quick Search,但三大界面比较起来,高级检索更为简洁明了(如图1)。图1LISA高级检索界面范式图

3网络LISA的检索结果揭示

LISA当前研发了4种检索结果的呈现形式,它们分别是:“full format”、“short format”、“Custom format”以及“full format no reference”。正因为LISA数据库是文摘型database,“Full format no reference”与“Full format”两者大体上不含有异样;值得着重一提的是“Custom format”,它堪称LISA新研发的一个个性化项目,提供给读者个性化的选择;“short format”则更具简单、灵活的特点,它提供的结果包含页码、摘要、日期、题名、叙词、作者、出版地等标志性信息。那么,概括起来,4种检索结查不约而同都在揭示页最上方呈现所选定的“database”、“Literature-style”、“type of retrieve”、“number of search results”、Such as:“Scholars”、“Journals”、“Peer-reviewed”期刊等[3],读者点击检索页面右下角的“View Record”,就能便捷地浏览全部字段的内容;与此同时,只要点击“Full-Text Linking”按钮,便能与机构图书馆的电子刊全文库链接起来;点击“Links to Holdings”,就能连接到机构馆馆藏被LISA整合进来的所有研究成果;还有一个雕虫小技:读者大可以通过“sort by”来更新日期以及重新排序;再有就是LISA为读者提供了Alert的定题通告,每个Alert的时间为半年,而且,LISA还规定每封电子邮件最多可发送250篇更新记录。

4对以LIAS为代表的外文数据库特色的认知与展望41注重精细化服务,从细微处体现“个性化”

在数字产品竞争激烈的形势下,研发细节对市场有着极大影响,甚至可以说细节决定命运。因此,外文数据库以及国外学者都相当注重节点的处理。点滴之处既能体现数据库对读者的Quick Search快捷方式,并能显示出Advanced Search中基本检索模式的构建,the retrieval results中文献类型的揭示等都证明了这一点。例如:学者Saarikoski指出,在聚类分析中应用自组织映射神经网络,(SOM)分析文本式的检索结果,可提高聚类分析的灵活性和精确性[4];再有,Galvez利用C-Value方法和TF-IDF算法达成了自动抽取术语,文献检索的查准率在显著提升[5]。

42以读者为中心、以用户为本

读者的评价、以及利用数据库的便利程度是数据库代理商在市场整合中永远不可忽视的内容。从这个角度上来说,读者就是数据库的生命线[6]。因此,LISA等Foreign Database尤其关注读者的需求指数,它们凭借清晰友好的检索界面、多元的检索入口、合理的检索结果显示及个性化服务即可略见一斑。其他Database也在便利读者利用这一方面下了诸多功夫,如Web of Science70版在原有的基础上增加了团体作者检索、“快速检索”、化学库和化学结构检索等功能,微调结果揭示位置、增添后期结果的解析功能等;Gale系统提供的InfoMark功能键,就允许读者将检索到确定结果的网址链接到个人的文件夹中,当与系统再次联机时,可随即更新5次的检索结果。

43开展合作,逐步实现各数据库系统的资源整合

海量的信息的资源所带来的副作用就是读者不仅要掌握多种系统的利用方法,而且要日复一日登录不同数据库,重复输入检索字段和检索表达式,如此,造成读者在时间 和精力上的巨大浪费,因此,资源整合是大势所趋[7]。时下,国外图书情报领域热切关注的主题为5大方面,其中这5大分支分别为:数字图书馆、馆际互借与文献传递、个性化信息服务、信息检索技术、图书馆电子资源建设与整合:曾有学者一度对2005-2010年间LISA Database中与高频词密切相关的文献为来源,统计以关键词替代文章主题随时间演变而显示的数据,其结果如图2[8]。

endprint

图2横坐标为6个年度的时间轴,纵坐标表明关键词的关注度。图中曲线说明,2005-2010这一时期,海外数图研究的关注度下滑后逐渐平稳;馆际互借与文献传递、图书馆电子资源建设 关注度变化很小;信息检索技术关注度出现了明显的下降;而个性化信息服务的关注度却略微有所攀升。基于此,笔者认为,国外数字图书馆的研究不远的将来会有实质性的进展。复合图书馆的功能将为数字

图22005-2010年Foreign Database 5个研究热点的变化

图书馆所替代,并且,由于高科技的运用,尤其是“开放源码”的应用、“数据挖掘技术”的普及推广,个性化的图情信息服务必将会有更高端的突破,上升到一个崭新的台阶[8]。LISA、Web of Science的多种策略说明国外的数据库商已经关注这类问题,在各类型数据库之间、数据库与信息企业中心之间多渠道地合作、逐步实现各系统之间的无缝链接,成为国外大型信息企业服务趋于一致的选择。

5结语

综上所述,LISA Database是图情界的一枝奇葩,虽然再如何完美也有不尽人意的地方。诸如:它没有提供专门的“二次检索”功能,只是以“组合配置”来代替,与一些隐蔽型数据库检索效应相类似[9],因此,读者与用户使用起来不如Web of Science便捷,后者目前都添加了分析功能,真正发挥了画龙点睛的作用,并且,这将昭示文献检索业界未来的发展走向,诚如业内学者所言:“对信息检索结果的分析和利用才是文献检索的真正意义所在!”[6]

参考文献

[1]华薇娜.网络信息资源检索与利用[M].北京:国防工业出版社,2002:191.

[2]丘莹.LISA的检索及应用[A].上海:全国报刊索引论文集,2005.1:39-40.

[3]董文鸳.LISA Database的检索技巧与方法[J].现代情报,2006,(9):57-58.

[4]Jyre Saarikoski and Jorma Laurikkala.A study of the use of Safe—Organizing Maps in Information Retrieve[J].Journal of Documnetation,2009,(2):306-320.

[5]Carmen Galvez.Term Conflation Methods in Information Retrieve:Non-Linguistic Appoaches[J].Journal of Documentation,2005,(4):520-545.

[6]华薇娜.美国ISI引文索引数据库最新检索功能评析[J].情报理论与实践,2005, 28(3):334-336.

[7]王玉玲.LISA数据库评析[J].图书馆建设,2006,(4):76-77.

[8]郭璇.基于LISA的国外图书馆学研究现状分析[J].新世纪图书馆,2012,(6):8-10.

[9]胡大敏,等.载体媒体视阈下大学图书馆阅读推广研究[J].大学图书馆学报,2012,(3):97-99.

(本文责任编辑:马卓)

endprint

猜你喜欢
图书情报版本趋势
初秋唇妆趋势
古籍版本鉴定
SPINEXPO™2017春夏流行趋势
趋势