李志明
(九江学院,332005)
信息爆炸时代,优良的文献搜索系统可使文献信息有序化,方便用户快速、准确找到所需信息,无论是对信息服务提供者,还是用户,都至关重要。读秀学术搜索与文津搜索系统就是文献信息搜索系统中的佼佼者。两者有效地整合了丰富的文献类型,收录了海量的元数据,提供了多途径的文献获取方式,检索快速、准确、全面。为了用户更好地使用文献信息搜索系统,也为了开发者更好地完善文献信息搜索系统,本文对这两种文献信息搜索系统做了详细的比较研究。
读秀学术搜索系统(以下简称“读秀”)是由海量全文数据及元数据组成的超大型数据库。其以260万种中文图书、10亿页全文资料为基础,为用户提供深入内容的章节和全文检索,部分文献的原文试读,以及高效查找、获取各种文献类型学术资源的一站式检索,周到的参考咨询服务,是一个真正意义上的学术搜索引擎及文献服务平台[1]。
文津搜索系统(以下简称“文津”)是国家数字图书馆的资源搜索门户,也是数字资源服务利用的集中体现。该系统整合了国家图书馆和地方图书馆的众多数字资源,汇聚60多个资源库、近2亿条数据的海量文献信息。建立了分布式索引,提供了一个高效的、拥有良好用户体验且精准权威的元数据统一搜索平台,读者通过它对各类资源进行“一站式”检索,可快速地获取到所需内容,享受到便捷的应用服务。支持在线阅读和分享功能,用户可以根据个人权限,浏览更多的信息。通过登录认证,为读者提供多种个性化服务,包括查看检索历史、设定搜索习惯等,使检索更具个人特色[2]。
名称 读秀文津内容搜索类型、搜索框、热门关键词、图书被引用情况报告(2012)、把读秀设为主页、联系我们、网上客服、用户反馈、常见问题、使用帮助、使用感受、首页、服务中心、退出搜索类型、搜索框、高级检索、整合检索、搜索热词榜、国图首页、个人中心、登录、注册、意见反馈、帮助
首页面是否简洁、明了、友好,影响到搜索系统是否受读者青睐。读秀与文津首页都是简洁、明了的一站式检索系统,都有热门关键词。但读秀有十大热门关键词,而文津搜索热词榜不仅按日、周、总有不同的十大热门关键词,还有十大热点阅读、十大人气资源库、关键词云图。两者在友好性方面都有使用帮助等服务,但读秀有网上在线客服,可即时解决读者使用过程中的问题,还有视频讲解演示和PPT演示,形象生动,前者友好性更胜一筹。
名称 读秀文津文献类型及其分类知识、图书、期刊、报纸、电子书、讲座、专利、标准、视频、人物、词条、词典、学位论文、会议论文、课程、文档、考试辅导、博客、论坛、网页、图片、电影、音乐、新闻、虚拟咨询全部、图书、古文献、论文、期刊报纸、多媒体、缩微文献、文档、词条
文献信息搜索系统的文献类型是否丰富,关系到读者检索结果是否丰富、全面。两者都收录了图书、期刊、报纸、学位论文、会议论文、文档、词条、图片、音频、视频,前者还收录了专利、标准、人物、课程、考试辅导、博客、论坛、网页、新闻,后者则收录了图书中的古代图书和缩微文献。
分类方面,读秀有25个一级分类类目,没有二级类目,有交叉,更切合读者的使用习惯;而文津分为9个一级类目,19个二级类目,也有交叉,但相对专业。
名称 读秀文津内容 单条件检索、二次检索、高级检索、专业检索、聚合检索、相关检索单条件检索、二次检索、高级检索、聚合检索、相关检索、整合检索
两者都有单条件检索、二次检索、高级检索、聚合检索、相关检索等方式,此外,前者有专业检索,适合专业人员使用,后者有整合检索,对所有馆藏文献进行了梳理、展示和整合。
检索项的多少关系到对文献信息的揭示程度,也关系到读者的检索效果,即读者掌握的文献的相关信息与检索项的匹配程度及读者的选择度。两者对收录不同的文献类别所提供的检索项不同,下边对两者收录相同类型文献的检索项进行比较。
4.2.1 初级检索
读秀文津图书 全部字段、书名、作者、主题词、丛书名、目次 全部字段、题名、责任者、关键词、出版商、ISSBN期刊 全部字段、标题、作者、刊名、关键词、作者单位 全部字段、题名、责任者、关键词、刊名报纸 全部字段、标题、作者、来源、全文、关键词 全部字段、题名、责任者、关键词、报纸名学位论文 全部字段、标题、作者、授予单位、关键词、导师 全部字段、题名、责任者、关键词会议论文 全部字段、标题、作者、关键词、会议名称 全部字段、题名、责任者、关键词文档 全部、DOC、PDF、PPT、XLS、TXT、其他格式 全部字段、题名、发布者、关键词、责任者词条 全部字段 全部字段、题名多媒体 全部字段、视频名称、简介、字幕、关键词 全部字段、题名、责任者、出版商、关键词
两者收录所有文献类型都有全部字段,即检索词可以出现在任何检索项,可以满足没有任何检索知识或检索目的不明确的用户。图书方面,两者都有书名、作者,前者还有主题词、丛书名、目次,后者有关键词、出版商、ISSBN,前者体现出了规范和搜索深入的特点,后者更符合用户使用习惯。期刊方面,两者都有标题、作者、刊名、关键词,前者还有作者单位。报纸方面,两者都有题名、责任者、关键词、报纸名,前者还有全文。学位论文方面,两者都有题名、责任者、关键词,前者还有授予单位、导师。会议论文方面,两者都有题名、责任者、关键词,前者还有会议名称。文档方面,前者选择不同文档格式,在任意检索项内搜索,没有具体的检索项,而后者有题名、发布者、关键词、责任者。词条方面,前者没有具体检索项,而后者有题名。多媒体方面,两者都有题名、关键词,前者还有简介、字幕,后者还有责任者、出版商。由此可见,在初级检索的检索项上,读秀相对丰富,但文津也有自己特点。另外,两者在选择检索项后,前者有检索项与检索词的精确和模糊两种匹配模式可供选择,而后者没有。
4.2.2 高级检索
读秀文津图书 书名、作者、主题词、出版社、ISBN、分类、中图分类号、出版年期刊 全部字段、标题、作者、刊名、关键词、作者单位、内容摘要、年期全部字段、题名、责任者、关键词、出版商、ISSBN、出版年全部字段、题名、责任者、关键词、刊名、年报纸 全部字段、篇名、副篇名、作者、来源、日期范围 全部字段、题名、责任者、关键词、报纸名、年学位论文 全部字段、标题、作者、关键词、授予单位、年度 全部字段、题名、责任者、关键词、年会议论文 全部字段、标题、作者、关键词、会议名称、年 全部字段、题名、责任者、关键词、年
两者都有高级检索方式的文献类型有图书、期刊、报纸、学位论文、会议论文。对各类型文献的检索项进行比较:图书类,两者都有书名、作者、出版社、ISBN、出版年,前者还有主题词、分类及中图分类号,后者则有关键词。期刊类,两者都有标题、作者、刊名、关键词、年,前者还有作者单位、内容摘要、期。报纸类,两者都有题名、责任者、报纸名、年,前者还有副题名、日期,后者有关键词。学位论文类,两者都有标题、作者、关键词、年度,前者还有授予单位。会议论文类,两者都有题名、作者、关键词、年,前者还有会议名称。综上,在高级检索的检索项上,读秀比较丰富,揭示文献信息更全面。
4.2.3 高级检索逻辑组配关系及添加检索项的数量
读秀文津图书期刊报纸学位论文会议论文只有逻辑与的组配关系,最多8个检索项组配有逻辑或与非组配关系,最多7个检索项组配有逻辑或与非组配关系,最多三个检索项组配有逻辑或与非组配关系,最多5个检索项组配
高级检索能提高检索的效率,即提高查全率和查准率,检索效率的高低取决于检索系统的逻辑组配关系及组配检索项的数量。图书类,读秀只有逻辑与组配关系,有8个检索项可供选择,期刊有逻辑或与非3种组配关系,最多7个检索项选择,报纸、学位论文、会议论文有逻辑或与非3种组配关系,最多5个检索项选择,而文津所有文献类型都有逻辑或与非的组配关系,最多可3个检索项组配。前者检索项更丰富,检索效率会大大提高,后者则相对较弱。
聚类方式是缩小检索范围的一种方式,使检索结果更精准。两者无论什么文献类型都有年代的聚合方式。读秀根据文献的特点有相对应的聚合方式,文津所有文献的聚合方式都是一样的,但有前者所没有的全文聚合、语种聚合、来源数据库聚合。
名称 读秀文津图书 类型、年代、学科、作者期刊 类型、年代、学科、期刊刊名报纸 年代、报纸名学位论文 年代、学位授予单位、学位级别、学科会议论文 年代、学科指定类型、全文、年份、著者、语种、来源数据库
在文献详细信息方面,两者差不多,但各有特点。读秀更趋向读者的阅读习惯,信息相对单薄;文津系统相对专业性强,信息更丰富。如图书类,两者都有封面页、题名、作者、页数、出版地、出版社、出版时间、ISBN、中图分类号、提要、获取方式、相关资源信息,前者还有价格、主题词、分类名称、参考文献格式、试读、评论信息,后者则有来源数据库、分享到、关键词、语种、版本、目次、延伸检索信息;期刊类,两者都有篇名、作者、刊名、年期、页码、ISSN、分享到、相关资源(本期的其它文章、相关文章、本周热门文章)、获取途径信息,前者还有参考文献格式信息,后者则有来源数据库、关键词、语种、中图分类号、延伸检索信息。
另外,两者虽都有相关资源、获取方式、分享到信息,但其中包括的具体内容是不一样的,前者的相关资源特指某一类文献范围内的,而后者指本搜索系统所包含的所有类型文献;前者获取全文的方式有本馆电子全文在线阅读或下载、文献传递、相似文档下载、按需印刷、文献互助、馆际互借、推荐购买、在线试读等方式,后者只有文献传递与在线阅读方式;前者可以将检索记录信息分享到55种网络媒体上,而后者只能分享到新浪微博和腾讯微博上。
作为文献信息搜索系统,读者使用的最终目的是在线阅读或下载所需全文,因此,仅有好的检索功能还不能满足读者需求,更需要与图书馆的各种资源系统,如OPAC及各种电子图书数据库进行无缝对接,实现电子图书与纸质图书的互查。目前实现的只是从信息搜索系统到OPAC的链接,没有实现OPAC到文献信息搜索系统的链接,电子图书也只实现了与本公司的对接,并且数据更新是人工的,不是两个系统无缝对接。与各种期刊、报纸、学位论文、会议论文、标准、专利等电子资源数据库,目前也只实现了单向链接,满足不了读者检索其他数据库中相类似的数据。在这方面,读秀与文津系统都要做很大的改进。
为了满足读者日益个性化的需求,文献信息搜索系统应该提供按照学科、作者、兴趣爱好、热词、年代等特点进行检索结果或数据库记录定制,定制之后提供RSS、邮件等方式推送,即使读者不进入本搜索系统,也能享受到方便、快捷的服务。目前,读秀有收藏和导出检索结果功能,文津没有此功能,两者在个性化服务方面都有很大的改进空间。
[1]读秀学术搜索系统[EB/OL].http://www.duxiu.com,2013-08-13.
[2]文津搜索系统[EB/OL].http://find.nlc.gov.cn ,2013-08-13.
[3]李志明.谷歌、百度、读秀三大中文图书搜索引擎比较及启示[J].图书馆工作与研究,2009,(8).