陈振华
(武汉理工大学图书馆 武汉 430070)
发现系统新功能在科学研究选题中的应用分析
陈振华
(武汉理工大学图书馆 武汉 430070)
基于图书馆的知识发现系统,探讨了科学研究中选题的重要性和必要性,并就发现系统的功能,特别是新开发的3个功能模块在科学研究选题中的应用进行分析.以检索关键词“航海”为例,介绍发现系统的应用方法和使用步骤,以方便图书馆广大用户在海量的信息中快速揭示学科发展趋势,精准选题.
发现系统;科学研究;选题;检索;航海
发现系统(discovery system)是建立在迅猛增长的海量信息基础上,旨在打破过去的书刊目录检索和部分文献全文检索,为广大用户提供完善的数据挖掘、知识聚成和数据分析功能的知识发现系统.是近几年来才形成的图书馆数字资源的一种整合方式,是建立在OPAC基础上的一种资源整合、数据库导航、跨库检索等系统基础上发展而来.它是先在后台通过预设集中索引库,再在系统前台给广大读者提交一个的检索框,让读者只通过单一的检索框籍以实现对各种数据库和发现系统中数字文献资源进行一站式搜索[1].以数据挖掘技术为支撑,把集成的海量信息进行知识关联和数据分析,挖掘数据背后的信息,以此建立功能强大的学术资源发现平台,帮助广大用户快速便捷地获得自己所需要的知识.对广大用户来说,知识发现系统是一个自主学习的工具;对图书馆来说,它是一个功能强大的文献资源管理和学习研究平台.
大数据是发现系统的基石,发现系统不仅集成了大量结构化的元数据、全文数据,还网罗了大量半结构化、非结构化的数据,通过建立关键词表、超10亿条的相关引文数据库、相关作者库、相关机构库、中外文学科分类表、收录刊源库、基金统计、学术专业词库、各类型学术成果库、同义词表、地区统计、单位产出库等,为实现数据挖掘和分析处理形成数据基础.发现系统就是通过一个检索框,对预设的检索关键词在整合好的元数据仓储中进行检索,发现系统能自动汇集所有符合条件的检索结果.图书馆的发现系统可以帮助广大用户获得海量的、类型复杂存在关联的各种文献资源,这在很大程度上提升了图书馆数字文献资源的利用率[2-4].
好的选题决定了科学研究的目标方向,也决定了在科学研究实践中应该采取的研究手段、方法和途径.依据科研选题应遵循的原则,科研人员在科研选题时所掌握的信息资源应符合下列要求:①选题是否具有研究的必要性和可行性,这决定你的研究工作学术是否有意义,也预示着该项研究是否可以顺利开展.②所掌握的信息资源是否具有综合性和针对性,科研人员所掌握的信息资源既有海量又要有针对性,这往往靠科研人员手工收集、甄别、整理、处理分析是很难做到的.③所掌握的信息资源是否具有及时性与预见性,这就需要科研人员能够及时地搜集到最新的信息资源或按照指定检索词来搜集有关的信息,还可以对已有的数据进行统计分析,寻找这一领域的研究趋势,针对已选定的选题做出大胆的预测.④选题的新颖预示着成果是否具有科学性和创新性,这就需要科研人员掌握正确的检索方式和检索途径,合理利用知识发现系统,在掌握的海量信息里挖掘出知识关联,同中求异,寻找新的突破点.
发现系统不仅具有传统的馆藏书目查询检索、本地镜像数据库查询、联合目录查询检索等功能,还开发出了海量元数据仓储、考镜学术源流、学术研究趋势分析3个新功能模块[5].这极大地满足了科研人员的科学研究选题中对信息资源的需求,方便了科研人员搜集海量的文献信息,可以大大提升科研人员对文献资源收集整合的效率,将发现系统的新功能模块应用到科研的选题过程中去,对科研人员在科研选题中的信息资源处理加工带来影响.
1) 为科研人员所遴选收集的图书馆文献资源提供了可靠保证 图书馆发现系统能够检索获取的图书资料、期刊杂志、著作专利、国际会议论文、硕士博士论文等信息资源都来源于国内外顶级数据库商,从商业的角度讲这本身保证了文献资源来源的可靠性,也为这些资源的准确性提供了保证,为科研人员在科研选题中的选题方向正确性提供可预见性.
2) 为科研人员所获取的信息资源的全面性提供了保障 发现系统的优势就在于网罗了海量的元数据仓储,它可以按照预先设置好的程序自动预索引科研人员获得的数据资源,这些元数据的数量、质量远远超过图书馆原有的查询系统.在科研人员科研选题初期,需要文献信息资料应越全越好,图书馆的发现系统整合的海量元数据就能够为处于这期间的科研人员科研选题提供帮助.
3) 为科研人员所获取的信息资源的相关性提供了保障 科研人员所获取的信息往往需要与选题密切相关,发现系统既可以实现老系统的简单检索、高级检索等功能,又能实现对检索结果的分类检索,可以选取文献的主题、类型、时间、作者、学科、机构等不同的维度来展示所检索的结果,为科研人员既快又准的获取满足自己选题要求的信息资源提供了方便.
下面以检索关键词“航海”为例,介绍怎样把武汉理工大学图书馆发现系统[6]中新开发的海量元数据获取、揭示考镜学术源流、各种学术趋势分析这三种功能模块运用到科研选题当中,展示发现系统的应用方法和使用步骤,辅助服务科学研究的选题工作.
2.1 发现系统的元数据仓储整合
发现系统覆盖了各种中外文全文数据库、索引库,从中获得海量元数据,足以满足广大用户的需求.发现系统按照文献资源内在的数据规律,对其网罗的数据库所包含的信息数据资源进行整合,集成统一的预索引,再在系统中跨库进行检索元数据,获得质量比较高的元数据索引,还能通过清洗所汇集的元数据集合,从而实现对所获得的元数据进行归并和去重.
发现系统不仅拥有海量的元数据,发现系统还具备更新时间短、更新快的优势.这里用2016年11月20日的数据显示发现系统的元数据覆盖情况,见图1.
图1 发现系统检索海量资源部分显示
由图1可知,在发现系统的检索框中不需要输入任何字符,空框检索,系统显示的元数据表明,截至检索日,发现系统的数据数量为689 207 268条,每天新增10万条元数据记录,每周更新2次.其中中文元数据330 370 209条,外文元数据358 749 169条,主要的元数据资源内容类型的数量如下:图书28 078 499种,期刊论文325 457 020篇,报纸文章152 356 782篇,学位论文8 321 948篇,会议论文23 082 878篇,标准3 490 059条,专利101 442 529项,视频9 557 997部,科技成果3 678 831项,信息资讯18 284 921条,特色库资源信息1 315 838条.从以上完全说明发现系统的元数据是海量.
在发现系统首页中输入检索关键词“航海”,进行检索,见图2.就可以清晰地显示与“航海”有关的元数据:系统中数据总量为124 301条,其中中文元数据117 795条,外文元数据6 506条,主要的元数据资源内容类型包括图书3 348种,期刊论文85 379篇,报纸文章9 086篇,学位论文3 646篇,会议论文13 636篇,标准144条,专利1 813项,视频1 375部,科技成果1 011项,信息资讯1 235条,特色库资源信息284条.
图2 发现系统检索关键词“航海”资源部分显示图
不仅如此,从检索到的整个页面中还可以看到海量的元数据的年代、关键词、学科分类、重要收录、作者、作者机构、刊种、地区、基金等分布情况.这必将为科研人员在科研选题时为获取更多文献信息节约时间提高效率.
2.2 考镜学术源流
考镜学术源流是指通过对单一文献的研究,去寻找文献资源内在客观存在的知识关联,把文献中的各不相同知识概念串联起来,形成相关的知识链,这其中所包含的关联就是不同知识概念相互关联的基础.图书馆发现系统可以通过考镜学术源流功能模块寻找不同知识概念间的关联,找到其中的线性关联,不管是双向还是单向的,把它结成链状、织成网状的关系图,进而获得知识关联图谱,形象的表达这种知识关联,最后得到依照知识点、机构、作者等各种的关联图,显示出各种学术研究间的源流及相互影响.
由图2可知,科研人员可以通过点击“可视化”按钮,切换到知识关联图分析页面,可以获得与检索词“航海”相关的知识点网状关系图、相关作者的网状关系图、相关机构的网状关系图、“航海”的词义关系网状结构图,见图3.然后通过图3中所显示的各种关联图,从中挑选一个词节点或一个作者节点来检索,从而更深入地了解所预设的检索词关系及作者关系结构.
图3 发现系统考镜“航海”学术源流示意图
为了考镜学术源流,科研人员可以选取一个知识点,寻找当前词的不同地位词,寻找当前词在其所属学科的定位,以及与之相关联的研究选题间的逻辑关系;还能显示出该词的关联作者,通过进一步分析找出与当前词相关联的作者间的关联,籍此寻找相关的科学研究潜在合作者,以及发现与该检索词相关的机构,找到可能的合作机构,或者是方便科研机构进行人员招聘.
2.3 学术发展趋势功能应用分析
学术发展趋势分析是指通过各种曲线图、excel表等展现某一科研选题在研究时序上的发展趋势,来帮助科研人员获取该选题在不同时序上的各种数据,通过对比分析数据,全面了解该选题研究领域研究的历史、起源、成长、研究活跃程度,把握科研选题研究的整个过程和研究趋势,见图4.
图4 航海-各类型学术发展趋势曲线图
由图4可知,发现系统中既可分别导出与检索词“航海”相关的图书、期刊、学位论文、会议论文、专利、标准、科技成果等学术发展曲线图,还可直接导出与检索词“航海”相关的各类型学术发展趋势曲线图,也可直接导出excel表格文件.
发现系统可以对任一选定检索关键词进行检索并对检索结果数据完成统计,总结分析相关文献年代分布规律,利用相关数建立时间序列模型,科研人员可以对未来相当长的时间内的选题发展趋势作出预测.从图4可知,曲线无论呈现出上升还是下滑趋势,只要是在某一时间段呈现出上升趋势或波峰状态,说明此时该选题学术研究活跃;当曲线在某一时间段呈现出下降趋势或波谷状态,说明此时该选题学术研究相对低迷.所以发现系统具有学术研究趋势辅助分析功能,能够为研究人员预测某一选题领域的未来发展趋势提供帮助.
发现系统的优势在于有效的整合了系统内数据库资源,克服了传统的OPAC系统及过去的导航系统等都只能是形式上简单的资源整合,检索只能到刊名层面,内容层面很难深入;发现系统不仅可以检索到文献资源的元数据本身各种信息,包括全文信息,更能显示相关知识点、相关作者、相关机构间相互关联,资源整合更加深入,同时发现系统在用户体验、可视化、多主题对比分析、学术成果统计等方面更是传统的检索系统无法比拟的.
发现系统新开发的海量元数据仓储功能、揭示考镜学术源流功能、分析学术发展趋势功能等运用到科学研究的选题中,辅助科研人员科研选题工作,帮助科研人员发现相关的潜在合作者,找到可能的合作机构,预测某一选题领域的未来发展趋势,正确把握选题方向,节约时间,提高效率,起到事半功倍的效果
[1]陈秀秀.基于发现系统的图书馆数字资源整合探析[J].四川图书馆学报,2012(6):578-583.
[2]常唯.综合性学术搜索引擎研究[J].大学图书馆学报,2007(2):73-77.
[3]王红霞.WorldCat Local资源整合与服务集成及其启示[J].现代情报,2010,30(3):45-54.
[4]NFAIS Code of Practice Draft: Discovery Services[EB/OL].(2012-01-30)[2013-07-04].http://info.nfais.org/info/codedraft1312012.pdf.
[5]刘段.发现系统在学术研究中的应用研究[D].武汉:华中师范大学,2014.
[6]武汉理工大学图书馆.武汉理工大学图书馆发现系统网址[EB/OL].[2016-11-10].http://ss.zhizhen.com.
Analysis on the New Functions of Knowledge Discovery System in Topic Selection of Scientific Research
CHEN Zhenhua
(Library, Wuhan University of Technology, Wuhan 430070, China)
This article introduces the knowledge discovery system in libraries and discusses the necessity and importance of topic selection in scientific research. By analyzing the three new functions of the knowledge discovery system, it explores the application and effectiveness in the topic selection of scientific research. Taking “navigation” as the retrieval key word, this article demonstrates the application method and usage steps of the knowledge discovery system, which makes it possible for users to reveal the academic development trends among large amount of information and achieve the goal of precise topic selection.
knowledge discovery system; scientific research; topic selection; retrieval; navigation
2017-04-10
G250
10.3963/j.issn.2095-3844.2017.03.035
陈振华(1970—):男,副教授,主要研究领域为信息管理与核心竞争力研究