大数据时代信息资源的检索方法

2016-11-30 14:11程晓燕
创新科技 2016年11期
关键词:信息检索检索百度

程晓燕

(禹州市图书馆,河南 禹州 461670)

大数据时代信息资源的检索方法

程晓燕

(禹州市图书馆,河南 禹州 461670)

文献检索是指根据学习和工作的需要获取文献的过程。生活信息大爆炸的当今社会,如何收集、获取、选择、利用信息已经成为提升个人素质和竞争力的一个有力标准。

大数据;信息资源;检索方法

随着信息技术的高速发展,互联网上的信息每日以指数级增长。如何快速准确地从海量信息中找到高质量的、有用的信息,是我们每个人经常面临的问题。因此,学习和掌握信息资源的检索方法和技巧,是教育工作者必须具备的一项技能。

广义上的文献信息就是指:以文字、图形、符号、音频、视频等方式记录在各种载体上的知识和信息资源。检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程[1]。

早在没有网络的时候,图书馆一直作为重要的知识传播方式存在。通过书目的检索和寻找,虽然信息量远不如现在的网络承载量,但也相对节省了信息选择的时间和精力。

1 掌握检索信息重要性

期刊的检索方式总结为以下几个方面:第一,检索词必须与检索项匹配。例如,检索词是人名,检索项应选作者;检索词是机构,检索项应选单位等。其次,使用两个以上检索词必须选择逻辑关系,“并且”表示两个条件均满足;“或者”表示两者任一即可;“不包含”表示排除该特点。第二,学科检索途径是利用专辑导航功能,从专业的角度检索论文,是一种辅助的检索途径。学科途径的优点是查全率高,缺点是检索步骤偏多。第三,数字图书馆等资源优缺点并存。优点是信息涵盖范围广,领域宽,检索速度快。缺点是观看体验不如纸质书。

2 合理利用网络资源,达到较好的检索效果

第一,学会判断信息的来源。学习判断信息是否来自权威以及是否具有稳定性。例如,来源于科研机构或报纸等的信息,可信度比一般网站的信息要更加可靠。第二,巧妙使用关键字搜索技巧。在做科研时,如果涉及其他语言的信息,会对研究者造成很大的不便。谷歌语言工具可提供单词、段落、文章90多种语言的互译。可直接输入需要访问的外国网址,此时的目标网页可以译成中文页面。例如:左栏输入原始语种“http://网址”,在右栏选择目标语种。第三,对于教师来讲,备课资源的寻找会耗费到很大的精力。例如:教育部“爱课程”资源共享课、MeTeL教学资源平台、国家精品课程平台等,主要收录多国名校的教学资源,包含各种音频、视频资料[2]。第四,对于一些数据的检索,可以依托一些国家数据网站。国研网提供的数据属于研究数据,虽然大部分是收费数据,但对信息经过了深度加工。

文献信息检索的重要意义。例如:美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此投资了数百万美元来研究解决这一问题。事后查明,早在10多年前就有人研究出来了,该方法非常简单,只需要在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟[3]。可以说文献检索的作用非常大,它可以避免重复研究、节省研究人员的时间、提供获取新知识的捷径等。

3 信息检索的思想观念应与时俱进

在互联网还没有普及的时候,主要是通过检索工具书手工进行检索。随着信息技术的发展,我们的学习、工作和生活的环境都发生了变化,现在已进入移动互联时代,人们通过手机、平板电脑等便携设备可以随时随地上网。信息检索也在不断发生变革,通过计算机和网络进行信息检索已成为目前主要的检索手段。我们也应该顺势而为,要了解当前互联网上有哪些常用学术资源信息、数据库和工具软件,以及这些数据库和软件的使用方法,否则信息检索的能力就会止步不前。中国知网和维普网的搜索特点、提供资料的侧重领域都有所不同。很多人有多年在网上收集信息的经验,但许多时候只知道用百度与谷歌,即使是常用的百度,也有许多新功能没有用到,因此,在信息检索时要注意以下几点:

首先,在进行信息检索前要能够全面地掌握有关的必要信息,增强决策的科学性。掌握一定量的必要信息,是进行搜索的首要条件,也是进行正确决策必不可少的前提条件。科学的决策,源于对信息资料的充分了解与认识,信息检索是获取信息的重要途径。因此,信息检索会使个人的决策建立在科学基础之上,大大增加了决策的科学性,减少了决策的盲目性。其次,要努力获取所需的全部信息。掌握常用中文数据库检索、网络搜索引擎的高级检索方法,电子图书的检索与利用,国内外硕、博士学位论文的检索与全文获取、网络免费学术资源的检索与利用,多媒体学术资源及其使用等方面的知识。熟练掌握信息检索的技术和方法,拥有信息的鉴别利用的能力。信息素质的提高,可增强信息意识,熟悉检索技巧,有利于科学研究工作的顺利开展。再次,锻炼撰写论文的能力。信息检索是获取知识的有效途径,学会运用信息检索的基本技能是学习和科研的一项基本功,因为在撰写科研论文的时候需要专业基础知识和科学最前沿的信息,而所需要写作的这些知识都分布在图书馆的图书和数据库里面,要想充分地利用现有的数据库文献,必须学会运用检索工具,比如,Web of Science核心数据库的检索与利用、中外文电子期刊全文数据库检索与利用、国内外学位论文的检索与原文获取、多媒体学术资源及其使用,撰写论文虽然与个人的基本学术素质和学习态度有着十分密切的关系,但也要求重视最新信息的收集、充分利用图书馆的资源[1]。

4 常用几种检索工具的简要总结

第一,维普期刊服务平台是国内最早开发的中文期刊数据库,收罗面广,功能齐全,专功期刊,包含的期刊种类比知网多,平台比知网便宜。

第二,读秀学术搜索是一个知识搜索平台,最大的特点是知识搜索。一般搜索到的书很少能几本同时看。读秀平台上将一本图书打碎,以章节为单位,想看某一内容,能同时检索到好几本书相关的内容。可单独查内容、讲座、电子书等信息点。这个对老师编书编教材时非常有用。缺点是查到的内容比较旧。标准公文通过百度找不到,使用读秀可以找到过去的一些文件。学位论文、学术论文就比不上维普。对于个人用户来说,还有费用问题,普通的只能免费读15页,使用图书馆文献传递,只能传递50页,并且还有时间限制。

第三,数字图书馆。一是超星数字图书馆是国内第一个数字图书馆,它没有自己的数据库,都是链接的,类似于百度,分类标准是按内容种类进行分类;二是国家图书馆,电子书覆盖了新中国成立以来所有电子书的80%以上,报纸覆盖100%的报业集团,提供了各大类大部分重要工具书,覆盖绝大多地方综合年鉴和行业年鉴,艺术图片覆盖了各艺术领域。

第四,专业检索窗口。如:大雅相似度检测工具,可提供300~10 000字的免费检索,还提供了相关知识点可视化服务,从而实现以图显示出知识点的关联性。

第五,大众检索工具:百度与谷歌。以百度为例进行介绍:可支持多种媒体,没有正规的文献数据库,只能解决简单的搜索需求,查不到政府出版物与文献。这种检索工具虽然是万事通,但搞研究可能借鉴的东西很少。上面有许多实用的功能值得去使用,如:地图,百度学术,百度云、百度阅读等。百度阅读:一般都是旧书,没版权的书;百度云:多功能的网络存储器;百度预测:如流行病高发区是大数据的应用案例;百度视频:可以观测动物园实时情况;此外,还支持以图搜图,手写输入等功能。

5 百度信息检索技巧使用结果对比

学术方面检索使用较多的是中国知网、维普网等,检索技巧也相差无几。下面仅就百度搜索检索的高级技巧,简述使用。

第一,不同运算符输入搜索结果的对比。在输入框输入“百度 空格 谷歌”时,大家可以对照最前面的搜索结果;而输入“百度|谷歌”时,大家可以对照最前面的搜索结果;再输入“百度-谷歌”时,大家可以对照最前面的搜索结果。因此,可以看到运算符不同,带来的结果显然是不一样的。

第二,限定词的使用搜索结果对比。Site:搜索范围限定在特定站点中,例如在输入框中输入:暴风影音site:www.skycn.com,大家可以对照结果;Intitle:搜索范围限定在网页标题,例如输入“世界历史intitle美国”,可以对照搜索结果;Inurl:搜索范围限定在url链接中,例如输入“photoshop视频教程inurl:video”,可以对照搜索结果;Fi⁃letype:搜索范围限定在指定文档格式中,例如输入“pho⁃toshop使用技巧filetype:doc”;+包含特定查询词,输入“阿甘正传+qvod”,大家可以对照搜索结果;-不含特定查询词,输入“阿甘正传-qvod”,大家可以对照结果。百度搜索中,一些主要的搜索高级技巧,非常实用,不同的结果显而易见。

为了提高检索效率,应学会使用常用的运算符与限定符,如:与运算:使用“空格”,A B实现A、B条件交集功能;或运算:使用“|”,A|B实现A+B功能;非运算:使用“-”,A-B-C实现去除功能;限定符:site搜索范围限定在特定站点中,intitle搜索范围限定在指定的网页标题中,inurl:搜索范围限定在URL链接中,filetype:搜索范围限定在指定文档格式中。

信息检索从表面看是一种技术,但从内涵上看,可以帮助我们通过分类、对比、总结,起到大数据的作用,便于我们对发展的趋势做出正确的判断。同时,掌握良好的信息检索习惯及方法,便于我们在信息量爆炸式增长的时代,提高检索的质量和速率[2]。信息检索,还可以帮助我们站在前人的肩膀上,以前人的科研成果为基础,结合自己的兴趣和优势,发挥自己的强项,提高科研水平和能力,并且能够有效地避险学术上的抄袭现象发生,尊重别人的知识劳动成果,维护良好的科研氛围。

我国信息检索的发展相对国外还有一定的差距,数据库的数量虽多,但是高质量、高水平的学术成果数量较少,因此,为了能够便于提高我国信息检索的有效性及真实性,需要我们每一个用户的共同努力。不断提高自己的学术水平,有效地撰写和提供高水平高质量的学术成果,不断地完善信息检索的内容建设。

6 高质量检索能力是提高信息运用能力的基础

只会在百度上查找自己想要知道的问题,而且选的关键字的正确率不高,这是大多数学生甚至老师都出现的问题。信息检索是查找信息的方法和手段,它能使人们在浩如烟海的信息海洋中迅速正确全面地查找所需信息。在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂问题的要求。对于文献信息检索的方法,最重要的是关键词的选择,即检索词和检索策略的选择。检索词选得精确,不仅可以节省时间,提高检索速度,而且可以大大提高检索结果的质量,更容易找到自己所需数据或文献资料。如果不懂得高质量的信息检索的方法,不能提高信息检索的准确性和有效性,不仅不能体现信息检索的工具的价值,并且我们在信息检索上所花费的时间也没有收到相应的回报。只有当你具备高质量的信息检索能力,才谈得上信息运用能力[3]。

7 信息检索能力的培养需要在大量的实践中完成

理论和实践相结合的道理,在信息检索能力的培养中一样适用。学习了很多的信息检索的方法,不能合理区分和运用这些方法并达到熟练的程度,仍然不能说自己具备信息检索的能力。因此,这就需要我们在实践中大量地进行训练,针对自己所要搜集信息特征的不同,在不同的数据库当中,通过初级检索到高级检索的运用,不断地筛选出自己需要的信息。通过这种长期的训练,总结出一些规律和特征,提高自己的信息检索能力。

8 信息素养是信息检索能力培养的终极目标

信息素养涉及各方面的知识,是一个特殊的、涵盖面很广的能力,它包含人文、技术、法律等诸多因素。信息检索能力更加强调对信息的收集和使用技能。而信息素养的重点是意识、内容、传播、分析以及评价。它是一种了解、搜集、评估和利用信息的知识结构,既需要通过熟练的信息检索这一硬件,还需要软件与人,其中信息素养也暗含人对待信息的心理状态、情感与意识,三个要素组成一个整体,三个要素之间必须十分协调配合,才能充分发挥信息系统的效能,达到预期目标。

总之,信息检索能力的培养和信息素养的养成是一个漫长的过程,特别是在海量数据检索的今天,提高检索能力实现精准搜索已成为当今图书馆职员与广大师生不可缺少的重要技能。

[1]张大勇.论网络环境下高校图书馆工作人员的素质[J].才智,2016(7):15.

[2]覃丽金,吉家凡,唐朝胜.基于查新档案利用的学科服务实践研究——以海南大学为例[J].图书情报工作,2016(6):20.

[3]季亚文.经管类高职院校图书馆信息资源共建共享研究[J].图书情报工作,2016(6):15.

Retrieval Method of Information Resources in the Era of Big Data

Cheng Xiaoyan
(YuzhouMunicipal Library,Yuzhou Henan 461670)

Literature retrieval is the process of obtaining documents according to the needs of study and work.In today's society with life information exlosion,how to collect,obtain,select and use information has be⁃come a powerful standard to improve personal quality and competitiveness.

big data;information resources;retrieval method

G250.7

A

:1671-0037(2016)11-78-3

2016-10-16

程晓燕(1985-),女,本科,助理馆员,研究方向:读者服务。

猜你喜欢
信息检索检索百度
CNKI检索模式结合关键词选取在检索中的应用探讨
瑞典专利数据库的检索技巧
2019年第4-6期便捷检索目录
百度年度热搜榜
计算机信息检索技术的发展及问题研究
英国知识产权局商标数据库信息检索
不懂就百度
对大学案理研讨课学生信息检索意识若干问题的思考
百度年度人气萌娃
万有的百度