基于CiteSpace II信息素养研究的知识图谱分析

2014-12-13 08:35邵慧丽
中国医学教育技术 2014年3期
关键词:主题词图谱可视化

邵慧丽,张 帆,2

新乡医学院:1管理学院;2卫生信息资源研究中心,河南 新乡 453003

随着计算机技术、网络技术以及多媒体技术的发展,信息素养(information literacy)日渐成为信息社会中人们必备的基本素养之一。1974年,美国信息产业协会主席保罗·泽考斯基(Paul Zurkowski)在给美国图书馆与信息科学委员会(NCLIS)的报告中首次提出信息素养概念:“利用大量的信息工具和信息资源使问题得到解决的技术和技巧”[1]。随后便掀起了世界各国对信息素养研究的热潮,逐渐成为国内外图书情报界普遍关注的热点领域之一。虽然大家围绕信息素养的讨论研究各有立场,但是都围绕信息意识、信息知识、信息能力、信息道德四个层面进行的。人们对它的认识逐步深入,比较简明的阐述来自美国图书馆学会(american library association,ALA 1989),其内容包括:能够判断什么时候需要信息,并懂得如何去获取信息,如何去评价和有效利用所需要的信息[2]。可见,在当今信息爆炸的时代,具备基本的信息素养对保持终身学习和实现自我价值显得异常重要。世界各国对信息素养的重点研究是什么?信息素养是怎么演化的?文章将以可视化的方式呈现出来,以增加大家对信息素养的了解。

1 数据来源和方法

1.1 数据来源

该文数据来自于ISI Web of Science的子库SCIEXPANDED和SSCI。具体的检索策略是:主题=“information literacy”,文献类型 =“article”or“review”,时间跨度为1983-2013,数据下载日期是2013年8月15日,此次检索共得1179条记录。

1.2 研究方法

该文使用引文分析工具 CiteSpaceII[3-4],版本3.0.R1,是基于Java运行环境的可视化分析工具,绘制研究主题为信息素养的科学知识图谱。CiteSpaceII是美国费城Drexel大学信息科学与技术学院陈超美博士开发的科学知识图谱可视化软件,可以用来识别和分析科学文献的新趋势和新动态。利用Cite-SpaceII软件使用定性与定量相结合的方法进行研究,并利用突现词技术来确定信息素养研究前沿。

2 结果分析

将下载得到的1983-2013年以“information literacy”为主题的相关数据导入CiteSpace II软件中,然后进行相关选项的设定。在CiteSpace II的操作界面上,设置Time Slicing为3,即设置每三年为一个时间间隔,1983-2013之间的31年分为11个阶段,主题词来源选择 title、abstract、descriptors、identifiers。在前、中、后三个时期分别设定阈值,其余的由线性内插值来决定[3]。设定c(文献被引频次),cc(两篇文献的共引频次),ccv(文献的共引系数)的阈值分别是(2,2,20)、(4,3,20)和(4,3,20)。其他值默认。最后根据分析内容选定相应节点,如关键词、作者、国家,等。以下将从时间分布、地区与机构分布、共被引作者、研究热点、研究前沿等5个方面做具体分析。

2.1 时间分布

检索得到1 179条文献数据记录,其年代分布结果如表1所示。从表1中我们可以看出,以“信息素养”作为主题词的文献最早出现在1983年,是Layman D L发表在美国社会情报学学报(Proceedings of The American Society for Information Science)上的《信息素养和教育生产力》(Information Literacy And Educational Productivity)一文。随着对信息素养认识的不断深化,研究文献也在不断增加。1983-1995年研究文献较少且不稳定,1995-2002年持续增长,2002年后增长迅速,可见在信息社会中信息素养研究越来越受世界各国的关注。

表1 “信息素养”文献年代分布表

2.2 国家(地区)与机构分布

图1 信息素养研究领域国家与机构的知识图谱(频次越高字体越大)

将数据导入CiteSpace II软件,节点类型选择Country和Institution,得到发文国家(地区)与机构分布概况图。图1是各个国家(地区)与机构研究实力分布图。图中,一个节点代表一个国家(地区)或机构,节点大代表该国家(地区)或机构出现的频次高。图2是各国或地区出现频次分布图。从图2我们可以清楚地看出,在信息素养研究领域,美国独居首位,发文量为771篇,具有绝对优势,与排名第二的国家相差很大,其次是英国177篇、澳大利亚152篇、加拿大89篇、西班牙61篇、中国56篇、南非52篇、新西兰42篇、瑞典31篇,等。近年来,中国虽然在信息素养研究领域有一定的造诣,但是由于起步晚,标准体系不健全,等,与美国、英国等国家仍有较大的差距。我国信息素养研究所涉及的学科领域虽与国外大体保持同步,但尚未在互联网信息评价中受到广泛研究[5],这说明我们国家在信息素养研究领域仍存在很大的提升空间,需要不断地探索与研究。从图1中可以看出,在信息素养研究领域各国联系甚少,缺乏应有的沟通与合作,尤其是在美国已经形成一个独立集团,这在一定程度上反映出在信息素养研究方面美国走在发展的最前端,也反映出美国与其他国家或地区学术壁垒现象的存在。而在发文量相对较少的国家,如意大利、苏格兰,等,反而与其他国家有一定的协作关系。

图2 信息素养研究国家或地区分布

图1还展现了不同国家(地区)在信息素养研究领域中比较有实力的研究机构分布情况。此次研究发现,有关信息素养研究的文献主要的研究机构是大学,WOS上美国的主要研究机构是伊利诺大学(illinois university)、华盛顿大学州立(washington state university)、威斯康星大学(wisconsin university)、加州洛杉矶大学(calif Los angeles university),等;我国信息素养研究领域的主要机构有北京师范大学、香港康莫大学,等;英国的主要研究机构有谢菲尔德大学(sheffield university)、拉夫堡大学(loughborough university),等。

2.3 作者共被引分析

对信息素养领域作者进行共被引知识图谱分析,节点类型选择作者(author)和被引作者(cited author),其他设置不变,得到信息素养研究领域作者共被引知识图谱(如图3所示)。从图3可以看出,代表作者Kuhlthau CC,Breivik PS,Dervin B和团体作者美国图书馆协会信息素养总统委员会(american library association presidential committee on information literacy)的节点有紫色外圈并且紫色外圈较大,根据陈超美的科学文献可视化理论,可知这四位作者是在信息素养研究领域具有桥梁作用的重要作者,其中心度较大。此外,中心度和发文量都较大的有Bruce C、American Library Association、Bawden D,等。可知这些作者是信息素养研究领域的突出贡献者和引领者。

图3 信息素养作者共被引知识图谱

Kuhlthau C C是美国罗特格斯州立大学信息交流与图书馆研究中心教授,多年来致力于情报学和图书馆学研究,主要进行实践型检索及用户检索行为研究[6]。她的突破性研究是信息检索过程(information search process,ISP)和信息检索及使用六个阶段中情感、认知和物质的信息检索过程模型。1985年在《图书馆技能指导的过程方法》(aprocess approach to library skills instruction)一文中首次进行ISP研究,此后不断发展对ISP的认知和研究。Kuhlthau CC从用户角度进行信息检索和使用,认为ISP分为开始(initiation)、选择(selection)、探索(exploration)、表达(formulation)、搜集(collection)、描述(presentation)和评价(assessment)七个阶段,以预见用户在信息检索和信息素养研究中的重要作用,对我们今天的研究依然影响深远。

Breivik PS参与创建美国国家信息素养论坛(national dorum on information literacy,NFIL),并担任首任主席。该论坛给国内外学者提供了一个促进和维持信息素养交流的平台,使各行各业的人们能够有效地搜集、使用、评价和发布信息,以实现他们的个人、社会、职业和教育目的。

Dervin B是俄亥俄州立大学教授,她关于信息检索和信息利用的研究促使意义构建理论方法的发展。1972年提出情报学领域的意义建构理论,认为信息的意义建构是内部行为(即认知)和外部行为(即过程)共同作用的结果。Dervin B是从以系统为中心转移到以用户为中心的典范,他认为信息检索是主观建构的活动。强调个人理解,而非协同理解。

美国图书馆协会下属的信息素养总统委员会于1989年重新概括了信息素养的含义:要成为一个有信息素养的人,必须能够确定何时需要信息,并且能够有效地查询、使用和评价所需要的信息。这一概念实际上包含了信息素养的两个维度:信息意识和信息能力。推动美国国家信息素养论坛的成立,并号召全民及全世界重视终身学习和信息素养的培养。

2.4 信息素养研究热点和前沿可视化分析

2.4.1 信息素养研究热点知识图谱分析 文献的关键词/主题词是从文章中抽取出来的高度概括文章主题的核心词汇,是一篇文章的核心与精髓,是文章主题的高度概括及凝炼,频次高的关键词/主题词常被用来确定一个研究领域的热点问题[7]。主题词类型选择Noun Phrase(名词短语),节点类型选择Key Word(关键词),选用Pathfinder(路径搜索)算法,运行CiteSpaceII软件,得到信息素养研究关键词共现知识图谱(如图4所示),共有101个节点,372条连线。表2是信息素养领域热点高频关键词/主题词,是将不同写法的同义词进行合并,频次进行累加,中心度选取较高值的基础上整理出来的。

图4 信息素养研究关键词共现知识图谱

由分析可知,信息素养研究领域的热点关键词/主题词除信息素养外,还有图书馆、网络、信息检索、计算机辅助教学、信息技能、信息知识、教育、信息行为,等。表2中列出频次排名前15的关键词,出现频次最高的关键词是information literacy,频次是356。排名第二位的是education,频次82,说明信息素养教育成为一个重要的热点研究领域。Internet排在第三位,说明因特网为信息素养的研究提供支撑。

表2 信息素养研究热点关键词/主题词表

这些热点研究领域大致可以归纳为三大类:一是有关素养研究的分类,包括信息素养、计算机素养、健康素养、媒介素养,等,热点研究领域是信息素养和健康素养。二是信息素养内涵构建的四个维度,信息意识、信息能力、信息道德、信息知识四者相互依存、相互影响。信息意识是指对信息交流活动在社会中的地位、价值、功能和作用的认识[8],包括信息保密意识、信息主体意识、信息传播意识、信息更新意识、信息获取意识等多种形式。信息意识是人们进入信息社会的通行证,信息意识的强弱影响人们是否能有效地判断、获取、评价、传播和利用信息。信息能力是信息时代人们必备的基本能力之一,是进行终身学习必不可少的能力,是信息素养的核心。信息道德是人们在社会信息活动中形成各种信息行为人之间的行为规范的总和。信息知识的形成是一个动态的过程,随着信息意识、信息能力的提高而深化。三是信息素养的实现。分为主要的实现地点:图书馆;主要的实现环境:www网络、Internet、多媒体、信息社会,等;主要的实现方式:计算机辅助教学、图书馆教学、信息检索、信息交流,等;实现标准:信息素养能力标准、信息素养人的界定标准,等。

2.4.2 信息素养研究前沿及演进路径分析 针对1983-2013年间信息素养研究的题录数据,利用Citespace软件中提供的膨胀词探测(burst detection)技术和算法,通过考察词频的时间分布,将其中频次变化率高的词(burst term)从大量的主题词中探测出来,依靠词频的变动趋势,而不仅仅是频次的高低,来确定信息素养研究的前沿领域和发展趋势[9]。在CiteSpaceII上术语类型选择膨胀词(burst terms),其他设置不变,然后进行膨胀词探测(detect bursts),运行Citespace软件,得到信息素养领域研究前沿的时区视图,如图5所示。

图5 信息素养演进路径及研究前沿

我们探测出膨胀词居于前6位的是:understanding-information(信息理解)、cancer-information(癌症信息)、knowledge-economy(知识经济)、digital-literacy(数字素养)、online-tutorials(在线教程)和researchevidence(证据研究)。此外,还有在线学习、检索策略,等。从图5中,我们可以看出信息素养研究领域主题词变化率最高的是2001年出现的understandinginformation,说明在信息素养研究领域开始重视基于语义网络的信息理解问题。信息理解可以加深对信息素养的判断、理解和深化。2013年美国信息素养月就强调了数字素养整合实践对学生成绩和教师专业发展影响的问题。这些研究前沿反映出信息素养研究顺应时代潮流,基于信息技术和网络环境进行自主学习成为提高公民信息素养的主要途径之一。

3 结论

该文利用CiteSpaceII软件,绘制Web of Science所收录的1983-2013年间30年的信息素养研究题录数据的知识图谱。从时间分布、国家、机构、作者、研究热点、研究前沿等方面进行了可视化分析。结果显示:从2002年开始,信息素养研究文献数量增长较快并逐渐形成规模。世界各国广泛参与信息素养研究,尤其是美国在信息素养研究方面的贡献最大,中国排名第六,各国之间应该加强合作,促进共同发展;在该研究领域,关键作者对信息素养研究及普及做出了突出贡献;另外信息检索、高校图书馆等是研究的热点领域,在研究前沿方面,信息理解的作用日渐凸显。

[1]Spitzer KL,Lowe CA,Eisenberg M B.Information Literacy:essential skills for the information age[M].USA:Libraries Unlimited,1998:13-14

[2]孙平,曾晓牧.面向信息素养论纲[J].图书馆论坛,2005,25(4):8-11,106

[3]陈超美,陈悦,侯剑华,梁永霞(译).CiteSpace II:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009,28(3):403-421

[4]刘则渊,陈悦,侯海燕.科学知识图谱:方法与应用[M].北京:人民出版社,2008:3-5

[5]刘晓波.新世纪十年我国信息素养研究可视化分析[J].现代情报,2013,33(4):159-161

[6]赵勇,沙勇忠.当代情报学研究的知识图谱:基于ACA的分析[J].图书馆论坛,2008,28(6):63-69

[7]张凌.基于CiteSpace的竞争情报研究的可视化分析[J].图书情报工作网刊,2011,(10):1-8

[8]王征清.网络时代的信息素养培养[J].情报科学,2002,20(5):453-455

[9]栾春娟,侯海燕,王贤文.国际科技政策研究热点与前沿的可视化分析[J].科学学研究,2009,27(2):240-243

猜你喜欢
主题词图谱可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
绘一张成长图谱
关键词的提取与确定
基于CGAL和OpenGL的海底地形三维可视化
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
“融评”:党媒评论的可视化创新
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
《中国骨与关节杂志》2016 年第五卷英文主题词索引