2017年国际信息科学与图书馆学研究热点分析

2018-10-30 10:10田大芳魏瑞斌
现代情报 2018年8期
关键词:共词分析研究热点聚类分析

田大芳 魏瑞斌

〔摘 要〕[目的/意义]通过共词分析和聚类分析研究国外2017年信息科学与图书馆学领域的研究热点。[方法/过程]首先从Web of Science收集数据;然后利用HistCite统计关键词频次,确定高频关键词;最后利用VOSviewer对原始数据进行处理,最终得到9个聚类。[结果/结论]研究发现,国外信息科学与图书馆学的研究主题可以归纳为以下9个方面:图书馆管理与服务、用户研究和信息素养;社交媒体、电子商务、电子政务、智慧城市、信息技术和信息安全;文献计量学、科学计量学和替代计量学;开放数据、数据分析、数据质量和数据挖掘等;开放存取、数字人文、数字图书馆和信息检索等;医疗健康信息学;知识管理与开放创新等;公共信息、信息分享、社交网络和政治交流;图书馆情报学教育。

〔关键词〕信息科学与图书馆学;共词分析;聚类分析;研究主题;研究热点

DOI:10.3969/j.issn.1008-0821.2018.08.017

〔中图分类号〕G250 〔文献标识码〕A 〔文章编号〕1008-0821(2018)08-0125-05

〔Abstract〕[Purpose/Significance]This study aimed to explore the research hot topic during 2017 in Information Science & Library Science using the co-words analysis and cluster analysis.[Method /Process]Firstly,the paper collected the raw data from the web of science.Secondly,it counted the frequency of the authors keywords by HistCite.Finally,it used VOSviewer to deal with the data and Generated 9 clusters.[Result/Conclusion]The result showed that there were 9 hot topic which were library management and service,user studies and information literacy;social media,e-commerce,e-government,smart city,information technology and information security;bibliometrics,scientometrics,altmetrics;open data,data analysis,data quality and data mining;open access,digital humanities,digital libraries and information retrieval;health informatics;knowledge management and open innovation;public information,information share,social network and political communication;library and information science education.

〔Key words〕information science & library science;co-words analysis;cluster analysis;research topics;research hot topics

研究熱点是指在一定时期内某一研究领域中,研究人员所共同关注的焦点。研究热点的识别一直是科学计量学等相关研究领域非常关注的问题之一。随着各类数据源的不断丰富,研究工具的便利性和功能性的提升,原有研究方法的改进和新研究方法的涌现,关于学科、主题或某领域的研究热点的研究产生了一系列的研究成果。

从研究方法的角度看,有些学者使用一种文献来识别研究热点。如文献[1-2]利用词频分析方法来识别研究热点;文献[3-5]利用共词分析方法识别研究热点;文献[6-7]利用聚类分析来识别研究热点。有的学者采用多种方法综合使用来识别研究热点。如文献[8-12]使用了至少两种方法来识别研究热点。还有的学者从一些新的视角或理论来进行研究热点识别的研究,如文献[13-17]。目前,大多数的研究热点的研究是以期刊论文数据为基础进行的,也有些学者在研究过程中使用学位论文、科研项目等数据来对某个学科或领域的研究热点进行识别,如文献[18-21]。

关于国外图书情报学研究热点的研究也已经有了一系列成果,如文献[22-29]。这些研究成果对于了解国外图书情报学特定时间段、特定数据范围的情况有较高的参考价值。同时,它们所使用的研究方法和数据源等对于进行相关研究也有一定的指导作用。本文主要对国外2017年信息科学与图书馆学研究热点进行研究,以期国内学者能及时了解国外学术期刊上相关论文的研究主题,为其科研选题等工作提供参考。

1 数据与方法

1.1 数据采集

本文以Web of Science为数据源,在其高级检索中,WC表示Web of Science Category。该分类一共有251个。本文的检索式为:(WC=“Information Science & Library Science”) AND DOCUMENT TYPES:(Article);Indexes=SCI-EXPANDED,SSCI,A&HCI;,CPCI-S,CPCI-SSH,BKCI-S,BKCI-SSH,ESCI,CCR-EXPANDED,IC Timespan=2017。最终获得5 721条记录。在5 721条记录中,有1 575篇论文没有关键词信息。

利用HistCite统计的作者关键词总数为13 535个,出现频次为23 158次,包含关键词的论文的篇均关键词为5.63个。本文仅以包含关键词的论文作为分析对象。

1.2 高频关键词选择

笔者认为,一个研究主题能称之为研究热点,那么表示这个研究热点的专业术语应该要达到一定的频次。本文对研究热点的研究也是基于高频关键词来进行分析的。郭春侠等[25]认为,确定高频词,一般可以采取两种办法:1)研究者根据研究经验主观判断;2)根据齐普夫第二定律,确定高频词界限,这种方法由于比较科学、简单易行而被研究者广泛使用。齐普夫之后,人们对该方法进行了一些改进,其中Donohue于1973年提出了高频词低频词界分公式。但本文根据公式计算后仅有一个关键词符合条件,不能满足本研究的需要。本文根据关键词的词频次排序,取10次以上的228个关键词为高频关键词。它们总的出现频次约占所有关键词出现频次的20%。出现100次以上的分别是Social Media(148次)、Academic Libraries(140次)和Bibliometrics(113次)。Bibliography等37个关键词出现频次为10次。图1为228个高频关键词的频次分布图。从其分布看,整体表现为乘幂分布,趋势线的方程为:y=208.86x-0.558,拟合系数为R2=0.9869。

1.3 数据处理工具与方法

Eck N J V等[30]的介绍了VOSviewer的基本功能及原理,并进行了實证分析。张力[31]等比较VOSviewer和CiteSpace发现,两款软件给出了基本一致的图谱结构,表明两种软件在信息可视化研究中可以相互参验。宗乾进等[32]基于VOSviewer,通过对中国知网中收录的13种图书馆学CSSCI来源期刊文献信息进行挖掘,可视化展示2010年我国图书馆学2010年的研究热点主题。综合来看,VOSviewer比较适合对相关文献研究热点的挖掘。

笔者将Web of Science采集的数据直接导入VOSviewer,然后利用其生成高频关键词(频次大于等于10)共现网络,最后利用其绘图功能生成整体共词网络图(图2)。结合VOSviewer聚类功能看,这些关键词共形成了9个聚类。

潘玮等[33]研究了关键词共现方法识别领域研究热点过程中的数据清洗方法。但从他们脏数据产生的原因来看,其方法对于本文的研究参考价值不大,因为其方法实际主要是从词的形式上的一种清洗。在对图2的共词网络及聚类结果进行分析时,更多的是要从词的语义层面进行分析。

结合原始数据看,这些高频词当中,有些高频词并不能表示一个研究主题。本文将这些词归纳为:1)表示国家或地区的关键词,如China、Spain和Australia等。2)表示研究方法的词,如Citation Analysis、Social Network Analysis和Qualitative Research等。3)表示数据源的词,如TWitter、Facebook和Web of Science等。4)表示研究对象的词。如Academic Libraries、Public Libraries和University Libraries等。5)表示研究背景的词。如Web2.0、Internet of Things和Big Data。6)意义比较宽泛的词。如Assessment、Leadership和Learning等。这些词一共有117个,占高频词总体的51%。这些词在聚类分析过程中,都会提及。在归纳研究主题时,主要以除以上6类外的词为主,结合关键词共现,适当使用一些泛词。

2 基于高频词聚类的信息科学与图书馆学研究热点研究

2.1 图书馆管理与服务、用户研究和信息素养

第1个聚类一共包括了37个关键词。从关键词来看,这个聚类的研究可以分为两个小类。一是图书馆的管理与服务的相关研究。图书馆的类型涉及学术图书馆(156次)、公共图书馆(54次)、大学图书馆(42次)和图书馆(37次),管理内容涉及图书馆管理、组织文化、馆藏管理、馆员学习战略、信息资源建设等。图书馆服务涉及服务内容、服务质量的评价等;二是用户研究。用户研究是围绕用户的信息行为、信息需求、信息查找、信息素养、用户满意度等。在该聚类中,Institutional Theory(制度理论)出现了10次,这反映了相关研究共用的一个理论基础。Empirical Study(实证研究,11次)是该聚类中唯一表示方法的关键词,这反映出该聚类的研究比较多的使用了该方法。在相关研究中,以土耳其、巴基斯坦和尼日利亚3个国家的公共图书馆、大学图书馆和学术图书馆为实证对象。总体看,该聚类的研究都属于图书馆学研究的范畴。

2.2 社交媒体、电子商务、电子政务、智慧城市和信息技术和信息安全等

该聚类一共有34个关键词。从研究内容看,该聚类的研究主题较多。如Web2.0环境下在线交流的用户内容生成、云计算和物联网环境下的智慧城市建设、信息技术与信息安全、技术接受和扩散、社会科学的研究伦理、公民管理、图书情报学教育等主题。该聚类涉及的研究方法有Case Study(31次)和Ethnography(15次)。相关研究中涉及较多的数据源是Wikipedia(37次)和Facebook(17次)。涉及的国家和地区是India(39次)和China(21次)和Developing Countries(17次)。总体看,该聚类属于信息科学研究范畴,相关研究与管理学有一定的交叉。

2.3 文献计量学、科学计量学和替代计量学

该聚类一共有32个关键词。从其研究内容看,研究比较多的首先是科学合作问题,具体涉及到国际合作、跨学科合作、研究合作等;第二个主题是科研评价;第三个主题是电子资源的社会影响。这个聚类中出现的比较多是研究方法,如Citation Analysis(59次)、Social Network Analysis(37次)、Content Analysis(26次)、Network Analysis(19次)和Structural Equation Modelling(10次)。评价指标涉及Impact factor(16次)、Research Impact(14次)和h-index(13次)。研究过程中使用较多的数据源是Web of Science(33次)、Scopus(21次)和Google Scholar(12次)。总体看,该聚类的研究非常集中,与其它聚类研究的差别非常明显,个性比较突出。

2.4 开放数据、数据分析、数据质量和数据挖掘等

该聚类一共有27个关键词。从其研究内容看,主要是围绕“数据”展开。其研究对象涉及研究数据、电子健康记录和开放政府等。研究主题包括了数据分析、数据挖掘、数据质量、数据分享、数字可视化、大数据、记录管理、绩效评价、临床决策支持等。该聚类还涉及了自然语言处理、机器学习、健康信息技术、分类、聚类、算法、混合方法等具体的方法和技术。该聚类中出现较多的国家是Mexico(10次)。总体看,该聚类的研究与计算机科学的交叉较多,领域研究偏向于医疗信息学。

2.5 开放存取、数字人文、数字图书馆和信息检索等

该聚类一共有27个关键词。从研究内容看,该聚类研究主题相对丰富。其主要是围绕数字图书馆、开放存取、机构知识库、数字化保存、关联数据、用户体验和信息检索展开。在相关研究中涉及元数据、人机交互、语义分析、文本挖掘、本体等方法和技术。该聚类中出现较多的是地区和国家是Africa( 18次)和Brazil(15次)。总体看,该聚类的研究宏观上研究了数字化和开放存取对学术交流和科学交流的影响,微观层面研究了数字图书馆、开放存取和信息检索的技术环节。

2.6 医疗健康信息学

该聚类一共有27个关键词。从研究内容看,该主题涉及心理健康与疾病、卫生保健、健康、决策支持等,研究的对象有女性和青年人。采用的研究方法包括定性研究、扎根理論、访谈、主题分析和话语分析等。另外,该聚类中出现较多的国家和地区包括了美国、加拿大、北美、欧洲、澳大利亚Australia(26次)、Canada(15次)、Europe(15次)、United States(13次)和North America(10次)。总体看,该聚类的研究领域集中在医疗健康领域,专业性非常明显,采用最多的研究方法是定性研究(117次,该聚类中出现次数最多的关键词)。

2.7 知识管理与开放创新等

该聚类有18个关键词。从研究内容看,主要是围绕知识管理、知识转移、知识分享和技术接受等展开。在这些相关研究中涉及合作、信息系统、信息技术、组织文化、高等教育等领域。该聚类中涉及的国家South Africa(12次),没有明显的研究方法和数据源等关键词。总体看,该聚类的研究主题与管理学存在一定的交叉。

2.8 公共信息、信息分享、社交网络和政治交流

该聚类有17个关键词。从研究内容看,其研究主题主要是围绕网络环境下的信息分享、基于社交网络的政治交流。这个聚类中还出现了Scientific Production(19次)、Journalism(12次)、Elections(10次)和Media(10次)。该聚类涉及的数据源是Twitter(52次),研究方法是调查法(Survey,14次),涉及的理论是认识论(Epistemology,10次),出现的国家是Spain(32次)。总体看,该聚类是以信息分享与交流为中心,研究主题与新闻传播学领域有交叉。

2.9 图书馆情报学教育

该聚类只有5个关键词。从研究内容看,主要是围绕图书情报学教育的多样性和包容性展开。有10篇论文的关键词中同时包含了Library and Information Science和Education。这些论文的研究角度各不相同。如Derakhshan M等[34]使用2000年ACRL标准作为框架,利用半结构化访谈,研究了如何通过提升信息素养来应对图书情报学领域面临的挑战。Lee J等[35]利用Kram和Isabella在组织关系中提出的同伴关系框架研究了图书情报学博士生的同伴关系。Golub K等[36]基于组织象征主义理论和加入Ischool的意图,分析了丹麦、挪威和瑞典3所加入Ischool高校的意图,比较了它们与美国三所Ischool高校的427个硕士课程大纲。

3 结 论

本文以Web of Science 2017年Information Science & Library Science的Article论文为研究对象,以4 146篇论文的高频关键词进行了聚类分析。从聚类规模看,第1、2、3;第4、5、6;第7、8的规模相当,第9个聚类规模较小。与以往相关成果相比,本文在聚类结果分析前,对关键词进行了分类,这种分类有利于最终研究主题的归纳。但由于是人工完成,具有一定的主观色彩。从聚类结果看,第1、3、4、6、7和9共6个聚类的特色比较明显,其它3个聚类结果中涉及的研究主题较多。这在一定程度上反映了相关研究的集中性与分散性;从聚类的内容看,第1、3、7和9都是比较传统的图书情报学研究主题,其它研究主题则与计算机科学、管理学、医学和新闻传播学等有一定的交叉。这反映了信息科学与图书馆学研究主题一方面具有稳定性,同时在与其它学科交叉的过程中,也丰富了其研究主题,体现了一定的包容性。从表示国家或地区的关键词看,有些研究主题具有较为明显的地域性特征。

随着人工智能、大数据、虚拟现实等技术的迅猛发展,信息科学和图书馆领域将迎来一些新的机遇和挑战。结合本文的研究结果和ASIS&T;在2017年10月在华盛顿召开的学术年会的相关信息等内容看,未来几年内,替代计量学、社区信息学、数字人文、健康信息学、人机交互、社交媒体、信息伦理、知识转移、信息行为、信息检索、用户体验等将是国外信息科学与图书馆学领域重点关注的研究主题。

参考文献

[1]巩永强,刘莉.基于词频分析法的情报学研究热点透析[J].图书馆学研究,2011,(13):9-13.

[2]储节旺,钱倩.基于词频分析的近10年知识管理的研究热点及研究方法[J].情报科学,2014,32(10):156-160.

[3]Van Den Besselaar P,Heimeriks G.Mapping Research Topics Using Word-reference Co-occurrences:A Method and an Exploratory Case Study[J].Scientometrics,2006,68(3):377-393.

[4]Sugimoto C R,McCain K W.Visualizing Changes Over Time:A History of Information Retrieval Through the Lens of Descriptor Tri-occurrence Mapping[J].Journal of Information Science,2010,36(4):481-493.

[5]李武,董伟.国内开放存取的研究热点:基于共词分析的文献计量研究[J].中国图书馆学报,2010,36(6):105-115.

[6]闵超,孙建军.学科交叉研究热点聚类分析——以国内图书情报学和新闻传播学为例[J].图书情报工作,2014,58(1):109-116.

[7]徐春浪,汪天皎.我国学生评价研究热点聚类分析及其知识图谱——基于CNKI 684篇核心期刊文献的关键词共词分析[J].教育理论与实践,2016,36(31):35-39.

[8]Chen C,Ibekwe-Sanjuan F,Hou J.The Structure and Dynamics of Co-citation Clusters:A Multiple-perspective Cocitation Analysis[J].Journal of the American Society for Information Science & Technology,2010,61(7):1386-1409.

[9]Chang Y W,Huang M H.A Study of the Evolution of Interdisciplinarity in Library and Information Science:Using Three Bibliometric Methods[J].Journal of the American Society for Information Science and Technology,2012 63(1):22-33.

[10]劉晓波.我国图书馆学研究热点及趋势:基于关键词共现和词频统计的可视化研究[J].图书情报工作,2012,56(7):62-67.

[11]张幸,华薇娜.近二十年国际智能代理领域研究热点分析——基于共词分析和社会网络分析[J].现代情报,2014,34(9):133-140.

[12]皇甫青红,华薇娜,刘艳华,等.国际数字图书馆领域研究热点及作者团体分析——基于共词分析和社会网络分析[J].情报杂志,2013,32(1):118-123.

[13]孙建军.链接分析:知识基础、研究主体、研究热点与前沿综述——基于科学知识图谱的途径[J].情报学报,2014,33(6):659-672.

[14]王知津,李博雅.近五年我国情报学研究热点动态变化分析——基于布拉德福定律分区理论[J].情报资料工作,2016,(3):34-40.

[15]刘自强,王效岳,白如江.基于时间序列模型的研究热点分析预测方法研究[J].情报理论与实践,2016,39(5):27-33.

[16]赵雅馨,杨志萍.研究热点探测的替代计量学方法和应用——以信息与计算科学为例[J].情报杂志,2016,35(11):39-44.

[17]尚晓倩.基于突变检测的国际Altmetrics研究热点和趋势分析[J].情报科学,2017,35(5):51-56.

[18]孙晓宁,储节旺.近十年知识管理领域硕博士学位论文研究热点分析——以共词分析为方法[J].情报杂志,2012,31(6):85-90.

[19]李长玲,翟雪梅.基于硕士学位论文的我国图书馆学与情报学研究热点分析[J].情报科学,2008,(7):1056-1060.

[20]刘孝文.试论我国图书馆学研究热点及走向——基于国家社科基金课题指南和研究生培养方向的分析[J].情报资料工作,2007,(1):30-33.

[21]王晴.国内图书馆学学科研究热点透视与特征分布——基于2012年国家社科基金项目及课题指南的统计分析[J].新世纪图书馆,2013,(2):15-18,58.

[22]王英,马海群.美国情报学研究热点管窥——基于BASIST的词频统计[J].情报理论与实践,2009,32(9):125-128.

[23]柯平,贾东琴,李廷翰.2010年国外图书馆学情报学研究热点分析[J].情报科学,2011,29(9):1281-1288,1293.

[24]赵蓉英,马丽娜.国际情报学核心期刊与研究热点的可视化分析[J].情报科学,2011,29(8):1238-1243.

[25]郭春侠,叶继元.基于共词分析的国外图书情报学研究热点[J].图书情报工作,2011,55(20):19-22.

[26]邱均平,吕红.近五年国际图书情报学研究热点、前沿及其知识基础——基于17种外文期刊知识图谱的可视化分析[J].图书情报知识,2013,(3):4-15,58.

[27]刘自强,岳丽欣,王效岳,等.主题演化视角下的国际情报学研究热点与前沿分析[J].图书馆,2017,(3):14-22.

[28]Milojevic S,Sugimoto C R,Yan E,Ding Y.The Cognitive Structure of Library and Information Science:Analysis of Article Title Words[J].Journal of the American Society for Information Science and Technology,2011,62(10):1933-1953.

[29]Bauer J,Leydesdorff L,Bornmann L.Highly Cited Papers in Library and Information Science(LIS):Authors,Institutions,and Network Structures[J].Journal of the Association for Information Science and Technology,2015,67(12):3095-3100.

[30]Eck N J V,Waltman L.Software Survey:VOSviewer,a Computer Program for Bibliometric Mapping[J].Scientometrics,2010,84(2):523-538.

[31]张力,赵星,叶鹰.信息可视化软件CiteSpace与VOSviewer的应用比较[J].信息资源管理学报,2011,(1):95-98.

[32]宗乾进,袁勤俭,沈洪洲.基于VOSviewer的2010年中国图书馆学研究热点分析[J].图书馆,2012,(4):88-90.

[33]潘玮,牟冬梅,李茵,等.关键词共现方法识别领域研究热点过程中的数据清洗方法[J].图书情报工作,2017,61(7):111-117.

[34]Derakhshan M,Hassanzadeh M,Higgins S E,et al.The Pedagogical Challenges of Creating Information Literate Librarians[J].Library Review,2017,66(2):570-583.

[35]Lee J,Anderson A,Burnett G.Peer Relationships and Mentoring Between LIS Doctoral Students:A Qualitative Approach[J].Journal of Librarianship & Information Science,2017,49(1):115-124.

[36]Golub K,Hansson J,Selden L.Cult of the“I”:Organizational Symbolism and Curricula in Three Scandinavian iSchools with Comparisons to Three American[J].Journal of Documentation,2017,73(1):48-74.

(責任编辑:陈 媛)

猜你喜欢
共词分析研究热点聚类分析
近五年我国职业教育研究热点综析及未来展望
自闭症谱系障碍儿童的教育干预
基于社会网络分析的我国微课研究探析