数据科学时代,情报学快速发展,学科研究文献数量迅速增长。科学研究目的在于提出前沿的看法而引导人类向前迈进,以及探讨当前遇到的问题并提出解决方案[1]。“论文”是科学研究成果产出中极为重要的形式,故“论文”也是情报学研究成果极为重要的表现方式。情报学学者历来重视学科的回顾与展望,Figuerola、Ivanovic D、Olmeda-Gomez、周鑫、赵蓉英等分别从不同角度及主题对国际情报学领域研究论文进行统计分析[2-6]。大数据、云计算、物联网等“互联网+”环境下新一代信息技术的发展,为情报学科的自身发展、情报学科的跨界及与其他学科的融合发展带来了新的历史机遇[7]。
为洞悉近5年情报学研究态势,本文综合考虑查全率、查准率、可视化布局等有关因素,优化行文结构,保留定量结构,挖掘内容特征,以多样化的知识图谱进行国际情报学领域研究分析,以期回答三方面的研究问题:(1)近5年国际情报学研究高影响力作者如何分布?(2)近5年国际情报学研究高被引文献有哪些?(3)近5年国际情报学研究热点内容是什么?希望本文的研究能有助于相关学者把握情报学领域研究前沿。
在研究方法的选择上,与其他研究者所不同的是,本文将洛特卡定律、社会网络分析、内容分析等方法进行了综合使用,以期对国际情报学领域研究论文进行全面的分析与解读,充分借助文献的内、外部特征,并采用数学与统计学的方法,通过绘制科学知识图谱来揭示该领域的知识结构、知识特征和研究热点。
通过WOS中期刊引用报告(Journal Citation Reports,JCR),笔者检索到2016年(2017年尚未公布)在“Information Science&Library Science”类目中被收录的85种期刊。以期刊五年影响因子降序排列,根据期刊分布存在的“二八定律”,选取85种期刊中前20%,即17种最具影响力的权威期刊来揭示国际情报学近5年研究态势(由于前17种期刊都为情报学类刊物,故无需进行情报学专业期刊挑选,见表1)。在WOS核心集数据库,对17种刊物依次输入出版物名称并用布尔逻辑“OR”连接,时间设置为2012-2016年,文献类型选择“Article”或“Review”,共检索到4686条文献记录(每条文献记录包括题目、作者、关键词、摘要、参考文献等信息)。
表1 国际情报学领域TOP17高影响力期刊
在工具使用上,结合各软件优势,选取多种软件来为本文研究做辅助工作。首先,使用Cite Space IV和Netdraw软件进行可视化分析,利用Excel、UCINET、SATI、BICOMB等软件,对数据库收录的情报学研究论文进行统计分析。然后,基于文献计量学的理论规律和分析方法,通过绘制科学知识图谱,分别对相关文献进行揭示与解读。
根据广义洛特卡定律的文字表述[8-9],在某一时间内,写了x篇论文作者总数的比例与其撰写论文数x的平方成反比关系,即f(x)=C/xn。其中f(x)为写x篇论文的作者占作者总数的百分比,x为论文篇数,C,n为某主题领域的特征常数,C值范围为0.6079-0.8276,n值范围为2-3。根据该定律可分析出近5年情报学领域作者分布的特点和规律,表2为情报学相关文献作者频次的分布。从表2可以看出,2012-2016年共有11199位作者(含第二、三作者)发表情报学相关研究论文。其中,发表1篇论文的作者为8802人,约占78.60%,满足洛特卡定律文字表述中参数C的范围。发表2篇文章的作者1421人,约占12.69%。随着频次的增加,同一频次的作者数量逐渐减少。作者频次在3篇及以上的不到9%,说明国际情报学相关研究论文作者分布十分广泛,研究具有“百家争鸣”的特点,情报学文献的分布呈现明显的集中和离散趋势。一方面,多数作者集中在频次低的范围;另一方面,大部分的文献由少数高产作者撰写,而小部分的文献由其他大量频次低的作者所撰写。
表2 近5年情报学相关论文作者频次
根据洛特卡定律的图像描述,设x为一位作者撰写的论文数量,y为撰写x篇论文的作者数量。将x与y分别求对数,根据作者频次分布数据,绘制散点图,利用Excel对其进行曲线拟合,得到作者频次的近似分布规律。图1为近5年国际情报学研究论文作者的频次分布规律(洛特卡分布曲线)。图1中拟合直线的拟合优度R2为0.96,可见拟合效果良好,lgy与lgx呈良好的线性关系,近5年国际情报学研究论文作者的频次分布符合洛特卡定律。拟合直线斜率为-3.0101,因此n近似值为3,满足洛特卡定律文字表述中参数n的范围。作者频次(作者产出)的近似分布规律为:lgy=-3.0101lgx+4.0298(由于横纵坐标取对数,故图中公式y=lgy,x=lgx)。
为了界定近5年情报学研究的核心学术团体,了解本学科研究者的合作情况以及高被引情况,本文对其合作网络及共被引网络做了进一步分析。将情报学相关研究论文题录及引文信息从WoS数据库导出后,首先,利用BICOMB软件对题录信息进行格式转换,抽取作者字段(包括第二、第三等所有作者)、统计作者频次,生成作者共现矩阵(矩阵规模取值149*149,发文量大于8篇的前149名作者),利用UCINET软件生成.##h格式的作者共现文件,使用可视化软件Netdraw绘制近5年国际情报学相关研究发文作者共现知识图谱(见图2);其次,利用CiteSpaceIV软件,以1年为时间线,选择被引作者节点,生成作者共被引知识图谱(见图3)。同时,本文运用Excel统计得到,近5年国际情报学相关论文的高产作者及高被引作者的Top10分布情况(见表3、4)。
在图2中,节点是以点度中心性的大小进行可视化,由此来展现各节点在网络中的重要程度,其中,将节点采用不同的形状来做进一步区分。由图2可知,从作者共现整体网络结构来看,作者合作网络较为紧密,互动性效果较好。近5年国际情报学研究拥有多个合著子群(研究团 体 ), 诸 如 以 Denny, Joshua C、 Bates,David W、Chute,Christopher G、Pacheco,Jennifer A、Peissig,Peggy L、 Rasmussen,Luke V等为核心的学术研究团队。同时,由表3可知,近5年国际情报学研究领域发文量最多的是来自美国的Bates,David W(31篇),发文量排名第二和第三的分别是德国的Bornmann,Lutz和意大利的Abramo,Giovanni。
表3 近5年情报学相关论文Top10高产作者
表4 近5年情报学相关论文Top10高被引作者
由图 3可知,Venkatesh V、Fornell C、Orlikowski WJ、Gefen D、Podsakoff PM、Davis FD、Eisenhardt KM、Chin WW、Nonaka I等高被引作者,在整个共被引网络中,具有较高影响力,成为情报学各细分研究方向的关键人物,引领情报学学科不断向前发展。同时,由表4可知,近5年国际情报学研究领域被引频次最多的是来自美国马里兰大学的Venkatesh V(471次),被引频次排名第二和第三的分别是美国密歇根大学的FornellC和麻省理工大学的OrlikowskiWJ。
结合表3和表4可以发现,情报学领域高产作者和高被引作者主要来自于美国,并长期占据绝对优势的地位,具有较高的国际影响力。此外,德国、意大利、英国、日本等国家由于汇集了Bornmann,Lutz、Abramo,Giovanni、D'Angelo,Ciriaco Andrea、Thelwall,Mike、Nonaka I等一批高产或具有高被引作者特征的杰出学者,使得其在国际情报学研究领域影响力不断提升。
被引频次往往能反映出文献受关注程度和学术影响力。通常高被引文献中传递的知识在某一时间内易受到学者的认同,同时学者们会将这些高被引文献所传递的知识、观点作为下一步研究的知识基础。因此,分析高被引文献对情报学研究具有重要的参考价值。设置CiteSpace参数,节点选择被引作者,生成文献共被引知识图谱(见图4)。图中连线代表文献共同被引用的关系,节点的大小代表文献被引用的频次,不同颜色的年轮圈表示文献在不同年份被引用的情况。其中,带有红色的节点表示近5年词频变动较大的爆发词,即近5年该文献被引频次迅猛增多,在一定程度上说明该文献是近5年情报学某新兴研究领域重要的知识基础来源。
结合图4对高被引文献进行统计分析,并研读相关文献,重点阐述TOP10高被引文献。第一篇是2007年Petter S等的Specifying Formative Constructs in Information Systems Research,对信息系统结构构建常见的错误做了讨论,提出路线图来说明如何避免该错误,还讨论了在特定模型中的信息系统构建。第二篇是2007年Liang HG等的Assimilation of Enterprise Systems:The Effect of Institutional Pressures and the Mediating Role of Top Management,开发和测试一个理论模型来研究后期实施阶段企业系统的同化,发现制度压力与高层管理人员对信息技术的同化产生重要影响。第三篇是2010年Kaplan AM等的Users of the world,unite!The challenges and opportunities of Social Media,讨论了社交媒体的概念及其与Web2.0、用户日志的区别,划分了社交媒体的类型,提出公司利用社交媒体的10条建议。第四篇是2009年 Yin R K的 Case Study Research:Design and Methods,讲述案例研究的设计与方法,是一本经典的案例研究丛书。第五篇是2008年 Orlikowski WJ等的 Sociomateriality:Challenging the Separation of Technology,Work and Organization,通过调研文献发现,95%的高级管理机构未考虑到信息技术在组织生活中的作用,接着根据其技术观将这些文献分为两个流派:离散集合和依赖集合,并进行了实证研究,最后发现组织工作与信息技术不可分离,信息技术和社会活动之间存在不可分割的关系。第六篇是2010年Blumenthal D 等的 The“Meaningful Use”Regulation for Electronic Health Records,介绍了电子健康档案在美国的重要性、实施效果,回顾并总结了公民对该电子健康档案制度的看法,最后提出信息驱动医疗,呼吁供应商和消费者重视医疗信息资源,更好服务于病人。第七篇是2010年Hair J F等的Multivariate Data Analysis(6th edition),重点讲解多元数据分析的概念,侧重于实际应用,如市场调研、研究设计和数据分析。第八篇是2010年Bertot J C等的Using ICTs to create a culture of transparency:E-government and social media as openness and anti-corruption tools for societies,探讨了信息和信息通信技术的潜在影响,尤其是对电子政务和社会媒体的影响,并指出可利用信息和通信技术创造文化的透明度,信息和通信技术是电子政务和社会媒体作为社会开放性和反腐败的工具。第九篇是2005年Hirsch JE的An index to quantify an individual's scientific research output,提出了h指数,作为表征科研人员科研成果的一种有用的评价指标。第十篇是2007年Pavlou PA等的Understanding and Mitigating Uncertainty in Online Exchange Relationships:A Principal-Agent Perspective,以委托代理理论提出一套含有四个不确定性因素(用户、网站信息、产品特征和社会风气)的模型,并进行实证调研,以此来减轻在线交流关系中的不确定性问题。以上高被引文献为近5年国际情报学相关领域研究奠定了坚实的理论与方法基础,并为其发展指明了方向,是重要的知识基础来源。
关键词是对论文主题的高度概括和凝练,统计分析近5年情报学研究发表论文中关键词出现频次及其相互关系,可对该领域的研究热点分布情况作出清晰揭示。基于获取的数据统计得到近5年情报学研究论文的关键词总计12563个,总频次为24471次。表5为近5年情报学Top20高频关键词及其点度中心性。频次最高且点度中心性最大的是知识管理(knowledge management)、其次是社交媒体(social media)、知识共享(knowledge sharing)等。
表5 近5年情报学Top20高频关键词(频次≥46)
为了更加直观展示本领域研究内容(关键词),探测研究热点,利用Netdraw软件,绘制关键词共现知识图谱(见图5)。图5中节点以点度中心性的大小展现出来,同时可发现近5年国际情报学研究涉及面广、内容丰富,主要分八大研究维度:管理、信息、医疗卫生、社交媒体、知识、技术、电子政务、理论与方法,对应图5中的A、B、C、D、E、F、G、H八个子聚类群。
(1)管理维度。A聚类是有关管理维度的热点词汇,包括performance(绩效)、management(管理)、innovation(创新)、collaboration(合作)、participation(参 与 )、 motivation( 动 机 )、productivity(生产力)、organizational(组织化)、transparency(透明度)、crowdsourcing(众包)、public sector(公共部门)、absorptive capacity(吸收能力)等,这些词是情报学研究管理学派的反映。Fitoussi D等运用契约理论研究信息技术外包合同中目标和激励机制的关系,并对信息技术外包合同中的绩效进行了测度[10]。Schmeil A等设计了在虚拟世界合作的结构化方法,通过案例描述了如何在虚拟世界中合作学习[11]。
(2)信息维度。B聚类是有关信息维度的热点词汇,包括information(信息)、information systems(信息系统)、information sharing(信息共享)、information management(信息管理)、data(数据)、information security(信息安全)等,这些词是情报学研究信息学派的反映。Saparova D等指出在线共享空间是具有共同利益的人相互交流以达到共同目标或为个人追求而借用彼此专长的目的地,并对信息管理工具及在线共享空间的设计和开发提出了建议[12]。Silva MM等提出一种信息安全风险管理方法,对信息和系统、通信安全、基础设施、安全管理和信息系统开发5个方面作了分析,发现影响信息安全风险最重要的方面是通信安全,其次是基础设施[13]。
(3)医疗卫生维度。C聚类是有关医疗卫生维度的热点词汇,包括Electronic/electronic health records(电子健康记录)、healthcare(医疗保健)、health(健康)、health information technology(医疗信息技术)、security(安全)等,这些词是情报学研究医疗卫生领域的反映。该维度是既包含医学,又包含信息技术的交叉学科研究领域。Caban,JJ等对医疗保健领域研究进行了可视化分析,总结该领域面临的机遇与研究挑战[14]。Demirezen EM等基于三方博弈模型,研究医疗信息提供者进行医疗信息交换和参与程度可持续性问题[15]。
(4)社交媒体维度。D聚类是有关社交媒体维度的热点词汇,包括social media(社交媒体)、social networks(社交网络)、social capital(社会资本)、Facebook(脸书)、Twitter(推特)、Web 2.0(网络 2.0)、network(网络)、communication/diffusion(传播)、online communities(网络社区)、digitaldivide(数字鸿沟)、socialnetworking sites(社交网站)等,这些词是情报学研究社交媒体领域的反映。Lovejoy K等调查了美国100个最大的非营利组织的Twitter使用情况,结果发现,虽然微博的信息使用范围很广泛,但是非营利组织更擅长通过使用Twitter进行沟通、交流,从而吸引利益相关者[16]。Cavusoglu H等评估了隐私控制对Facebook内容共享和信息披露的影响[17]。
(5)知识维度。E聚类是有关知识维度的热点词汇,包括knowledge management(知识管理)、 knowledge sharing(知识共享)、knowledge(知 识 )、 knowledge transfer(知 识 转 移 )、knowledge creation(知识创造)等,这些词是情报学研究知识学派的反映。MantymakiM等以知识管理的视角对如何从企业社会网络中获取有用价值进行了研究[18]。Chen L等运用系统动力学方法来进行知识管理绩效评价,并通过仿真预测知识管理战略的发展及演变[19]。
(6)技术维度。F聚类是有关技术维度的热点词汇,包括technology(技术)、cloud computing(云计算)、big data(大数据)、software(软件)、technology adoption(技 术 采 纳 )、 natural language processing(自然语言处理)、structural equation modeling(结构方程模型)、model(模型 )、 open source software( 开 源 软 件 )、ontology(本体)、technology acceptance(技术接受)、machine learning(机器学习)、data mining(数 据 挖 掘 )、 text mining(文 本 挖 掘 )、 usergenerated content(用户生成内容)等,这些词是情报学研究技术学派的反映。半个多世纪以来,情报学界一直致力于解决信息飞速增长与难以获取有用信息的矛盾,最早可以追溯到1945年,“信息科学之父”“NSF之父”Vannevar Bush在大西洋月刊发表As We May Think(诚如所思)一文中首次谈到用不断出现的信息技术来协助人类管理和利用信息的思路,可见技术学派在情报学领域一直占据十分重要的地位[20]。Venkatesh V等结合接受理论和技术使用理论,研究了消费者对技术的接受和使用情况[21]。
(7)电子政务维度。G聚类是有关电子政务维度的热点词汇,包括e-government(电子政务)、governance(治理)、government(政府)、open government(开放政府)、IT governance(IT 治理)、open data(开放数据)、business value of IT(IT 商业价值)、business intelligence(商业智能)、E-commerce(电子商务)等,这些词是情报学电子政务领域的反映。Stefanovic D等从政府雇员角度出发,应用结构方程模型对塞尔维亚市154个电子政务系统的员工进行了问卷调查,发现了影响电子政务系统成功的因素[22]。Veljkovic N等利用美国政府开放数据门户网站(data.gov)提供的数据,从开放数据的角度提出了开放政府的基准和应用建议[23]。
(8)理论与方法维度。H聚类是有关理论与方法维度的热点词汇,包括bibliometrics(文献计量学)、theory(理论)、socialnetwork analysis(社会网络分析)、citation analysis(引文分析)、research evaluation(研究评价)、quality(质量)、scientometrics(科 学 计 量 学 )、 qualitative research(定 性 研 究 )、methodology(方 法论 )、institutionaltheory(制度理论)、grounded theory(扎根理论)、h-index(h 指数)、citation(引文)等,该维度主要侧重于计量与评价、定性研究、制度理论及扎根理论等领域的研究。Bornmann L等探讨了文献计量学中有效引用与无效引用的特点[24]。Aksnes DW等通过实证介绍国家引证指标整体计数和非整数计数两种不同的方法,表明在国家层面计算相对引文指标,使用非整数计数更为常见,也更具有说服力[25]。
基于定量与定性相结合的研究方式,本文从文献计量学角度,利用知识图谱工具对近5年国际情报学研究态势作了全面分析。(1)发现了情报学研究的高影响力作者:近5年国际情报学研究的论文作者的频次分布符合洛特卡定律,近似分布规律为:lgy=-3.0101lgx+4.0298;核心队伍的领军人物有Denny,Joshua C、Bates,David W、Chute,Christopher G、Pacheco,Jennifer A、Peissig,Peggy L、Rasmussen,Luke V等学者;高产作者有Bates,David W、Bornmann,Lutz、Abramo,Giovanni、Denny,Joshua C、D'Angelo,Ciriaco Andrea等学者;高被引作者有 Venkatesh V、Fornell C、OrlikowskiWJ、Gefen D、Podsakoff PM等学者。(2)核实了情报学研究的10篇高被引文献,这些文献为国际情报学研究奠定了坚实的理论与方法基础,并为其发展指明了方向,是重要的知识基础来源。(3)剖析了情报学研究热点,主要包括管理、信息、医疗卫生、社交媒体、知识、技术、电子政务、理论与方法八个维度。
综上,国际情报学发展与时俱进,取得了丰硕成果,对于我国情报学发展具有一定的借鉴意义。学科交叉、技术应用、深度需求等仍会是未来情报学学科发展的重要作用因素。大数据、云计算、物联网等“互联网+”环境下新一代信息技术的发展,为情报学科的自身发展、情报学科的跨界及其与其他学科的融合发展带来了新的历史机遇。基于此,我国情报学发展首先应选择和培养一批不仅具备情报学学科基础,同时也了解情报学依附和融合的相关学科知识的情报学理论研究人才,注重以情报学为主,以计算机科学、数据科学、医学信息、管理学等相关领域为辅的多学科交叉研究。其次,鼓励研究者尝试将新一代信息技术应用于情报学理论研究和实践研究中,同时应当注重建设既与国际接轨又独立自主的情报学学科体系。再次,鼓励定量与定性分析进一步结合,鼓励信息技术突破、推动情报分析和利用的发展。早在1980年代,著名情报学家布鲁克斯就指出:“情报学如果不实现定量化,它将是一堆支离破碎的技艺,而不会成为科学”。信息技术为情报分析提供了新的研究方向。然后,2017年6月《情报法》的颁布使情报工作有法可依,为我国情报学学科发展、科技情报工作的展开提供了法律保障。因此,我国情报学发展,不仅要大力提高社会对情报学的重视程度和研究人员的素质,还要大力发展我国情报学的核心理论、方法和技术,完善情报学教育内容与机制。最后,我国情报学研究者,除在原有情报领域展开研究外,还可以结合我国国民经济和社会发展的重要产业领域和社会发展的民生问题,开展情报工作的延展性和纵深化研究[7],在学科及研究方法的交叉融合中、在与国外研究者的交流合作中更好地实现情报学科研创新。