国际科学合作领域主流学术团体与代表人物分析

2012-04-29 06:07侯剑华
现代情报 2012年1期
关键词:信息可视化

侯剑华

〔摘 要〕在美国ISI的Web of Science网络平台检索数据库中,以Topic=(″Scien* collaborat*″or″Scien* cooperat*″or″research collaborat*″or″research cooperat*″)为检索式进行检索,对下载的文献数据进行信息可视化分析。基于作者共被引分析方法,使用CiteSpace可视化软件绘制作者共被引网络科学知识图谱,探测科学合作领域研究中的主流学术团体和代表人物。国际科学合作研究领域的代表性人物主要有Newman M.,Katz J.,Glanzel W.,Barabasi A.,Beaver D.,Luukkonen T.,Narin F.,Watts D.,Albert R.,Price D.等。主流学术团体主要包括:以Beaver D.,Luukkonen T.等为代表的科学合作基础理论和应用研究;以Newman M.,Barabasi A.等为代表的科学合作网络研究;以Bozeman B.,Etzkowitz H.为代表的科学产出绩效研究;以Merton R.等为代表的科学社会学问题研究等。

〔关键词〕科学合作;信息可视化;作者共被引分析;CiteSpace;科学计量

DOI:10.3969/j.issn.1008-0821.2012.01.021

〔中图分类号〕G301 〔文献标识码〕A 〔文章编号〕1008-0821(2012)01-0084-08

Visual Analysis on Scholarly Group and Representatives

of International Scientific CollaborationHou Jianhua

(1.School of Humanities,Dalian University,Dalian 116622,China;

2.Business Administration Academy,Dalian University of Science and Technology,Dalian 116024,China)

〔Abstract〕This paper made visual analysis on the data that retrieved from Web of Science of ISI by Topic=(″Scien* collaborat*″or″Scien* cooperat*″or″research collaborat*″or″research cooperat*″).The author detected the scholarly group and representatives of international scientific collaboration using the software CiteSpace based on author co-citation analysis.The representatives in this domain were mainly Newman M.,Katz J.,Glanzel W.,Barabasi A.,Beaver D.,Luukkonen T.,Narin F.,Watts D.,Albert R.,Price D.and so on.On the other hands,the scholarly group were mainly the research on theory and application of scientific collaboration represented by Beaver D.and Luukkonen T.;the research on scientific collaboration network represented by Newman M.,Barabasi A.;the research on sociology of science represented by Merton R.

〔Key words〕scientific collaboration;information visualization;author co-citation analysis;CiteSpace;scientometrics

科学合作已经成为科学研究中的一个重要方面,这源于科学发展的复杂性、技术的飞速变化和知识的动态增长以及高度发展的专门知识和技能,个体科学家通常不能提供全部的昂贵试验耗费和研究资源,必须通过合作来解决复杂的科学研究问题[1]。合作是“大科学”时代的一个重要现象[2,3]。科学专门化发展的历史趋势引起了多学科合作发展的需求,也进一步促使了科学研究中知识,技能和先进技术的整合发展[4]。

人类社会和科学技术的发展史表明,科学的职业化发展推进了科学合作行为的产生,科学合作是与科学职业化相关的一种研究方式。科学研究的合作方式起源于科学文献的共作者,这也是对科学职业化发展的一种继承,发展和延续[5]。早期的科学和技术研究并不是一个独立的社会职业,科学研究与发展尚处于基于研究者个人兴趣的自由探索活动。科学和技术的研究者或者爱好者为了完成复杂和大型的研究活动,并得到社会外界的更多的支持和认可,开始进行合作研究,科学合作日益成为科学研究的主流方式,科学合作活动的规模和范围随着科学的迅速发展而迅猛增长。科学合作的形式、动因以及科学合作的影响因素也变得更加复杂和多样。

1 方法与数据处理

科学计量学为科学活动提供了重要的评价指标,可以用来评价研究者、研究机构、科学期刊、国家和不同学科的科学研究活动[6]。对网络结构分析的研究成果为科学活动的社会网络分析提供了一种重要的工具,他可以将科学合作与科学成果通过他们合作的社会网络关系用可视化图谱的方式表示出来,可以直观的揭示网络中元素的数量及其之间存在的强度关系。找出网络中关键的节点,以及通过关键节点连接的各聚类之间的关系[7]。由美国德雷克塞尔大学陈超美博士开发的CiteSpace信息可视化软件可用于进行作者,文献的共被引分析以及作者之间,研究机构之间和国家之间的合作网络分析。通过作者共被引网络图谱的可视化,可以直观的展现科学技术领域研究的作者合作情况[8-9]。

本文进行计量分析所使用的数据均来自美国科学技术信息情报所(ISI)的Web of Science,他是科学引文索引数据库的入口网站。进行分析的数据记录主要包括文献的作者、题目、摘要、源期刊和文献的引文。用于分析的工具是Citespace信息可视化软件[10]。我们以Topic=(″Scien* collaborat*″or″Scien* cooperat*″or″research collaborat*″or″research cooperat*″)为检索式,对1900-2010年间以英语发表的文献进行检索,为数据分析的精确性,我们选取Article类型且以English语言发表的文献数据,共获得1 959条文献数据(2011-02-26检索)。从文献的出版年份分布情况看,文献数量呈逐年上升的趋势,尤其是1991年以后增长迅速,到2009年达232条(图1)。这也展现了国际学者对科学合作领域研究的关注度不断提升。

2 结 果

作者共被引的概念最初由美国学者怀特(White H.)博士提出[11-12]。作者之间的共被引关系反映了作者之间在该研究方向具有密切的关系,两个作者共被引的频次越多说明作者在该学术研究方向的关联性越强。由此推而广之,由多作者间的共被引分析形成的作者共被引聚类,反映了聚类作者间共同的研究方向和关注的热点。通过信息可视化的科学图谱表现出来的作者共被引聚类,揭示了科学知识领域中主流研究团体的研究兴趣和研究的热点问题。

2.1 科学合作研究领域的代表人物分析

我们将下载的文献数据通过CiteSpace可视化软件绘制科学合作研究领域的知识图谱,选择“作者共被引分析(co-cited author)”,运行结果如表1,图2所示。

科学家发表作品的被引情况说明后续研究者对前人研究成果的认可和继承,除了对前人及其研究成果的尊敬以外,一般认为也反映了前人研究者在该研究领域中的重要地位及其研究成果的代表性[13]。基于这一假设,我们在前文作者共被引网络聚类图谱基础上,统计科学合作领域文献的作者中,被引频次最高的前十位作者信息(表2),这些作者和他们的相关研究文献引领了科学合作研究领域的主流方向,是科学合作研究领域的代表人物。

Mark Newman是美国密歇根大学复杂系统研究中心和物理系的教授(Department of Physics and Center for the Study of Complex Systems University of Michigan)。他的研究方向主要包括网络结构和功能,尤其是社会网络和信息网络的结构功能分析。应用领域主要是对科学合作网络,共作者网络,引文网络,E-mail网络,友谊网络和生物社会网络等研究。同时也对疾病传播的计算机模拟,友谊构建模式,计算机病毒传播和网络协同算法进行分析。

Mark Newman在网络结构、特性,如网络度的分布(degree distribution),中心性的测度(centrality measures),群体结构(community structure),节点相似度(vertex similarity)等及其应用方面的研究具有重要的影响。在SCI数据库中检索,Newman发表的学术文献达105篇,其大部分的文献主要分布在物理、数学和生物等基础学科领域。其中,在SCI数据库中,被引频次最高的前10篇文献,被引频次均在250次以上,最高的达到近3 000次(表3),而这篇文献在Scholar-google中的检索被引频次达到近5 700次(2011年3月检索)。

Katz J.是英国苏塞克斯(Sussex)大学科学技术政策研究中心(Science and technology policy and research)的著名学者,研究的领域主要包括复杂创新系统(complex innovation system),科学技术指标(S&T indicator)和技术预见(foresight)。Katz J.对科学合作现象进行了深入的分析和研究,与Martin B.R.合作发表的《什么是科学合作》(What is research collaboration?)一文,在科学合作的研究学者中产生了强烈的反响,一直保持了较高的被引频次。

比利时鲁汶大学的Glanzel W.是当前国际上文献计量指标研究的重要代表人物。主要通过数学模型等方法对文献计量指标进行测算和改进,利用文献计量学指标对科学合作现象进行研究,也是当前科学合作领域研究的一个重要代表人物。

Albert-László Barabási是美国圣母大学(University of Notre Dame)物理系复杂系统网络研究中心的主任。主要研究复杂系统网络算法和应用研究。他的相关研究的代表性文献主要发表在《Nature》,《Science》等顶级权威期刊(表4)。

Beaver D.是20世纪70年代较早对科学合作问题进行开拓性研究的学者之一,他于1978年和1979年分别发表的科学合作系列研究,以18世纪法国的科学合作为案例进行分析,分析了科学合作问题的起源、科学合作的概念、测度等基本问题,奠定了科学合作问题相关研究的基础。是早期科学合作领域研究的代表人物。

Luukkonen T.是芬兰著名学者,主要进行国际科学合作相关问题的研究,包括国际科学合作的结构,国际科学合作的度量。Narin F.是美国科学计量学家,也是最早进行专利计量研究的学者。主要研究专利计量指标,科学计量学绩效指标,专利计量方法在科学合作中的应用等相关问题。

Réka Albert是美国宾夕法尼亚州立大学的物理和生物学教授。她主要研究生物物理学领域的网络模型。主要是对理论模型和实验测量之间的研究,辨识复杂系统的组织原理。通过构建系统建模,为进一步的试验提供理论基础。她与Albert-László Barabási在研究方面有着密切的联系和交流。据《科学观察》(Sciencewatch.com)报导的物理学领域被引最高的文献中,他们于1999年共同发表的文章《Emergence of scaling in random networks》在Scholar-google中被引频次超过8 700余次[14]。可见其在网络结构方面研究成果的影响力之大。

普赖斯(Price D.)是著名的科学计量学家和信息计量学家。主要应用数学模型的定量方法研究科学发展和增长的一般规律。提供了一种全新的定量的方法去测定科学增长的持续性。他的这种创新性的突破,促使了在后来的信息计量学领域里涌现出大量出色的科学家,如Belver Griffith和Henry Small,这些科学家通过大规模的统计科学引文索引,来研究科学发展的内在的结构规律。普赖斯的主要理论贡献包括:(1)指数增长律与逻辑增长律;(2)普赖斯指数;(3)普赖斯定律;(4)最大引文年限。普赖斯的研究成果奠定了科学计量学研究的基础,被誉为“科学计量学之父”,也是科学合作问题研究的开拓者和早期代表人物之一。

2.2 科学合作问题研究的主流学术团体

在知识图谱的基础上,CiteSpace软件可以标示出网络中的聚类情况,共包含40个作者共被引聚类。同时,我们应用TF*IDF算法使用文献数据中的Title words对各个聚类进行了标注(图3),可以辨识图谱中共被引网络聚类对应的学术团体及其研究的前沿问题。其中,聚类尺度最大的前5项聚类信息如下(表5)。

从国际科学合作领域作者共被引网络的聚类结果的尺度和结构来看,选取的前5项聚类所包含的节点数占整个共被引网络节点数的68.6%。因此,这5个最大的作者共被引聚类簇代表了科学合作领域研究的主流学术团体和各学术团体的研究前沿问题。我们列出3个代表性的最大尺度的聚类信息,分别是Cluster 21,Cluster 28和Cluster 19(表6~8)。在CiteSpace软件给出的聚类标识词的基础上,结合各个共被引聚类中被引频次最多的作者及其代表性文献的相关信息,总结各网络聚类所对应的学术团体的主要研究方向。

以Cluster 21为代表的学术团体是科学合作领域研究最早也是最具代表性的一组,主要是早期科学合作领域的研究者,研究方向主要集中在科学合作的概念、起源、科学合作的影响因素等基本问题。同时,利用科学计量学中的引文分析相关理论对科学合作问题进行研究,也是这一学术团体中的一个主要代表。

从整体上看,这一群组中的文献是整个图谱中被引频次最高的一簇文献聚类,包含了大部分科学合作领域研究中的最经典文献。同时,学术团体中的文献作者也是科学计量学领域中最著名的学者。以Katz,Luukkonen,Narin,Price,Beaver,Glanzel,Schubert,Meilin等为代表的学术团体研究者是科学计量学领域的创始人和奠基人,也是科学合作问题研究的开创者,他们的研究成果引领了科学合作领域研究的主流方向,属于科学合作领域中的基础概念和基础理论研究。他们的代表性研究成果绝大部分发表在《科学计量学》(Scientometrics)上面。

网络分析技术和理论研究的主流学术群体。其中,社会网络分析方法最早被应用于对社会现象、人际关系等社会学问题的研究[15-16]。近二十年来,对社会网络技术方法的关注和深入研究,使其得到了迅速的发展,其中一个主要的应用就是对科学合作问题的分析,科学家不断地与不同的研究者进行合作研究和创作,结合他们的研究成果不断地被引用,在科学家群体中间形成了巨大复杂的网络系统。

将网络分析方法和技术引入对科学合作领域问题的研究是近年来科学合作领域研究的一个主流方向,也是对科学合作问题进行有效定量分析的重要手段。其中Newman在科学合作网络中所做的开创性工作奠定了网络技术和方法在科学合作领域研究中的重要地位。科学合作网络研究也是当前科学合作领域研究中的热点和前沿问题。

以Cluster 19聚类文献为代表的学术团体主要是科学产出与绩效研究方向。1979年,拉图尔(Latour B.)的经典之作《实验室生活:科学实践的社会构建》(Laboratory Life:The Social Construction of Scientific Facts)出版,标志着科学知识社会学(sociology of scientific knowledge)在欧洲异军突起,它试图以社会因素说明科学知识的产生和发展。在本文的作者共被引网络中,拉图尔是网络中的一个关键节点(中心度0.11),说明了在科学合作与科学知识社会学之间研究的交叉过程中,拉图尔所起到的“桥梁”的重要作用。同时,聚类19中的其他代表性学者如Bozeman B.,Etzkowitz H.,Fox M.F.等都从不同视角论述了科学合作中的科学产出与绩效的问题。

以Cluster27为代表的学术团体是科学合作的社会学问题研究。对于科学社会学,在20世纪30年代,默顿(Merton R.K.)在其文献中曾经有所论述,但并没有深入的进行研究[17]。直到20世纪60年代,普赖斯和库恩[13,18]的研究对科学社会学的发展起到了极大的推动作用。其中,被引频次最高的作者是美国社会学家默顿,他是科学社会学的奠基人之一。他早期研究的重点是外部社会环境对科学的影响。后期他转而对作为社会一个子系统的科学内部的社会现象的研究。

美国宾夕法尼亚大学社会学系的 Crane Diana也是较早的研究科学社会学的一位学者,Crane D.在1969年发表《科学家的社会建构》(Social Structure in a Group of Scientists:A Test of the‘Invisible CollegeHypothesis)以后,于1972年出版了专著《无形学院:科学交流中的知识传播》(Invisible Colleges:Diffusion of Knowledge in Scientific Communities)在书中详细论述了科学家的社会网络,构建了动态的科学增长的社会过程模型,为科学社会学的迅速发展起到了积极地推动作用[19]。

克雷奇默(Kretschmer H.)是科学计量和科学合作问题研究的代表学者,她在聚类(Cluster 27)中出现的文献是关于共作者网络的分层结构研究,分析了文献合作者数量随着分层程度的减少的现象。

以Cluster 12为代表的作者共被引聚类中的文献主要是对以卫生保健领域的科学合作研究的案例分析。对卫生保健(healthcare)问题的研究越来越引起学者们的关注,在科学计量学领域,卫生保健的信息计量学研究已经成为一个主流的热点研究方向,一些高等院校和研究所专门开设卫生保健信息计量学的研究专业或者研究方向。其中,对卫生保健领域的作者合作研究也越来越成为科学合作领域研究者关注的对象,卫生保健领域的作者合作有其特殊性,这也是科学合作问题研究者关注的一个重要原因。

3 结论与讨论

结合作者前面对科学合作领域的文献共被引分析,总结科学合作领域研究热点及其主流学术群体的演进。本文研究主要针对作者共被引进行分析,探测科学合作领域的主流学术群体和代表性人物。

(1)社会网络方法和复杂网络分析技术是十分有效的网络分析技术和方法,科学家之间和研究者之间的合作研究形成了复杂的网络结构,利用网络分析方法对科学合作问题进行研究已经成为科学合作问题研究的一个相对成熟的研究方法。在此基础上,应将复杂网络分析方法应用到对具体学科领域的科学合作案例研究中,进行分析,将对各领域中的科学合作和合作研究问题的分析与探测起到重要的推动作用。

(2)科学合作领域的主流研究由最早的对科学合作相关基础概念和理论的定性研究逐渐的转向利用数学模型定量方法研究科学合作问题,再到当前的以复杂网络理论方法研究科学合作问题。从对科学合作领域文献数据的可视化分析,可以看出,在科学合作领域中,Price D.,Garfield E.,Beaver D.等科学计量学家奠定了科学合作领域研究的基础,提出相关的基本概念,理论,并通过数学模型等方法构建了研究的基本理论和模型,由Garfield E.创意并组建的美国SCI,SSCI和A&HCI等世界著名的文献引文索引数据库,为基于引文分析的科学合作和相关领域的研究提供了最强大的数据来源和支撑。Luukkonen T.和Narin F.等人在国际科学合作问题的研究中奠定了基础工作,分别从国家科学合作的测度,影响因素,科学技术政策等角度进行了研究。Glanzel W.是著名的文献计量学家,主要是用数学模型等方法,将文献计量学的理论和方法应用在具体的研究领域,在科学合作,科学技术指标和科学技术政策等方面有重要的贡献。Katz J.S.是著名的复杂系统专家,也是把复杂系统理论和方法在科学技术合作,指标等科学复杂系统具体应用较早的学者。Mark Newman,Albert-László Barabási和 Réka Albert都是著名的物理学家和复杂网络研究专家,他们将复杂网络方法和技术在科学合作领域中的具体应用研究奠定了科学合作网络研究的基础,并且成为当前科学合作领域研究的一个主流方向和前沿热点。

(3)科学合作领域在最初的科学学领域和科学计量学,文献计量学家的研究,到近年的物理学家的介入,研究方法也从最初的定性研究到数学模型的定量研究,到当前的复杂网络结构,理论和方法的应用研究。科学合作领域研究的前沿热点和主流领域也发生了变化,由最初在对科学合作本身的基础理论研究,例如科学合作的概念界定,科学合作的度量,科学合作的起源等;国际科学合作问题的研究,如国际科学合作的度量,影响国际科学合作的因素等,到当前的以科学合作网络的研究为主流,如合作网络的结构,网络结构建模,网络基本属性的计算,以及网络结构相关理论和模型在具体学科领域中的应用等。

科学合作领域的研究正在不断的走向成熟和完善,随着科学技术的不断发展,科学研究活动也变得愈加复杂,各种层面的科学合作与交流必将成为科学研究活动的一个主要成产方式,而对科学合作领域的研究也必将成为科学计量学和科学学领域研究的一个重要的研究方向。

参考文献

[1]Noriko H.,Paul S.Seung K.& Diane H.S..An Emerging View of Scientific Collaboration:Scientists' Perspectives on Collaboration and Factors that Impact Collaboration[J].Journal of the American Society for Information Science and Technology,2003,54:952-965.

[2]Galison P.& Hevly B.(Eds.)..Big science:the growth of large-scale research.Stanford,CA:Stanford University Press,1992.

[3]Weinberg A.M..Impact of large-scale science on the United States[J].Science,1961,134:161-164.

[4]Stevens M.J.& Campion M.A..The knowledge,skill,and ability requirement for teamwork:implications for human resource management[J].Journal of Management,1994,20:503-530.

[5]Beaver D.D.& Rosen R..Studies in scientific collaboration.Part 1:The professional origins of scientific co-authorship[J].Scientometrics,1978,(1):65-84.

[6]González-Alcaide G.,Aleixandre-Benavent R.,Navarro-Molina C.,Valderrama-Zurián J..Coauthorship networks and institutional collaboration patterns in reproductive biology[J].Fertility and Sterility,2008,90(4):941-956.

[7]Scott J.P.Social network analysis:a handbook.London:Sage,1991.

[8]Chen C.& Paul R.J..Visualizing a knowledge domain餾 intellectual structure[J].Computer,2001,34(3):65-71.

[9]Chen C..Searching for intellectual turning points:Progressive Knowledge Domain Visualization.Proceedings of the National Academy of Sciences of the United States of America,2004,101:5303-5310.

[10]Chen C..CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientific literature.Journal of the American Society for Information Science and Technology,2006,57:359-377.

[11]Howard D.White and Katherine W.McCain,Visualizing a Discipline:An Author Co-Citation Analysis of Information Science,1972-1995,JASIST,1998,49(4):327-355.

[12]White,Howard D.,Belver C.Griffith.Author Cocitation:A Literature Measure of Intellectual Structure,Journal of the American Society for Information Science,1981,32(3):163-171.

[13]Price D.D..Little science,big science.New York:Columbia University Press,1965.

[14]Barabási A.L.,Albert R.Science 286[5439]:509-12,15 October 1999)ranks at #5 among Highly Cited Papers in the field of Physics, garnering 2,708 citations between January 1,1998 and August 31,2008.http:∥sciencewatch.com/inter/aut/2008/08-nov/08novBaraET/.

[15]Moreno J.L..Who Shall Survive?Washington,DC:Nervous and Mental Disease Publishing Company,1934.

[16]Fararo T.J.,Sunshine M.A Study of a Biased Friendship Net.Syracuse,NY:Syracuse University Press.,1964.

[17]Merton R.K..The Sociology of Science:Theoretical and Empirical Investigations,Chicago:The University of Chicago Press,1973:605.

[18]Kuhn T.S..The Structure of Scientific Revolutions.Chicago:The University of Chicago Press,1962:605.

[19]Crane D.Invisible Colleges:Diffusion of Knowledge in Scientific Communities,University of Chicago Press,1972.

猜你喜欢
信息可视化
基于大数据的图书馆信息模式与个性化服务研究
计算机网络安全可视化研究平台设计与实现
论信息可视化设计在个人简历中的应用
标签的可视化进程初探
基于毕业生求职简历的信息可视化研究
基于CiteSpace的智库建设研究可视化分析
新媒体时代背景下的图形动画设计与制作研究
浅谈信息可视化在新闻传播中的应用
信息可视化技术在数字图书馆馆藏资源检索中的应用研究
基于信息可视化的推动城市能源环保创新应用探究