面向科学技术创新的科学引文网络研究

2017-01-07 08:24吕鹏辉邵建芳
关键词:论文节点文献

吕鹏辉, 邵建芳, 程 诚

(合肥工业大学 a.管理学院;b.教育部过程优化与智能决策重点实验室;c.信息技术与工程管理研究所,合肥 230009)

面向科学技术创新的科学引文网络研究

吕鹏辉a,b, 邵建芳a,c, 程 诚a,b

(合肥工业大学 a.管理学院;b.教育部过程优化与智能决策重点实验室;c.信息技术与工程管理研究所,合肥 230009)

科学引文网络是知识网络以至知识管理领域发展最好的领域之一,这种科学知识网络是知识管理专家基于科学文献之间的相互引证关系总结出来的最早的一种知识网络类型。文章首先回顾了科学引文网络的发展史,随后介绍了科学引文网络的基本理论并总结了它的研究方法。最后,以我国自然科学领域为例进行了科学引文网络的实证与应用研究,即以我国发展最好学科的数据,如材料学科中石墨烯领域2010年之前的数据为例绘制了科学引文网络,明显发现了科技创新的路径。同时根据引文网络中文献节点的幂律分布,以全球2004-2014年化学与材料科学有引用记录的全部高质量论文为例,绘制了科学引文网络,进行科技创新规律及创新路径的发现。通过对来源于ISI的InCites数据库的化学与材料科学的引文网络特征的剖析,发现中国科学家论文有被引延迟现象,科学引文网络知识图谱说明中国科学研究目前仍处于自我提升的进程之中。

科技创新;引文网络;知识基础;知识结构

在人类科技创新史上,科学引文网络催生科技创新有毋庸置疑的著名先例,伟大如爱因斯坦这样的科学家,如果没有之前黎曼几何作为基础,其相对论学说也无从诞生[1]。科学史上纵然在1666年、1905年这样的科学奇迹年,科学创新切实发生了,但之前的科学文献对于后人的科学创新所起的作用依然不容小觑。

在科学知识的时间维度上,后出现的论文引用了先前发表的论文,则它们之间就在时间轴上产生了共现关系。但科学引文网络在时间上须遵守先后次序,这种在时间轴上形成的共现现象对于科学知识的继承和传播的研究非常重要。本文所谓科学引文网络,实质上是将论文本身(以TI字段代表)作为被引和施引对象来构建引文网络的,这是基于文献在“篇”整体层面上的一种知识网络。

对于未来的科学大数据研究来说,要全体不要抽样、要效率不要精确、要相关不要因果,这种情况下知识共现网络就能发挥大用。引文网络这种知识网络实质上是V Bush所提的以文献单元为实体的引文链接思想的一种实现[2],引文链接通过展示科学文献中的内容主题间的相互关联,揭示了科学研究之间承前启后的内在逻辑。

在科学引文网络中,80%的引用指向38%的科学家[3],因此人类的最为巨大的科技创新是那些位居幂律之巅的科学伟人创造和引领的,大多数科学家可能只能跟在他们后面做一些跟随型的研究。因此本文认为只要重点分析得到高被引20%的科学文献,一个学科领域的主流和脉络的大部分就能被认识和掌握了,这也是引文网络对于学科主流知识的主要贡献,并可以从知识图谱中分析获得。沿着这样的科学引文网络的主线和脉络,也可以迅速地厘清一个学科或者领域的科技创新历程,因此,引文网络在科学创新中亦能发挥其作用。

一、面向科技创新的科学引文网络研究

科学引文网络是知识网络领域甚至知识管理领域发展最早、最好的领域之一,论文之间的相互引用是目前研究的较为充分的一种引证关系,作者和作者团队之间、机构之间甚至国家之间的引用作为无形学院的有形痕迹[4],至今已经形成完善的理论构架和思路设计,是知识管理学科可向其他学科输出的为数不多的方法之一。这种知识网络是知识管理专家基于科学文献之间的相互引证关系领悟出来的最早的一种知识网络类型,对于这些引用和被引之间的研究更能获得科学交流模式上的特征与规律,这是本文要对科学引文网络继续研究的主要目的之一。

1.引文网络思想的发展历程

早在1927年,P.L.K Cross进行了科技文献研究史上第一次引文分析,他统计了化学专业的某些期刊论文的参考文献并进行了综合分析,据此得到了化学教育方面的核心期刊。由此开始,引文分析逐渐得到计量情报学家的重视。其后,加菲尔德(E Garfield)使用他创立的SCI数据库,尝试利用科学引证网络来研究知识之间的传承、发展的脉络和结构,并开发了专门绘制引文网络的在线软件与工具。Price D在1965年发表的《科学论文的网络》中正式提出了科学引文网络的最初设想,在这种“引证网络”中他首次发现了知识之间的关联关系,并将其投射为二维网络图,其后的各种引文网络研究基本都是基于这种关联共现关系的一种应用。PriceD还借助于物理统计的办法对引文网络的拓扑结构及引用行为进行深入分析,并形成了引证过程中的经典理论和研究前沿。

借助于生物学和医学中的基因学说,英国著名遗传学家道金斯还提出了思想基因学说,随后被印度情报学家S.K Sen发展成为情报基因学说。我国学者刘植慧更是发展出了知识基因学说[5],该学说的基本思想体现为知识基因的遗传与变异的交互运动,这些关于科学引文网络学说的建立均是为了更好探明引文网络背后的动力学,目标在于揭示科学知识增长的内在机制,以及确立科学大厦的规律。

2. 引文网络发展的前沿研究

沿着科学引文网络,人类的科学知识得到发展。数据、信息和知识的负熵值是不断减小的,因此科学的进步也是一个信息熵值不断减小的过程,该过程符合耗散理论的原理[6]。对于整个学科的引文网络,或者说引文网络引导下的整个学科的发展方向的研究,是极为重要的问题。在科学引文网络的研究方面,数据为其根本,深入挖掘可得到令人信服的研究结果;方法为其两翼,长久发展可以令其飞的更远[7]。论文之所以能被引,是因为被引文献触发了同行沿着该方向强烈而持久的研究动机[8],因此论文被引就是对于本身内容一定的认可与发展。

科学引文网络之所以能够形成,从科学知识创新路径的角度来看,一般是在一个学科领域的早期出现了原始的重大创新,从科学知识继承和发展的角度来看,后来者纵然能做出更大的创新,也是因为他“站在了巨人的肩膀上”,因此引文网络中大多数节点虽然未受关注,但不代表其对于学科的进步没有贡献。在科学引文网络中,当科学文献被其后的论文引用时,知识就流向了施用文献,因此从被引文献到施用文献的链接就可以作为一种主要路径来进行研究,以识别科学发展的主要路径。然而在一个大型引文网络中,要想沿着这样的思路跟踪一个学科领域主要思想的流变殊为不易,因此一种更为简化的方法就是识别其“主路径”,Hummon等人已经将此方法应用在中心性产出的文献引文网络中,之后该方法还被从诸如转化医学科学文献的引文网络移植到燃料电池的专利引文网络中。

3.引文网络创新的研究误区

对于科学引文网络的图谱指向,不管是以代数形式还是拓扑网络表示,科学引文作为一种典型的有向非循环网络(Directed acylic networks),在图论中简称DAG,也就是在这样的网络中,知识的传递路径是有着明确指向的[9],也就是时间反演不对称,这与其他类型的知识网络明显不同。

然而目前在这样一个高度成熟和发展的理论基础上,很多应用和实证型研究工作甚至图书情报领域的研究论文中,仍然没有在时间序列上将这些节点排序起来,忽视时间序列使得引用失去明确指向,导致节点之间的链接要么是双向的、要么是无方向的。如果引用关系在引文网络中指向不明,只是将引文网络当作一个复杂网络的对象研究,就失去了科学引文网络的本来意义。

二、科学引文网络构建与创新路径发现

科学引文网络可以实现知识转移,即对原有科学知识是一次再利用过程,这项创新指标可以由节点的知识转移存量,以及节点的知识开放度来衡量[10]。科学论文的被引可作为衡量论文价值的有形指标,比如没有被引的论文会很快在知识汪洋中陷入沉寂。

本文主要研究科学引文网络中知识转移与扩散和传播的规律,其中此处所指的知识主要指个人知识,科学引文网络中的科学文献节点的主要来源是科学家个人,而非其所在机构,所以不能被认定为组织知识。而科学引文网络中包含了多种具体的创新模式与路径,比如模仿创新的路径就主要来自于科学引文知识网络。

1. 科学引文网络主要构建办法

一般情况下,我们将前后相继的引文关系表达成时间的函数,但事实上这种关系同样也可以用矩阵的方式来表达,如果将论文本身编号后写成一行,而将论文的参考文献编号后写成一列,矩阵的节点上表示引用次数,那么这种二元引用矩阵同样可以用来表现论文与参考文献之间的关联关系网络[11],其方向将由列指向行。

引用矩阵与被引矩阵不同,同被引矩阵的行与列具有相同的含义,代表被引用的参考文献、作者或期刊,而引用矩阵行与列具有不同的含义,代表不同类型的特征项共现矩阵:行表示引用特征项(citing entity),矩阵的列代表被引特征项(cited entity)。例如在期刊引用矩阵中,行代表引证期刊,列代表被引期刊。因为引用矩阵的行与列代表同一种特征项,但特征项类型不同,行是引用特征项,列是被引特征项;另外,大多数异共现矩阵是矩形阵,而文献计量研究的引用矩阵基本是方阵。

2. 科学引文网络一般创建流程

引文网络出现以来,世界各国科学家陆续建立起包括期刊、专利、会议录以及网络文献在内的多种文献之间的科学引文数据库[12],并且其中的引文关系还可以跨库构建,形成了全球范围内的日趋完备的科学知识网络,其获取流程如图1所示,尤其要注意将文献及其参考文献同时下载下来存储在本地数据库里才能继续构建引文网络。

图1 科学引文网络图的一般获取流程

Eugene Garfield早在2001年前后就开发了Histcite系列应用软件,这是一个可对大规模数据进行分析的在线工具,可对学科领域文献进行引文时序分析,对于来源于SCI数据库的数据分析得很好。当然根据其他软件也可以尝试绘制科学引文网络,但是要避免本文1.3节中说所述的误区,避免失去科学引文网络的本质特色。

在科学引文数据库中,一般包括引用(Citing)和被引(Cited)两种关系,当然这个区分主要还是以主体的不同视角而决定的,在学术界也被称为后引(Backword Citation)和前引(Forword Citation),以引文网络的视角来看,科学文献引用的参考文献一般被称为引文,引用一篇科学文献的文献被称为施引文献(Citing Documents),在构建科学引文网络时要注意同时将文献及其参考文献下载下来才能构建科学引文网络。

3.引文网络与创新路径的发现

知识扩散是知识生产的核心环节,对知识的传承与创新起到了重要作用。引用是科研人员在撰写科学文献时的一种学术行为[13],也是知识扩散的表现形式之一,大量的引用关系构成了引文网络,体现了知识扩散过程的持续性与复杂性,为研究知识扩散提供了方法与平台[14]。通过后续发表的论文均引用前述论文,从而形成了一张科学引文网络图的同时也清晰指明了科技创新发展的创新流动路径。

科学引文网络中创新能力较强的那些节点一般都是知识存量大,对内部、外部知识进行识别、捕捉、评价和消化并整合、利用和创造新知识的能力较强的节点。科学引文网络的拓扑次序是指引文网络中由起点到终点的方向,引文网络中的知识主要是从一个专家手中转移到另一个专家之处,据此Nancy Dixon认为知识转移包括远转移、近转移、连续转移、传略转移、专家转移等类型[15]。

在科学引文网路中,如果将创新看成一种可以沿着网络传播和扩散的元素,那么这种创新和思想就会沿着知识网络在人际中传播,因为与枢纽节点连接的节点极多,一旦新的思想出现,就会很快通过核心节点连接到网络中的其他节点,这样创新就迅速蔓延和传播开来,这种情形下科技创新的效率较高。科学引文网络同时也是一个动态网络[16],另外,由于科学引文网络是有向网络,根据巴拉巴西的研究结果,科学引文网络也是具有四个核心区域的复杂网络,跟其他有向网络一样具有四大核心子集。

在这样的复杂网络中,位于某个学科领域之内的所有论文之间的链接关系形成一个最大的连通网络,在这个连通网络中任意节点之间互相可达,但网络规模较小;另外有部分文献是指向这个文献集合的,他们是该连通网络的参考文献,形成了该领域的知识基础;还有一部分文献是该集合中论文的施引文献,他们是这个文献集合的发展产物属于学科前沿,跟随这样的文献可以进入核心区域;最外层的文献集合是较小规模网络,其中的文献有引用关系,但未与核心节点有引用关系,自身形成一个孤岛[17]。因此如果能够预测到这些网络的规模和结构,其特点也就能掌握了。

三、我国科技领域的引文网络及其创新

进入21世纪以来,在国家创新战略和科技引领经济的政策推动下,中国科学家在科技界的成果数量持续上升。通过中国科学家群体的共同努力,自然科学一些主要领域成果数量提高很快,甚至一些学科的成果数量进入了全球最前列。

比如2014年度大陆地区(不包括港、澳、台)发表的SCI收录论文数为1 448 977篇,仅次于美国的3 578 524篇,但总被引次数少于美国、德国和英国,位居全球第四[18]。人民日报曾经刊文指出,经过多年大力发展,我国自然科学论文数虽然位居全球第二,但我国科技人员发表论文的总被引次数还比较靠后,且篇均被引次数低于世界平均值,有较大比例的论文为零被引论文,我国论文数量总量较高,但总被引次数较为落后。

在我国论文发表数量已经迈入科学大国的同时,如何实现我国向科学强国转变?如此之大的科学数据中又蕴含着怎样的科学再创新规律?未来我国尤其是自然科学应该如何布局和分配有限的科研经费等等?这些问题的答案其实可以通过基于共现的科学引文网络获得,在科学大数据引文网络的基础上,通过数据挖掘就可以逐渐获得上述问题的答案,找到未来我国科技创新的思路。

1.引文网络中主节点对创新的启示

从全球发文和高被引数据看,中国科学家入选人数越来越多,其中我国的材料科学表现最为突出;石墨烯领域又属于近年来的热点和重要研究方向,曾于2010年获得了诺贝尔奖,在我国也是重要的研发方向之一,其应用方向涉及多个具体行业及领域[19]。近五年(2010-2014)来,全球发表的石墨烯高端论文数已经超过46 150篇。

本文以材料科学中的石墨烯领域数据绘制了该领域的科学引文网络,来通过知识网络研究科技创新路径。本文数据截止到2010年,即石墨烯获诺贝尔奖之前,以WoS科学数据集为例绘制了石墨烯的科学引文网络,如图2所示。

图2 全球石墨烯科学引文网络图(部分)

该引文网络显示,在获诺贝尔奖之前,1996年Nakada K发表于PRB(Physical Review B)上的论文(405#节点)一直引领着该领域的发展,其后是康斯坦丁·诺沃肖洛夫(Novoselov K.S)和安德烈·海姆Geim A.K师生发表于Science和Nature Materials上的论文(1674#和2524#节点)在科学引文网络中影响最大,也正是他们师生摘取了诺贝尔奖的桂冠。这说明在引文网络中不以时间早晚评价其影响力,我国物质科学尽管起步较晚,但依然可能产生世界级高影响力的成果。

另外节点1945#、1946#在科学引文网络中起到的作用也较大,这两篇论文中都有华人科学家的贡献,前者是来自英国的Jiang D,后者是来自美国的Zhang Y.B。这说明华人科学家创造能力同样突出,但要正确引导和鼓励,我国近年来出台了多项科技政策吸引海归科学家回国效力,就是基于这样的一个考虑。石墨烯引文网络中,从1674#、1945#到2524#节点就形成了这样一条路径,科学知识在这样的节点上汇聚起来,对整个引文网络又能产生较大影响,但目前我国科学家撰写的综述性论文还较少,没有在国际科学界产生应有影响[20]。

科技创新一方面依靠内生,一方面也可以依靠外引,因为在引文网络中这样的枢纽节点发挥的示范和引领作用很大,能给我国科技带来较高起点和更多创新[21]。在科学引文网络中,关键节点对于引文网络的前后连接作用很大,尤其是一些贡献突出的关键性节点,会催生和引发后续的多个较大节点的诞生[22],科技创新在这样的节点上容易诞生、传播和扩散,这一点在本课题组之前多个研究工作中都取得了证明[23-24]。但如果这样节点的相关工作申报了专利,就会对后续的应用型科技创新产生一定人为影响[25],这也提醒我国科学家在科技创新的同时,也要重视对知识产权的保护,2015年国家出台的《国务院关于关于深化体制改革加快实施创新驱动发展战略的若干意见》中有着这方面的明确要求,说明我国已经根据引文网络中的节点认识到了科学创新路径发现的一些规律。

2. 引文网络节点产出幂律分布规律

科学引文网络是一种复杂网络,在科学引文网络这样的网络中主要节点的中心度分布如果呈幂律分布,核心节点就会因此拥有比其他节点更大的发展优势[26]。如果在科学引文网络中幂律开始占据统治地位的话,那么它的这种趋势就会越来越强,也就是说幂律趋势带来的优势统治地位也会随之越来越强[27]。

在科学引文网络中,Price D等人发现网络链接的度分布满足负的幂律分布,根据数学上的证明,如果一个能够描述两种现象的幂律的幂指数不同的话,那么支配两种现象的原理就有着本质的不同。多年来美国位于科学引文的核心枢纽位置,从而凭借其科学技术优势在全球经济领域称霸[28],这对未来中国科学的发展,将会产生不可低估的作用。

本文在WoS数据库中收集了全球化学与材料科学2004年至2014年间发表有引用记录的全部高质量论文,并以这些论文的被引情况为例,来绘制其科学引文网络。其中化学学科的高被引论文数为1 784 780篇,总被引次数为23 335 144次,篇均被引110次;材料科学高被引论文为769 456篇,总被引次数为7 678 818次,篇均被引9.98次。这些论文分别形成了其领域内的科学引文网络,其中的主节点按照国别区分后,依据国家节点的中心度排名,并对数据取对数后如图3所示,基本呈线性分布。

图3 中国化学与材料科学引文网络中心度

就这两个中国科学论文数量已在全球居首的优势学科而言,其引文网络的节点度分布规律是:在化学学科引文网络里,中国依然处于非核心地位;在材料科学中,尽管已处于核心地位,但与位居其次的美国相比差距很小。在以幂律主导的枢纽节点的分布中,只有占据绝对优势,才能在全球科技领域具有话语权。

就科技创新而言,只有第一,没有第二,如果一项科技成果创新性高则其被引率就会远大于其他论文。因此在科学发展方面,拥有绝对数量和质量的科技成果才能保证科学创新上的优势地位。根据科学引文网络反映的规律来看,科学技术在自然竞争和发展条件下成果倾向于分布成幂律形式,并且这种趋势还将继续保持下去并获得强者具有更强的先发优势,因此我国应该抓住当前的发展良机,继续将学科优势的地位加强并巩固下来,不要因为暂时的影响力不如他国或者尚未收到效果而因噎废食,导致固步自封。

3. 中国科学家论文的被引延迟现象

在我国全球发表论文数量不断攀升的同时,论文质量却受到了来自国内外同行的一致质疑[29],理由是这些年虽然我国发表的SCI论文数量上去了,但是被引数量却并没有相应地居于全球最前列。然而,在论文数据迅速崛起的同时,论文被引没有相应跟上,该现象称之为被引延迟,是一种科研成果发表中的正常现象,因为被引需要时间,不是立刻可以看到效果的事情。

但国内外同行的质疑也对我国科学家努力提高论文被引提出了要求,因为毕竟论文的被引与科学创新休戚相关,论文数量与被引上升有无规律可言呢?我国应该沿着什么样的路径来引导未来科学的发展呢?

下文将对化学与材料科学的引文网络特征做一剖析,数据来源于ISI的InCites数据库,选择InCites数据库的学科影响力作为评价指标,因为它是以篇均被引次数为基础、与全球平均水平相比的综合评价指标。根据中国国务院学位办颁布的学科分类,学科门是最高父系统,本节以中国国务院学位办学科分类(SCADC)学科分类为依据,考察我国自然科学整体被引情况的变化。

根据ISI的InCites数据库数据,中国在自然科学内的学科影响力和国家影响力年度增长趋势图如图4所示,中国篇均被引在近几年才逐渐赶上世界平均水平,但增长趋势较好,近十年来一直呈逐步上升趋势。引用期增加后,中国的自然科学2006~2013年发文的影响力有不同幅度的提升,和美国的差距也有缩小,这表明近年来我国SCI发文量快速增长的同时,论文质量也得到较大的提升。这提示我们适当地延长引用期有助于对我国SCI论文进行更为合理的评价,因此被引暂时位居他国之后,不能代表当前论文质量欠佳,延长被引周期,从更长时间维度看我国自然科学论文的被引率会得到更公正的评价。

图4 中国自然科学在全球的影响发展趋势图

四、结 论

本文基于科学文献与参考文献在时间上的共现关系重构了科学引文网络这种知识网络类型,并对科学引文网络的发展历程和前沿发展方向作了回顾,在此基础上重点论述了科学引文网络的构建办法、创建流程和发展误区等。最后总结了科学引文网络的创新特征,比如引文网络的知识扩散、知识传播和知识继承规律,这些规律对于我国目前对科技创新的吸收、利用和再创新将有所启示。

本文还以中国自然科学尤其是目前发文数量居首的化学、材料科学等学科的数据做了实证研究,结果表明我国在材料科学、化学等的优势学科中,近年来在诸如石墨烯这样的领域逐渐跟上主流但仍需根据引文网络揭示的一些规律调整自我发展战略。上述两个优势学科中国家成果数量与排名呈幂律分布,我国暂时被引落后仅仅是因为被引延迟,在物质科学领域科学未来创新趋势良好,目前仍需加强这种优势。

科学引文网络对于我们的深刻启示是知识的继承与创新发展相结合,我国才能走出一条真正的自己的自强之路。在我国的科技强国战略中,目前已经有了引进、吸收、再创新的实践,但有些领域做了,更多的领域还缺乏这种自发的实践与能动的反馈。面对我国的现实国情,将更多的人力、物力、财力等有限的稀缺资源向跟踪、学习、引进、吸收和转化方向上倾斜,将是一条与国家现有条件相符的科学发展之路。

[1] 阎晨光,邓明立. 黎曼的几何思想及其对相对论的影响[J]. 科学技术与辩证法,2009,03:82-85+101+112.

[2] VANNEVAR B. As we may think (Reprinted)[J].Library Computing, 18(3):180-188.

[3] REN F X, SHEN H W, CHENG X Q. Modeling the clustering in citation networks[J]. Physica A-Statistical Mechanics, Its Applications ,2012,(391): 3533-3539.

[4] MOORE S, SHIELL A, HAWE P, HAINES, V.A. The privileging of communitarian ideas: Citation practices, the translation of social capital into public health research[J]. American Journal of Public Health,2005,(95): 1330-1337.

[5] 刘植惠. 知识基因探索[J]. 情报理论与实践.,1998, (1): 62-64.

[6] HARMAN K, KOOHANG A, PALISZKIEWICZ J. Scholarly interest in gamification: a citation network analysis[J]. Industrial Management & Data Systems,2014, (114): 1438-1452.

[7] DAVID B T, FERNANDO J S, ITZIAR C M. Mapping the importance of the real world: The validity of connectivity analysis of patent citations networks[J]. Research Policy ,2011, (40):473-486.

[8] CSARDI G. Dynamics of citation networks[M]//In Artificial Neural Networks.ICANN 2006, Pt 1 (Kollias, S., et al., eds), 2006: 698-709.

[9] ROBINSON K A, DUNN A G, TSAFNAT G, GLASZIOU P. Citation networks of related trials are often disconnected: implications for bidirectional citation searches[J]. Journal of Clinical Epidemiology,2014,(67): 793-799.

[10] REAGANS R, MCEVILY B. Network structure, knowledge transfer: The effects of cohesion, range[J]. Administrative science quarterly ,2003,(48): 240-267.

[11] 周晓英, 陈兰杰. 基于引文网络的知识链接框架研究[J]. 情报杂志, 2010,(10): 37-40.

[12] SHIBATA N, KAJIKAWA Y, TAKEDA Y, et al. Detecting emerging research fronts based on topological measures in citation networks of scientific publications[J]. Technovation ,2008 ,(28):758-775.

[13] SEELEY H, URQUHART C. Action research in developing knowledge networks[J]. Health informatics journal,2008,(14): 279-296.

[14] 王亮. 基于SCI引文网络的知识扩散研究[D]. 哈尔滨:哈尔滨工业大学, 2014.

[15] 曾建勋, 赵捷, 吴雯娜,等. 基于引文的知识链接服务体系研究[J]. 情报理论与实践, 2009,(5):1-4+8.

[16] CHEN P, REDNER S. Community structure of the physical review citation network[J]. Journal of Informetrics ,2010, (4), 278-290.[17] ERDI P, MAKOVI K, SOMOGYVARI Z, et al. Prediction of emerging technologies based on analysis of the US patent citation network[J]. Scientometrics ,2013,(95): 225-242.

[18] 马佰莲, 李正风. 中国科学创新能力(2000-2010)评价[J]. 自然辩证法通讯, 2013,(5):82-87+127.

[19] LV PENGHUI, WANG GUIFANG, WAN YONG, et al.Bibliometric trend analysis on global graphene research [J]. Scientometrics, 2011, 88 (2):399-419.

[20] HO YUHSHAN, MICHAEL KAHN. A bibliometric study ofhighly cited reviews in the Science Citation Index expanded[J]. Journal of the Association for Information Science and Technology, 65(2):372-385, 2014.

[21] 刘臣, 单伟, 于晶中国学科知识网络的演化研究——基于1981-2010年引文数据[J]. 系统工程理论与实践, 2013,(2):430-436.

[22] KAJIKAWA Y, OHNO J, TAKEDA Y, et al. Creating an academic landscape of sustainability science: an analysis of the citation network[J]. Sustainability Science, 2007 ,(2): 221-231.

[23] MA FEICHENG, LYU PENGHUI, WANG XIAOYONG. Quantitative characterization of the research productivity of interdisciplinary [J]. COLLNET Journal of Scientoemtrics and Information Management, 2014, 8(1): 153-168.

[24] REN JUNLIN, LYU PENGHUI, WU XINMU, et al. An informetric profile of water resources management literatures [J]. Water Resources Management, 2013, 27(13): 4679-4696.

[25] 李杰, 当前我国自然科学创新的人文环境研究[D]. 南宁:广西大学, 2006.

[26] LEYDESDORFF L, RAFOLS I. Indicators of the interdisciplinarity of journals: Diversity, centrality, citations[J]. Journal of Informetrics ,2011, (5): 87-100.

[27] ZHAO S X, YE F Y. Power-law link strength distribution in paper cocitation networks[J]. Journal of the American Society for Information Science, Technology,2013,(64):1480-1489.

[28] GENG X M, WANG Y. Degree correlations in citation networks model with aging[J]. EPL 009 (88).

[29] OYRANOSKI D. Chinese institute is an innovation in theory[J]. Nature ,2002:416, 572-572.

(责任编辑 刘 翠)

Research on Scientific Innovation Oriented Science Citation Network

(a.School of Management; b.Key Laboratory of Process Optimization and Intelligent Decision Making of Ministry of Education; c.Institute of Information Technology and Engineering Management, Hefei University of Technology, Hefei 230009, China)

Science citation network is one of the earliest and best developed areas in the field of knowledge network and even knowledge management. This scientific knowledge network is one of the earliest types of knowledge network based on the mutual citation relationship between scientific literatures through summary of information scientists. This paper first reviews the development of the science citation network, and then introduces the basic theory of the science citation network and summarizes its research methods. Finally, the empirical research of the science citation network is carried out in view of the natural science field in China. The science citation network of the field of graphene in materials science is drawn from the data before 2010, and the innovation path is discovered. According to the power law distribution of literature node in citation network, and taking all the cited high quality papers in the field of chemistry and materials science in the world from 2004 to 2014 as an example, the scientific citation network is drawn, and the scientific innovation law and the innovation path are discovered. Through the analysis of the characteristics of the chemistry and materials science citation network based on the data from the InCites database of ISI, the phenomenon of the cited delay of Chinese scientists' papers is summed up. The result of science citation network knowledge graph shows that the scientific research in China is in the process of self-promotion.

scientific innovation; citation network; knowledge base; knowledge structure

2016-09-21

国家自然科学基金面上项目(71571060);中国博士后科学基金面上项目(2015M581984);安徽省软科学研究计划重点项目

吕鹏辉(1982-),男,陕西西安人,助理研究员,博士后。

G252.7

A

1008-3634(2016)06-0116-8.5

(1607A0202039);中央高校基本科研业务费专项资金项目(2015HGBZ0490)

猜你喜欢
论文节点文献
CM节点控制在船舶上的应用
Hostile takeovers in China and Japan
基于AutoCAD的门窗节点图快速构建
概念格的一种并行构造算法
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
抓住人才培养的关键节点
下期论文摘要预登
下期论文摘要预登