姜春林 梁帅 丁堃
〔摘 要〕运用引文分析法和信息可视化技术手段,对科学计量学最高奖普赖斯奖获得者弗朗西斯·纳林(Francis Narin)的论文及其引文进行计量分析。从发表作品的时间、领域、被引频次、论文在其研究领域的重要性等方面对纳林的学术贡献做了客观的统计分析,结果显示纳林的学术研究在专利计量、科技评估、科技管理等多方面都有很大的影响力,尤其是在科技管理与科技政策方面其学术贡献尤显突出。
〔关键词〕引文分析;弗朗西斯·纳林;科技评价;科学计量学弗朗西斯·纳林(Francis Narin),1931年出生于美国宾夕法尼亚州,是科学和技术研究领域的国际先导者之一,也是国际著名的科学计量学家。他首先在富兰克林与马歇尔学院(Franklin and Marshall College)取得了化学的理学学士学位,后又在北卡罗莱纳州立学院(North Carolina State College)取得了核能工程的硕士学位,最后在威尔顿大学(Walden University)取得了文献计量学的博士学位,并在1988年获得了科学计量学界最高奖——普赖斯奖(Derek de Solla Price Medal)。
在成立自己的公司之前,纳林在IIT研究所工作,并且是那里的高级科学家和技术社会研究中心的主任,并且还在Los Alamos国家实验室工作了4年时间,这段时间内他主要致力于开发评估科学活动的工具及研究科学是如何影响技术进步的。在1968年,纳林在芝加哥建立了自己的公司Computer Horizons(CHI Research,现在更名为THE PATENT BOARD),虽然自此以后忙于公司的管理,但是纳林仍然发表了60多篇文章,这些文章不仅反映了他在科技定量研究领域的产出,还体现了他在一些特殊领域的个人兴趣,从儿童的特殊教育、医学、化学到工业创新和科学的关系等各个领域都有他的论文产出。在1968年,他还担任著名工程TRACES(Technology in Retrospect And Critical Events in Science)里的重要角色。另外受国家科学基金会的支持,他在1976年发表了报告:“Evaluative Bibliometric:The Use of Publication and Citation Analysis in the Evaluation of Scientific Activity”,毫无疑问,他的先驱性工作是要把文献计量用于科学计量的活动中去[1]。
1980年,Mark Carpenter,Martin Cooper和纳林发表了《Linkage between Basic Research Literature and Patents》,这标志着纳林又开始了用专利和专利引文分析技术政策、研发管理、公司计划等方面的一系列先驱性研究。他不仅在科技研究领域有很大影响,还在政府和产业的绩效怎样赶上快速发展的技术方面,国家或企业的科技实力评估等都有重要贡献。另外,纳林在科技指标的制定和发展中也有系统研究。
进入20世纪90年代以后,他的学术成就达到了最高点,他致力于科学和技术之间联系的研究走在了学科同行前列,成为科技管理和科技政策研究群体中的领军人物之一。之后,又揭示了专利技术和股票市场绩效之间的联系。总之,在他学术研究的每一个阶段,他总是所在研究领域的佼佼者[1]。
1 数据来源和方法
1.1 数据来源
为了全面展现纳林的论文发表状况,我们采用的数据库是能够反映国际学术论文记录的美国Web of Science数据库,其收录了全世界出版的230个领域的9 000多种核心期刊。美国科技信息研究所(Institute for Scientific Information,ISI)在1964年正式发行Science Citation Index(SCI),2000年,ISI推出的ISI Web of Knowledge学术信息资源整合体系,其中以Web of Science为核心,通过WOS可以直接访问ISI的三大引文数据库Science citation index expanded(SCIE)、Social science citation index(SSCI)、Arts & Humanities citation index(A&HCI),覆盖了全世界最重要、最有影响力的研究成果[2]。通过研究被SCI收录的个人论文的引文数量,H指数等,能够反映出科学家的研究能力和学术水平,是评价科学家学术能力和影响力的重要指标。在WOS的检索中,我们构造“AU=Narin F”检索式,共得到102篇论文,通过剔除重名者等论文,最后共得到67篇论文。论文搜索时间和论文引用数据截止到2011年7月11日。
1.2 研究方法
为了全面对纳林的学术产出和影响进行评价,本文采用引文分析法和信息可视化的方法,用其所发表的论文为研究依据,来科学和客观地展示纳林的学术研究轨迹和学术影响力。
论文之间是通过文献的引用来联系的,文献的相互引用关系是引文分析的主要数据。所谓的引文分析就是利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文等各种分析对象的引用与被引用现象进行分析,以解释其数量特征和内在规律的一种文献计量分析方法[3]。引文分析的测度指标很多,有引文量、引用率、影响因子,共引强度和耦合强度等。还有其他的测量方法,如h指数等。在引文分析的应用中,我们可以通过影响因子来评价期刊的影响程度,利用论文的被引证次数来评价个人、期刊和学科的学术影响力等[4-5]。
另外,信息可视化也是一种有效分析方法。它是利用计算机,将大量的非空间的文本数据转换为更容易理解的图形或图像等视觉形式,以便科学工作者更容易理解数据的深层次内涵。在科学研究中,可视化技术为解释现象、解释机理、发现规律、预测结果提供了独到的方法。信息可视化工具较多,有Prefuse、CiteSpace、VitaPad、IVT等[6]。由可视化工具绘制的知识图谱描绘的对象不仅包括从事科学活动的科学家、技术人员,显性或编码化的知识,如论文、专利等,还包括研究问题和解决问题的过程和方法,及业务流程等很多方面[7]。
2 科学产出
科学论文的数量通常用来衡量科研生产率的高低。洛特卡在1926年提出了“科研生产率”的概念,指出科研生产率是指科学家在科学上所表现出的能力和工作效率,通常用其生产的科学文献的数量来衡量。科研生产率的提出为衡量科学产出能力提供了一个重要的定量指标[3]。
根据我们检索出的67篇文章中,共有49篇论文,5篇会议摘要,5篇会议论文,3篇社论,3篇标注,1篇书信和1篇文献综述。根据纳林每年的文章产出,我们可以了解分析他在不同时期的科学研究活动情况。我们以文章的发表时间为横轴,以每年发表的文章数量为纵轴,得出纳林的文章产出时间分布图,在图1中,我们可以看出,在1976年成立公司之前,纳林发表了4篇文章,研究领域主要分布在化学、空间科学和核能等方面,主要原因是这段时间他主要在学校和IIT研究所度过,所发表的文章主要与学校所学专业有关。在1976年成立自己的公司之后,他在科学计量等领域的研究活动再开始慢慢展开,发表了其发文的绝大部分。
纳林的研究在每一时期都有其侧重点,例如在20世纪70年代发表了19篇文章,其研究方向主要为通过文献或引文进行的科学计量活动;在1980年代发文21篇,其研究方向主要是国家或企业科技实力的评估,专利评估和有关评价指标的建立的探讨等;而在进入1990年代后所发表的19篇文章中,其主要研究领域为国际间的合作情况,国家科技发展与创新,科技管理与科技评价等领域。从1959年开始发第一篇文章到2000年止,其在41年间共发表文章67篇。
纳林不仅研究兴趣广泛,研究的课题项目几乎遍布每一个科学领域。在图2中,展示的纳林的论文的研究领域中看出,从化学、核技术到经济管理,再到社会科学,每一个领域中都有他独到的研究见解。在学校学习期间,纳林是化学学士、核能工程硕士及文献计量学博士。理工科背景的专业知识赋予他厚实的基础知识沉淀,及文献计量学为他的研究提供了强大的方法论指导和研究手段。使他在每一个领域都能获得有别于别人的研究视角,得到了突出的研究成果。
在纳林的论文领域中可以看出,他在信息科学和图书馆学、计算机科学和管理学这3个学科发文量是67篇,即他的所有论文都是属于此领域中的。但是即便是只发1篇文章的学科领域的论文,其论文的质量也得到了认可,其在1999年的经济统计领域的论文《Citation frequency and the value of patented inventions》的平均引用次数每年达9.92。
3 科学影响
引文分析法的研究可以将科学文献和作者联系起来,通过对引文时间分布和引文网络关系的分析和研究,可以揭示出某一科学领域的背景、发展过程、重大成果及未来的发展趋势等,引文分析为科学家的评价提供了定量依据[2]。
加菲尔德在1963年发现通过引文数据分析可以作为某篇论文的学术影响的判断,一般认为文献被引数量与作者的影响力成正比,被引用量越大说明作者的影响力越大,通过对引文的分析,可以发现哪些研究人员做了哪些后续的研究,还可以分析出这个领域的研究热度等[2,8]。
通过图3可以统计得出纳林的67篇论文的被引用的情况,从1965-2011年7月11日止,67篇论文共被引用2 737次,平均每篇论文被引用40.85次,年平均引用次数达51.64篇。在2010年,论文的被引次数达到最高值200次,从总体趋势看来,其每年的引用频次是逐渐增高的,说明随着科学学及科学计量学科的发展,其论文的学术价值逐渐被人们认识到,其学术影响力也逐渐提高。根据侯海燕、栾春娟在国际科学计量学权威的期刊《科学计量学》和国际科学技术政策研究的权威期刊《科研政策》中的研究,在1978-2004年间,被期刊《科学计量学》引证频次最高的科学计量学家中,纳林以419次的被引频次名列第三[9]。在1975-2007年间,被期刊《科研政策》引证频次最高的46位科技政策研究代表人物中,名列第18位[10]。
在纳林的67篇论文虽然都是用英语写作,但是其影响力不仅仅在以英语为母语的国家,根据引文报告分析,其引文的作者分布在45个国家,遍布世界各个大洲,数量排在前十位的国家或地区有荷兰、西班牙、中国台湾、英格兰、德国、中国大陆、意大利、韩国、比利时和日本,虽然有语言的限制,但是纳林的论文还是具有广泛的国际影响力。引文分析报告还指出,引用纳林的文章主要分布在139个小的学科领域中,其中主要为图书馆学和信息科学、管理学、计算机科学、商业、规划与发展等,其余的像天文学、地理学、生态学、医学、政治学等学科都有分布。由此看出,纳林的学术兴趣广泛,用专利及引文分析等方法在各个学科都有他的学术论文,其论文影响力不仅仅是国际性的,而且跨学科性影响力也很明显。
另外,美国加州大学圣地亚哥分校的物理学家J.E.Hirsch教授在2005年提出了一种定量评估论文质量的方法,这种方法利用论文数量和论文的被引频次设计的一项评价科学家学术成就的指标,称之为h指数法。其含义是一个科学家发表了h篇被引频次不少于h次得论文[11]。在本文中,纳林的h指数为30,即到现在为止,共有30篇论文的被引频次不少于30次,占发文量的45%。许多终身致力于某一研究领域的科学家来说,其h指数会很高,但是对纳林来说,他在每一段时期内都有其研究主题与兴趣,虽然他的h指数并不很高,但是对于他研究领域的广泛性来说,67篇文章取得如此高的h指数,也是很难得的。
在科学计量学的研究中,文献之间的相互引用是一种学术思想的传播,被引用的文献提供概念、理论或方法给引用文献,若是某篇文章多次被许多作者引用,就说明其在这个学科里有很大的贡献[12],在这里,我们首先通过Web of Science收集到的引用纳林的67篇文章的所用文章,共1 637篇论文。然后我们利用美国Drexel陈超美教授的开发的CiteSpace[13]软件对这1 637篇论文进行共被引分析,得到图4。
对于图4中所示我们可以看出,纳林的研究期间的发表论文的情况。其中4篇文章有特别高的共被引关系,即他的中介中心性特别高,分别为0.36、0.22、0.18和0.15。在图中紫色和浅蓝色代表的是在1965-1976年的发文情况,这段期间他主要是学生期间,发表的论文主题主要是化学和核能方面,共被引关系不是很明显。绿色代表主要是在1977-1988年的发文,最高的是1976年发表在的论文《STRUCTURE OF BIOMEDICAL LITERATURE》[14],纳林在其中通过分析大约900种生物期刊的引文得出生物化学和生理学领域具有高的引文影响力,并提出了一个等级影响图为以后计划研究活动提供了一个框架。这也是纳林将引文分析引入科学计量研究中影响最广的一篇文章。而他于同年出版的《文献计量学评价:将文献和引文分析用于科学活动的评价》也是一部科学计量学领域发展上的关键事件。著名社会科学学家默顿认为其与普赖斯的《大科学,小科学》,加菲尔德的《引文索引》,斯莫的《科学文献的的共引:出版物关系的新计量》等著作共同开辟了引文分析方法评估科学活动的科学计量学的主流研究方向[15]。
在20世纪80年代中,纳林发表了一系列利用专利和期刊引文来评估国家或企业科技实力、评价科技产出等一些文章,其中《PATENTS AS INDICATORS OF CORPORATE TECHNOLOGICAL STRENGTH》[16]一文,被引频次达到180次,文中利用美国17家医药企业数据,研究了专利数据及其引文和企业绩效的其他指标如研发支出、科研效率、销售利润等指标的关系,发现专利是衡量企业技术竞争优势的一个非常好的指标。除此之外,他认为科技指标可以用来定量测量研发活动,并且科技活动中的特殊指标可以用来评估研发绩效以便为国家或企业等服务,他也是第一位系统化的发展了研究下列问题的一些指标[17]:(1)出版在
基础科学期刊上的科学论文是被引用在基础科学期刊还是应用与实践期刊上?(2)研究中的高投入是否与高的科学产出(论文数量)和影响力(引文数量)有联系?(3)医学院或专业国家机构是否比大学部门的科学产出更高?(4)年轻人是不是比年老者产出更高?(5)一个国家的科学绩效(论文数量)及其影响力怎样?(6)一个国家或一个具体公司在技术上的优势和劣势在什么领域?这些科技指标的初步建立为国家和企业及科学家个人的科学活动都有很大的指导作用,特别是对于国家的技术战略的实施有重要影响,如科技经费的投入比例及分配额度,政府研发机构的体制改革,国家科学活动效率评价等。
进入90年代以后,纳林发表了另外3篇高中介中心性的文章,其主要研究内容都是关于科学——经济——技术领域,是他在科技管理和科技政策领域的代表性著作。分别是1996年发表的《BIBLIOMETRIC PERFORMANCE MEASURES》[18],文章通过文献计量的绩效评估论证了技术进步的推动力是高成效的活动及基础科学的研究工作,文中设立的评估指标,为机构或研究所的评估设立了标准。在1998年发表的《LINKAGE BETWEEN PATENTS AND PAPERS:AN INTERIM EPO/US COMPARISON》[19]主要内容是专利技术和科学研究文献之间的关系,利用美国的专利数据得出工业中的专利技术与公共科学体系的关系。作为科学学家,纳林最关注的研究领域是借助科学计量学的理论与方法研究科学与技术的关系,成为连接科学计量学理论与科技政策研究两个学术群体的桥梁[20]。特别体现在纳林于1997年发表的文章《THE INCREASING LINKAGE BETWEEN US TECHNOLOGY AND PUBLIC SCIENCE》[21]中,此文研究了国家公共科学和国家技术进步之间的关系,被引频次高达244次。在国际科学学的主要六大主流学术群体[20]中,纳林与Pavitt K,Nelson R.R,Freeman C被认为是科技管理与科技政策的代表人物,在4人中,虽然纳林的论文产出和单篇最高被引频次都是最低的,但是其总被引频次是最高的。
总体来说,在他的学术研究中,相比于同行者,他的文章被引频次并不是很高,但是论文的跨学科性很强,为在引文分析和科技评估领域研究的学者提供了一种新的视角,也从侧面体现了他在科学计量和科技评估之间的影响力,及其他在学术生涯中的研究关注点的转移。
4 小 结
以上分析表明,纳林不仅是一个研究兴趣广泛的科学家,也是一位有着国际学术影响力的科学计量学家。虽然他学术研究触及多个学科领域,但是他在科学计量和科技评估领域中的科研成就和学术影响力更显卓著。他在1988年被授予普赖斯奖,也是对他在科学计量学和科技评价等领域取得突出学术成就的一种肯定,是实至名归。
另外,需要指出的是,本文收集的仅是Web Of Science数据库中的记录,另外还有一些研究报告或网页信息等未被收录的未作分析,这也是本文分析的不足之处。
参考文献
[1]Dr.Francis Narin[Z].http:∥www.wipo.int/meetings/en/2003/patentzstatistics/speakers/narin.htm,2011-09-05.
[2]袁军鹏.科学计量学高级教程[M].北京:科学技术文献出版社,2010:107-134.
[3]邱均平.信息计量学(九) 第九讲 文献信息引证规律和引文分析法[J].情报理论与实践,2001,24(3):236-240.
[4]庞龙.科学引文分析的科学评价功能和意义[D].太原:山西大学,2006.
[5]姜春林.试论引文分析与社会科学定量评价[J].科技管理研究,2002,(6):91-93.
[6]李淑丽.信息可视化工具的比较研究[D].哈尔滨:黑龙江大学,2006.
[7]陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005,23(2):149-154.
[8]邱均平,周春雷.发文量和h指数结合的高影响力作者评选方法研究——以图书情报学为例的实证分析[J].图书馆论坛,2008,28(6):44-49.
[9]侯海燕.科学知识图谱:最有影响的50位科学计量学家[J].科学学研究,2007,25(03):404-406.
[10]栾春娟,侯海燕.科技政策研究代表人物与核心文献可视化网络[J].科学学研究,2008,26(6):1164-1165.
[11]金碧辉.科学家为自己设计了一项评价指标:h指数[J].科学观察,2006,1(1):8-9.
[12]刘林青.作品共被引分析与科学地图的绘制[J].科学学研究,2005,23(2):155-159.
[13]Cm C.CITESPACE II:DETECTING AND VISUALIZING EMERGING TRENDS AND TRANSIENT PATTERNS IN SCIENTIFIC LITERATURE[J].JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY,2006,57(3):359-377.
[14]Narin F,Pinski G,Gee H.STRUCTURE OF BIOMEDICAL LITERATURE[J].JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE,1976,27(1):25-45.
[15]侯海燕.权威科学计量学家对科学的关注及贡献[J].情报杂志,2006,(4):118-120.
[16]Narin F,Noma E,Perry R.PATENTS AS INDICATORS OF CORPORATE TECHNOLOGICAL STRENGTH[J].RESEARCH POLICY,1987,16(2-4):143-155.
[17]VAN Raan A.NARIN,FRANCIS RECIPIENT OF THE 1988 PRICE,DEREK,DESOLLA AWARD-COMMENTS[J].SCIENTOMETRICS,1989,17(1-2):5-7.
[18]Narin F,Hamilton K.BIBLIOMETRIC PERFORMANCE MEASURES[J].SCIENTOMETRICS,1996,36(3):293-310.
[19]Narin F,Olivastro D.LINKAGE BETWEEN PATENTS AND PAPERS:AN INTERIM EPO/US COMPARISON[J].SCIENTOMETRICS,1998,41(1-2):51-59.
[20]侯海燕,刘则渊,陈悦,等.当代国际科学学主流学术群体及其代表人物[J].科学学研究,2006,24(2):161-165.
[21]Narin F,Hamilton K,Olivastro D.THE INCREASING LINKAGE BETWEEN US TECHNOLOGY AND PUBLIC SCIENCE[J].RESEARCH POLICY,1997,26(3):317-330.
(本文责任编辑:马 卓)