顾亮亮,朱亮,寇远涛,金慧敏,叶飒,赵瑞雪
(中国农业科学院农业信息研究所,北京 100081)
基于论文产出的科研机构科研实力分析
——以中国农业科学院为例*
顾亮亮,朱亮,寇远涛,金慧敏,叶飒,赵瑞雪
(中国农业科学院农业信息研究所,北京 100081)
本文系统介绍论文产出分析的研究思路,以及数据的采集、处理与分析等内容,并以中国农业科学院为例,对其论文产出进行分析研究,重点选取发文趋势、优势学科、高被引论文、机构领军人物、科研合作网络多个维度,充分展示中国农业科学院的科研实力及国际影响力,以期为其他机构开展论文产出分析提供实践参考,为相关部门的管理决策与科研工作提供借鉴。
科技论文;产出分析;中国农业科学院;科研机构;科研实力
科学研究是科研机构主要的职能与使命。评价科研机构科研水平与实力的常用指标,包括科研经费总量、科技论文数量和所发表期刊质量及其被引用情况、科技成果的数量与获奖级别、专利总量及全球布局情况[1]。
科技论文是科研机构研究成果的重要表现形式之一,是考量科研机构研究能力、创新力及国际影响力的重要度量指标,是管理部门进行科学管理与决策的重要参考依据,还是促进科技交流与合作的重要载体与桥梁。
本文以中国农业科学院为例,采用文献计量学的分析方法,对科技论文产出进行分析研究,深入挖掘科研机构的研究实力及学术影响力,为科研系统相关部门开展管理与决策、科技评价及科研工作等提供参考和依据[2]。
科技产出分析是以文献数据为基础,情报人员为主导,分析工具为辅助的系统工作。科技论文产出分析主要包括8个步骤。
(1)确定分析对象。明确科技论文的分析对象,如机构、作者、学科、主题等。
(2)数据库遴选。基于分析对象,选定合适的数据库,确定数据来源。常用的中文期刊数据库有中国知网、万方数据库、维普期刊库、国家农业图书馆中外文科技文摘数据库等;英文数据库包括Web of Science、Chinese Science Citation Database、InCites、Essential Science Indicators、Springer、Scopus、Engineering Village、CABI等[3]。
(3)检索式构建。基于分析对象,构建检索式。若研究对象为机构,则构建机构及其下属单位名称的检索表达式;若研究对象为作者,则构建“作者+单位+邮编”的检索表达式;若研究对象为学科、主题,则构建相应的检索表达式。
(4)数据采集。基于构建的检索表达式,在目标数据库进行检索与下载。
(5)数据处理。通过TDA、SPSS、Excel等分析软件,对数据进行清洗处理。
(6)指标确立。文献计量学和引文分析方法被越来越多地应用于科研绩效评价。常用于体现论文水平与影响力的指标包括论文数量、被引频次、篇均被引频次、h指数、引文影响力、论文被引百分比、学科规范化的引文影响力、国际合作论文数量、横向合作论文百分比高被引论文百分比、热点论文百分比、期刊规范化的引文影响力等。选取符合研究内容与分析维度的指标,对论文产出进行分析[4]。
(7)数据分析。论文数据可导入分析工具(如TDA、Citespace、VOSviewer等软件)及数据分析平台(如Web of Science、InCites、ESI、JCR等数据库),进而挖掘国家、机构、作者、期刊、论文之间深层次关联关系及进行知识图谱可视化展示[5]。
(8)结果展示。情报人员基于数据分析结果进行图表分析及深入专业的解读。
本文对中国农业科学院2007—2016年的科技论文进行分析。其中,英文科技期刊论文来源于Web of Science收录的文献类型为Article的Science Citation Index Expanded(SCIE)论文。中文科技期刊论文来源于由中国农业科学院农业信息研究所建设的中国农业科技文献数据库,该库以国家农业图书馆馆藏中文期刊为基础,收录了1973年以来1 855种农业及相关领域的科技期刊,文献总量达1 100余万篇,其中收录的北大中文核心期刊876种。
数据采集时间为2007年1月1日—2016年12月31日,以第一作者或合著作者发表且署名地址/单位为“中国农业科学院”的论文,数据检索日期为2017年7月28日。
确保数据的准确性与完整性始终是农业科研机构在科研产出过程中面临的严峻挑战。
由于农业科研机构体制改革、更名和中外文名称的简写、缩写等原因,许多农业科研机构名称存在不统一、不规范以及错误表述的问题,这对农业科研机构学术成果的定位检索、共享及统计造成困难[6]。
采集机构数据必须构建完善的机构检索式,而机构检索式的完成需要完整、全面的规范机构名称。首先,以机构官网给出的科研机构及其下属研究单位的中英文名称作为正式名称表达;其次,从中文农业科技文献库、SCI数据库抽取科研机构及其下属机构的各类名称表达;再次,通过调查研究,获取机构历史名称与已发表中英文论文中常用的机构名称表达;最后,采用人机结合的方式,加工整理出机构正式中文名称、英文名称、历史名称、其他别名和上下级关系等详细信息,形成机构名称规范库[7]。
中国农业科学院资源规模庞大,且建设历史久远,期间机构调整及变动较多。为保证机构数据的完整性及统计结果的准确性,对中国农业科学院及其二级机构(院属京区单位、京外单位、共建单位、院机关及下属公司)信息进行规范化处理,重点是本单位的中外文规范名称、别名等。其中,别名所含信息包括单位历史沿革(拆分、合并、调整)名称、单位名称误写、单位名称缩写、单位重点实验室等。构建的中国农业科学院机构规范库,包含中文正式名称和别名1 461个,英文正式名称和别名524个。
基于中国农业科学院机构名称规范库,分别生成完整的机构中英文名称检索式,检索到2007年1月1日—2016年12月31日,Web of Science数据库中中国农业科学院作者共发表SCIE论文14 692篇,以中国农业科学院为第一作者发文单位及通讯作者发文单位的SCIE论文达8 937篇;中国农业科技文献数据库中,中国农业科学院作者共发表中文期刊论文50 973篇,其中收录的北大中文核心期刊论文34 842篇。
一方面,中文作者姓名易出现重名现象,另一方面,存在英文姓名缩写相同、中文拼音无声调导致的重名等情况,使作者发文统计,特别是英文文献的中文作者发文统计困难重重,这也是科技论文产出分析的世界性难题之一[2]。
因此,专家论文数据的采集需要建立准确有效的检索式,仅以专家姓名或ORCID、Research ID,无法准确获取完整的专家论文数据。建议结合专家姓名(中文姓名、曾用名、英文姓名全拼及简写等)、ORCID或Research ID,及专家教育背景(本科、硕士、博士毕业院校)、工作单位、邮编地址、学科、研究方向等,构建专家名称规范库。
机构作者发文情况是科技论文产出分析重要的研究对象与机构评价依据。本文将下载的中国农业科学院英文文献数据导入InCites分析平台,通过姓名全拼与简拼(姓全拼、名首字母)加上地址字段中的机构名称、邮编等进行匹配,清洗后得出高发文作者、高被引作者等机构领军人物。
农业科研机构科技论文产出数据分析维度有很多。如机构论文历年产出及趋势变化,高发文研究所(二级单位)、高发文作者、高被引作者、高发文期刊、合作发文国家与地区、国内外合作发文机构、高水平论文、高被引论文、热点论文、重点研究方向、优势学科、基金资助情况、高频词、研究热点、研究前沿、作者共现等。由于篇幅原因,重点选取发文趋势、优势学科、高被引论文、机构领军人物及科研合作网络,以中国农业科学院为例进行科技论文产出挖掘分析,展示农业科研机构的科研水平与学术影响力。
根据统计结果发现,中国农业科学院发表的中外文科技论文数量呈逐年稳步增长态势。其中,2007年中国农业科学院发表的SCIE论文量为475篇,2010年超过1 000篇,2012年突破1 500篇,2014年增至2 084篇,2016年达最高峰值2 904篇。十年间,中国农业科学院发表的论文增幅高达511%。其中,中国农业科学院发表的SCIE论文在SCI核心库的被引频次为140 020次,Web of Science所有数据库的总被引频次达169 093次。
Web of Science数据库收录了各学科领域最具权威性和影响力的学术期刊,更能体现机构的科研水平与国际影响力。因此,本文将基于中国农业科学院SCIE论文发表情况展开分析。
将下载的中国农业科学院SCIE论文数据导入InCites数据库得出中国农业科学院学科规范化引文影响力为1.04,高于全球平均水平;论文被引百分比为81.31%;h指数为95;国际合作论文3 536篇;国际合作论文百分比为24.10%。以上数据表明在国际农业科研领域,中国农业科学院的英文论文被其他农业科研工作者引用的程度较高,吸引国际合作的能力较强,在国际上拥有很高的科学影响力。
这些丰硕成果与中国农业科学院科技创新工程的启动实施与推进密切相关。2013年中国农业科学院科技创新工程启动实施,2016年科技创新工程进入全面推进期,科研团队总数增加到332个,科研团队的合作极大地提升了机构的科研产出能力与国际影响力[8]。
根据ESI数据库及InCites数据库统计,近十年中国农业科学院的动植物学、分子生物学和遗传学、农业科学、微生物学、生物科学、环境与生态科学、化学7大研究领域在全球研究机构中的排名进入前1%(见表1)。
表1 ESI收录的中国农业科学院全球研究机构前1%的学科
中国农业科学院7大优势学科共发表论文12 762篇,被引次数128 724次。其中,动植物学是中国农业科学院的最优学科,该学科的论文发文量、被引频次、高被引论文、学科规范化的引文影响力及国际合作论文数量均位于7大优势学科之首,论文总数4 057篇,被引频次40 469次,高被引论文56篇,学科规范化引文影响力值为1.47,国际合作论文1 132篇;分子生物学和遗传学的篇均被引频次最高,为16.56次。
中国农业科学院在科研经费投入、人才引进、创新团队、学科建设等方面应加强对7个优势学科的倾斜,优先发展优势学科,力争将这些优势学科建设成为世界一流学科。
科技论文的被引频次不仅反映论文质量,还是体现作者及其所在机构科研能力和水平的一项重要指标。2007—2016年中国农业科学院被ESI收录的高被引论文共120篇。ESI的高被引论文是以同一年同一个ESI学科发表论文的被引用次数按由高到低排序,排在前1%的论文。
2007—2016年中国农业科学院以第一作者或通讯作者完成单位发表的英文论文,并按其在Web of Science数据库中总被引频次排名前10的论文,如表2所示。其中,排名前3的论文,也位列ESI高被引论文的TOP10。
其中,蔬菜花卉研究所的黄三文、王晓武、杜永臣,植物保护研究所的吴孔明、陆宴辉,作物科学研究所的贾继增、万建民、王建康、李慧慧,棉花研究所的喻树迅、王坤波,以及农业资源与农业区划研究所的梁永超科研能力突出。在黄瓜、马铃薯、小麦、棉花及稻谷基因组研究领域,作物分子生物育种与遗传机制解析领域,抗虫棉及棉虫防治管理领域的研究成果在国际影响力大,受到国际同行的高度关注。
因此,中国农业科学院对这些科研人员及其研究领域应予以高度重视。
表2 2007—2016年中国农业科学院SCIE高被引论文TOP10(第一或通讯作者完成单位)
高产及高被引作者是科研机构及其所在研究领域具有一定权威的科研人员,是机构的领军人物,是科研团队形成、发展、创新的关键,对所在领域的研究有很大的贡献与影响力。领域同行可通过关注学习高产及高被引作者的研究成果及其所在团队、单位的研究动态,为自身研究工作提供重要的参考与借鉴[9]。
按作者发文量统计,2007—2016年中国农业科学院机构领军人物,如表3所示。这18名作者中,有中国工程院院士2名,中国农业科学院科技创新工程首席科学家8名。其中,兰州兽医研究所的朱兴全发文数量与被引频次均最高,发表SCIE论文258篇,被引频次2 850次;学科规范化引文影响力最高的是植物保护研究所的吴孔明;论文被引百分比最高的是饲料研究所的杨培龙。
表3 中国农业科学院机构领军人物(2007—2016年)
学科规范化引文影响力排除了出版时间、学科领域与文献类型的影响,评价结果相对客观。如果学科规范化引文影响力值等于1,说明该组论文的被引表现与全球平均水平相当;大于1,表明该组论文的被引表现高于全球平均水平;小于1,则低于全球平均水平。学科规范化引文影响力值等于2,表明该组论文的平均被引表现为全球平均水平的2倍。
统计发现,在中国农业科学院学科规范化引文影响力排名前10的作者中90%的论文被引表现均高于全球平均水平。学科规范化引文影响力值最高的是植物保护研究所的吴孔明,其论文的平均表现是全球平均水平的2.45倍;其次,依次是何中虎、万建民、郑永权、董丰收、刘新刚、朱兴全、石鹏君、周东辉和姚斌。
科研合作是推动科研创新的强大动力,是机构间协同创新的重要途径。论文合著则是科研合作最直接的表现形式之一。2007—2016年中国农业科学院与国内外1 413家机构展开了科技论文合作研究。
如表4所示,按国内机构合作发文统计,中国农业科学院与科研机构合作最密切的是中国科学院,与高校合作最多的为中国农业大学,合作发文均超过1 100篇。而合作发文机构中学科规范化引文影响力最高的是华中农业大学,这说明与国内其他机构的合作相比,中国农业科学院与华中农业大学合作发表的论文在国际上的影响力最大。
与中国农业科学院合作发文量排名前10的国际合作机构如表5所示。合作发文量、国际合作论文量、被引频次及h指数最高的国际合作机构均为美国农业部,学科规范化引文影响力最高的是美国加州大学与康奈尔大学,论文被引百分比最高的是法国国家农业研究所,引文影响力最高的为美国康奈尔大学。可见,中国农业科学院与美国的科研机构合作最多,其次为法国的科研机构。
通过科研合作网络分析,可以挖掘与中国农业科学院合作频繁且实力强的机构。随着国际合作的深入拓展,中国农业科学院的科技论文产出与国际学术影响力不断扩展与提升,得到越来越多国内外农业专家及科研人员的高度关注与认可[10]。
表4 中国农业科学院SCIE国内合作发文机构TOP10(2007—2016年)
表5 中国农业科学院SCIE国际合作机构TOP10(2007—2016年)
基于科研机构的论文产出分析,可以了解本机构的论文产出情况与发文趋势、学科在国内乃至国际上的发展现状、论文质量与影响力、科研人员学术水平、核心研究团队,及潜在竞争对手与合作伙伴等,有利于全面了解本机构的优势与发展潜力,有助于调整学科发展方向、调节资金配置、重点培养有潜力的科研人员及研究团队,从而不断提升机构的创新能力与国际影响力。
本文仅从科技论文视角,对机构产出进行分析与研究。如何考察分析科研机构专利、科技成果等其他科研产出,并结合论文产出,全面科学地评价科研机构的科研实力,并建立机构综合评价指标体系是今后需要继续探讨和研究的课题。
[1]贺秀英.西安科技大学近年来科技论文产出统计与分析[J].西安科技大学学报,2008(3):609-612.
[2]顾亮亮,赵瑞雪,鲜国建,等.中国农业科学院科研实力探析[J].农业展望,2016,12(4):71-80.
[3]唐研.山东省农业科学院文献信息资源共享服务平台建设研究[D].北京:中国农业科学院,2011.
[4]程菲,段庆锋.不同类型科技论文评价指标对比分析[J].情报探索,2015(10):119-123,128.
[5]韦恒.基于ESI的学科情报分析模型构建与实证研究[D].镇江:江苏大学,2016.
[6]李慧佳,马建玲,张秀秀,等.中文机构名称规范库建设的实践与分析——以“中科院机构名称规范库”建设为例[J].图书与情报,2016(1):133-139.
[7]王婷,颜蕴,续玉红,等.中国农业科学院科技论文产出及国际学术影响力分析——基于Web of Science数据库[J].中国农业科技导报,2013,15(2):54-63.[8]中国农业科学院.创新团队[EB/OL].(2017-06-10)[2017-07-01].http://www.caas.cn/rcjy1/cxtd/index.shtml.
[9]史纪元.基于CiteSpaceⅢ输血医学研究领域知识图谱分析[D].西安:第四军医大学,2015.
[10]张洋,谢齐.基于社会网络分析的机构科研合作关系研究[J].图书情报知识,2014(2):84-94.
顾亮亮,女,1987年生,博士,馆员,研究方向:文献计量、情报分析、数据挖掘分析与知识服务,E-mail:guliangliang@caas.cn。
朱亮,男,1981年生,博士,副研究馆员,研究方向:文献计量、情报分析、科学数据建设与管理研究。
寇远涛,男,1982年生,博士,副研究馆员,硕士生导师,研究方向:数字图书馆理论与技术、信息管理与信息系统。
金慧敏,女,1978年生,助理研究员,研究方向:信息管理与信息系统、知识服务。
叶飒,女,1985年生,硕士,馆员,研究方向:数据分析、文献计量、知识服务。
赵瑞雪,女,1968年生,博士,研究员,博士生导师,通讯作者,研究方向:信息管理与信息系统、信息资源管理、知识组织与数字图书馆,E-mail:zhaoruixue@caas.cn。
Based on Output of Papers Analysis of Scientific Research Strength of Scientific Research Institutions:A Case Study of Chinese Academy of Agricultural Sciences
GU LiangLiang, ZHU Liang, KOU YuanTao, JIN HuiMin, YE Sa, ZHAO RuiXue
(Agricultural Information Institute of CAAS, Beijing 100081, China)
This paper systematically introduced research ideas on output analysis of papers, data collection, processing and analysis. Taking the Chinese Academy of Agricultural Sciences as an example, it made analysis and researches on output of papers.The paper focused on as the selection of published trends, multiple dimensions,high cited papers, institutional leaders, scienti fi c research cooperation network, preponderant discipline, the scienti fi c research strength and international in fl uence of Chinese Academy of Agricultural Sciences were comprehensively and systematically investigated,which would provide practical reference to other institutions to carry out paper output analysis and provide references for management and policy-making for related departments and research purposes.
Scienti fi c and Technical Papers; Output Analysis; Chinese Academy of Agricultural Sciences; Research Institutions; Scienti fi c Research Capabilities
G353.1
10.3772/j.issn.1673-2286.2017.11.004
* 本研究得到公益性科研院所基本科研业务费项目(编号:JBYW-AII-2017-17)和中国农业科学院科技创新工程项目(编号:CAAS-ASTIP-2017-AII)资助。
2017-10-31)