CSCD体现的我国理工农医跨学科知识流动探析

2020-12-15 06:42张家榕张慧叶鹰
图书与情报 2020年3期

张家榕 张慧 叶鹰

摘   要:文章以中国科学引文数据库(CSCD)收录的2017年发表的期刊论文为基础,抽取621,066条引文记录,并以此构建5个学科门类、68个学科之间的引文网络,据此分析我国理工农医跨学科的知识流动情况。研究揭示自然科学发挥着基础性作用;生物科学、环境科学等学科占据着跨学科交互网络的核心;医药卫生、农业科学皆自成一体;自然科学和工业技术之间联系紧密;自然科学门类下的学科之间的相似度较低,农业科学之间的相似度极高,工业技术之间的相似度适中。

关键词:知识流动;学科相似度;理工农医

中图分类号:G250.2   文献标识码:A   DOI:10.11968/tsyqb.1003-6938.2020042

Abstract Based on the published journal articles in the Chinese Science Citation Database(CSCD) in 2017, 621,066 citation records were extracted, and two citation networks of five types and 68 disciplines were constructed to analyze the interdisciplinary knowledge flows of sciences and technologies in China. It is revealed that the disciplines of natural science play fundamental roles; that the disciplines of biological sciences and environmental sciences occupy the core of interdisciplinary interaction networks; that the disciplines of medical sciences and agriculture are all self-contained; and that the natural sciences and engineering are closely connected. While the disciplines similarity in natural sciences is low, there is extremely high disciplinary similarity in agriculture, and mid-similarity in engineering and technology.

Key words knowledge flow; discipline similarity; science and technology

1   引言

隨着现代科学研究深度的不断提升,越来越多的研究需要多学科交叉研究共同解决。知识跨越学科边界而流动的现象日渐频繁[1]。学科之间的论文相互引用关系,可以用来表征不同学科知识的相互借鉴、汲取和融合的情况。通过引文网络,可以一窥这种知识流动情况。

近年来,知识流动研究得到了很多学者的关注[2-4]。随着跨学科间知识流动研究深入,国内外研究者已经做出了一系列研究成果[5-8]。如陈柏彤和张斌[9]总结以往文献,提出知识扩散的对象,包括期刊、学科、科研人员等不同层次,扩散过程主要以文献引证和作者合作来表示;董克和张斌[10]综述了学科知识扩散网络路径识别方面的主要研究进展。研究者们对于国内外不同主题、学科间基于引证关系的知识迁移现状进行了实证研究。如Liu等[11]通过对CNKI数据库中精选的500多种代表性期刊构成的引文网络,刻画了我国跨学科知识网络的结构和动态变化情况;赵星等[12]通过CNKI收录的人文社会学科论文,构建了文科领域的引文网络,刻画了我国文科领域知识扩散情况;岳增慧和许海云[13]通过Web of Science数据库,研究了社会网络主题引证网络的知识扩散特征;邱均平等[14]通过中文社会科学引文索引的核心期刊,研究了我国图书馆、情报、档案学学科的知识扩散情况;关鹏等[15]等则基于科研合作网络研究了知识扩散模型的问题。

引文网络是研究知识流动的有力工具之一。引文网络最早由Price[16]提出,用以描述论文之间的相互引用关系,是最典型的信息网络之一。而蓬勃兴起的复杂网络研究,则为研究引文网络提供了大量的理论方法。

本文通过对中国科学引文数据库(CSCD)收录的论文进行统计分析,采用引文网络、网络分析和学科相似度方法,从一个断面揭示我国理工农医学科门类间及各个学科间的知识流动情况,并对其进行可视化解析。

2   数据与方法

选取中国科学引文数据库中的文献数据,根据其本身及其所引用的参考文献所属学科,构建我国理工农医跨学科知识流动的引文网络。

2.1    数据

本文数据来源是中国科学引文数据库(Chinese Science Citation Database,CSCD)。它收录我国理工农医主要领域数千种中英文科技核心期刊,并且内容丰富、数据准确。选取其2017年发表的252,928篇文献及其引文进行处理。

对每个期刊所属学科分类的依据是期刊在《中文核心期刊要目总览(2017年版)》即北大核心中所属的学科门类和学科,其中因为有些学科分类本身具有较强综合性,可能交叉覆盖其他多个学科,故去掉了综合性科学技术、自然科学总论、综合性医药卫生、综合性农业科学等综合性较强学科,也去掉了上述分类中对应的综合性期刊。最后,共选择农业科学、工业技术、医药卫生、自然科学、社会科学5个学科门类,分别包含46、240、138、159、6种中文核心期刊;数学、物理、林业、工程材料学等68个学科。每一个学科仅对应一个学科门类,如数学学科对应的学科门类为自然科学。在学科门类中含有社会科学的原因是中国科学引文数据库本身涵盖部分偏重社会科学的期刊,如《心理学报》《心理科学》《中国管理科学》《管理科学学报》等,故仅留作参照。

进行如上限定后,统计并抽取数据中论文及其引用的参考文献所属期刊均为2017年中国科学引文数据库来源的中文核心期刊的数据记录,共获得621,066条引文记录,将以此为基础构建引文网络。

2.2    方法

采用引文网络研究,学科门类或学科根据其引用关系,构建引文矩阵G。引文矩阵中包括n个学科门类或学科。

通过计算学科两两之间的余弦相似度来量化学科之间的相似关系。余弦相似度是计算两个非零向量的夹角的余弦值,并以来衡量两个向量的差异情况。

采用的引文网络中,节点为学科门类或者学科,边为两个学科门类或学科间的引用关系,由于引文网络中存在引用次数和施引被引关系的差别,故网络是有向权重网络。

通过上述引文数据,可以构建5个学科门类之间的引用网络和68个学科之间的引用矩阵。

3   结果分析

为了清晰展示的理工农医知识流动情况,本文将梳理理工农医学科门类、学科间知识流动情况的基本特征,建立理工农医跨学科交互网络,分析理工农医学科间的相似度,并将结果进行可视化表达。

3.1    理工农医学科门类及学科间知识流动情况

根据文献的引证关系,可以揭示学科门类间的知识流动。在引文数据中,被引文献的知识通过引证关系流入施引学科。每个学科门类在被引学科门类和施引学科门类中所占比例,及其差值可以刻画出该学科门类是更多的引用其他学科门类,还是被其他学科门类引用。

汇总后的引文数据中,被引记录和施引记录的学科门类属于自然科学的分别占32.9%和30.4%,属于医药卫生的分别占12.6%和12.6%,属于工业技术的分别占43.6%和44.8%,属于农业科学的分别占10.2%和11.6%,属于社会科学的分别占0.7%和0.6%。通过学科门类间的知识流动,可以揭示自然科学的基础性作用,其他学科门类均从自然科学中汲取养分,导致自然科学的被引频次大于施引频次,工业技术、农业科学会更多的从其他学科汲取知识,致使其中学科门类的被引频次小于施引频次,而医药卫生、社会科学(不完整)的施引和被引频次较为平衡。

理工农医学科间知识流动情况,也可以用每个学科在被引学科和施引学科中所占比例的差值判断学科知识流动网络中,是更多的引用别的学科还是被别的学科引用。如果差值为正,说明该学科被其他学科引用次数较多,有着明显的学术溢出;差值为负,说明该学科引用其他学科较多,从其他学科汲取知识较多(见图1)。68个学科中,绝大多数学科的差值为±0.3%以内,说明该学科被引和施引次数大致相当,没有明显的波动。其中差值为正值,且大于0.3%的学科有,建筑科学0.9%、生物科学0.8%、物理0.6%、地理学0.4%、化学0.4%,这些学科被引次数明显大于施引次数,有较多学术溢出;差值为负值,且小于-0.3%的学科有环境科学-0.7%、无线电电子学、电信技术-0.5%、畜牧、动物医学-0.4%、农学(农艺学)-0.4%,这些学科被引次数明显小于施引次数,从其他学科获取知识较多。

3.2    理工农医跨学科交互网络

将68个学科之间的引用矩阵,通过可视化手段,表示理工农医跨学科交互网络(见图2)。交互网络中共有68个学科节点,2625条引用关系。从图中可以看出,生物科学和环境科学在网络中居于最为核心的地位。总体而言,网络过于繁杂,需要进一步简化,提取其更为核心的结构。

采用Zhao等创立的h子网的方法[16],对网络的核心结构进行抽取。h子网抽取的核心思想是抽取网络中h条连接强度不小于h的边,并保留与之相连的节点。它能在保留网络核心信息的同时,极为高效的简化网络,并且不需要人工设置参数对结果进行干预(理工农医跨学科交互核心网络见图3)。核心网络中共有55个学科和240条边。

图中节点的大小代表该学科施引次数的大小。学科间的箭头的大小代表某一学科从另一学科引用的文章的数量,箭头方向是知识流动的方向,也即从被引学科指向施引学科。在核心网络中,生物科学、环境科学、农业基础科学、地理学、地质学处于最核心的地位。核心部分的上侧,是农业科学门类中的学科,如农学、植物学、林业、植物保护等。核心部分的左侧是医药卫生门类中的诸多学科,如基础医学、中国医学、内科学、外科学等,它们都处于相对边缘位置。核心部分的下侧和右侧是工业技术和自然科学的部分学科,右侧形成了以物理和无线电电子学、电信技术,自动化技术、计算机技术,机械、仪表工程等学科为主的网络结构,下方形成了以石油、天然气工业、建筑科学、煤矿开采、矿业工程、工程材料学为主的网络结构。从核心网络可以看出,医药卫生、农业科学都自成一体,自然科学和工业技术之间联系紧密。

3.3   理工农医学科间的相似度

学科相似度是基于学科间的引用关系而确定的学科间相似性的大小。学科相似度是一个在0-1间的值,學科相似度越大说明学科之间的引用关系越相似。根据选用的引用关系不同,学科相似度可以分为被引相似度和引用相似度。

68个学科两两之间的被引相似度和引用相似度的相关系数高达0.977,两者强烈相关,可以互相替代,两者中任意取其一进行分析即可。选用施引用次数排名前20的学科,计算其两两之间的被引相似度(见图4)。在这20个学科中,区域Ⅰ是同属自然科学的7个学科之间的相似度,总体而言,两两之间相似度较低;区域Ⅱ是同属农业科学的4个学科之间的相似度,这四个学科互相之间的相似度均较高,并且与环境科学这一属于工业技术门类的学科之间的相似度也较高;区域Ⅲ是工业技术门类中的8个学科之间的相似度,除了环境科学和较为笼统的一般性问题之外,剩余学科之间的相似度较高。所有学科之间的相似度可以较为笼统的概括为,自然科学之间的相似度较低,农业科学之间的相似度极高,工业技术之间的相似度较高。

4   讨论

明晰理工农医学科流动的特征,可以让研究者更好的认识各个学科门类、学科的作用,合理划分学科边界,从而辨识知识流动和促进学科发展。

4.1    学科作用的再认知

自然科学毫无疑问发挥着基础性作用。自然科学的被引频次显著大于施引频次,自然科学学科门类中的物理、化学的被引频次都显著大于施引频次,这两点都是自然科学基础性作用的有力论据。但是在跨学科交互核心网络中,物理、化学、数学这些传统的基础学科都没有处于网络最为核心的地位,这可能是由于基础学科的进步,其知识需要一定的时间才能传导到其他学科,并且被其他学科运用。除此之外,自然科学内部的学科相似度较低,是由于物理、化学、数学、地理学等各自激发了相关的工程技术类学科,如物理的知识流向电信技术、原子能技术;力学流向机械、仪表工业、航空航天;化学流向基础无机化学工业、金属学与金融工业;地质学流向石油、天然气工业。工程技术这一学科门类中每一个学科之间联系相对更为密切,某些学科间的相似度也较高,并且被引频次显著大于施引频次,接受其他学科特别是自然科学的学科知识流出也较多。

农业科学和医药卫生这两个学科门类自身已经高度的专业化。这两个门类各自所属的学科,在核心网络中,都各成一派,各自形成明显的集团结构。在最后对于学科相似度的分析中,也可以看出农业科学内部的学科相似度极高。但农业科学和医药卫生都从生物科学中汲取知识,这也导致了生物科学在核心网络中处于最为核心的地位。

4.2    学科边界的再思考

对于跨学科知识流动迁移和交互作用的探讨,离不开对于学科边界的界定和探索。从科学发展史来看,学科不是静止不变的,它本身就是科学研究和培训科学家过程中通过劳动分工而产生的副产品[17]。学科知识的相似度和学科划分之间本身就存在着互为因果的关系。学科知识相似度的某种表征就是学科被引相似度和学科引用相似度。在学科划分之时,学者们往往希望学科内部知识的相似度尽可能的小,学科之间知识的相似度尽可能的大。而随着时间推移,学科知识不断演化,此时学者可以适时根据学科被引相似度的大小,调整学科的划分,重新定义学科的边界,从而更好的指导学科发展。

4.3    本文局限

一是使用的学科门类和学科是以文章所刊载的期刊来确定其学科分类,这本身也具有一定的局限性。与此同时,学科门类和学科的划分是根据中文核心期刊要目总览,如果采用另一种学科划分方法,如根据《中华人民共和国学科分类与代码国家标准(GB/T 13745-2009)》分类或者Web of Science中的研究方向分类来划分学科,结论也可能会有一些微小的差异。

二是由于理工农医数据信息量庞大,本文只是从CSCD 2017年数据断面导出的结论,可能影响结论的普適性。与此同时,本文采用中国科学引文数据库来表征我国理工农医知识流动情况,可能存在国内高水平研究成果更偏好于发表在国外期刊、会议论文集上等问题。

5   结语

本文通过引文网络的方法,对CSCD2017年收录的20余万条文章进行统计分析,抽取了其中60余万条引文数据,构建了5个学科门类、68个学科之间引文网络,探析了我国理工农医学科门类间以及各个学科间的知识流动情况。结果显示,自然科学的被引频次显著大于施引频次,具有基础性地位,工业技术、农业科学被引频次小于施引频次,医药卫生和社会科学(不完整)的施引和被引频次较为平衡;就具体学科而言,建筑科学、生物科学、物理、地理学、化学,有较多学术溢出;在理工农医跨学科交互的核心网络中,生物科学、环境科学、农业基础科学、地理学、地质学处于最核心的地位,医药卫生、农业科学这两个学科门类较为独立,自然科学和工业技术这两个学科门类中的学科互相之间联系较为紧密;从学科相似度角度,自然科学之间的相似度较低,农业科学之间的相似度极高,工业技术之间的相似度较高。由于学科分类和数据的局限,本文研究结论存在片面性,仅供进一步研究参考。

参考文献:

[1]  Jacobs J A,Frickel S.Interdisciplinarity:A Critical Assessment[J].Annual Review of Sociology,2009,35(1):43-65.

[2]  Zahedi Z,Costas R,Wouters P.How well developed are altmetrics?A cross-disciplinary analysis of the presence of ‘alternative metrics in scientific publications[J].Scientometrics,2014,101(2):1491-1513.

[3]  Costas R,Zahedi Z,Wouters P.Do“altmetrics”correlate with citations?Extensive comparison of altmetric indicators with citations from a multidisciplinary perspective[J].Journal of the Association for Information Science and Technology,2015,66(10):2003-2019.

[4]  Harzing A W,Alakangas S.Google Scholar,Scopus and the Web of Science:a longitudinal and cross-disciplinary comparison[J].Scientometrics,2016,106(2):787-804.

[5]  Yan E.Finding Knowledge Paths Among Scientific Disciplines[J].Journal of the Association for Information Science and Technology,2014,65(11):2331-2347.

[6]  Gao X,Guan J.Network model of knowledge diffusion[J].Scientometrics,2012,90(3):749-762.

[7]  Liu Y,Rousseau R.Knowledge Diffusion Through Publications and Citations:A Case Study Using ESI-Fields as Unit of Diffusion[J].Journal of the American Society for Information Science and Technology,2010,61(2):340-351.

[8]  Lewison G,Rippon I,Wooding S.Tracking knowledge diffusion through citations[J].Research Evaluation,2005,14(1):5-14.

[9]  陳柏彤,张斌.科学知识扩散研究框架[J].图书情报工作,2014,58(15):48-57.

[10]  董克,张斌.学科知识扩散网络路径识别研究进展[J].情报理论与实践.2017,40(8):139-144.

[11]  Chen L,Wei S,Jing Y.Shaping the interdisciplinary knowledge network of China:a network analysis based on citation data from 1981 to 2010[J].Scientometrics,2011,89(1):89.

[12]  赵星,谭旻,余小萍,等.我国文科领域知识扩散之引文网络探析[J].中国图书馆学报,2012,38(5):59-67.

[13]  岳增慧,许海云.学科引证网络知识扩散特征研究[J].情报学报,2019,38(1):1-12.

[14]  邱均平,瞿辉,罗力.基于期刊引证关系的学科知识扩散计量研究——以我国"图书馆、情报、档案学"为例[J].情报科学,2012(4):481-485.

[15]  关鹏,王曰芬,傅柱.基于多 Agent 系统的科研合作网络知识扩散建模与仿真[J].情报学报,2019,38(5):512-524.

[16]  Price D J.Networks of Scientific Papers[J].Science,1965,149(3683):510-515.

[17]  K伯特·a·西蒙,张铭.科学中的交叉学科研究[J].中国科学院院刊,1986(3):233-235.

作者简介:张家榕,女,南京大学信息管理学院博士研究生,研究方向:定量信息分析;张慧,女,南京大学信息管理学院博士研究生,研究方向:数据分析与科学计量;叶鹰,男,南京大学信息管理学院教授,研究方向:定量信息分析、数据分析与科学计量。