基于科学叠加图的我国人文社会科学跨学科现象研究

2018-01-10 07:09
现代情报 2018年1期
关键词:社科跨学科人文

开 滨

(山东女子学院图书馆,山东 济南 250300)

·管理论坛·

基于科学叠加图的我国人文社会科学跨学科现象研究

开 滨

(山东女子学院图书馆,山东 济南 250300)

[目的/意义]利用科学叠加图进行跨学科的研究,可以非常直观地从全领域的宏观层面对学科之间的引用关系及跨学科现状进行研究。[方法/过程]基于CSSCI中23个学科对我国人文社科领域的科学叠加图的制作过程进行了探讨研究,具体包括我国人文社科领域基础图、科学叠加图的制作以及Rao-Stirling跨学科指数的计算。[结果/结论]对我国图情学和山东省6所高校CSSCI发文这两个实例进行了实证研究。结果表明,基于CSSCI构造的人文社科领域科学叠加图较好地展示了学科的引用情况,Rao-Stirling指数较好地显示了跨学科的水平,因此可以将其作为一种展示我国人文社科领域跨学科研究的可视化方法。

科学叠加图;人文社科领域;跨学科;Rao-Stirling指数

随着各学科领域的不断融合发展,学科交叉性态势呈现出不断上升的趋势,局部领域科学图谱由于受制于有限的学科范围,无法揭示整个全领域学科之间的特征及变化过程。近年来在计算机大数据计算及可视化技术日渐成熟的条件下,产生了一种不同于局部科学图谱的方法——科学叠加图。科学叠加图是近年来兴起的一种较新的可视化展示技术,用于对全领域性进行科学有效地展示。科学叠加图作为一种全领域的科学图谱,与以往局部的科学图谱呈现的不同,借助于科学叠加图,使我们能够快速地跟踪领域的发展变化,特别是在跨学科研究方面,科学叠加图能够为研究人员的科学研究及科学评价提供了一种全新的视角。国外研究方面,Leydesdorff和Rafols等学者开创了科学叠加图的先河,他们通过使用WOS中的JCR构建了由221个学科组成的基础图,并利用科学叠加图对具体实例进行了实证研究,证明了科学叠加图已经成为科学研究非常有力的工具[1-2]。关于科学叠加图的实用方面的研究包括Garechana等学者对废物回收利用研究领域[3]、Kalz等学者对技术增强学习领域[4]等的实证研究。Shiji Chen等学者基于NSF包含的143个学科构造了一个全学科基础图,并以此构建的科学叠加图对国际上生物化学和生物分子学的跨学科演变过程进行了分析[5]。国内研究方面主要是基于Leydesdorff和Rafols等学者制作的科学叠加图对不同领域的跨学科进行研究,如张金柱、郭婷等学者分别对国际图情学[6-7]、齐燕等学者对国际医学信息学科[8]等进行的研究。孙茜等学者通过对国外科学叠加图的概念、特点、原理进行了归纳总结,并通过实证研究证明了科学叠加图同时也可以作为一种有效的展示机构学科成果评价的可视化工具[9]。当前的研究者主要基于国外的学科分类法进行科学叠加图的构造,迄今还未有学者针对我国的引文数据库构造我国的科学叠加图,基于此,本文拟采用CSSCI数据库对我国人文社科领域的基础图及科学叠加图进行构造,以期为我国跨学科研究提供相应参考。

1 数据来源

本文数据来源包括两部分,第一部分为CSSCI中获取的全学科数据,该数据用于构造全学科基础图,该数据来源于我国中文社会科学引文索引数据库(CSSCI)中23门学科包含的数据,由于检索延迟的原因2016年部分数据还未收录,因此我们设定发文时间从2006-2015年的10年。第二部分为我国中文社会科学引文索引数据库(CSSCI)中获取的实例数据,本文中包含的实例数据分别为我国图情学的数据以及山东省6所高校发表的CSSCI数据。以上两部分数据的文献类型均为Article,数据获取时间截止到2017年2月20日。

2 具体制作过程

具体制作过程包括4步,流程图如图1所示,下面我们结合图1对各步骤进行说明。

图1 制作过程流程图

2.1 原始数据的获取

从CSSCI中下载23个学科在2006-2015年10年间的全部数据,同时列出23个学科的中文名称与英文缩写的对照表,23个学科名称及对应表见表1所示。

2.2 引文矩阵、引文相似性矩阵的构造

为了对CSSCI原始数据中的引文进行分析,我们编写程序用于对原始数据中的来源期刊进行自动提取以及对提取的期刊与学科进行自动匹配,最终得到23个学科之间的引文矩阵,该引文矩阵为非对称矩阵,其中横向代表施引学科,纵向代表被引学科。该矩阵中的数值为整数,代表了该数值所在的横向学科引用了纵向学科的频次,同时也代表了该数值所在的纵向学科被横向学科引用的频次。由于引文矩阵为非对称矩阵,无法直接进行分析,接下来我们将引文矩阵导入SPSS中进行余弦相似性分析,得到学科引用相似性矩阵。该矩阵为对称矩阵,该矩阵中的数值范围为[0,1],代表了两个学科之间的相似性程度,该数值越大,说明学科之间的相似性越高。

2.3 基础图及科学叠加图的构造

为了构造科学叠加图,我们首先要构造全学科基础图。由于本文采用Pajek[10]可视化软件,因此我们需要构造3种能被Pajek识别的文件,分别为Net文件、Clu文件和Vec文件。Net文件用于存放各学科代码及其引用关系,Clu文件用于存放学科聚类信息,Vec文件用于存放实例数据中被引学科的频次。下面分别对这3种文件的构造进行说明。

表1 CSSCI各学科名称与代码对应表

2.3.1 Net文件的构造

Net文件包含各学科之间的引用关系,简言之,即某一学科具体引用了哪些学科及其引用频次,该文件由3列构成,第1、2列分别为施引学科和被引学科,第3列为引用次数,引用频次由引文矩阵来构造,然后依次经过去除零引用关系、去除自引关系、去除有向边等步骤后得到Net文件。

2.3.2 Clu文件的构造

Clu文件包含各学科之间的聚类关系,简言之,即哪些学科之间的关系更强,可以合并为同一大类。为了将其聚类,我们将引文相似性矩阵导入SPSS中进行因子分析,采用主成分分析法,因子旋转采用最大方差法,共萃取得到8个主成分,如表2所示,其总方差解释量为70.34%,这8个主成分即可得到Clu文件。

表2 CSSCI各学科因子分析结果

2.3.3 Vec文件的构造

这3类文件中,Net文件和Clu文件构造完成后即固定不变。只有Vec文件属于实例文件。Vec文件的构造如下,从CSSCI中下载需要分析的实例数据后,通过自编程序可得到实例数据中的引用学科及其频次,即得到了Vec文件。

2.3.4 基础图的构造

将上面得到的Net文件、Clu文件导入Pajek中,即可得到全学科的基础图,如图2所示,该图直观显示了2006-2015年我国人文社科领域23个学科之间的引用及聚类关系,图中每个点代表了一个学科,连线的粗细代表了学科之间的相对引用频次,线条越粗,表示学科之间引用的次数越多,相同颜色的点代表了学科之间属于相同的聚类。

图2 CSSCI人文社科全领域基础图

2.3.5 科学叠加图的构造

在全学科基础图的基础上,我们可以对具体的实例,例如某一学科领域、某一机构、某一地区或者某一作者的CSSCI数据进行科学叠加图的构造。方法为将Net文件、Clu文件以及Vec文件同时导入Pajek中即可得到相应实例的科学叠加图。

2.4 Rao-Stirling指数计算

根据Rao-Stirling指数的公式,需要计算两个变量:被引学科i所占的比例以及学科i、j之间的相似性Si,j。其中学科i所占的比例可以从实例数据的Vec文件中求得。Si,j可以从学科引文相似性矩阵中求得,最终可以计算Rao-Stirling指数。

3 应用举例

例1:以CSSCI中2006年至2015年我国图情学为例,绘制10年间我国图情学的科学叠加图,并对其跨学科变化进行分析,研究步骤如下。

第一步,从CSSCI中下载2006-2015年我国图情学包含的数据作为实例数据;

第二步,将数据导入自编程序中得到10年间我国图情学总的引用的学科及其频次,该数据用于构造科学叠加图;得到我国图情学每年引用的学科及其频次,该数据用于计算每年的Rao-Stirling指数;

第三步,将Net文件、Clu文件和Vec文件一并导入Pajek中,得到十年间我国图情学的科学叠加图,如图3所示;

第四步,分别计算每年的Rao-Stirling指数及其变化趋势,如表3、图4所示。

从图3可以直观地看出,10年间我国图情学最大的学科来源为图书馆、情报与文献学,该学科代表的点远远大于其他学科所代表的点。这是因为:从隶属关系来说,图情学属于图书馆、情报学与文献学的范畴,说明我国图情学的学者最经常引用的为本学科的知识。除了自引之外,我国图情学的学科来源主要集中在管理学、经济学、新闻学与传播学、教育学等学科,这些学科构成了近十年来我国图情学的主要学科来源,我国图情学与这些学科的关系非常密切,说明我国图情学的学者也较多的从管理学、经济学、教育学、新闻与传播学等学科中引用知识。而环境科学、人文、经济地理、民族学与文化学、宗教学、考古学、艺术学、中国文学、外国文学等学科由于被引用频次非常少,成为我国图情学学科来源中的边缘学科,这些学科与我国图情学的关系较为疏远。从图3中我们也可以看出,与图情学密切相关的学科大致分布在图情学的邻近位置,而与图情学关系较为疏远的学科则分布在离图情学较远的位置。

从表3和图4我们可以得出如下结论:从被引学科数量来看,我国图情学的引用学科的涉及面基本保持在21~23个学科之间,说明学科数量的多样性变化并不明显。从跨学科指数的变化趋势来看,10年间我国图情学的跨学科经历了增长、下降、增长的过程,具体为2006-2011年,我国图情学的跨学科处于增长阶段,2012-2014年,我国图情学跨学科处于下降阶段,2015年之后又开始增长,说明2010年、2011年、2012年这3年我国图情学的跨学科水平最高,即这几年图情学的引文分布较为均衡。同时我们也发现跨学科指数与自引率呈现出了相反的关系,这可以解释为学科自引率越高,会导致越多的引文集中到该学科中,因此其引文分布变化相对不均衡,从而导致跨学科水平也越低。在计算跨学科指数时,我们同时计算每年的布里渊指数和COC指数进行对比。将表3导入SPSS进行相关性分析,结果显示3种跨学科指数具有显著的正相关性,其中Rao-Stirling指数与布里渊指数、COC指数的相关性分别高达0.997、0.999,说明了三者在描述跨学科变化程度上具有一致的效果,同时这一结论也可以从图4中的3种指数的曲线具有非常近似的变化趋势得出。

图3 2006-2015年我国图情学科学叠加图

年引用的学科数量Rao-Stirling指数布里渊指数COC指数(%)自引率(%)年引用的学科数量Rao-Stirling指数布里渊指数COC指数(%)自引率(%)2006220.2196170.27983213.0986.912011220.3029110.346519.5180.492007220.2212420.2780413.3186.692012230.2986990.34662319.1180.892008220.2270270.28357913.7086.302013220.2803590.33059417.7082.302009220.2505480.30436115.4484.562014230.257490.31065315.8484.162010220.3001030.34886119.1980.812015210.2820470.3378117.4982.51

图4 2006-2015年我国图情学3种跨学科指数变化过程

例2:以2011-2015年山东省6所高校(山东大学、中国海洋大学、中国石油大学(华东)、山东师范大学、山东农业大学、山东科技大学)所发表的CSSCI文献为研究对象,绘制6所高校的CSSCI科学叠加图并进行分析,研究步骤如下。

第一步,从CSSCI中下载2011-2015年内6所高校发文的数据作为实例数据;

第二步,将数据导入自编程序中得到5年间6所高校所引用的学科及其频次,该数据用于构造科学叠加图及计算Rao-Stirling指数;

第三步,将6所高校的Net文件、Clu文件和Vec文件一并导入Pajek中,得到5年间6所高校的科学叠加图,如图5所示;

第四步,分别计算6所高校的Rao-Stirling指数,如表4所示。

图5 2011-2015年山东省6所高校科学叠加图

从图5和表4我们可以得出如下结论:从6所高校的引文学科数量来看,CSSCI学科上涉及面最广的为山东大学和山东师范大学,均为23个学科,其余4所高校为21个学科,这一点可以从图5中各高校包含的点的数量看出。从6所高校相互比较来看,山东大学、中国海洋大学、山东师范大学3所高校所含有CSSCI优势学科的数量较多,说明这3所高校在CSSCI学科的发展过程中优势较为明显,这一点可以从图5中各高校包含的较大的点的数量看出。从6所高校自身比较来看,这6所高校在CSSCI学科上具有自身的特点,这一点可以从图5中各高校具体包含哪些较大的点看出。其中山东大学的CSSCI优势学科主要集中在经济学、管理学、法学、政治学、历史学、考古学、语言学等学科上,中国海洋大学的CSSCI优势学科主要集中在经济学、管理学、人文、经济地理等学科上,山东师范大学的CSSCI优势学科主要集中在心理学、经济学、教育学、中国文学等学科上,中国石油大学(华东)、山东科技大学两所学校的CSSCI优势学科集中在经济学和管理学上,除此之外6所高校也有各自的优势学科,如山东大学的法学政治学、历史学、考古学,中国海洋大学的人文、经济地理,山东师范大学的心理学、教育学、中国文学,这些学科也与6所高校实际的人文社科优势学科基本一致,代表了在学校发展中逐步积累起来的自身科研优势。

表4 2011-2015年山东省6所高校跨学科指数列表

从跨学科指数来看,6所高校中山东师范大学的跨学科水平最高,说明该校从CSSCI各学科中吸收知识的多样性和均衡性最为合理,之后依次为山东大学、中国石油大学(华东)、中国海洋大学,山东农业大学和山东科技大学两所高校的跨学科性最低,一方面是由于这两所高校引用的CSSCI学科数量及频次相对较少;另一方面也由于这两所高校在CSSCI的学科吸收方面,过度地集中在少量几个学科中(山东农业大学为经济学为主,山东科技大学为经济学、管理学为主),缺乏较多有竞争力的优势学科,导致了CSSCI学科的知识吸收均衡性水平相对较低。

4 结 语

本文基于CSSCI中23门学科的引文分析,对我国人文社科领域的基础图及科学叠加图的制作及Rao-Stirling指数计算进行了研究。并以我国图情学领域及山东省6所高校的CSSCI发文数据为例进行了实证研究。结果表明本文构造的CSSCI科学叠加图能够较好地反映我国人文社科领域学科引用的真实情况,同时Rao-Stirling指数也能较好地对我国人文社科领域的跨学科水平及其演变过程进行描述。因此借助于本文构造的科学叠加图,我们可以开展如下研究:

1)针对CSSCI中某一学科、领域的科学叠加图进行构造,能够分析该学科、领域对于我国人文社科领域不同学科知识的吸收利用程度,同时也能够反映学科、领域的跨学科状况及其变化过程,为该学科、领域内的跨学科研究提供一种全局的视角。

2)针对某一地区、某一研究机构或研究学者在CSSCI中所发文献的科学叠加图进行构造,能够分析该地区、研究机构或学者的科研产出对于各学科知识的吸收水平,这可以体现该地区、研究机构和学者对于不同学科辐射的广度及深度,同时对于评价不同地区、不同研究机构、不同学者之间的科研水平也提供了一种全新的方法。

当然本文的研究还存在一定的局限性,由于本文构造的科学叠加图只能对我国人文社科领域进行描述,对于自然领域则无能为力。本文的第2个例子中,中国海洋大学、中国石油大学(华东)、山东农业大学、山东科技大学4所高校均为理工类高校,因此根据人文社科领域科学叠加图得出的结果仅能反映上述4所高校人文社科领域的科研水平,而并不能真实反映该校自然领域的科研水平,因此将本文构造的人文社科领域科学叠加图扩展到全领域(包括自然领域和人文社科领域)范围内的科学叠加图才会更加真实地反映不同机构的科研水平和特色。由于科学叠加图是基于引文数据库开发的,最能代表我国人文社科领域和自然领域的引文数据库分别为CSSCI和CSCD,如何将CSSCI和CSCD两大引文数据库整合在一起构造我国人文社科领域和自然领域全学科领域的科学叠加图,需要后续的进一步研究。

[1]Rafols,Ismael,Porter,Alan L.,Leydesdorff,Loet.Science.overlay maps:A new tool for research policy and library management[J].Journal of the American Society for Information Science and Technology,2010,61(9) :1871-1887.

[2]L Leydesdorff,I Rafols.Interactive overlays:A new method for generating global journal maps from Web-of-Science data[J].Journal of Informetrics,2011,6(2):318-332.

[3]G Garechana,R Rio,E Cilleruelo,J Gavilanes.Tracking the evolution of waste recycling research using overlay maps of science[J].Waste Management,2012,32(6):1069-1074.

[4]M Kalz,M Specht.Assessing the crossdisciplinarity of technology-enhanced learning with science overlay maps and diversity measures[J].British Journal of Educational Technology,2014,45 (3) :415-427.

[5]Shiji Chen,Cle ment Arsenault,Yves Gingras,Vincent Larivie`re..Exploring the interdisciplinary evolution of a discipline:the case of Biochemistry and Molecular Biology[J].scientometrics,2015,102(2):1307-1323.

[6]张金柱,韩涛,王小梅.利用参考文献的学科分类分析图书情报领域的学科交叉性[J].图书情报工作,2013,(1):108-111,146.

[7]郭婷,许海云,岳增慧,等.情报学学科交叉态势可视化研究[J].情报理论与实践,2015,(9):94-99.

[8]齐燕,许海云,方曙.基于WOS数据的医学信息学学科交叉发展态势研究[J].中华医学图书情报杂志,2016,(11):30-41.

[9]孙茜,赵旭,王大盈.科学叠加图谱及其应用研究[J].情报资料工作,2016,(5):53-60.

[10]Pajek主页[OL].http://mrvar.fdv.uni-lj.si/pajek,2017-04-18.

ResearchontheInterdisciplinaryPhenomenaofHumanitiesandSocialSciencesinChinaBasedonScienceOverlayMaps

Kai Bin

(Library,Shandong Women’s University,Jinan 250300,China)

[Purpose/Significance]Interdisciplinary studies using science overlay maps could be very intuitive to study the citation relations and interdisciplinary situations from the macro level of the whole field.[Method/Process]This paper studied the production process of the science overlay maps based on 23 disciplines in the CSSCI of China’s humanities and social sciences,specifically including the production of base map and science overlay maps of humanities and social sciences in China,and the calculation of Rao-Stirling index.[Result/Conclusion]This paper then made an empirical study on the two instances of library science and information science and scientific output of CSSCI in 6 universities in Shandong Province.The results showed that the science overlay maps of humanities and social sciences based on CSSCI could better demonstrate the citation of disciplines,and the Rao-Stirling index preferably showed the interdisciplinary level,therefore,it could be used as a visualization method to demonstrate interdisciplinary research in humanities and social sciences in China.

science overlay maps;humanities and social sciences;interdisciplinary;Rao-Stirling index

10.3969/j.issn.1008-0821.2018.01.024

G250.252

A

1008-0821(2018)01-0162-07

2017-08-01

开滨(1981-),男,副研究馆员,硕士,研究方向:科学计量学、跨学科计量研究。

郭沫含)

猜你喜欢
社科跨学科人文
社科成果展示
跨学科教学在高中生物课堂教学中的应用实践
初中历史跨学科主题学习活动的实践与思考
社科成果展示
应用型高校推进跨学科人才培养的路径探索
社科成果展示
人文绍兴
商标跨类保护的跨学科解释
人文社科
让人文光辉照耀未来