基于社会网络分析的国际数学家论文合著现象研究

2014-04-29 02:40顾海东闫统江
电子世界 2014年19期
关键词:社会网络分析可视化数学

顾海东 闫统江

【摘要】利用社会网络分析方法,研究国际数学领域作者合作关系。选择以著名数学家Paul Erd?s为核心的庞大的国际数学家合著网络进行实证研究。构建可视化合著网络以研究国际数学领域的合著现象。通过实证研究,揭示出国际数学领域作者合著网络的特点现状,评价了数学家在合著网络中的地位,指出了合著网络中核心作者,发现了合著网络中的联系紧密的团体。

【关键词】社会网络分析 数学 合著网络 可视化

Study of Co-authorship of International Mathematicians Based on Social Network Analysis

China University of Petroleum(East China),College of Science,Department of Computational and Applied Mathematics  GU Hai-dong  YAN Tong-jiang

Abstract:This paper is focus on the status of the collaboration in the international mathematics field by using the method of social network analysis. Choose the enormous international mathematician coauthoring network centering the notable mathematician Paul Erd?s to study. Build visualizable coauthoring network to study the international mathematical coauthoring phenomenon. Through the study,it reveals the features and the status of the coauthoring network,evaluates the status of mathematician in the network,distinguishes key authors in the network,and discovers several subgroups with close links between their members.

Key words:Social Network Analysis;Mathematics;Coauthoring network Visualization

1.引言

随着现代科学技术蓬勃发展,学科专业化程度越来越高,一些前沿尖端问题的解决往往需要跨学科跨领域的专家合作。国际科研合作日趋频繁,其中的一个重要标志就是论文合著现象向多角度,多领域的延伸。因此,对现代科研领域合著现象的研究无疑有助于更好地了解现代科学发展趋势。

研究合著现象,其本质就是研究作者之间的关系,而社会网络分析方法正是以研究关系见长的一种方法。本文拟采用社会网络分析方法,分析以20世纪数学家、最伟大的学者共同作者Paul Erd?s为核心的庞大的国际数学家合著网络,以研究近现代国际数学领域的合著现象。Erd?s作为合作者的角色在数学领域很惊人,体现在他庞大复杂的合著者网络(见网站http://www.oakland.edu/enp/)。

2.研究方法

2.1 数据来源

本文选择以Paul Erd?s为核心的庞大的国际数学家合著网络,以研究国际数学领域的合著现象。数据来源是奥克兰大学(OAKLAND UNIVERSITY)Erd?s数工程项目(见网站http://www.oakland.edu/enp/),该工程专门研究国际数学家之间的合作。原始数据来自Erd?s1文件(见网站https://files.oakland.edu/users/grossman/enp/Erdos1.html)。 Erd?s1文件列出了511位Erd?s数为1的数学家(与Erd?s直接合作过的数学家)及其合作者的姓名。

2.2 研究工具

为了是社会网络分析更简单易行,很多学者都致力于开发应用于社会网络分析的软件或程序。社会网络分析软件有多种,在国际社会网络分析网(INSNA)的网站上列出的可用于社会网络分析的程序/软件多达54种[1]。其中一些是可视化软件,用于对社会网络进行可视化,一些具有分析的功能。中国社会科学院社会学研究所主办的中国社会学网(http://www.sociology.cass.cn/)的“研究工具”专栏列出了一些常用的社会网络分析软件[2],主要包括:KrackPlot、STRUCTURE、GEGOPY、Pajek、Stocnet和UCINET等。其中,UCINET是研究者使用较多的社会网络分析软件。

论文作者合著研究所形成的网络具有复杂性网络的特性,这种特性可以通过具有交互性、多维性和可视性的可视化技术生动、形象地呈现出来[3]。UCINET软件集成了NETDRAW,MAGE,PAJEK三种可视化方法。本文的数据分析主要是通过UCINET软件完成的。

3.研究结果分析

3.1 Erd?s数为1的数学家合著网络

本文在构建合著网络时,用1表示两位作者之间存在合著关系,用0表示两位作者之间不存在合著关系[4]。对Erd?s1文件进行数据提取,建立由511位Erd?s数为1的数学家构成的合作关系网络。表1是构建的Erd?s数为1的数学家合著网络的矩阵的部分。

本文采用的是UCINET中的NETDRAW方法,通过该方法把511位Erd?s数为1的数学家间的合著情况以网络图的方式呈现出来,图1即为这511位数学家间的合作网络图,该图是点度中心度作为衡量指标呈现出来的,及点度中心度越大的作者,他的节点就越大。

3.2 确定核心作者群

由于构建的Erd?s数为1的数学家合著网络十分庞大复杂,且不便于分析,也无法突出重点。为了更直观的观察数学领域的合作情况,需要对511位合作作者做进一步的限定,以期观察数学领域中较为重要的作者和合作团体的特点。所以,本文选取Erd?s数为1的数学家中的核心作者。根据普赖斯定律:在同一主题中,半数的论文是一群高生产力作者所写,这一作者集合数量约等于全部作者总数的平方根。511位数学家中,最高发文量为361篇。根据公式(1)可以得出数学领域核心作者最低发文数。

(1)

式中:m为核心作者中最低产作者发表论文数;为核心作者中最高产作者发表论文数。

在Erd?s数为1的数学家群体中,=361,计算出核心作者的发表文献数量在15以上,因此可以定义发表文献数量在15以上的作者为核心作者共有362位[5]。用UCINET中NETDRAW方法把511位Erd?s数为1的数学家中的核心作者间的合著情况以网络图的方式呈现出来,图2即为这362位核心作者间的合作网络图,该图是点度中心度作为衡量指标呈现出来的,及点度中心度越大的作者,他的节点就越大。

3.2.1 核心-边缘结构分析

在UCINET中进行核心-边缘结构分析的菜单路径为Network>Core/Peripher y>Categorical。

核心-边缘结构分析的结果将60位数学家置于核心位置,另外451位数学家置于边缘位置。核心数学家作者群中,发表文献数量最多的作者发表了361篇文献,最少的仅发表了15篇文献。而由普赖斯定律,这60位数学家也被认为是核心作者。综合普赖斯定律和核心-边缘结构分析的结果,这60位数学家是真正的核心作者。

用UCINET中NETDRAW方法把511位Erd?s数为1的数学家中的真正核心作者间的合著情况以网络图的方式呈现出来,图3即为这60位真正核心作者间的合作网络图,该图是点度中心度作为衡量指标呈现出来的,及点度中心度越大的作者,他的节点就越大。

3.2.2 中心性分析

(1)点度中心性

UCINET中进行点度中心性分析的菜单路径为Network>Centrality>Degree。下表是利用UCINET对60位真正的核心作者的合著网络进行点度中心性分析的结果。由于篇幅关系,仅列出部分结果,下同。

表2 点度中心度排名

Ranking Name Degree Nrm Degree Share

1 ALON,NOGAM. 35.000 59.322 0.041

2 RODL,VOJTECH 30.000 50.847 0.035

3 FUREDI,ZOLTAN 28.000 47.458 0.033

4 GRAHAM,RONALDLEWIS 28.000 47.458 0.033

.

.

. .

.

. .

.

. .

.

. .

.

.

59 KLUGERMAN,MICHAEL RICHARD 5.000 8.475 0.006

60 POMERANCE,CARLBERNARD 5.000 8.475 0.006

在表2中Degree那一列是绝对点度中心度,NrmDegree那一列是相对点度中心度。从结果可以看出,点度中心度最高的是ALON,NOGAM,其绝对点度中心度是35。根据点度中心度的定义,表明其与网络中其他35个结点有直接联系,也就是说,ALON,NOGAM曾与35位数学家合作发表过论文。绝对点度中心度的最低值是5。

表3是这60位核心数学家作者发表论文数量排名。对比点度中心度排名(表2)和发表论文数量排名(表3),发现两者具有很大的相似性,说明发表论文数量比较多的作者和他人的合作也比较频繁。

表3 发表论文数量排名

Ranking Name papers

1 ALON,NOGAM 361

2 HARARY,FRANK* 316

3 TUZA,ZSOLT 177

4 GRAHAM,RONALDLEWIS 177

.

.

. .

.

. .

.

.

59 SARKOZY,GABORN 15

60 KLUGERMAN,MICHAELRICHARD 13

但是,点度中心性仅仅考虑的是一个作者与其他作者之间的直接联系,而忽视了他与整个网络中所有作者的联系。也就是说,即使一个作者与其他很多作者都有直接联系,但是和这个作者有直接联系的作者和其他作者都没有什么联系,即使这个作者有很高的点度中心度,但是这种情况只存在于“本地”网络中。从整个网络的角度看,点度中心性的意义就不是很大了[6]。

(2)中间中心性

在UCINET中进行中间中心性分析的菜单路径是Network>Centrality>Free

man Betweenness>Node Betweenness。下表是利用UCINET对60位真正的核心作者的合著网络进行中间中心性分析的结果。

表4 中间中心度排名

Ranking Name Betweenness nBetweenness

1 ALON,NOGAM. 347.797 10.164

2 GRAHAM,RONALDLEWIS 201.608 5.892

3 FUREDI,ZOLTAN 188.937 5.521

4 PACH,JANOS 171.863 5.022

.

.

. .

.

. .

.

. .

.

.

59 CHEN,GUANTAO 0.762 0.022

60 KLUGERMAN,MICHAELRICHARD 0.000 0.000

从表4可以看出,中间中心度最高的是ALON NOGAM,其次是 GRAHAM RONALDLEWIS 和FUREDI ZOLTAN等人。这些作者的中间中心性比较高,说明他们掌握了比较多的研究资源。同时,结果表明,有一部分作者的中间中心度接近0,这些作者几乎不具备控制资源的能力。统计排序这60位真正核心作者的中间中心度,发现是均匀递增的,最高和最低相差比较大。说明这60位作者控制资源的能力良莠不齐。

(3)接近中心性

计算接近中心性时,网络必须是完全连通图,及每个结点都和网络中其他所有结点有联系。因此,在计算接近中心性之前,我们必须先进行成分分析,因为成分是网络中最大的连通子图。

在UCINET中进行成分分析的菜单路径是Network>Regions>Components

>Simple graph。

通过对合著网络进行成分分析,发现网络只有一个成分,及整个网络就是一个完全连通图,所以可以直接计算接近中心度。

在UCINET中进行接近中心性分析的菜单路径是Network>Centrality>

Closeness。下表是利用UCINET对60位真正的核心作者的合著网络进行接近中心性分析的结果。

从表5可以看出,ALON NOGAM的接近中心度值最小,说明他能以最短的路径到达其他作者,在网络中处于比较核心的地位。

综上,比较表2至表5,可以发现接近中心性和中间中心性分析指数都比较高的作者是和比较多的作者合作过并且发表论文数量较多的学者。

表5 接近中心度排名

Ranking Name In Farness Out Farness

1 ALON,NOGAM. 83.000 83.000

2 RODL,VOJTECH 88.000 88.000

3 FUREDI,ZOLTAN 90.000 91.000

4 GRAHAM,RONALDLEWIS 91.000   91.000

.

.

. .

.

. .

.

. .

.

.

59 SCHULMAN,LEONARDJ.Y. 136.000 136.000

60 KLUGERMAN,MICHAELRICHARD 140.000 140.000

ALON NOGAM的点度中心度最高,说明与他有合著关系的数学家也是最多的。他在中间中心性和接近中心性分析结果中都位居第一,其发表论文数量也位于第一位。ALON NOGAM是著名的以色列数学家,在组合数学和理论计算机科学领域做出卓越贡献,曾获得Erd?s奖、Feher奖、Pólya奖、G?del奖等国际著名奖项。

RODL VOJTECH的点度中心度第二高,及与他合作的数学家数量第二多。他在接近中心性分析中排第二,在中间中心性分析中排第五。RODL VOJTECH是杰出的捷克数学家,他在组合数学领域享有盛誉,曾获得Pólya奖。

FUREDI ZOLTAN在点度中心性分析,中间中心性分析和接近中心性分析中均排名第三。FUREDI ZOLTAN是知名的匈牙利数学家,在分形几何和组合数学均有建树,同时是匈牙利科学院院士。

GRAHAM RONALDLEWIS在点度中心性分析和接近中心性分析中排第四,在中间中心性分析中排第二,发表论文数量排名第三。GRAHAM RONALDLEWIS美国著名数学家,在排程理论、拉姆齐理论、计算几何学和低差异数列均有建树。他曾经是美国数学学会主席,AT&T首席科学家。2003年荣获美国数学学会颁发的Steele奖。

3.2.3 凝聚子群分析

利用UCINET中的CONCOR法进行凝聚子群分析。CONCOR是一种迭代相关收敛法(convergent correlation)。经过多次迭代计算之后,CONCOR利用树形图表达各个位置之间的结构对等性程度,并且标记出各个位置拥有的网络成员。

下图4就是利用UCINET中的CONCOR法得到的凝聚子群树形图。

由图4可以清楚的看出60位Erd?s数为1的真正核心作者被分成8个小团体。

团体1,AJTAI,MIKLOS;SZEMEREDI,ENDRE;SERESS,AKOS;BABAI,LASZLO;HAJNAL,ANDRAS;SOS,VERATURAN;STRAUS,ERNSTGABOR;LINIAL,NATHAN;LOVASZ,LASZLO;CHVATAL,VACLAV(VASEK);ROTHSCHILD,BRUCELEE;RUZSA,IMREZ;KOMLOS,JANOS;SARKOZY,ANDRAS;SIMONOVITS,MIKLOS。

绝大部分都是匈牙利数学家,研究领域集中在组合数学和图论。其中大部分匈牙利数学家都在匈牙利科学院数学研究所工作学习过。

团体2,WINKLER,PETERMANN;GRAHAM,RONALDLEWIS;

TROTTER,WILLIAMTHOMAS,JR;ALON,NOGAM;SPENCER,

JOELHAROLD;SAKS,MICHAELEZRA;FISHBURN,PETERC;FUREDI,ZOLTAN;CHUNG,FANRONGKING(GRAHAM);ODLYZKO,ANDREWMICHAEL;TETALI,PRASAD;FRANKL,PETER。

绝大部分是美国数学家,研究领域集中在组合数学和离散数学。他们大多来自美国东海岸和西海岸的高校,如哈佛大学,麻省理工学院,纽约大学,普林斯顿大学,宾夕法尼亚大学,罗格斯大学,佐治亚理工学院,加州理工学院,加州大学伯克利,加州大学洛杉矶和加州大学圣地亚哥等。GRAHAM,RONALDLEWIS,CHUNG,FANRONGKING(GRAHAM),TROTTER,WILLIAMTHOMAS,JR和SPENCER,JOELHAROLD等人都在拉姆齐理论方面有深入研究。值得一提的是GRAHAM,RONALDLEWIS和CHUNG,FANRONGKING(中国台湾)是夫妻,二人都在加州大学圣地亚哥任教。GRAHAM,RONALDLEWIS曾任美国数学学会主席,被授予终生成就奖,被称赞为“现代离散数学快速发展的主要推动者”。

团体3,ARONOV,BORIS;SCHULMAN,LEONARDJ.Y.;GODDARD,WAYNEDEAN;PACH,JANOS;KLEITMAN,DANIELJ。

这五人都致力于计算几何的研究,其中两人来自纽约大学,两人来自麻省理工学院,还有一位来自克莱姆森大学。五人中只有PACH,JANOS不是美国人,他出生于匈牙利一个著名的学者家庭,他叔父是匈牙利最著名的数学家之一。他本人现在身为纽约大学库朗数学研究所教授还担任国际知名学术期刊离散和计算几何主编。

团体4,SZEKELY,LASZLOA;POMERANCE,

CARLBERNARD。

SZEKELY,LASZLOA来自南加州大学数学系。POMERANCE,CARLBERN

-ARD是国际著名的数论学家,在哈佛大学取得数学博士学位,被达特茅斯学院聘为杰出教授,2012年当选美国数学学会会员。

团体5,PYBER,LASZLO;KOHAYAKAWA,YOSHIHARU;

LUCZAK,TOMASZ;KOSTOCHKA,ALEXANDRV;GYORI,ERVIN;RODL,VOJTECH;BOLLOBAS,BELA。

这七位数学家虽然来自不同国家和研究机构,但研究领域都集中在组合数学和图论。其中LUCZAK,TOMASZ和RODL,VOJTECH都来自埃默里大学。PYBER,LASZLO和GYORI,ERVIN都来自匈牙利科学院。

团体6,WORMALD,NICHOLASCHARLES;HELL,PAVOL;NESETRIL,JAROSL-AV。

HELL,PAVOL和NESETRIL,JAROSLAV都曾在捷克的布拉格查理大学学习数学。HELL,PAVOL后来加入加拿大籍,在西蒙菲莎大学执教。WORMALD,NICHOLASCHARLES是澳大利亚数学家,莫纳什大学数学教授,曾担任加拿大国家首席教授在滑铁卢大学。这三人都致力于组合数学和图论的研究。

团体7,BURR,STEFANANDRUS;CHARTRAND,

GARYTHEODORE;HARARY,FRANK;OELLERMANN,

ORTRUDR。

这四位数学家均来自不同的科研机构,但都主要致力于图论的研究。HARARY,FRANK还被誉为“现代图论之父”。

团体8,SCHELP,RICHARDH;GOULD,RONALDJ;

CHEN,GUANTAO;JACOBSON,MICHAELSCOTT;FAUDREE,RALPHJASPER,JR;GYARFAS,ANDRAS;ROUSSEAU,CECILCLYDE;TUZA,ZSOLT;

WEST,DOUGLASBRENT;LEHEL,JENO;SARKOZY,GABORN。

SCHELP,RICHARDH;CHEN,GUANTAO(中国);FAUDREE,RALPHJASPE -R,JR;ROUSSEAU,CECILCLYDE和LEHEL,JENO均来自孟菲斯大学。其他数学家也大多来自美国中部各高校。他们的研究领域集中在组合数学和图论。

通过凝聚子群分析,可以得出数学同其他学科一样,合作关系受地理位置影响大,同一地域或者同一机构的学者,更容易构成合作关系。团体1就主要由匈牙利科学院数学研究所的数学家构成。团体2和团体8尽管都是美国数学家,但是团体2的数学家来自美国东、西海岸的各大高校,而团体8的数学家来自以孟菲斯大学为主的中部各大高校。由此可见美国数学领域作者合作团体分为两大类,东、西海岸合作团体和中部合作团体。

以上数学家研究领域集中在组合数学,图论,计算几何,离散数学,数论。通过调查分析,可以发现这60位Erd?s数为1的真正核心作者大多数来自美国和匈牙利,这与Paul Erd?s身为一名美国籍匈牙利数学家有直接联系。

4.结论

本文利用社会网络分析方法,借助UCINET软件工具,选择以Paul Erd?s为核心的庞大的国际数学家合著网络进行研究分析,以研究国际数学领域的合著现象。数据来源是奥克兰大学(OAKLAND UNIVERSITY)Erd?s数工程项目(见网站http://www.oakland.edu/enp/),该工程专门研究国际数学家之间的合作。

首先,构建Erd?s数为1的数学家合著网络。然后,为更直观的分析该领域合作情况,根据普赖斯定律和核心-边缘结构分析确定核心作者群。接着,通过中心性分析,确立了国际数学领域有重要影响力的作者。同时还发现,点度中心度排名与发表论文数量排名有很大的相似性,说明发表论文比较多的数学家同他人的合作也比较频繁。最后,通过凝聚子群分析,发现数学领域作者合作关系受地理位置影响大。核心作者之间合作密切,并且研究领域集中在组合数学、图论、计算几何、离散数学和数论。

通过本研究,一方面为新进入数学领域的研究人员,提供知识交流的指导,另一方面,为数学家加强合作交流提供参考。

参考文献

[1]Computer Programs for Social Network Analysis[EB/OL].[2014-02-18].http://www.insna.org/INSNA/soft-inf.html.

[2]社会网络模型[EB/OL].[2014-02-20].http//www.sociology.cass.cn/shxw/software/network.htm.

[3]张秀梅,吴魏.科研合作网络的可视化及其在文献检索中的应用[J].情报学报,2006(1):9-13.

[4]王志亮.社会网络分析方法在科研协作网中的应用研究[D].大连:大连理工大学管理学院,2005.

[5]李铄,张志强.情报研究中核心著者的影响力评价方法研究[J].情报杂志,2010(10).

[6]Thomas Krichel,Nisa Bakkalbasi.A social network analysis of research collaboration in the economics community[EB/OL].http://openlib.org/home/krichel/papers/nancy.pdf,2007:1-24.

基金项目:本文系国家自然科学基金项目(项目编号:61170319);山东省自然科学基金项目(项目编号:ZR2010FM017)研究成果之一。

作者简介:

顾海东(1993—),男,江苏大丰人,大学本科,现就读于中国石油大学(华东)理学院数学与应用数学专业,主要从事应用数学研究。

闫统江(1973—),男,山东郓城人,博士后,中国石油大学(华东)副教授,计算数学系主任,主要从事代数学和密码学研究。

猜你喜欢
社会网络分析可视化数学
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
境外公益旅游研究进展与启示
新浪微博娱乐明星的社会网络分析
基于社会网络分析的我国微课研究探析
我为什么怕数学
数学到底有什么用?
错在哪里