20世纪遗传学诺贝尔奖获得者科学交流网络的结构特征

2015-03-22 03:18
中华医学图书情报杂志 2015年1期
关键词:获奖者获得者遗传学

, , ,

美国科学社会学家科尔在《科学界的社会分层》中提到,科学是在一个互动的科学共同体内发展的,科学进步部分取决于科学思想交流的成效[1]。科学交流作为最普遍和最重要的科学行为,把科学家、科学研究活动和科研成果联结在一起,形成一个庞大而有序的动态网络,在科学发展与科技进步中发挥着重要作用。

诺贝尔科学奖的获奖者被称为“科学界的超级精英”,他们的获奖成果为人们的生产、生活带来了巨大利益,同时也深刻影响着科技进步与社会发展。本文研究的是诺贝尔奖获得者传递学术思想、促进科研互动的科学交流网络特征及其对获奖者取得重大突破的作用。

1 诺贝尔奖获得者科学交流网络的构建

为使研究结果更加清晰明确,本文以20世纪遗传学领域诺贝尔奖获得者为研究对象,利用诺贝尔奖官方网站发布的生平传记,构建获奖者科学交流网络并探讨其结构特征和重要作用。具体操作步骤如下。

1.1 数据采集

根据《现代遗传学原理》[2]附录二“遗传学领域诺贝尔奖名录”的记载,20世纪诺贝尔奖的颁奖历程中有22个年度的科学奖项授予了遗传学领域的重大科技成果,共涉及56位杰出科学家,其中诺贝尔生理学或医学奖获得者45人,诺贝尔化学奖获得者11人,如因发现连锁定律而获得1933年诺贝尔生理学或医学奖的摩尔根(T.H. Morgan),因建立PCR技术而获得1993年诺贝尔化学奖的穆利斯(K. Mullis)等。登录诺贝尔奖官方网站[3],下载56位获奖者的生平传记。

1.2 关系抽取

获奖者的生平传记述了他们主要的人生经历和社会关系,包括对其取得诺贝尔奖成果有重要影响的人物,如老师、同事、合作者或从事相关研究的科学家等。在与获奖者关系密切的人物之中,有一些已经获得了诺贝尔奖,也有一些是后来的获奖者,而这些社会关系反映了获奖者之间的科学交流。

笔者对诺贝尔奖得主的生平传记进行一一解读,从中抽取出对每一位获奖者与其他获奖者之间的社会关系进行描述的句子,分析两者之间的关系类型。依照科学社会学家尼科尔斯·穆林斯(Nicholas Mullins)的分类方法[4],诺贝尔奖得主的社会关系可划分为合作关系、师生关系、同事关系、一般交交流关系4种类型,其传记描述和具体说明见表1。

表1 遗传学诺贝尔奖获得者生平传记描述的社会关系

一是合作关系(Co-authorship),指关系比较密切的科研合作伙伴,如沃森(J.D. Watson)与克里克(F.H.C. Crick)、比德尔(G.W. Beadle)与塔特姆(E.L. Tatum)等共同完成获奖成果的发现工作;二是师生关系(Apprenticeship),指在科学研究中给予指点的导师和研究生,如塔特姆和卢里亚(S.E. Luria)分别是莱德伯格(J. Lderberg)和沃森的博士研究生导师;三是同事关系(Colleagueship),指曾在同一机构或实验室工作或学习过的科研人员,包括博士后、同学和进修人员,如巴尔的摩(D. Baltimore)曾在杜尔贝科(R.D. Dulbecco)研究所的实验室工作,科恩伯格(A. Kornberg)曾在奥乔亚(S. Ochoa)的实验室进修酶学;四是一般交流关系(Communication),包括科学家之间的间接交流,如通过与物理学家的交往,卢里亚知道了缪勒(H.J. Muller)及其关于X射线诱导突变的论文,

1.3 构建网络

合作、师生、同事和一般交流四种关系相互交织,构成了一个基于社会关系的科学交流网络。其节点是遗传学领域诺贝尔奖获得者,边为两个获奖者之间的社会关系。为了便于在社会关系网络图中区分四种关系类型,本文按照诺贝尔奖获得者之间科学交流对其获奖成果影响力的大小设置边的权重,假设合作关系的影响力最大,为其赋值为4;师生关系次之,赋值为3;同事关系再次之,赋值为2;一般交流关系最低,赋值为1。如果存在多重关系,取权重的最大值。基于上述四种关系的科学交流大多是双向的,部分关系(如师生关系)虽然是单向的,但所占比例较小,且彼此之间也存在着双向交流(如塔特姆和莱德伯格既是师生又是合作者)。因此本文在构建科学交流网络时忽略了边的方向性。 最后,按照获奖者生平传记的描述建立遗传学领域诺贝尔奖获得者的社会关系矩阵(图1),用Ucinet读取矩阵数据(行和列的标签保持一致),“Data-export-pajek-network”命令生成.net文件后导入Pajek软件,生成基于社会关系的科学交流网络进行分析(图2)[5]。

图1 遗传学领域部分诺贝尔科学奖获得者社会关系矩阵

图2 遗传学领域诺贝尔科学奖获得者的科学交流网络

2 诺贝尔奖获得者科学交流网络的结构特征

根据诺贝尔科学奖获得者生平传记而构建的科学交流网络是一个基于人际关系的社会网络,同时也是一个融合各种社会关系的复杂网络。现实世界中的许多复杂网络都表现出一些结构上的相似性,如无标度(Scale-free)、小世界(Small-world)等[6]。因此,本文重点考察该网络是否也具有这样的结构特征。

2.1 无标度分布

无标度分布是描述大量复杂系统整体上严重不均匀分布的一种内在性质。在无标度网络中,少数的节点拥有大量的连接,而大多数节点只有很少量的连接,节点度值的波动范围很大,无法确定一个特征度值(或平均度值),或者说缺乏一个可以代表其他大部分节点的特征节点(Character node)[7]。

度(Degree)是描述网络特征的一个重要指标,网络中节点的度是与该节点直接相连的所有节点的数目。如果一个节点与其他很多节点存在关系,该节点在网络中就处于一个比较关键的位置,即一个节点的度越大就意味着这个节点越重要。将一个网络中所有节点的度进行排序,统计其分布情况,就得到了网络中节点的度分布。

不同网络的度分布是不同的,随机网络的度分布类似泊松分布(Poisson distribution),即大部分节点的度接近平均值,度很高或很低的节点都极少,并且随着度值的增大,其概率呈指数递减。然而近年的研究结果表明,现实世界中有很多网络的度分布服从幂律分布(Power law distribution),如Internet、引文网络、交通网络等,这样的网络符合无标度分布。无标度网络的度分布可以用分布函数p(k)来表示,其数据表达式为:p(k)-p-r,含义是一个任意选择的节点恰好有k条边的概率,或者等于网络中度数为k的节点个数占网络节点总数的比例。图3是遗传学领域诺贝尔科学奖获得者社会关系网络的度分布Power 回归图。在获奖者社会关系网络的度分布中,排名前三位的分别是沃森、克里克和杜尔贝科,度数非常高(>10)的节点只有沃森一人(占全部节点的1.79%),度数小于2的节点占全部节点的57.14%,体现了“少数的节点拥有大量的连接,大部分节点却连接很少”的网络特征。用SPSS对获奖者的度分布进行Power 曲线拟合,拟合函数为:ln(y)=ln(0.502)-1.362ln(x) ,(P<0.05)。Power 曲线拟合结果显示,遗传学领域诺贝尔奖获得者科学交流网络的度分布符合无标度分布。

图3 遗传学领域诺贝尔科学奖获得者科学交流网络的度分布

2.2 小世界现象

小世界的概念来源于1967年美国社会心理学家Stanley Milgram提出的“六度分离”理念[8],随后Watts和Strogatz采用网络图进一步解释“六度分离”的小世界效应,并提出了WS小世界网络(Small World Network,SWN)模型[9]。在这个模型中,“小世界网络”是介于聚类系数较高但平均路径较长的规则网络和聚类系数较低但平均路径较短的随机网络之间的一种网络,聚类系数(Clustering Coefficients,C)和平均路径长度(Average Path Length,L)是考察网络小世界现象的两个重要指标。

聚类系数是反映网络集团化程度的一个指标,主要考察一个网络所有节点各自的近邻之中有多少是共同的近邻。聚类系数的计算方法如下[10]:假设一个无向网络共有N个节点,其中的一个节点i存在着ki个与之相连的近邻,那么这ki个近邻之间可能存在的边的最大值为ki(ki-1)/2。如果这ki个近邻之间实际存在的边数为ei,则节点i的聚类系数ci为:

整个网络的聚类系数C为所有节点聚类系数的平均值:

聚类系数是一个介于0和1之间的值。以人际关系网络为例,聚类系数反映了朋友圈的重叠程度,即朋友之间也互相是朋友的概率。聚类系数为1,意味着人际关系网络中每个人的朋友彼此之间也都是朋友;聚类系数为0,代表每个人的朋友彼此之间素不相识。

平均路径长度是指网络中任意两个节点之间的平均最短路径长度,也是度量整个网络节点之间信息交流有效性的指标之一。平均路径长度的计算方法如下[9]:假设定义节点i与节点j间的最短距离为d(i,j),则平均路径长度L为:

小世界现象在社会网络中非常普遍,人际关系网络、知识转移网络等都是小世界网络,更有研究者认为无标度网络也是小世界网络的一种。诺贝尔科学奖获得者的科学交流网络是基于社会关系的人际网络,无标度分布比较明显,但是该网络是否具有小世界现象却还是个未知之数。

为了验证诺贝尔奖获得者科学交流网络的小世界现象,本文首先生成了一个与该网络相近的随机网络,然后采用对比分析的方法比较两个网络的聚类系数和平均路径长度,具体方法和步骤如下。一是提取特征指标。首先计算诺贝尔奖获得者科学交流网络的基本特征指标,主要包括网络的规模和平均度,这两个指标是构建随机网络的标尺。二是生成对照网络。利用Pajek软件生成一个与诺贝尔奖获得者科学交流网络相对应的随机网络作为对照,两个网络的基本特征指标大致相同,只是节点间的连接是随机产生的。三是指标对比分析。比较诺贝尔奖获得者科学交流网络和随机网络的聚类系数和平均路径长度。如果诺贝尔奖获得者科学交流网络的平均路径长度接近相应的随机网络,同时聚类系数远大于相应的随机网络,即可以证明诺贝尔奖获得者科学交流网络具有小世界现象。诺贝尔奖获得者科学交流网络与随机网络的网络特征指标见表2。

由表2可知,两个网络具有相近的平均路径长度,其值介于3到4之间,提示56位获奖者中的大部分人通过三四步就可以取得联系。但是,诺贝尔奖获得者科学交流网络的聚类系数明显大于相应的随机网络,表明遗传学领域诺贝尔奖获得者科学交流网络存在小世界现象。

表2 诺贝尔奖获得者科学交流网络与随机网络的网络特征指标对比

3 结语

遗传学领域诺贝尔奖获得者科学交流网络的无标度分布表明:在获奖者群体内部,存在着少数拥有大量连接的集散节点(Hub node),如沃森和克里克。这些高连通的集散节点在网络中占据主导地位,基本上控制了整个网络的科学交流,影响着其他获奖者之间的信息传递。笔者认为,集散节点的特殊地位与其获奖成果有很大关系,他们通常做出了其他人需要加倍努力才能做出的重要贡献。这些科学成果不仅为获奖者赢得了荣誉和声望,还将其科学积累与创新纳入已有的科学知识体系,成为科学发展的主流和其他科学家创造性成果的重要基石。

从诺贝尔奖获得者科学交流网络小世界现象的对比研究可以看出:高聚类系数显示了网络中各位获奖者之间信息交流的密集程度,而平均路径长度则反映了获奖者之间信息交流的效率。具有小世界网络现象的诺贝尔奖获得者科学交流网络加速了获奖者之间信息和知识的流动,使科学精英的突破性成果能够很快推广到其他科学家,从而成为未来获奖者进步的阶梯。该现象还进一步提示,科学精英之间的强强交流可能是激发科技创造力、催生更多重大科技成果的助推器。因此,诺贝尔奖获得者科学交流网络对重大科学成果的产生具有重要意义,它为获奖者传承科学知识,提升创新能力发挥了独特的效应。

猜你喜欢
获奖者获得者遗传学
诺贝尔奖垂青气候科学,不仅是获奖者的成功,还是更多人的成功
第二届“刘征青年诗人奖”获奖者巡展
第二届刘征青年诗人奖获奖者
例析对高中表观遗传学的认识
实验设计巧断遗传学(下)
2006年诺贝尔文学奖获得者
2010年诺贝尔文学奖获得者
2008年诺贝尔文学奖获得者
2015年诺贝尔文学奖获得者
第二届辞书事业终身成就奖获奖者名单