乔心月
在群居的社会性动物中,一些个体为了种族的生存和基因的延续甘愿牺牲自己,如像蚁群里的工蚁,它们自己并不生育,却悉心照料它们母亲的后代。人类也是这样——尽管人类拥有更为复杂的社会关系,但在某种程度上,人类也是群居动物——年长的哥哥姐姐会照顾年幼的弟弟妹妹;人类甚至还会说:“我会为你而死。”
那么,在充满竞争、互相倾轧的世界,合作、利他主义和自我牺牲是如何出现的?对这个问题,就连达尔文也深感困惑:如果说自然选择是所有生物个体为生存而互相竞争的结果,那又如何解释个体之间的合作关系以及其他无私行为呢?
对此,英国生物学家比尔·汉密尔顿在20世纪60年代做出了他的解释:当某种合作行为(如“我可以为你做某件事,即使我会为此付出代价”)出现时,那就是某些个体为拯救有亲缘关系群体的基因挺身而出,哪怕它们自己会因此死去,它们用自我牺牲换取其种族谱系和其共有的DNA,包括它们自己的DNA,得以传承下去。这种理论被称为“包容性适存”,即个体之间的合作行为源自于有亲缘关系的家族成员基因延续的需要。
自那以后,近50年来,成百上千的科学家甚至以他们毕生的精力去观察和研究白蚁蚁丘。然而,2010年,生物学家马丁·诺瓦克发表了他的“超级合作”理论。他提出:有五个关键机制推动着像我们人类这样高度社会化物种的合作,而亲缘选择只是其中之一。这五个机制是:
直接互惠机制(或称“投桃报李”机制):这一机制的最好解读是:“我给你挠挠背,你也会给我挠挠背。”当两个个体再次碰面的概率高于无私行为的成本收益比时,直接互惠就能引领合作的进化。
间接互惠机制:这一机制的最好解读是:“我给你挠挠背,就会有其他人来给我挠挠背。”我们付出成本与某个人合作,不指望这个人给予直接的回报;相反,这种行为相当于购买了一个名声,确保将来你能从其他人那里得到回报。只要期望的未来收益超过所需付出的成本,利他行为就会产生。
空间博弈机制:“空间博弈”很好地再现了生物的进化过程:不需要复杂的过程和聪明的思想,合作与生命仍可诞生。
群体选择机制:自然选择既能影响到个人,也能影响到由个人组成的群体。研究表明,只要群体中的个体愿意为群体利益而付出自己的代价,那么,这样的群体就拥有生存优势。
亲缘选择机制:与谁的血缘关系越近,我们就越愿意努力与谁达成合作。这种形式的合作关系之所以得到进化,是因为我们可以用这种方式增加传到下一代的基因数量,从而扩大我们未来的遗传规模。
诺瓦克的“超级合作”理论认为,没有亲缘关系作为支点的合作拥有更为宽广的背景,对作为整体的进化产生深远影响。诺瓦克说:“合作是进化的基本原理,没有这样的合作,就没有生命的构建和生命形式的复杂化。你所看到的生命演化中的一些有趣的现象,无论是多细胞生物的进化,还是人类语言的产生和发展,都有合作参与其间。”
“超级合作”理论对达尔文的自然选择理论进行了重新诠释:在努力求生存的竞争中,利他主义的出现给予了某些个体以某种优势;这些个体幸存下来,并将它们的有益的利他基因传递给后代;随着时间推移,幸存下来的群体团结在一起,形成强大的族群。简言之,任何一个个体的动机都可能是自私的,但在危难关头的个体之间合作所产生的却是皆大欢喜的结果。举例来说,当一些个体因食物来源匮乏等原因不得不困在一个狭窄空间时,产生大量合作关系的群体会给予其中每个个体以更大的生存机会,而在这种情况下,亲缘关系似乎不再那么重要。
流行了几十年的“包容性适存”理论受到了“超级合作”理论挑战,在进化生物学领域掀起了一场轩然大波。在诺瓦克的论文于2010年发表后不久,137名科学家联名写信给《自然》杂志,表达了他们对诺瓦克的愤怒。
然而,诺瓦克是在经过了几十年的研究和沉淀后才形成他的“超级合作”理论的,他将其精华提炼浓缩于《超级合作者:利他主义,进化,以及为什么成功需要彼此》一书中。
具有讽刺意味的是,诺瓦克的父母原本打算将他们唯一的孩子培养成为一个具有强大竞争能力的人。在父亲的鼓励下,诺瓦克对国际象棋和数学难题产生了很大的兴趣。但在进入大学后,他觉得数学用处不大,想要成为一名生物化学家,想要了解构成生命的基础是什么。他开始与人合作研究DNA复制的数学机制。在一次讲座上,维也纳大学数学家卡尔·西格蒙德提出了他于1950年设计的“囚徒困境”博弈模型,诺瓦克听得十分入迷。
所谓“囚徒困境”博弈,指的是在合作行为与自私行为之间的选择。这个问题看起来很简单:两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。检察官知道两人有罪,但缺乏足够的证据。于是,检察官分别告诉两个人:如果你认罪并指控你的同伙,而你的同伙保持沉默,你将被轻判一年监禁,你的同伙则将被判四年监禁。
“囚徒困境”其实就是一个游戏,游戏规则很简单:如果两人互相忠实于对方,都拒不指控对方,按游戏中的术语来说,两人仍然是“合作关系”,那么,由于警方没有足够的证据,两人都不会被判得太重——各判两年监禁;如果两人都坦白并指证对方,警方就会根据两人提供的证据,给两人都定重罪——各判三年监禁;如果两人中一个坦白而另一个抵赖,坦白的将被轻判一年监禁,抵赖的将被判四年监禁。
显然,如果背叛朋友的只有一人(他的同伙没有背叛他),他将只被判一年监禁,这是最理想的结果;如果两人都背叛了对方,两人的刑罚将都是三年,比两人都抵赖的后果严重,但不是最长的四年;如果一方背叛,抵赖的一方将获最高刑期四年。可见,“囚徒困境”游戏考验的是人们在背叛与合作之间、个人利益与群体利益之间的选择。
20世纪70年代,政治科学家罗伯特·阿克塞尔罗德用“囚徒困境”对物种的合作关系进行了研究。当时,全世界的科学家纷纷给阿克塞尔罗德的虚拟“囚徒们”献计——什么情况下“合作”,什么情况下“背叛”——然后用计算机对各种应对策略进行处理,并对每一轮的应对策略进行评分,获得的刑期越短,得分越高。
在数百轮计算机测试中,获胜的策略是一种“你帮我,我也帮你”的“投桃报李”策略,也可以叫作“以其人之道还治其人之身”的“以牙还牙”策略——无论你在上一轮比赛中采取什么策略,在这一轮中我依样照搬。这个策略依据的是直接的互惠关系,在现实世界中很常见。例如,如果纽厄尔在上周帮助邻居琼斯修好了出故障的割草机,那么琼斯有更大的可能在纽厄尔求上门来时愿意帮他换车胎。这个策略也适用于动物世界:在一个山洞里,如果一只吸血蝙蝠上次没找到猎物差点挨饿时,有其他蝙蝠请它共享了血食,那么这次它更愿意与那些友好的蝙蝠共享血食大餐。
1976年,对理论生物学做出显著贡献的英国物理学家罗伯特·梅伊在一篇发表在《自然》杂志上的文章中提出,阿克塞尔罗德设计的计算机虚拟比赛可能并不能准确复制现实生活中的合作与背叛。“计算机模拟的结果取决于虚拟人物的决定和策略,并分毫不差地按这个决定或策略执行。而在现实生活中,生物体很少能遵循完美的策略,在执行过程中会有大量的干扰和误差。你不得不考虑这些因素。”例如,在通常情况下,邻居琼斯会报答纽厄尔曾经给过的帮助。但是,纽厄尔因车胎坏了过来寻求帮助时,如果琼斯刚刚与妻子争吵过,也许他就没有心情去插手邻居的事情了。
“囚徒困境”的游戏令诺瓦克非常感兴趣,他认为这提供了一种研究人类行为的数学方法,这种方法运用到物种进化上,就是合作所要付出的“成本”与所获得“收益”的问题。1987年,他开始与人合作探讨物种进化中的数学问题,重点是“囚徒困境”,如今可以用计算机和数学方法进行解析。
受梅伊的启发,诺瓦克和他的合作者对“囚徒困境”的游戏规则进行了修改,以将“囚徒困境”置于更合理的进化背景下。在新版本的游戏中,他们允许虚拟参赛者有一定概率的干扰和误差,并赋予了虚拟参赛者赢得繁衍的能力——获胜者获得的将不只是分数积累,还包括复制自身的奖励,复制出来的“后代”拥有同样的获胜策略,并替换掉该群体中另一个虚拟参赛者。这个游戏更真实地模仿了生物界的现实:随机突变导致一些参赛者产生在游戏中获胜的策略,并将这样的获胜策略传递给“下一代”参赛者,而原有的一些参赛者会相继“死亡”。在无数轮这样的电脑游戏中,诺瓦克和合作者将看到群体中主要的“合作”与“背叛”策略。
正如诺瓦克他们所预计的那样,一种被称为“获胜的永远是背叛者”的策略在延续了100代之后,让位于“投桃报李”策略,之前的“获胜的永远是背叛者”的游戏策略被淘汰出局。新出现的获胜策略后来被命名为“大度的投桃报李”策略,利用这个策略的虚拟玩家有时会采取合作策略,即使曾经被对方“背叛”过。
在这个电脑模拟游戏中,诺瓦克看到了一种意义深远的进化信息。他说:“我们看到的是一种‘宽恕’的进化策略。”“‘大度的投桃报李’策略表明,对于善意或友谊的行为,对于别人施予的恩惠,我们永远不会忘记,但对于别人的一些恶意行为,我们偶尔也会宽恕原谅,即以德报怨。这具有重大的意义。‘以牙还牙’有可能产生族间仇杀,但‘投桃报李’或‘大度的以德报怨’行为则让族群进一步兴旺发展。”
随着游戏的继续,诺瓦克发现,虽然“大度的以德报怨”是一种长期战略,但并非永远立于不败之地,总会有一些“背叛者”幸存下来,他们的行为最终甚至能够打破新的高度合作的现状。也就是说,在一个充满愉快合作氛围的社会中,总会有一些自私分子在其中轻松搅局,最后导致社会后退到残酷无情竞争的局面。不过,幸存下来的少数合作者最终会再次打破这个局面,重新回归到“大度的以德报怨”和“投桃报李”的合作轨道上。
在人类历史上,我们可以看到这种模式一直在循环往复的上演着,和平过后是战争,战争结束后重新恢复和平;帝国崛起与衰落,更迭往复;公司成长壮大,吸引竞争对手的关注,渐渐失去原有的市场份额,公司经过重组(通过内部合作)再次主导市场……合作与背叛的每一轮趋势,似乎都在酝酿着走向反面。但诺瓦克意识到,无论发生什么,在自然选择的压力下,最后总会走向合作。
之后,诺瓦克和合作者又开发了一个计算机模拟程序,以解读被称为“间接互惠”的合作行为,即彼此并不熟悉的陌生人之间的合作行为。在这个游戏中,就如在“囚徒困境”中一样,虚拟参赛者要么“背叛”,要么“合作”,但无论是“背叛”还是“合作”都是一次性的,没有与其他参赛者之前的经验为依据来决定如何做。诺瓦克还额外添加了一种机制,即根据虚拟参赛者之前的合作行为,建立起他们的“声誉值”记录。结果不出所料,与“信誉不佳”的虚拟参赛者相比,有“良好合作声誉”的虚拟参赛者能够获得更多的合作机会。
诺瓦克认为,在不熟悉、不了解的人中间,信誉的力量,或者“间接互惠”,是人类合作中的一个重要因素,也是推动语言发展和大脑进化的一个主要因素。
合作是帮助我们进化的生物学机制的一部分,合作是我们之所以成为今天的人类的一个重要的核心因素。作为超级合作者,人类借助语言和沟通非凡能力,已经能够利用所有的五种机制进行合作。但是,面对一些严峻的全球性问题,人类需要创造性地利用合作的创造能力。
物种合作的几种表现形式
部落里的合作关系 生物学家马丁·诺瓦克提出,五种机制推动了合作的进化,其中最强大的是群体选择,例如在不同部落的竞争中,一个紧密团结、其成员拥有更多合作精神的部落,拥有更多的胜出机会。
家族中的合作关系 大多数进化生物学家认为,合作行为源于确保基因相近家庭成员生存的个人需要。诺瓦克则认为,亲缘选择只是推动更普遍合作意愿的几种机制之一。
邻居之间的互相帮助 研究表明,个体有牺牲自己利益帮助住在附近其他人的倾向,无论他们之间是否有亲密的亲缘关系。
你帮我,我帮你 这是最基本形式的合作,被称为直接互惠。一个人帮助他人时会想到,也许有一天他也会需要别人的帮助。