☉[英]本·米勒 著 金立峰 陈青石 译
DNA到底是什么呢?这三个字母代表deoxyribonucleic acid,就是“脱氧核糖核酸”,它是一种非常特别的分子。它的名字听起来好像很复杂,但其实不然。核糖(ribo)是一种糖类,是DNA的主要成分之一。你可能已经猜到了deoxy的意思——脱氧,就是每一个核糖分子都被移走了一个氧原子。而nucleic(核)之所以会出现,是因为DNA是在细胞的核中出现的。所以,总结来说:DNA是一种很长的分子,存在于细胞核中,由脱氧核糖构成。
你可能还记得在中学生物课上看到的细胞的样子,为了更好地帮你回忆起来,我在下面画了一个。如果你从口腔内壁刮下一些上皮细胞,滴一滴染色剂在上面,然后在显微镜下观察,你就能看到生物学家所谓的“真核细胞”的所有重要特征了。真核细胞的中央有一个细胞核,细胞核周围有一层看起来有点起泡的果冻状物质,然后最外层的细胞膜把它们都包起来。你的DNA,整齐地打包成了23对染色体,就位于细胞核中。果冻状物质叫做细胞质,其中的气泡则是能帮助细胞进行各种生物机制的各种小玩意儿。
首先,DNA很稳定。DNA的结构非常不寻常,使它很难被破坏,因此科学家可以成功获取数万年以前原始人的DNA。其次,DNA可以储存信息,事实上,如果要复制一个你,所需要的全部信息就保存在DNA中。再次,DNA有能力复制自己。没有DNA的话,孩子就得不到父母的遗传,进化也不能进行。
所以让我们总结一下:DNA是一种特殊的分子,可以携带信息,相当于某个特定生命体的蓝图。DNA存在于细胞核中,在这里它被切成称为染色体的小段。染色体成对出现,人类一共有23对。那么,它是怎么发挥作用的呢?怎么把DNA里蕴含的信息传递到一个能走能说的人体里去呢?
现在是时候讨论一下蛋白质了。
口腔上皮细胞染色体和一条DNA
植物和动物都含有大量的蛋白质。比如说,你可能知道,你的肌肉、骨骼、毛发和皮肤都是由蛋白质构成。但是你可能不知道,蛋白质也是在细胞的层次让各种事情办成的:从助你消化食物的酶,到调节血糖浓度的激素,到给血液输送氧气的血红蛋白都是蛋白质。虽说听起来可能不够浪漫,但是把植物和动物说成是一袋袋蛋白质,袋子里充满水,一点也不夸张。
现在据估计人体里有数十万甚至上百万种不同的蛋白质,但是它们由仅仅20种不同的氨基酸组成。我们的身体可以合成出大部分氨基酸,但是并不是全部。我们的身体不能自行制造的氨基酸,我们只能从食物中摄取。换句话说,我们吃肉、蛋、鱼类和植物蛋白的原因就是可以把它们分解成单个的氨基酸,然后用这些氨基酸来合成我们需要的蛋白质。
最神奇的地方就是这里。对于你身上的每一种蛋白质,都有对应的密码在你的某条染色体的某个区域上,告诉身体要用哪些氨基酸。以及要用什么样的顺序连接氨基酸,从而制造出这个蛋白质。染色体上的这类区域有专门的名称、你应该很熟悉——它叫基因。
我曾经与弗兰西斯·克里克有过一面之缘,他就是发现DNA结构与功能的两位著名科学家中的一位。
克里克和沃森推断出的DNA分子有双螺旋结构,就好像盘旋扭转的梯子一样。
克里克和沃森不仅解決了DNA结构之谜,还破解了DNA密码。如果DNA是一个梯子的话,那两边的梯柱就是由交替出现的糖和磷酸基组成的。每个糖类分子会与一个碱基连接,共有4种不同的碱基:腺嘌呤(adenine)、胸腺嘧啶(thymine)、鸟嘌呤(guanine)、胞嘧啶(cytosine)。我们先不管它们到底是什么,因为如果要理解这个密码,我们只需要用每个碱基的英文首字母,也就是A、T、G、C来称呼DNA的密码就可以了。这些碱基成双配对,连接构成梯子中间的横杠;A总是跟T连接,而G总是跟C相连。
接下来是最令人惊奇的部分:这些碱基构成了一种密码,而我们的身体可以像拉拉链一样将一个DNA分子从中间拉开,阅读密码并且用它来制造蛋白质。而且,这个密码极为简单。在基因里,这些碱基组成许多个单字,每个单字由三个字母组成。这些由三个字母组合的单字,正好对应了建构我们身体的20种氨基酸。换句话说,基因基本上是制造特定蛋白质的食谱;它简单地告诉身体,哪些氨基酸需要按什么次序放在一起,来制造出某个蛋白质。
你可能听说过“人类基因组计划”,这个计划的目标就是要定出完整的人类染色体的碱基测序。最早的一组完整序列于2003年完成,从那以后,我们一直在研究每个基因到底位于哪条染色体上的哪个位置,以及它能制造出哪一种蛋白质。
DNA是跟人类历史直接相关的。每个人的DNA上面都有他们祖先的标记,而如果用一点侦探的高明技巧,我们就能往前推导,不仅能回溯到我们的近亲,而且可以回溯到几百万甚至几十亿年前。
一个典型的动物或植物细胞,里面都有个塞满了以染色体形式存在的DNA,细胞核在果冻般的细胞质中飘忽游荡,最外边还包着一层细胞膜。还记得我说过细胞质里有各种各样的小玩意吗?线粒体(“线型颗粒”)就是其中的小玩意之一,它为细胞提供能量。线粒体有着自己的DNA,而且下面这点很重要:它只存在于女性的卵细胞中,而男性精子中没有。所以你从母亲那里遗传了线粒体DNA,而这个DNA并没有经过重组。
那线粒体DNA怎样帮助我们追溯祖先呢?好吧,DNA很善于复制自己,但是做得并不完美。每一次在复制DNA时(就是制造新细胞时),就会发生错误。因为这个复制过程,时间长了以后,即使是线粒体DNA中的单体型都可能发生突变。由于染色体DNA在传递到下一代时,都会与父母的DNA混合,产生重组,所以线粒体DNA的变化速度跟染色体DNA相比是很慢的,但是,经过人类5000代传承之后,这个突变还是会为线粒体DNA带来显著效应。
观察个人的单体型以后,你就可以很容易地把这个人放到一个更大的相似单体型所构成的集合里,我们称之为“单倍群”。整个人类被分成大概20个线体单倍群,这些群组都可以按年代顺序进行排列。而且,就像你期望的那样,作为一个从非洲进化出来,然后移民到全球各角落的物种来说,肯定存在一个非洲单倍群是地球上其他单倍群的祖先。
确定每一个单倍群出现的年代,是目前很多人感兴趣的研究方向,但是基本原则还是很好掌握的。我们知道人类跟黑猩猩有一个共同祖先,而且我们可以向前追溯,看看这个祖先的线粒体DNA是什么样子。从化石证据中我们大概知道人类与黑猩猩是什么时候分开的;最新的证据显示大概是600万年前。所以,我们知道了人类的线粒体DNA在600万年前的样子,以及现在的样子,我们就可以拿中间任何一种DNA进行分析,然后很有把握地计算出它最初的出现时间。
人们一直都在改进这个基本的方法,因为每一代线粒体的变化速度都可能被比如自然选择和人口瓶颈等因素干扰。我之前所描绘的人类迁徙图从非洲开始,沿着海岸到达印度尼西亚,然后回到欧洲,或到达新世界——由于需要因应新的研究成果,科学家们会对其中的路线和年代进行调整和修改,但是大家在大致轮廓上已有了共识,在细节看法上也越来越趋向一致。而且,在下面这个重要的事实上,大家都没有分歧:我们都是20万年前生活在非洲的一个女人的后代。她被称为最近共同祖先(MRCA),但是我更喜欢另外一个富有诗意的名字:“线粒体夏娃”。
现在你知道了:你的线粒体DNA是从你母亲那一条线遗传下来的,它告诉我们你来自非洲。不仅如此,不管你是不是跟英王征服者威廉或者演员威廉·夏特纳有亲戚关系,如果你追溯你的线粒体家谱够早的话,你就会找到一个生活在20万年前的女人:线粒体夏娃。
如果要准确地说,线粒体夏娃当然不是第一个存活在地球上的女人,她只是远古女性人类中最幸运的那个而已。在她之前地球上可能已经出现过其他女人,跟她同时期也可能有其他女人活着,但是她们的线粒体DNA刚好已经绝迹了,只有她的存留了下来。对于这一点,我们只能说她的运气很好了;以任何可遗传的性状来说,如果一个小群体延续了足够多代,这个性状最终表现得比其他性状频繁,完全要靠好运气。最初的人类只是一个小群体,而且碰巧早期的线粒体DNA中,只有一种流传了数千年到数万年。
但是,从你的母亲那里遗传过来的线粒体DNA,并不是你跟最初的人类唯一的联系。人类的基因组中还有一部分可以让你从父系这边进行追溯,一直可以追溯到一位幸运的男人,那个部分就是他Y染色体中的DNA。