李芸芸
詹姆斯·沃森和弗朗西斯·克里克在1953年4月25日的英国《自然》杂志发表了DNA双螺旋结构假说的论文,今天DNA双螺旋结构已经获得广泛认同。这个学说的核心是,人的细胞核染色体(DNA)的结构是双螺旋形。双螺旋的两根螺旋主干是核苷酸,每个核苷酸又由磷酸、戊糖(又称为五碳糖)和碱基组成。而双螺旋之间的连接是由碱基之间的磷酸酯键来完成的。
人和动物细胞核苷酸中的碱基有四种,即胞嘧啶(C)、胸腺嘧啶(T)、腺嘌呤(A)和鸟嘌呤(G),它们之间的排列方式有下面几种:A-T、G-C、T-A和C-G,因此称为碱基互补原则。
生命如歌的内涵
碱基和碱基互补的原则很像乐曲中几个体现音高的基本音符按一定的规律重复和组合的过程。研究人员发现A-T、G-C、T-A和C-G与1(do)、2(re)、3(mi)、4(fa)、5(sol)、6(la)、7(xi)之间的相互组合具有相似性。音乐家可以把这7个基本音符以不同方式和频率进行有规律的排列、组合、重复等,谱写出一支又一支优美动听的歌曲和一个又一个感人心脾的旋律,甚至让人听得如痴如醉,回肠荡气。
那么,相似的碱基排列组合会不会也能谱出悠扬的旋律呢?显然,4个碱基与7个基本音符相比少了3个。但是,这并不妨碍按照作曲的方式来排列4个碱基,同样可能谱写出千回百转的美妙旋律。
早在1986年美国一些研究人员就发现,人和动物的DNA中4个基本碱基的循环往复排列既是基因编码,也可以谱写出不同的乐曲。研究人员把胞嘧啶(C)与1(do)相对应,腺嘌呤(A)与2(re)和3(mi)相对应,鸟嘌呤
(G)与4(fa)和5(sol)相对应,胸腺嘧啶与6(la)和7(xi)相对应,再让胞嘧啶(C)与高音ī(do)对应,结果,这些基因编码谱写出了乐曲。
这种音乐可以称为基因音乐,但是基因音乐并不像人们按基本音符谱写出的乐曲一样那么美妙动听,因为基因中碱基的重复有些单调、串连和聚合,但是也表现出某种旋律的结构和音色。而且,每个基因中的一连串碱基(基因音符)都有自己的风格,一些基因谱出的曲子有点像巴洛克的音乐,因为它们中的某一碱基一再重复发音。另一些基因所谱的曲子则有些浪漫,因为它们的碱基重复有些隐秘而且被较长的区间所间隔,即频率较低。
例如,用小鼠的为核糖核酸聚合酶II编码的一段基因所谱的曲子听起来像萧邦的钢琴曲,用编码细胞黏附分子的基因所谱的曲则像德彪西的乐曲。用为胶原组织编码的基因所谱出的曲子有些像巴赫的乐曲。用为人类X性连锁磷酸甘油激酶编码的基因所谱的曲子则很像萦绕于心头挥之不去的忧郁小提琴旋律,似乎这样厌世的旋律保留在人的基因中已经有千百万年。
这就给人一种提醒,如果是健康的人,按其DNA的碱基正常排序所谱写的基因之歌将是动听和优美的。但是,疾病患者或有基因缺陷的人,其基因音乐则可能与噪音和杂音相似,既刺耳,又难听。
两种新音符
健康人和患病者的基因音乐会呈现不同的旋律的假设源自两方面。一是有基因突变或缺陷的人,其基因中的碱基序列规律性较低,因此以它们为模板谱写出来的音乐并不优美,甚至刺耳。另一方面,由于碱基只有4个,当然不能与人创造的最基本的7个基本音符,甚至8个基本音符(加上高音ī)相比较。所以,有研究人员测猜,人类基因中可能还有一些基本的音符,即碱基没有被发现。
这个假说既是对DNA双螺旋结构中碱基排列规律,即基因序列的挑战,又提示音乐与生物学有密切关系。但是,这只是假设,还没有证据。
然而,随着对人类和动物基因组的深入研究,表观遗传学进入人们的视野。基因要发挥作用就需要一种调整和修饰基因外观从而让特定基因发挥作用的机制,这就是表观遗传。所以,表观遗传学(也称表观基因组学)也是研究在基因组序列不变的情况下,一些遗传密码是如何调控基因表达并可稳定遗传下去的机理。例如,DNA的后天修饰(如甲基化修饰)、组蛋白的各种修饰等都是表观基因组的内容。
实际上,基因被修饰的体现之一就是碱基被修饰,被修饰后的碱基就成为新的碱基,也即新的基因音符。研究人员发现,除基因的4个固定的碱基外,还有新的碱基,即第5和第6碱基。第5碱基就是5-甲基胞嘧啶(5mC),这是一种对胞嘧啶的甲基化修饰,即一种“表观遗传”的标记。但是,5-甲基胞嘧啶并非基因组上唯一的表观遗传标记。现在,美国洛克菲勒大学的斯柯尔曼塔斯·克里奥希昂里斯和纳撒尼尔·海因茨发现,胞嘧啶还有另外一种修饰,这就是5-羟甲基胞嘧啶(5hmC),也因此把这种修饰后的碱基称为第6碱基。
这样算下来,基因中的碱基就分别是A、T、G、C、5mC和5hmC。这些被称为基因音符的碱基还是比音乐中的7个基本音符少了一个,不过,这已经比较接近人类音乐的基本要素了。
迄今研究人员还没有从基因音乐来认识这两种新的音符,不过,从基因功能来看,它们与基因音乐是有关系的,因为它们对基因的功能和表达有重要的作用。
第5和第6碱基的作用
第5碱基(5mC)和第6碱基(5hmC)具有不同的作用,最大的作用就是与疾病和健康有关,更确切地说,与癌症和某些遗传病有很大关联。
海因茨和克里奥希昂里斯通过对小鼠健康脑细胞基因组测序,发现第5碱基分布在更具致密包装、不易接近的DNA链上,而第6碱基则大部分位于松散包装的DNA区域。而且,第6碱基的分布如果发生变化,就可能与癌症有关,因为过去的研究发现,肿瘤细胞中都存在第6碱基的分布改变。
更有意思的是,第5碱基主要分布在沉默的基因组CpG岛上。CpG岛是指DNA上的一个区域,这个区域含有大量相联的胞嘧啶(C)、鸟嘌呤(G),以及使两者相连的磷酸酯键(p)。哺乳类动物基因中的启动子上含有约40%的CpG岛,而人类则更多,约有70%。而且,一般CpG岛的长度为300~3000个碱基对。但是,第6碱基则更多地位于基因高水平表达的基因组区域。这就是说,第5碱基主要是使基因沉默,而第6碱基主要是使基因表达。
当然,第5碱基与第6碱基的区别还在于,第6碱基主要分布在基因主体上,基因主体是编码蛋白质的部分。同时,作为一种回避或分散原则,在基因序列中出现第5碱基的地方就很少出现第6碱基,反之亦然。虽然研究人员还不能确认第5和第6碱基的精确作用,但是一些线索已经提示,它们分别或共同与癌症和其他一些疾病有关。
例如,一些研究发现,在一些癌症,包括急性白血病和骨髓增生异常综合征中,第6碱基被高度耗竭。而且,这种耗竭伴随着肿瘤抑制基因TET2的破坏。
同时,研究人员也发现,一种主要产生于女孩身上的疾病——雷特综合征(头小综合征)也与第5和第6碱基有关。这是一种遗传病,属于神经系统的严重失常,病症会影响到患者的运动能力,患儿智力低下,出现语言和交流障碍,行为刻板,共济失调以及出现自闭症行为等。
雷特综合征的发病与一种称为甲基化CpG结合蛋白2 (MeCp2)的分子有关。正常情况下,MeCp2既能结合第5碱基,又能结合第6碱基。但是海因茨和克里奥希昂里斯发现,如果MeCp2发生突变,就只能结合第5碱基,而不能结合第6碱基。此时,就会导致雷特综合征的发病,并让患者产生轻微的认知和语言能力的下降。
期待深入了解基因音符
人和动物基因中的碱基或基因音符是否只有6种呢?现在尚不会有明确答案,但是,就现有的6种基因音符来看,有可能以它们为基础开发出诊断疾病和表现生命特征的基因音乐。因为,在第5和第6碱基出现较多或反复出现的地方,基因音乐肯定是不一样的。
首先是,美妙动听的音乐是与健康细胞的基因中的碱基正常而有规律的排序相关。过去有研究人员按英语的习惯把四个碱基T、G、A、C分别对应为3(mi)、4(fa)、5(sol)、ī(do,高音),由此谱出的胰岛素基因的乐曲优美迷人,其旋律就像《幸福勤劳》那样动听。既如此,现在发现了第5和第6碱基(音符),就有可能按照这6个基因音符来谱出更为复杂和组合更广泛的音乐,而且这样的音乐也可能更为优美动听。
另一方面,如果人们患病,如癌症,而癌细胞是不正常的细胞,其中的6个碱基的分布就有可能打破正常的规律和程序,就如同雷特综合征患者的细胞中只出现第5碱基,而没有出现第6碱基一样。在没有第6碱基这个音符时,谱出的乐曲就显然不如正常人既有第5碱基(音符),又有第6碱基(音符)所谱出的乐曲那么动听。
一个简单的例子是,过去有研究人员把白血病Ⅱ型病毒的基因按简谱的对应关系谱曲,产生的音乐使人愁肠百结,就像一个厌世者频频发出的悲叹。
所以,未来生物医学研究人员与音乐工作者结合,根据现在发现的6个基因音符来谱曲,有可能创造出识别和区分健康与疾病的基因音乐。而且,随着未来发现的基因音符越来越多,也就可以既从生物学角度,又从音乐角度为认识生命现象、健康和疾病提供更多的线索。
【责任编辑】张田勘