吴 琨 孙 策 龙红岸
(中国海洋大学水产学院/海洋生物多样性与进化研究所 青岛 266003)
一提起基因突变(DNA序列上的变化),很多人第一反应就是这种遗传学现象的发生是随机的,这种直觉式的反应或许是源于教材。例如,高中生物学教材中的论述:“基因突变是随机发生的、不定向的”及“基因突变的方向和环境没有明确的因果关系”等[1]。教材中解释突变是随机的,是因为突变可以发生在个体不同发育时期以及基因组中的不同位置等;突变是“不定向”的论据则是基因由于突变,向不同的方向发生变化。美国分子与行为生物学家Seymour Benzer在1961年就曾提出过疑问: 可突变的基因位点是随机分布的,还是在遗传图谱的某些区域不寻常的集聚或缺失[2]?
抛开“突变是随机发生的”这一论断先不讲,教材中给出的论据不够深入,并且把基因层面的变化混淆为基因表达后的表型变化。“基因突变的方向和环境没有明确的因果关系”,则忽视了学界近年关于环境因子诱导突变形成的研究结论。
而结合近年来的突变研究[3-5],当今演化生物学界普遍认同: 突变不是随机的,而是存在偏好性的,多种环境因子可以显著改变突变率和突变谱(不同类别突变的频率分布)。笔者以突变中最常见的碱基替换为例,讨论教材中相关的突变知识。
首先,介绍一下基本概念: 什么是随机?统计学上的随机可通俗地定义为: 一个事件的发生是不可预测的或者缺乏可归纳的模式。而突变的可预测性与可归纳的模式则为学界所熟知。例如,在一条DNA链上,由于碱基堆积力以及G∶C碱基对,对碱基错配的高容忍性,一个碱基的两侧有无G∶C碱基对可以导致至近80倍的突变频率变化(两侧存在G∶C碱基对比不存在的情况下突变率大幅升高)。类似的,甲基化碱基比非甲基化碱基的突变率有数量级的升高[6-9],杂合位点比纯合位点突变率要高[10]等,这些都是突变过程不随机的例子。近年的自发突变研究还发现: 在细菌整个基因组中,突变率的高低呈波形分布,靠近复制起点处,生物的突变率最低,而在复制终止区,有较高的突变率[2, 3, 6](图1)。造成这种波形分布的因素尚无定论,现在推测是由基因组不同区域超螺旋结构的差异引起。值得一提的是,以上大部分发现最初在微生物中报道,随后也在其他生物的研究中得到验证。
图1 大肠杆菌基因组中不同位置的碱基替换(Base-Pair Substitution,简写为BPS)突变率[3]注: x轴代表基因组中连续的不同区域,每一个单位(bin)代表100 kbp的DNA; 0、 46代表DNA复制起点附近,22~24之间为复制终点;曲线1代表实际的突变率,曲线2是小波转换后的突变率(小波转换是波形信号处理的一种方式)
生物体在不同的生长发育时期都会有突变发生,然而不同时期的突变率则有很大差异。例如,长期处在平台期的大肠杆菌,其有害突变率要比正常生长情况下高上百倍[11]。
综上,突变是有发生模式并且可预测的。中学教材中给出的论据“突变可以发生在个体不同发育时期以及基因组中的不同位置等”与其结论“突变是随机的”并没有逻辑关系。换句话说,真正“随机”的突变指的是在不同发育时期和基因组中的不同位置没有发生模式规律或者不可预测。
突变在单个至多个碱基尺度上是有变化方向的,这个变化是DNA水平上的,而非教材中列举的突变造成的表型水平变化(小鼠毛色变化)。突变造成的表型变化通常不能直接用来描述突变的方向。对于碱基替换突变来说,每种碱基的突变方向对应三种情况,如: A对应A→G、 A→C、 A→T,四种碱基则共有12种碱基替换,这些不同类别的突变在一种生物中的频率分布即该物种的突变谱。在过去十几年间,高通量测序大大促进了生物基因组自发突变研究,约37种生物的突变谱被完整解析出来(足够的突变数目是解析突变谱的前提)。而在绝大多数物种中,一个物种总的突变结果要么倾向于产生G∶C碱基对,要么倾向于产生A∶T碱基对,这种倾向性也被证实与生物基因组的G/C碱基含量有很强的正相关关系,是生物基因组结构演化的重要驱动力量[12](图2)。
图2 根据突变倾向性计算的G/C碱基含量与实际观察到的基因组G/C含量正相关[12]注: 在该图中,横坐标表示假设突变是影响G/C含量的唯一演化力量,根据突变倾向性(由突变谱决定的整体突变方向,是倾向于产生A∶T碱基对,还是G∶C碱基对)计算出的G/C碱基含量;纵坐标表示在基因组中实际观测到的G/C碱基含量
至于教材中“基因突变的方向和环境没有明确的因果关系”则更需更新,因为近年环境因子诱导突变领域的诸多发现与此论断不符,例如海水pH降低会减小突变率,并改变珊瑚病原菌罗尼氏弧菌的全基因组突变方向,由倾向于产生A/T碱基变为倾向于产生G/C碱基[5]。因此,环境因素可影响突变的频率和方向。
正如本文引言中Seymour Benzer提出的问题,早先的科学工作者并不确定基因突变到底是不是随机的,近年来全基因组测序和生物信息工具的发展,给我们提供了大量的数据,支持基因突变并非随机的这一论断。