胡惠芳
(湖北轻工职业技术学院湖北武汉430200)
基因组拷贝数变异及其突变机理分析
胡惠芳
(湖北轻工职业技术学院湖北武汉430200)
拷贝数变异能够导致呈孟德尔遗传的单基因病和罕见疾病,同时与复杂疾病相关。目前用来进行全基因组范围的拷贝数变异研究方法有很多,包括单核苷酸多态性分型芯片技术、基于芯片的比较基因组杂交技术和新一代测序技术。拷贝数变异的形成机制也有很多种,总的来说可以概括为DNA重组和DNA错误复制两大类。本文对基因组拷贝数变异进行简单介绍,并详细分析了其突变机理。
基因组;拷贝数变异;发现;突变机理
顾名思义,“拷贝数变异”就是会产生拷贝数的量变。准确来说,拷贝数变异通常是指长度超过1kb的基因组大片段的拷贝数减少或者增加,主要表现为亚显微水平的重复和缺失。拷贝数变异是由基因组发生重排而导致的,是基因组结构变异的重要组成部分。
2004年是拷贝数变异研究中具有重大意义的一年。利用新的能够覆盖整个人类基因组的先进研究技术,有两个研究小组差不多同时发现了大片段的拷贝数变异,这种大片段的拷贝数变异不仅能够导致出生缺陷等重大疾病,而且能够作为一种遗传多态性而广泛分布于人类基因组之中。目前,被报道的基因组结构变异已经超过了66000个,其中主要是拷贝数变异。
那么,人类基因组上大量的拷贝数变异究竟是如何产生的呢?DNA重组是其中一类已知的机制,包括非同源末端连接和非等位同源重组等。最近研究发现的“复制叉停滞与模板交换”(Fork stalling and template switching,FoSTeS)模型是一种新的基于DNA错误复制的机制。此种机制可以解释那些不符合非等位同源重组和非同源末端连接等突变机制的具有复杂结构的拷贝数变异。
2004年,某研究小组应用寡核酸微阵列分析技术,使用85000个平均间隔为35kb的探针对20例正常个体的基因组DNA片段的拷贝数情况进行了分析,鉴定出其中76个位点上存在的221个长度超过100kb的拷贝数变异。同时,有人利用基于细菌人工染色体探针的分辨率为1Mb的比较基因组杂交芯片,对55例个体的大片段拷贝数变异情况进行了分析,发现了255个重复和缺失。
“基因组变异数据库”对已经被报道的拷贝数变异进行了收录和数据整理。“基因组变异数据库”中的所有拷贝数变异所覆盖的基因组片段占人类基因组的29.7%,但是实际上这个比例要更低一点。此外,根据研究数据估计,人类基因组上有5~10%的区域存在拷贝数变异,比其他遗传变异形式要高很多。
事实证明,拷贝数变异研究具有重大的临床价值和科学意义,因此全球范围内开展拷贝数变异研究项目的研究中心越来越多,例如千人基因组计划和人类基因组结构变异研究组等。千人基因组计划已经获得了初步数据,包括2万个拷贝数变异,100万个短的插入或缺失以及1500万个单核苷酸多态性的位点,其中绝大部分都是新的发现。
3.1 非等位同源重组主要发生在减数分裂中,可导致倒位、重复和缺失
等位同源重组是生物遗传多样性的来源,是指在减数分裂过程中,基因组上同一位点的DNA序列与其同源序列发生的重组。
非等位同源重组是由两条同源的、但在基因组不同位置重复出现的、高度相似性的DNA序列配对并发生序列交换造成的。非等位同源重组若发生在相同染色体上的同向重复序列间则会造成缺失或重复,若发生在相同染色体上的反向重复序列间则会造成倒位。若非等位同源重组发生在不同染色体上的重复序列间则可能会导致染色体易位。
非等位同源重组的底物通常是长度超过10kb,序列相似度大于95%的SD序列。除了SD序列之外,非等位同源重组的底物还包括可以反转录转座的L1元件、Alu等较短的重复序列。由于检测手段的局限性,此类机理导致的拷贝数变异通常会低估。
同源重组(包括非等位同源重组和等位同源重组)是存在重组热点的,即重组发生的位点存在着一定的序列倾向性,而不是随机分布于基因组之上。一个顺式作用基序“CCNCCNTNNCCNC”富集的现象在等位同源重组和非等位同源重组的重组热点中都有被发现,这不仅说明等位同源重组和非等位同源重组是共享重组热点的,并具有类似分子机理,同时也提示了该段特征序列是某些或者某一重组相关蛋白识别位点的可能性。
非等位同源重组主要发生在减数分裂中,造成不平衡交换,形成携带有拷贝数变异的配子,进而传递给后代。在有丝分裂中也可以发生较少的非等位同源重组事件,在体细胞中形成携带拷贝数变异或者其它结构变异的嵌合型。
基于非等位同源重组机理发生的拷贝数变异具有较高的突变率。某研究小组采用精子分型技术,分析了几名4个基于非等位同源重组机理产生的拷贝数变异,源自5名正常男性的精液样本。这些拷贝数变异包括:Potocki-Lupski综合征重复突变与Smith-Magenis综合征缺失突变,腓骨肌萎缩症重复突变与遗传性压力敏感性神经病缺失突变,无精子症因子a缺失突变及其相对的重复突变,7q11.23重复突变和Williams-Beuren综合征缺失突变。
3.2 一些结构简单的拷贝数变异可以源自非同源末端连接
非同源末端连接是在人类细胞中进行生理性的V(D)J重组的,此外还可以修复由氧化反应或者辐射引起的DNA双链断裂。如前面所述,非等位同源重组需要具有同源性的DNA片段作为重组底物,而非同源末端连接则是不需要的;另外,非同源末端连接产生以后能够在连接部位插进若干个碱基。同其他突变机理相比,这两点是非同源末端连接的主要特征。
某些基于非同源末端连接的拷贝数变异的断点倾向于落在重复序列内或者其周围;此外,某些DNA基序可以引起DNA弯曲或导致DNA双链断裂,如TTTAAA,因此基于非同源末端连接产生的拷贝数变异容易出现在此类位点附近。
3.3 基于DNA错误复制的FoSTeS机理可以产生含复杂结构的拷贝数变异
高密度比较基因组杂交芯片技术的发展促进了对拷贝数变异的研究,众多具有复杂重排结构的拷贝数变异被发现,并且无法被前述的基于DNA重组的机理模型所解释。为此,有人提出了一种解释拷贝数变异突变和一些异常人类基因组重排的新机理。
根据“复制叉停滞与模板交换”模型,在DNA复制叉停滞的同时,滞后链从模板上脱落,通过微同源序列转移到另一个复制叉上,然后开始重新合成DNA。两个要产生模板转换的复制叉会在空间上接近彼此。新复制叉上错误的结合片段最终是正向还是反向出现,这取决于复制叉的方向以及新复制叉中的作为模板是引导链还是滞后链。除此之外,模板转换的结果是重复还是缺失,取决于新的复制叉是在起始复制叉的上游还是下游。
研究表明,由于DNA复制错误而产生的拷贝数变异在SMS综合征或PTLS综合征、佩梅病、LIS1、MECP2等位点上都有被发现。通过“复制叉停滞与模板交换”机理不但可以产生长度高达数Mb的拷贝数变异,还能够引起单个外显子水平和基因水平的重排并产生拷贝数变异。“复制叉停滞与模板交换”可以导致基因的重复和外显子混编,这些过程是驱动基因和基因组进化的主要机制。
拷贝数变异是产生人类遗传多样性和个体间遗传差异的一个重要来源。与单核苷酸多态性相比,拷贝数变异涉及更多的人类基因组序列,具有更高的突变率。基于DNA重组机制(例如非等位同源重组和等位同源重组)与DNA错误复制机制(例如“复制叉停滞与模板交换”)的基因组重排可以产生多种类型的拷贝数变异。拷贝数变异与人类复杂疾病相关,也可以导致呈孟德尔遗传的单基因疾病。但是,由于当前基因组覆盖率和拷贝数变异研究方法的分辨率的限制,人类基因组中没有被发现的拷贝数变异还有很多。今后,对拷贝数变异相关疾病以及人类基因组的系统研究,可以使我们对拷贝数变异的形成、分布、进化、生物学效应以及自然选择等问题产生更加全面认识。
[1]吴志俊,金玮.拷贝数变异:基因组多样性的新形式.遗传,2014,31(4):339~347.
[2]何阳花,俞英,张沅.拷贝数变异与疾病的关系及其在动物抗病育种中的应用前景.遗传,2013,30(11):1385~1391.
[3]杜仁骞,金力,张锋.基因组拷贝数变异及其突变机理与人类疾病.遗传,2015,33(8):857~869.
R394
A
1004-7344(2016)30-0296-02
2016-10-9
胡惠芳(1982-),女,硕士,主要从事生物、化学等相关工作。