陈纪鹏, 刘小林, 胡月清
(宜春学院生命科学与资源环境学院/江西省作物生长发育调控重点实验室,江西宜春 336000)
多倍化在植物进化历程中发挥着巨大作用,植物近缘种间的天然杂交和随后发生的基因组自然加倍是推动植物进化、产生新物种的主要动力。细胞遗传学研究表明,自然界约70%的被子植物是自然进化形成的异源多倍体,而且许多重要的栽培植物也都是自然形成的异源多倍体。比如小麦是在形成史上经过2次杂交和2次基因组加倍形成的异源六倍体。白菜型油菜与甘蓝杂交再经基因组加倍后,经历近万年的进化演变成当前广泛种植的甘蓝型油菜。另外,像棉花、马铃薯等多种重要的栽培作物都在形成史上经历过多倍化历程。自然界多倍体植物的成功进化为作物遗传育种指出新的思路。人工合成多倍体虽然表现出植株高大、生长旺盛、适应性强等优点,但往往出现配子育性下降、结实率低的缺憾。针对这一问题,人们的目光集中在植物多倍体配子的形成过程中,其中减数分裂就是配子形成的关键阶段。
芸薹属包含大量的栽培植物和野生植物,约占十字花科植物种类的1/10,在我国就有15个栽培种,还形成了多个变种、亚种,如甘蓝型油菜、白菜、芥菜等都是重要的油料作物和蔬菜作物,还有些作为药用植物(如板蓝根)和观赏植物(如诸葛菜)广泛种植。芸薹属植物大多数具有独特的农艺性状,如甘蓝型油菜具有较高的种子产量和含油量,白菜、卷心菜、苞菜和芥菜等可形成硕大的叶球或膨大的根茎,西兰花、花椰菜的花序则变形为主要的食用部位。
众多的种类和多样的形态以及重要的经济价值都源自芸薹属复杂的遗传背景。在长期进化和栽培驯化过程中,芸薹属经历了多轮多倍化演变形成了庞大而复杂的基因组。20世纪30年代,日本学者Nagaharu提出芸薹属3个二倍体基本种和3个四倍体复合种之间的进化关系,即芸薹属禹氏三角(图1)。他指出3个二倍体基本种有白菜(,AA)、黑芥(,BB)与甘蓝(,CC),它们两两杂交分别形成甘蓝型油菜(,AACC)、芥菜型油菜(,AABB)和埃塞俄比亚芥(,BBCC,简称“埃芥”)。又经过大量的细胞遗传学研究,人们提出了芸薹属的3个基因组(A、B、C)都起源于同一共同祖先,即单源进化论学说,这种说法后来也得到比较基因组学研究结果的验证。芸薹属基因组起源的问题也存在较大争议,但有一点共识就是3个基因组都由1个染色体数目为7的祖先种进化而来。但是,随着分子生物学技术应用于遗传研究中来,大量的研究结果显示,芸薹属3个基因组并非起源于1个共同祖先,而是有2个起源,即A和C基因组有1个共同起源,而B基因组由另一个祖先种进化而来。基于保守的同源序列标记和蛋白质组学研究结果也支持二源论的说法。
伴随着多倍化进程,基因组结构也发生着剧烈的变化,以适应多倍化带来的基因组冲击。白菜基因组来源于3个亚基因组(来自同一个7条染色体的祖先),经序列重排、序列消除以及转座子控制的基因沉默,最终形成二倍体白菜。全基因组测序结果显示,白菜有4万多个基因,并发现白菜基因组在进化历程中的序列消除规律。RNA-seq技术检测到甘蓝型油菜基因组存在2万多个SNPs及125 InDels多态性位点。还发现重复序列在甘蓝基因组中占重要地位,整个基因组有56%的区域是由重复序列构成的。芥菜型油菜与白菜的全基因组序列比较显示,2个物种的A基因组只有约45%的序列片段是一致的,芥菜型油菜在进化中发生了更大的序列变异。还有研究显示,芸薹属植物C基因组比A和B基因组在进化史上保守性更高。分析甘蓝型油菜全基因组测序结果得出,它由白菜和甘蓝于7 500年前经杂交形成。它是当前测序的所有植物中基因数量最多的物种,大约有10万个基因维持其生长发育。测序结果还显示,白菜A基因组和甘蓝C基因组之间存在着广泛的序列重组。2021年,埃塞俄比亚芥全基因组测序工作完成,结果显示,17条染色体相连全长1.087 GB,其中重复序列约占58.34%。进一步分析表明,埃芥基因组形成于4万多年前,早于甘蓝型油菜,但晚于芥菜型油菜。多倍化的同时伴随着发生的基因组序列变化形成了芸薹属复杂的遗传组成,复杂的遗传组成不但促使形成了丰富的遗传资源,还为芸薹属多倍体育种提供了广阔的空间。但是,面临合成多倍体配子育性差的难题,减数分裂染色体行为规律及其遗传机制的研究显得尤为重要。
在绝大多数真核生物(动物、植物和真菌)中都发现了有性繁殖方式,而有性繁殖过程中形成雌雄配子的主要过程就是减数分裂。这是一个复杂的过程,DNA复制1次而细胞分裂2次,第1次分裂(MⅠ)前期同源染色体相互识别并配对与联会、重组和分离,随后进行第2次分裂(MⅡ)。经过连续2次细胞分裂形成配子。减数分裂不但为有性繁殖提供了染色体数目减半的配子保证了上下代间的遗传稳定,还通过重组产生了种类多样的配子,使后代具有丰富的变异基础。减数分裂中复杂的染色体行为背后必然隐藏着复杂的遗传机制,全基因组关联分析显示,甘蓝型油菜中存在着与花粉育性有显著关联的区段,包含、等多个基因,这些基因以各种方式参与减数分裂中染色体配对、联会复合体形成、DNA双链断裂与修复、同源重组等过程。
在MⅠ偶线期,同源染色体相互识别并配对。配对的结构和动力学因素来自于染色单体间交叉和着丝粒间连接,交叉的形成受多因素干扰呈现非随机分布,这些连接点沿染色体纵向延伸最终形成稳定结构;同时,端粒之间形成束状结构有助于辅助同源染色体对齐。在染色单体间交叉、着丝粒和端粒等多因素共同作用下,同源染色体配对并联会。二倍体与天然异源多倍体同源染色体发生精准配对,终变期后分开。染色体配对保证了染色体发生均等分离,最终形成平衡而有活性的配子。然而在合成多倍体和单倍体中,不但会发生同源配对,还可能发生非同源配对,有些染色体也可能不配对。非同源配对导致在MⅠ后期正常的染色体分离规律变化,发生不均等分离而形成不平衡配子,往往导致配子败育。在细胞水平上,多倍体杂种在减数分裂过程中染色体行为异常而导致配子败育,此外还有染色体排列混乱、落后染色体或染色体桥等现象。
荧光原位杂交通过探针标记杂种不同基因组,可用于区分不同基因组的染色体,是研究多倍体杂种基因组互作的可靠技术。以黑芥B基因组为探针进行荧光原位杂交时,信号只出现在B基因组上,A、C基因组上无信号,且灵敏度较高。然而,A、C基因组起源于同一祖先,序列相似度较高,基因组原位杂交易产生信号交叉。因此,只能采用特异性更强的DNA序列做探针,如C基因组特异序列(BoB014O06)作为探针可将荧光信号特异标记在C基因组上。45S核糖体RNA基因和端粒序列也常用作芸薹属荧光原位杂交探针,这些探针标记在染色体特定位置,可用于区分不同的染色体。
由于没有同源染色体存在,单倍体中基因组内或基因组间染色体部分同源关系常引起染色体非同源配对。小孢子培养获得的芸薹属三倍体杂种(ABC)不同基因组间染色体以12%~18% 的频率发生非同源配对(A1-C1、A2-C2、A3-C3和 A7-C6),还有的染色体间发生频率较低(小于1%)的非同源配对(A8-C8、A8-C9)。甘蓝型油菜与黑芥的杂种(ABC)还检测到黑芥B基因组与甘蓝型油菜的AC基因组间异源配对,三倍体和六倍体杂种异源配对的花粉母细胞分别占38%和15%。白菜单倍体也以较高频率发生非同源配对,超过50%的花粉母细胞至少形成3对二价体,而且像同源染色体配对结果一样,在MⅠ后期配对染色体分开进入不同的子细胞。
合成多倍体中即使存在同源染色体,也可能发生非同源配对。对合成的芸薹属四倍体(AACC、AABB和BBCC)的研究发现,基因组内和基因组间染色体配对水平差异很大,基因组内染色体配对的概率小于基因组间配对,配对频率取决于细胞质背景和基因组之间的相互作用。还发现黑芥B基因组内配对频率小于白菜A与甘蓝C基因组内配对的频率,而A与C基因组配对频率相似。减数分裂中不同染色体组间非同源配对易造成染色体易位而产生不对等交换。在合成六倍体(AABBCC)中,A基因组与C基因组染色体片段发生易位,结果就导致花粉育性下降。甘蓝型油菜与甘蓝杂交形成的三倍体杂种(ACC)减数分裂中出现染色体排列混乱,而且发生较高频率的非同源配对,后期Ⅰ染色体不均等分离。合成多倍体减数分裂中染色体的非同源配对和单价体还会引起染色体消除,致使染色体组稳定性下降。染色体稳定性也是影响配子育性的因素,染色体越稳定的群体,花粉育性越好,而染色体不稳定容易丢失的群体,花粉育性就越差。
联会复合体(SC)是同源染色体与相关蛋白质在联会过程中形成的特异结构,它将同源染色体从轴向连接起来,其空间模式影响着配对的染色体双链断裂和重组的全过程。同源染色体配对时,DNA双链断裂,而后修复愈合,错误的修复将产生交叉,而恢复性修复则不形成交叉。双链断裂修复以及交叉的形成促使同源染色体折叠成环状并彼此靠近,联会从断裂修复位点开始,然后沿着同源染色体轴向延伸,最终形成联会复合体。联会复合体的形成过程比较复杂,有多种蛋白参与,如拓扑异构酶Ⅱ、凝聚蛋白、内聚蛋白和内聚蛋白相关蛋白等。在这个过程中,ZIP4作为一个主要平台,将ZIP2-SPO16复合物与CM1-GMC2连接起来,从而启动联会复合体形成。ZIP4还与ZIP3、MSH5相互作用,后者与伴侣蛋白 MSH4一起稳定联会复合体结构(图2)。
采用免疫荧光定位观察相关蛋白的生成和分布是揭示联会复合体形成特征的有效方法。在芸薹属3个二倍体和3个四倍体栽培种中均克隆到联会辅助蛋白ASY1基因,虽然不同种间存在序列差异,但功能完全相同。在芸薹属及其模式植物拟南芥中均发现,ASY1参与联会复合体形成过程,联会复合体形成早期,在同源染色体轴向上出现蛋白检测信号,而后信号位点增多并沿着联会复合体轴向延伸,信号几乎延伸到联会同源物的整个长度;当减数分裂进入终变期联会复合体解体时,信号也随之消失。这表明ASY1的形成与联会复合体形成有时间和空间上的相关性。免疫共沉淀反应发现,在芸薹属与拟南芥中还存在与ASY1相互作用的另一种蛋白ASY3,这是一种减数分裂所需的具有卷曲螺旋结构的蛋白,这2种蛋白在染色体联会复合体中相结合形成特定结构共同发生作用。ASY3突变体中,常发生非同源染色体联会,且交叉难以形成。AtZYP1是一种横向细丝蛋白,它的作用是促进染色单体间形成交叉。在白菜、甘蓝和甘蓝型油菜中均发现与AtZYP1同源的基因,通过基因编辑去除该基因后,在减数分裂中出现非同源配对频率增加、同源重组减少和染色体落后等现象。合成芸薹属三倍体(ABC)染色体发生非同源配对时,也在联会的位置检测到ZYP1荧光信号,但与同源联会的染色体相比,信号弱且不连续,表明非同源联会其实是2条染色体部分区段发生联会。在白菜型油菜和拟南芥中,另一种蛋白PCH2在同源染色体联会中也发挥了重要功能,突变体中该蛋白缺失导致交叉减少甚至无法形成交叉。
联会复合体形成中,DNA双链在拓扑异构酶SPO11蛋白的作用下发生断裂(DSBs),断裂位点在随后的修复过程中可能出现原位复合,也可能发生非恢复愈合形成交叉。在SPO11缺失的情况下,双链断裂不能形成。甘蓝型油菜双链断裂形成的数量受基因组结构的影响,较长的染色体双链断裂位点就较多,而在减数分裂不需要配对的植物中很少出现双链断裂位点。DNA双链断裂修复蛋白RAD51参与DNA的损伤感应和修复,是同源重组过程中的关键因子。此蛋白聚集在同源染色体双链断裂处,可作为双链断裂的标记。另外,RAD54是调节RAD51活性的重要辅助因子,它稳定RAD51结构,并刺激其发挥作用。RAD54的缺失对减数分裂细胞中的DNA损伤修复具有显著影响。
双链断裂后愈合的结果只有非恢复愈合才形成交叉(CO),在几乎所有的生物体中,交叉的数量总是比双链断裂数量少得多,可见断裂修复并不是随机发生的。每对同源染色体只有1 个到几个交叉点,即使在基因组大、染色体长的情况下也是如此,在拟南芥中,30个DSB中只有1个成为交叉。交叉的分布规律也受基因组背景的干扰,利用芸薹属二倍体AA和三倍体 AAC杂交产生非整倍体分析,额外的C基因组使A基因组同源交叉沿着染色体轴向较均匀分布,而在二倍体中交叉分布不均匀,着丝粒附近基本不形成交叉。此现象显示,物种进化过程中可能形成了抑制交叉发生的某种机制,但尚不清楚。DMC1基因是已知的减数分裂特异基因,参与同源染色体DNA双链断裂修复。芸薹属模式植物拟南芥免疫荧光定位结果显示,DMC1定位于减数分裂DSB的相对两侧。DMC1与ASY1共同作用促进同源染色体双链断点修复。白菜同源四倍体与二倍体相比,联会复合体出现异常的同时,DMC1的基因在同源四倍体中显著下调表达,这导致白菜同源四倍体减数分裂异常。DMC1的表达还受环境条件的影响,如在白菜中,盐胁迫可刺激其表达,提高植株耐盐特性。
交叉的结果DNA片段发生互换而产生重组,是减数分裂时染色体正确配对和分离的必要条件。联会的双链断裂与愈合的结果形成交叉,交叉染色体将配对的染色体连接在一起,从而确保它们对齐并使着丝粒与纺缍丝正确连接。未能进行交叉重组的减数分裂会导致染色体错误分离而产生异常配子。在人类中,染色体异常重组和分离通常会导致严重的遗传疾病,如唐氏综合征。
同源重组确保了同源染色体之间二价体的形成和随后的均等分离,这也导致后代遗传多样性,影响物种对选择的进化反应。同源重组可防止多价体形成,能有效规范染色体行为,但也可能破坏遗传稳定性,导致减数分裂异常。同源染色体之间的重组频率受植物遗传组成影响,例如,芸薹属四倍体(AACC)与三倍体(AAC)相比,完全相同的同源AA染色体对之间的重组数量显著增加。在甘蓝型油菜中,重组基本上发生在同源染色体之间,只有少数在非同源染色体之间形成。而甘蓝型油菜单倍体也能发生重组,其中同一基因组的染色体之间优先发生重组,然后2个基因组间的染色体之间也发生非同源重组,非同源重组还造成半数单倍体后代出现染色体片段重复和丢失。对甘蓝型油菜与埃塞俄比亚芥种间杂种(CCAB)微卫星标记分析显示,重组引起的A和B基因组缺失的频率有很大差异,基因组间非同源重组引起19个A-C、3个A-B和10个B-C间发生重复/缺失;而2个C基因组间同源重组产生55个缺失和19个重复。重组引起的基因组序列变异拓展了生物遗传多样性的遗传基础。
多倍化改变了植物基因组结构,伴随着发生大量的序列变异及表观遗传变异。芸薹属植物在多倍化进程中基因组发生了大量的选择性剪接,不仅使基因组序列发生了变化,也导致转录本发生改变。在芸薹属基因组进化过程中还出现不对称的基因丢失、不对称的转座元件积累和亚基因组表达优势等情况。与拟南芥同源区段共线性比较结果显示,甘蓝基因组形成过程中发生了大量区段消除和重复等序列变化。多倍化进程中基因组的极不稳定使人工合成杂种往往表现出遗传不稳定、育性差和种子产量低等缺陷,使其难以直接用于农业生产。配子败育表面上看属于细胞遗传学范畴,但减数分裂中复杂的染色体行为背后必然隐藏着相应分子遗传机制。研究支配减数分裂过程的相应基因作用及其表达调控规律是调控合成芸薹属多倍体配子发育的基本手段。今后芸薹属多倍体减数分裂研究将聚焦在减数分裂中各染色体行为背后的遗传机制和开发调控多倍体配子发育遗传方法等方面。