刘 青,潘浩研,黄家丽,JOHN Seymour Heslop Harrison
(1中国科学院 华南植物园,植物资源保护与可持续利用重点实验室,广东 广州 510650;2 中国科学院 核心植物园,广东 广州 510650;3 中国科学院大学,北京 100049;4 华南农业大学 生命科学学院,广东 广州 510642;5 莱斯特大学 遗传学和基因组生物学系,英国 莱斯特 LE1 7RH)
核型分析(karyotype)是一种基于物种特有的一组或一套染色体,来构建染色体形态学模式图的研究方法,其在细胞遗传学、分类学、染色体工程学中应用广泛[1]。常规核型分析按照体细胞分裂中期的染色体长度、臂比、着丝点位置以及核型表达模式来进行分类[2-3]。然而对于染色体数目较多,或单条染色体间区别特征不明显的物种,通过传统核型分析无法识别该物种所有染色体。
随着电子显微镜发明和计算机技术的进步,其促生了染色体显带技术(chromosome banding)。这是一种通过显带染色处理,使染色体一定部位显示出深浅不同的带纹,从而来分辨染色体细微特征的方法[4]。常见的有Q带[5]、C带[6]、N带[7]、G带[8]。荧光原位杂交(fluorescent in situ hybridization,FISH)技术是一种基于碱基互补配对原则,采用荧光素标记DNA或RNA探针,再与单链的靶DNA或RNA分子杂交的方法[9]。染色体荧光显带(chromosome fluorochrome banding)技术是FISH技术的补充,该技术中常用复染剂的作用机理与DNA分子的碱基组成有关,如4′,6-二脒基-2-苯基吲哚(4′,6-diamidino-2-phenylindole,DAPI)和色霉素A3(chromomycin A3,CMA3)可分别结合双链DNA中的AT和CG碱基对,显示染色体的特异标记信息[10]。
目前针对葫芦科、秋英属(Cosmos)等部分物种已开展染色体分子核型研究[11-12]。根据染色体形态特征,已解决茄属(Solanum)、松属(Pinus)种间亲缘关系、柚(Citrusmaxima)的基因组核型鉴定问题[13-15]。但对于基因组内染色体小且形态相似,或者基因组间分化程度小的物种鉴定,该方法尚有缺陷。如孙桂芳等[12]对秋英属波斯菊(Cosmosbipinnata)与硫华菊(Cosmossulphureus)物种进行了研究,发现品种“风景(Scenery)”和“优雅(Elegant)”与“凯莱(Sensation Gloria)”和“白蛋挞(Cupcakes White)”的核型不对称系数相似,但却属于2个完全不同的形态种。
基因组学技术的飞速发展使作物科学理论与技术不断实现新突破。全球30%的作物增产得益于野生近缘种在作物育种中的应用[16],作物野生种的遗传多样性呈现动态变化,因此一些潜在应用价值和适应意义,以及只有在特定环境下表达的隐藏遗传变异很难被发现。研究表明,不同作物基因组大小差异较大,但其二倍体野生种中基因数量相似,均为3万~4万个[17],这可为植物染色体进化研究提供遗传标记。基因组数据的积累,提供了越来越多染色体组型及带型的DNA序列信息,也因此推动了遗传标记开发的研究[18]。文章综述了利用单拷贝序列染色体涂染(single-copy sequence based chromosome painting)和寡核苷酸荧光原位杂交(oligonucleotide-FISH,Oligo-FISH)技术合成新型探针池的方法,总结其在比较基因组学研究中的应用案例,以期为植物染色体分子核型研究提供参考。
染色体核型(karyotype)分析是指一个物种的染色体组在有丝分裂中期的表型,包括染色体数目、长度、着丝点位置、臂比、随体有无等特征总和,是细胞遗传学领域最基础的研究内容[2]。核型分析可以为细胞遗传分类、物种间亲缘关系以及染色体重组研究提供重要依据[19]。目前新技术正在被运用到核型分析中,特别是它与基因组学的结合日益紧密,建立染色体核型主要有根尖压片法和荧光原位杂交技术。
植物细胞有丝分裂中期染色体标本的制备通常采用根尖压片法[2,20],对根尖进行预处理、固定、解离[21-22],在显微镜下观察染色体数量和形态特征。用Adobe Photoshop[23]等软件统计染色体长度、臂比、着丝粒指数及核型不对称系数[19,24-25],以推测物种亲缘关系[26]与染色体重组[27]。如张超等[20]采用根尖压片法,发现三倍体在山西太行山野生萱草(Hemerocalisfulva)中广泛存在,提出核型不对称系数与染色体倍性无关。张颖等[26]发现8个样地的假臭草(Praxelisclematidea)具有4种不对称核型,说明地理距离影响了假臭草的核型进化。Medeiros-Neto等[27]提出兰科植物不对称核型可能是染色体重组的原因之一。
采用FISH技术[28]可以鉴定作物外源遗传物质[29-30],判断染色体间配对关系[31-32],阐明物种间亲缘关系[33],并提高核型分析的精细程度[34-35],有助于深入了解基因组结构和进化关系,辅助基因组组装积累资源,有效地推动了核型分析工作。如王坤波等[36]采用亚洲棉(Gossypiumarboreum)总DNA对海岛棉(Gossypiumbarbadense)体细胞染色体进行FISH试验,明确了四倍体棉A与D亚基因组染色体长度的差别。Liu等[37]发现燕麦(Avenasativa)染色体具有C、A、D 3个亚基因组核型,且亚基因组间有频繁易位现象(图1)。
鉴定植物单条染色体是染色体进化研究的里程碑。在植物中应用最普遍的是物种间高度保守的基因家族核糖体RNA基因(rDNA),包括18S-5.8S-25S rDNA(简称45S rDNA),或其转录单元内的一部分,如25S rDNA以及5S rDNA,此外还有端粒相关序列(telomere-associated sequences, TAS)、着丝粒区域特异重复序列和微卫星序列。利用以上探针组合,黑麦(Secalecereale)、小麦(Triticumaestivum)、短柄草(Brachypodiumdistachyon)和燕麦(Avenasativa)中的部分染色体和染色体区域得以分辨[38-41]。但由于缺乏染色体水平基因组数据,因此寻找单条染色体上特异的重复序列位点相当困难。随着基因组测序技术进步和成本逐渐降低,部分植物类群已实现了单染色体鉴定,主要采用单拷贝基因染色体涂染技术和寡核苷酸荧光原位杂交技术完成。
单拷贝基因染色体涂染技术可为构建细胞学图谱提供直接证据。Lou等[42]采用单拷贝基因染色体涂染技术,纠正了黄瓜(Cucumissativus)4号染色体远端约2.16 Mb的基因组组装错误。Wang等[43]标记9个单拷贝基因片段,用FISH技术完成了玉米(Zeamays)9号染色体上的基因定位。Danilova等[44]采用单拷贝基因染色体涂染技术,发现了小麦A基因组特异的染色体间易位(T4AL/5AL和3AtL/4AtL)。这些研究均采用单拷贝基因染色体涂染技术验证了基因组序列组装结果,实现了核型精细结构分析。
寡核苷酸荧光原位杂交技术(Oligo-FISH)在植物基因组内单条染色体识别和染色体特定区域鉴定中独具优势[45]。最早该技术被应用于大麦(Horedeumvulgare)和黑麦端粒序列的定位研究[46],1995年Doudrick等[47]用寡核苷酸荧光原位杂交技术开展湿地松(Pinuselliottiivar.elliottii) rDNA序列的定位研究,1996年Kamm等[48]完成了Tyl-copia反转座子元件和rRNA序列在湿地松染色体上的定位研究。1997年在白云杉(Piceaglauca)和北美云杉(Piceasitchensis)基因组结构研究中,首次提到分子核型(molecular karyotype)的概念[49],标志着植物染色体进化研究进入分子核型时代。研究者对寡核苷酸荧光原位杂交技术进行优化,高分辨率多重寡核苷酸荧光原位杂交技术和非变性寡核苷酸原位杂交(non-denaturing fluorescent in situ hybridization,ND-FISH)技术逐渐得以应用。
Cui等[50]采用多重寡核苷酸荧光原位杂交技术鉴定了小麦、中间偃麦草(Thinopyrumintermedium)单条染色体。Huang等[51]采用高分辨率多重寡核苷酸荧光原位杂交技术,在148个中国小麦品种中发现了14个结构重组以及167个多态染色体区域。寡核苷酸荧光原位杂交技术还推动了基因组学的进步。Zhou等[52]对人参(Panaxginseng)开展了寡核苷酸荧光原位杂交研究,鉴定了人参基因组结构,追溯了人参的起源及分化历史。Piperidis等[53]采用Oligo-FISH技术分析了甘蔗属(Saccharum)不同品种及候选亲本物种的基因组结构,揭示甜根子草(S.spontaneum) 5号染色体与甘蔗(S.officinarum) 8号染色体之间发生了易位事件。Liu等[45]采用Oligo-FISH技术发现,野生稻3号染色体一个片段易位到5号染色体上,并鉴定了水稻不同品系非整倍体染色体的起源。Agrawal等[54]采用Oligo-FISH技术完成了芸苔属蔓菁(Brassicarapa)的单染色体鉴定。因此,Oligo-FISH技术在染色体进化研究中逐渐成为应用主流。
另外,也有研究采用ND-FISH方法来鉴定植物外源染色体。Fu等[55]将Oligo-1162、Oligo-pSc200和Oligo-pSc250探针用于ND-FISH研究,代替黑麦基因组DNA探针,以区分黑麦和小麦染色体。Ren等[56]采用5种寡核苷酸探针,鉴定了小麦全部染色体。An等[57]采用ND-FISH方法鉴定小麦WR35的B和D基因组以及B和A基因组之间发生的染色体易位事件。以上研究说明利用ND-FISH方法能够鉴别染色体来源和结构变异。
单拷贝序列染色体涂染技术对所标记片段的长度有限制,一般应在10 kb以下,且在实验操作以及探针设计上有两点需要注意:一是为得到覆盖整条染色体的遗传标记,须设计细菌人工染色体(bacterial artificial chromosome,BAC)片段,这需要耗费大量时间和较高的PCR扩增成本[58];二是对于重复序列占比较高且染色体数目较多的植物,单拷贝片段筛选往往成为技术瓶颈[4,59]。为解决上述难题,需要已知染色体水平的正确组装序列,筛选每条染色体上足够数量的单拷贝序列,保证筛选的序列信号达到可视化[46]。寡核苷酸荧光原位杂交技术是鉴定复杂基因组植物单染色体的前沿技术,可有效解决这些问题。
与传统探针相比,寡核苷酸探针库对无参考基因组的植物具有重要应用价值,依据某种植物基因组设计的寡核苷酸探针可在其近缘物种中得到应用。如Han等[58]采用黄瓜(Cucumissativus) Oligos探针库鉴定了野生黄瓜的单条染色体;Braz等[60]使用阳芋(Solanumtuberosum) Oligos探针库,在番茄(Solanumlycopersicum)染色体上得到了特异染色体信号。Tang等[61]使用Oligo-pAs1-1探针,对小麦和小麦×黑麦杂交种进行了FISH研究,极大地节约了成本。寡核苷酸探针库还可用于鉴别多倍体物种同源染色体之间的亲缘关系,如四倍体柳枝稷(Panicumuirgatum)染色体对4a与4b(同源序列大于90%),其寡核苷酸探针库FISH信号强度大于染色体对8a与8b(同源序列大于70%)[62],证明同源序列占比高的FISH结果相对准确,在异源多倍体植物染色体进化研究中独辟蹊径。
寡核苷酸荧光原位杂交技术受到众多研究者青睐,是因为其有如下优点:(1) 单拷贝序列的特异性高。设计探针时可以去除基因组中的重复序列(包括同源序列、rDNA、叶绿体DNA等),不加封阻DNA也不会产生背景信号。(2) 可以准确识别染色体精细结构。因寡核苷酸探针短,因此可牢固地结合染色体上的目标区域。(3) 探针库设计灵活。通过生物信息学软件分析染色体水平基因组数据,即可获得不同探针库。(4) 探针库稳定性强。该技术适用于跨物种荧光原位杂交,如水稻(Oryzasativa)、黄瓜(Cucumissativus)、雷蒙德氏棉(Gossypiumraimondii)等已实现单染色体准确鉴定[45,58,63]。因此,寡核苷酸荧光原位杂交技术成为单染色体图谱构建不可替代的技术[60]。
但在Oligo-FISH技术应用中,探针数目多少决定着信号质量的优劣。有研究者认为,中期染色体寡核苷酸探针密度为0.1~0.5 oligos/kb较为合适;对于小于10 kb的目标区域需选择尽可能多的寡核苷酸短片段[62]。对于大型基因组或者高比例重复序列的植物而言,筛选特异探针库的难度较大。这是因为重复序列占比较高时,寡核苷酸探针密度下降,在染色体上的荧光强度也随之下降,导致寡核苷酸信号检测相对困难。如果信号放大,在非目标基因序列中则可能出现背景信号(非特异杂交片段),导致假阳性。如刘玉玲等[63-64]采用地高辛标记的雷蒙德氏棉D501染色体探针库的信号结果相对弥散,某些区域可能是假阳性。因此,设计优质探针库是应用寡核苷酸原位杂交技术的关键。前期研究发现,选择目标区域时应遵循以下规则:(1) 尽量避开重复序列占比较高的染色体区域[37]。(2) 设计的寡核苷酸序列GC含量在30%~66%。(3) 寡核苷酸(短)片段内相同碱基连续重复数目一般不多于6个。(4) 寡核苷酸片段与非目标区域(或片段)的相似度不高于80%。(5) 寡核苷酸片段的退火温度与潜在发夹结构退火温度之差大于10 ℃。
染色体上的编码基因是作物改良的“密码本”,单染色体鉴定是作物改良的基础,因此单染色体鉴定是染色体进化研究的必然趋势。单拷贝基因染色体涂染技术可用于鉴定单染色体,在重复序列占比较高的植物中应用效果较好。如大麦基因组重复序列达80%以上[65],采用单拷贝基因染色体涂染技术,分析大麦(H.vulgare)和球茎大麦(H.bulbosum) 3H染色体共线性[66],揭示了单拷贝序列探针对染色体特殊结构鉴定的应用价值。
除单拷贝基因染色体涂染外,植物染色体分子核型的辅助标记还有重复DNA序列和低拷贝短序列。例如2019年杨婷等[67]用来源于黑麦近端粒区域的pSc200与pSc250重复序列进行原位杂交,鉴定了林保小黑麦(Triticalerimpau)14条染色体。曾艳华等[68]用重复序列对自交系300玉米(Zeamays)开展荧光原位杂交试验,发现了10条染色体有较强信号。周湘英[69]使用A基因组重复序列pAs120a鉴定了燕麦A基因组14条染色体。虽然重复序列荧光原位杂交可以有效地区分染色体组,但利用重复序列无法鉴定单条染色体。对于重复序列占比较高的植物单染色体进行鉴定,亟待开发物种通用寡核苷酸库,这是该领域未来研究的主要方向。
未来植物染色体分子核型研究需要关注的重点有:(1) 提高基因组装配准确度,包括重复序列库及着丝粒和端粒区域(序列)的鉴定。(2) 提高单拷贝探针序列的特异性,前期试验证明,含有同源序列探针、探针密度低等均是造成探针库特异性不高的主要原因[45,54],因此应该选择多于2 000个寡核苷酸片段的目标区域,且同源序列≤80%的短片段集合设计探针库。(3) 为鉴定染色体组间及染色体内部的重组变异,目标区域应该定位在染色体重组热点区域,以便提供染色体间或者染色体内部的重组证据。(4)染色体分子核型研究亟需多物种研究的案例积累,并深入研究探针设计策略,以实现精准识别单条染色体及染色体特定区域重组变异。
志谢:感谢扬州大学龚志云和张韬教授提供寡核苷酸引物设计方法。