龚意辉, 谢雪阳, 魏媛媛, 周桂花, 李丽梅, 曾永贤
(湖南人文科技学院农业与生物技术学院,湖南娄底 417000)
叶绿体是普遍存在于高等植物中的一种重要质体,通过光合作用合成植物正常生长所需的营养物质和能量。叶绿体作为半自主的细胞器,具有完整的遗传信息表达系统。高等植物的叶绿体基因组高度保守,是一个典型的四分体结构,包括1个大单拷贝区(large single copy region,LSC),1个小单拷贝区(small single copy region,SSC),反向重复区 a(inverted repeat region a,IRa)和反向重复区 b(inverted repeat region b,IRb)[1]。叶绿体基因组遗传特性与核基因组不一样,常表现出单亲遗传;叶绿体基因组相比于核基因组和线粒体基因组在基因类型、基因结构上更加保守[2]。因此,叶绿体基因组已成为分析植物系统发育地位的重要研究手段之一[3-5]。随着生物信息学技术和三代测序技术的快速发展,已有较多学者利用叶绿体基因组开展植物进化分析,例如在苹果(Malusdomestica)、芒果(Mangiferaindica)、草莓(Fragaria×ananassa)、蓝莓(Vacciniumspp.)、葡萄(Vitisvinifera)、辣椒(Capsicumannuum)、露兜树(Pandanustectorius)、高粱泡(Rubuslambertianus)、沙枣(Elaeagnusangustifolia)等物种中开展了植物叶绿体基因组结构和进化分析,为研究植物物种鉴定、性状改良、优化外源基因表达效率等方面提供重要的分子依据[6-14]。
油桃(Prunuspersica)属蔷薇科(Rosaceae)桃属,是普通桃的一个变种,已有2 000多年的种植历史[15]。油桃具有味道鲜美、香气扑鼻、色泽鲜艳、质地脆甜等特点而深受国内外消费者的青睐[16]。其果实含有大量的胡萝卜素、花青素、多种人体必需氨基酸种类、维生素C等营养物质,在国内外市场中具有较高的营养保健价值和经济价值。金冠8-18是近年来培育出的油桃新品种,其果实近圆形、扁平、微凹、茸毛少、果肉坚硬、耐贮藏、果实套袋后色泽金黄,单果质量约200~250 g,最大果实可达400 g。目前,国内外学者主要从果实裂果、绿色高效栽培技术、果实品质调控等方面开展油桃相关研究[17-19],但对金冠8-18油桃的研究相对较少,尤其是有关金冠8-18叶绿体基因组研究尚未见报道,开展金冠8-18叶绿体基因组分析不仅可以丰富油桃品种的遗传信息,而且还可通过分子标记开展金冠8-18品种改良研究。本研究对金冠8-18叶片进行基因组 DNA 提取,采用Illumina NovaSeq 6000 对金冠8-18叶绿体基因组进行测序、组装和注释,并采用生物信息学软件对金冠8-18叶绿体基因组特征、简单重复序列(SSR)位点及其系统发育进行分析,以期为油桃品种鉴定、遗传育种和系统发育研究提供分子依据和理论支撑。
2021年6月20日在湖南水云峰农业科技股份有限公司基地采集金冠8-18新鲜幼叶,采用宝日医生物技术(北京)有限公司提供的DNA试剂盒(D9194)对金冠8-18全基因组DNA 进行提取,利用凝胶电泳检测DNA样品的纯度和质量。
挑选金冠8-18DNA纯度和含量符合要求的样品送至南京集思慧远生物科技有限公司,采用Illumina NovaSeq 6000 对其叶绿体基因组进行测序、组装和注释分析。以与金冠8-18亲缘关系相近的桃树叶绿体基因组(MZ673795.1)为参考序列。首先采用SPAdesv3.10.1软件对金冠8-18叶绿体基因组序列进行组装[20],然后分别使用Prodigal v2.6.3(https://www.github.com/hyattpd/Prodigal)、RNAmmer 1.2 Server (http://www.cbs.dtu.dk/services/RNAmmer/)、tRNAscan-SE(http://lowelab.ucsc.edu/tRNAscan-SE/)对金冠8-18叶绿体的CDS、rRNA、tRNA进行预测分析,并使用BLAST v2.6软件(https://blast.ncbi.nlm.nih.gov/Blast.cgi)对注释结果进行校正,并将校正后的结果采用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)制图分析。再使用MISA v1.0(http://pgrc.ipk-gatersleben.de/misa/misa.html)分析金冠8-18叶绿体全基因组 SSR 位点,Find repeats工具获得桃树、梨树、杨梅、苹果等 8种基因组的 IR、LSC、SSC序列,最后使用MAFFT 7.427软件(auto模式)进行多序列比对,将比对结果用RAxML 8.2.10(https://cme.h-its.org/exelixis/software.html)软件,选用GTRGAMMA模型进行rapid bootstrap分析,bootstrap=1 000,构建最大似然进化树。金冠8-18叶绿体基因组序列在NCBI数据库中已公布,其登录号为OL449945.1。
本研究以桃树MZ673795.1叶绿体基因组为参考,对金冠8-18叶绿体基因组序列进行组装和注释,获得金冠8-18叶绿体基因组大小为153 754 bp的全长序列(图1、表1)。金冠8-18叶绿体基因组含有1 个 LSC、1 个SSC和1对IR(IRa 和 IRb)的4分体结构,其长度分别为 85 923、19 100、26 381 bp。A、T、C、G在金冠8-18叶绿体基因组中的含量分别为31.12%、32.11%、18.78%、17.99%,AT 含量占碱基总数的 63.23%,远高于GC含量(36.77%)。在金冠8-18叶绿体基因组中共注释到 133 个基因,包括 84 个蛋白编码基因(CDS),37个转运 RNA 基因(tRNAs),8 个核糖体 RNA基因(rRNAs ),4个假基因(pesudo)。GC碱基含量在LSC、SSC 和 IR 区中所占比重分别为 34.61%、30.40%和 42.58%,AT 含量分别为 65.39%、69.60%和 57.42%。并且LSC和SSC区域中的GC 比重明显低于 IR 区。
表1 金冠8-18叶绿体基因组的详细特征
对金冠8-18注释到的基因进行功能分类,包括44个光合作用相关基因(photosynthesis genes)、58 个自我复制基因(self-replication genes)、 5个其他基因(other genes)、6个未知功能基因(genes ofunknown function)(表2)。在金冠8-18叶绿体全基因组中共有17个双拷贝基因和1个四拷贝基因。包括 1 个 NADH 脱氢酶亚基基因(ndhB)、4 个自我复制基因(rpl2、rpl23、rps12、rps7)、4 个rRNA 基因(rrn16、rrn23、rrn4.5、rrn5)、6个 tRNA 基因(trnA-UGC、trnI、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC)、 2 个未知功能蛋白基因(ycf15、ycf2),四拷贝基因为trnM-CAU。在金冠8-18叶绿体全基因组中所注释到大部分基因不含内含子,只有少数基因含有1个和2个内含子。其中ndhA、petB、petD、atpF、rpl2、rpl22、rps16、rpoC1、trnA-UGC、trnI、trnK-UUU、trnL-UAA、trnS-CGA、trnV基因只有1个内含子,含2个内含子的基因分别为rps12、clpP、ycf3。共在金冠8-18叶绿体全基因组中检测出4个假基因,分别为rps19、ycf1、ycf15(2)。值得注意的是,需进一步利用分子技术手段对金冠8-18叶绿体基因组中鉴定出的6个未知功能基因进行功能分析。
表2 金冠 8-18叶绿体基因组编码的基因
使用MISA v1.0软件对金冠8-18的SSR 位点进行分析(表3)。总共在金冠8-18叶绿体基因组中找到251个符合条件的SSR 位点。分布在 LSC、SSC、IR区域的 SSR位点数量分别为168、44、39个,分别占总SSR位点数比例为66.9%、17.5%、15.5%。在LSC区域中,分别位于外显子区(exon)、内含子区(intron)、基因间隔区(intergenic)的SSR 位点数为36、33、99个,在SSC区域中,分别位于外显子、内含子、基因间隔区有28、4、12个,在IR区域中,分别位于外显子、内含子、基因间隔区的有21、4、14个;单碱基重复、复合碱基重复分别为158、93个。
表3 金冠8-18叶绿体基因组 SSR 位点分布 个
将金冠8-18通过与2个桃树品种(Prunuspersica,MH169125.1、HQ336405.1)、 李树(Prunus
armeniaca,MK645899.1)、杨梅(Prunussalicina,MW406460.1)、梨树(Pyruspyrifolia,AP012207.1 )、石斑木(Rhaphiolepisbibas,MN577877.1)、土库曼斯坦苹果(Malussieversiivar.turkmenorum,NW018864.1)等不同植物进行叶绿体基因组IR区边界比较分析(图2),发现这8种植物叶绿体基因组全长范围为157 566~160 139 bp,基因具有相对保守性。rpl22基因完全位于LSC区域,金冠 8-18、2个桃树品种、李树、杨梅距离连接区域的长度分别为226、426、426、426、426 bp。rps19基因在金冠8-18、2个桃树品种、李树、杨梅、梨树、石斑木、土库曼斯坦苹果中LSC区分别扩增并产生97、97、97、89、93、159、156、165 bp,而在IRb区域内分别扩增并产生182、182、182、190、186、120、123、114 bp;金冠8-18中的ycf1基因在IRa、IRb区域内扩增 1 051 bp,在SSC区域内扩增5 bp。ndhf基因在金冠8-18、2个桃树品种、李树、杨梅、梨树、石斑木中IRb区域分别扩增10、10、10、18、19、12、12 bp,而在SSC区域分别扩增2 219、2 219、2 219、2 220、2 228、2 244、 2 244 bp;金冠8-18、2个桃树品种、李树、杨梅、梨树、石斑木中的trnN基因全部位于IRa区域。8个物种中的trnH基因全部位于LSC区域内。
挑选30个蔷薇科物种的叶绿体基因组与金冠8-18进行系统发育分析(图3)。进化树分析表明,金冠8-18与桃树(MH169125.1)处于同一分支,说明金冠8-18与桃树的亲缘关系最近,并与桃属聚为大类,说明金冠8-18属于蔷薇科桃属植物。此外,金冠8-18与蔷薇科其他属相距较远,说明其亲缘关系较远。
本研究采用 Illumina NovaSeq 6000测序平台首次完成了金冠8-18的叶绿体基因组测序,采用SPAdes v3.10.1 软件对金冠8-18的原始数据进行组装。金冠8-18叶绿体基因组结构与枇杷(Eriobotryajaponica)、瑞冠18油桃品种、黄晶果(Pouteriacaimito)等植物叶绿体基因组结构相似,具有典型的 LSC、SSC、IRa、IRb结构[21-23]。金冠 8-18 叶绿体基因组大小属于蔷薇科植物叶绿体基因组全长范围之内。一般来说,大多数高等植物的叶绿体基因组大小介于120~180 kb之间,注释到的基因数介于100~200个之间,其中含70~80 个CDS基因,30~32个tRNA基因,4个rRNA基因。例如,枇杷叶绿体基因组全长为 157 494 bp,共编码129个基因,其中CDS基因、 tRNA基因、 rRNA基因分别为84、37、8个[21]。甘蓝型油菜(Brassicanapus)叶绿体基因组全长为152 860 bp,注释到113个基因,其中含79个CDS基因、30个tRNA基因和4个 rRNA基因[24]。金冠8-18全长介于甘蓝型油菜和枇杷之间,为153 754 bp,共注释到133个基因,其中CDS基因、 tRNA基因、 rRNA基因、假基因分别为84、37、8、4个。本研究中金冠8-18的IRa和IRb区为26 381 bp,其GC含量比LSC和SSC中的含量均高,为42.58%,与欧地笋(LycopuseuropaeusLinn.)、萹蓄(Polygonumaviculare)等植物叶绿体基因组相一致[25-26],可能是AT在IR区域中rRNA序列中含量低而导致该区域中的GC所占比例均高于LSC和SSC。
SSR位点分析在辅助植物育种、种群分析、多态性分析等方面的研究起着很好的应用价值[27-28]。目前,已在石榴(Punicagranatum)、龙眼(DimocarpuslonganLour)、枣(ZiziphusjujubaMill.)、芒果(Mangiferaindica)、香蕉(Musaacuminata)等果树品种中开展了SSR位点分析[29-33]。本研究发现金冠8-18叶绿体基因组共有251个SSR 位点,有158个单碱基重复,以 A/T碱基重复为主,说明SSR位点偏好使用A/T,这与荷花玉兰(Magnoliagrandiflora)、狗枣猕猴桃(Actinidiakolomikta)、草果(Amomumtsaoko)、金花茶(Camelliapetelotii)等植物叶绿体基因组中的SSR位点分析结果相符[34-37]。复合核苷酸有93个, 以ATA、TAT、TTA、TAA为主。而Yan等研究发现,石榴叶绿体基因组中的SSR位点主要以TAA、TTC重复单元为主[29]。金冠8-18大部分SSR位点位于LSC区中的基因间隔区,少数位于SSC和IR区中,这与露兜树叶绿体基因组SSR分析[12]相符,表明 SSR 位点长度发生变异时,对金冠 8-18 叶绿体蛋白质影响较小,几乎不发生性状变异。金冠8-18叶绿体 SSR 位点的获得对进一步研究蔷薇科相关物种鉴定、遗传多样性分析和植物进化等方面具有重要的应用价值。
为进一步了解金冠8-18在蔷薇科中的系统发育地位,对已报道的30种蔷薇科叶绿体基因组与金冠8-18进行系统发育分析,其结果显示,金冠8-18与桃树(MH169125.1)亲缘关系最近,说明金冠8-18属于蔷薇科桃属植物。这一研究结果与Liu等研究发现的瑞冠18号油桃品种与桃树聚为一类,亲缘关系较近的结论[22]相一致。本研究获得了金冠 8-18 的叶绿体基因组大小、结构、基因数量、SSR、系统发育树等特征信息,为今后开展油桃品种鉴定、性状改良和进化等研究提供了分子依据和理论支撑。