鸡矢藤叶绿体基因组分析

2024-03-09 08:38吴民华吴子健叶晓霞谭靖怡黄琼林
河南农业科学 2024年1期
关键词:茜草密码子叶绿体

吴民华,吴子健,叶晓霞,谭靖怡,王 燊,黄琼林

(1.广东医科大学基础医学院,广东 湛江 524023;2.广东医科大学第一临床医学院,广东 湛江 524023;3.广东医科大学药学院,广东 湛江 524023)

叶绿体是植物的3 种质体之一,广泛存在于陆生植物、藻类以及一些原生生物,是细胞内具有独立遗传体系和执行光合作用的重要细胞器[1]。叶绿体基因组结构稳定,为由1 个大单拷贝区(Large single copy,LSC)和1 个小单拷贝区(Small single copy,SSC)以及插隔在它们之间的1 对反向重复区(Inverted repeat,IR)组成的环状四分体,通常编码约130 个基因[2]。叶绿体基因组包含大量的遗传信息,核苷酸置换速率适中、基因组大小适中,且各植物类群叶绿体基因组之间具有良好的共线性[3]。此外,IR 区经常发生收缩和扩张,从而引起叶绿体基因组的变异和进化[4]。叶绿体基因组已应用于药用植物的真伪鉴定[5]、系统进化[6]、种属谱系地理分析[7]等研究,已有露兜树[8]、高良姜[9]、远志[10]等多种药用植物相继被报道。

鸡矢藤(Paederia scandens)为茜草科(Rubiaceae)鸡矢藤属(Paederia)藤本植物,在我国南方地区分布广泛,主产于广东、广西、福建、江西等岭南省区[11]。鸡矢藤以根或全草入药,具有消食健胃、化痰止咳、清热解毒、止痛的功效,常被用于治疗饮食积滞、小儿疳积、热痰咳嗽、热毒泻痢、咽喉肿痛等多种病症[12]。鸡矢藤主要含有挥发油类、环烯醚萜苷类、黄酮类等化学成分,其中环烯醚萜苷类成分活性显著、结构独特,特别是其结构中含有硫原子以及二聚体受到较多的关注[13]。目前,对鸡矢藤的研究主要集中在化学成分及其药理作用,而其叶绿体基因组等基因组学的报道尚少。鉴于此,拟分析鸡矢藤叶绿体基因组的结构和基因组成等特征,比较鸡矢藤和相关物种叶绿体基因组的差异,并探究它们之间的系统发育关系,旨在从基因组层面为鸡矢藤的种质鉴别、遗传多样性、进化发育等方面研究提供参考。

1 材料和方法

1.1 鸡矢藤的采集和处理

鸡矢藤植株采集于广东省梅州市兴宁市叶南镇,取约100 mg 叶片,采用磁珠法植物DNA 提取试剂盒(北京康为世纪生物科技有限公司,货号:CW2528)提取基因组DNA,并使用DNA 文库制备试剂盒(美国因美纳科学器材有限公司,货号:FC-131-1024)制备DNA 测序文库,随后交由深圳惠通生物科技有限公司进行双端模式高通量测序。

1.2 叶绿体基因组的组装和注释

经测序获得的鸡矢藤叶绿体基因组初始读序,作质检和过滤处理后,分别利用SPAdes 3.11.0 和PLANN 软件进行序列拼接和基因注释,并统计获得注释基因的数量和种类。采用BankIt 软件将鸡矢藤叶绿体基因组序列和注释信息提交至GenBank,登记号为OQ784936。运用OGDRAW v1.3.1 软件完成鸡矢藤叶绿体基因组圈图的绘制。

1.3 叶绿体基因组的特点分析

采用CodonW v1.3 软件计算鸡矢藤叶绿体基因组编码区(Coding space,CDS)中全部密码子的相对同义密码子使用情况(Relative synonymous codon usage,RSCU),以评价鸡矢藤叶绿体基因组的密码子偏好性。RSCU 值越大,密码子的使用频次越高,若RSCU>1,则认为其是使用偏好性密码子。参照黄琼林[9]的方法,采用MISA v2.1 在线软件检索鸡矢藤叶绿体基因组中含有的简单重复序列(Simple sequence repeat,SSR),并分析其组成类型、分布等特点。

1.4 叶绿体基因组的比较分析

植物叶绿体基因组相邻两部分的分界处称为边界,因此,叶绿体基因组内共有4 个边界,分别称为JLB(LSC-IRB)、JSB(SSC-IRB)、JSA(SSC-IRA)和JLA(LSC-IRA)。使用IRscope 软件对鸡矢藤、高山野丁香(Leptodermis forrestii)、茜草(Rubia cordifolia)、钩藤(Uncaria rhynchophylla)、海巴戟天(Morinda citrifolia)进行4 个边界的比较分析,随后使用Perl脚本将上述5 种植物的叶绿体基因组序列转换并导入mVISTA 软件进行序列差异分析以及结果的可视化。

1.5 系统进化分析

从GenBank 下载茜草科植物鸡矢藤、薄皮木(Leptodermis oblonga)、高山野丁香、管萼野丁香(Leptodermis ludlowii)、柔枝野丁香(Leptodermis gracilis)、糙叶野丁香(Leptodermis scabrida)、拉萨野丁香(Leptodermis hirsutiflora)、茜草、柄花茜草(Rubia podantha)、紫参(Rubia yunnanensis)、拉拉藤(Galium spurium)、巴戟天(Morinda officinalis)、海巴戟天、虎刺(Damnacanthus indicus)、钩藤、毛钩藤(Uncaria hirsute)、大叶钩藤(Uncaria macrophylla)、白钩藤(Uncaria sessilifructus)、攀茎钩藤(Uncaria scandens),忍冬科植物长白忍冬(Lonicera ruprechtiana)、女贞叶冬忍(Lonicera ligustrina)、小叶忍冬(Lonicera microphylla)、唐古特忍冬(Lonicera tangutica),败酱科植物少蕊败酱(Patrinia monandra)、岩败酱(Patrinia rupestris)、白花败酱(Patrinia villosa)、糙叶败酱(Patrinia scabra)以及单子叶植物芭蕉(Musa basjoo,用作外群)的叶绿体基因组序列。将所有序列导入MAFFT v7.427 软件进行序列多重比对,然后使用RAxML 8.2.12 软件构建最大似然法进化树,其中建树模型为GTRGAMMA、自展检验值为1 000。

2 结果与分析

2.1 鸡矢藤叶绿体基因组的测序质量

鸡矢藤叶绿体基因组高通量测序产出15 057 915 条初始读序,将低质量序列、文库构建时附加的接头序列及含有无法确定碱基的序列去除后,获得15 010 950条待分析读序,测序有效率达到99.7%,平均碱基测序错误率约为0.03%。识别正确率>99%的碱基占比97.0%,识别正确率>99.9%的碱基占比91.6%。本次测序的平均测序深度为2 115×,显著高于后续序列拼接要求的100×。整体而言,鸡矢藤叶绿体基因组测序质量较佳。

2.2 鸡矢藤叶绿体基因组的结构和组成

如图1 所示,鸡矢藤叶绿体基因组为153 456 bp 的环状双链四分体结构,GC 含量为37.7%,依次由83 542 bp 的LSC、26 513 bp 的IRA、16 888 bp 的SSC 和26 513 bp 的IRB 排列而成,其中IRA和IRB的序列互相反向重复。

图1 鸡矢藤叶绿体基因组Fig.1 Chloroplast genome of P.scandens

鸡矢藤叶绿体基因组含有133 个基因,分别由88 个蛋白质编码基因(Protein-coding gene,PCG)、8个核糖体RNA(Ribosomal RNA,rRNA)和37 个转运RNA(Transfer RNA,tRNA)组成(表1)。其中,PCG 中的atpF、petB、petD、ndhA、ndhB、rpl16、rps16、rpoC1,以及tRNA 中的trnK-UUU、trnV-UAC、trnLUAA、trnG-UCC、trnI-GAU、trnA-UGC具有1个内含子,PCG 中的ycf3、clpP则存在2 个内含子。鸡矢藤叶绿体基因组中有19 个基因为双拷贝基因,包括PCG 中的ndhB、rps7、rpl2、rpl22、rpl23、ycf1、ycf2、ycf15,所有rRNA 以及tRNA 中的trnl-CAU、trnLCAA、trnV-GAC、trnI-GAU、trnA-UGC、trnR-ACG、trnNGUU,余下基因则是单拷贝基因。

表1 鸡矢藤叶绿体基因组基因及其注释信息Tab.1 Genes summary in P.scandens chloroplast genome

2.3 鸡矢藤叶绿体基因组的密码子偏好性分析

鸡矢藤叶绿体基因组有26 983 个密码子,包括氨基酸编码密码子61 种26 895 个以及终止密码子3 种88 个。其中,编码亮氨酸的密码子最多,达2 934 个;编码半胱氨酸的密码子最少,仅304 个。所有密码子及其RSCU 值见图2,UUA 的RSCU 值最高,为1.81,是鸡矢藤叶绿体基因组使用频次最多的密码子;而AGC 的RSCU 值最小,为0.37,是鸡矢藤叶绿体基因组使用频次最少的密码子。在鸡矢藤叶绿体基因组中,RSCU>1 的密码子有31 种,以A∕T(U)结尾的有29 种,占比93.5%;RSCU>1.5 的密码子共12 种,全部是以A∕T(U)结尾,说明鸡矢藤叶绿体基因组在进化过程中偏好使用第3 位是A∕T(U)的密码子。

图2 鸡矢藤叶绿体基因组的相对同义密码子使用情况Fig.2 Relative synonymous codon usage in chloroplast genome of P.scandens

2.4 鸡矢藤叶绿体基因组的SSR分布和组成

如表2 所示,通过预设参数在鸡矢藤叶绿体基因组中找到54 个SSR,包括36 个单核苷酸、8 个二核苷酸、4 个三核苷酸、4 个四核苷酸、1 个五核苷酸和1 个六核苷酸(表2)。鸡矢藤叶绿体基因组各类SSR均是以A∕T及其组合居多,而且A∕T单核苷酸占比最高(33∕54,61.1%)。这些SSR 均分布在单拷贝区,其中45 个在LSC,9 个在SSC,而IR 区没有SSR位点。从所在位置来看,位于基因间隔区(Intergenic space,IGS)最多,有31个;其次是在基因内含子(Intron)内,为13 个;最少的是在基因CDS区,只有10个。

表2 鸡矢藤叶绿体基因组SSR信息Tab.2 SSR information in P.scandens chloroplast genome个

2.5 鸡矢藤叶绿体基因组的IR边界比较

对鸡矢藤、高山野丁香、茜草、钩藤、海巴戟天等5 种茜草科植物的叶绿体基因组进行边界分析,结果如图3 所示。鸡矢藤和高山野丁香的JLB 位于基因间隔区,分别在rps19和rpl2、rps19和trnH基因之间,而其余3 种植物的JLB 均落在rps19基因内。鸡矢藤的JSB 处于ycf1和ndhF基因的重叠区域,高山野丁香和茜草的JSB 落在ndhF基因内,钩藤和海巴戟天的JSB 则位于trnN和ndhF基因的间隔区。除了钩藤的JSA 位于rps15和trnN基因的间隔区外,其余4 种植物的JSA 均落在ycf1基因内。与海巴戟天的JLA落在trnH基因内不同,另外4种植物的JLA均处于基因间隔区,其中高山野丁香的JLA 在trnH和psbA基因之间,其他的在rpl2和trnH基因之间。由此可见,IR 收缩和扩张在茜草科5 种植物叶绿体基因组中引起较明显的差异。

图3 茜草科5种植物的叶绿体基因组IR边界的比较Fig.3 Comparison on boundaries of IR in chloroplast genomes of five Rubiaceae species

2.6 鸡矢藤叶绿体基因组的序列比对

对鸡矢藤、高山野丁香、茜草、钩藤和海巴戟天等5 种茜草科植物叶绿体基因组进行全序列比对,结果经可视化后如图4 所示。在5 种植物叶绿体基因组中,编码区的序列相似度较高,大多数基因的同源性达到90%以上,而基因间隔区和内含子等非编码区存在明显的碱基突变或缺失。

图4 茜草科5种植物叶绿体基因组序列差异分析Fig.4 Sequence divergence among chloroplast genomes from five Rubiaceae species

2.7 基于叶绿体基因组的鸡矢藤系统进化分析

利用叶绿体基因组序列建立的鸡矢藤系统进化树如图5 所示。鸡矢藤的3 条叶绿体基因组序列最先聚集在一起,形成鸡矢藤属分支,说明叶绿体基因组序列在鸡矢藤种内具有高度的同源性。随后鸡矢藤属再与野丁香属汇成鸡矢藤族分支,继而与茜草族、巴戟天族聚成茜草亚科,最终与金鸡纳亚科共同构成茜草科分支。忍冬科、败酱科植物也单独形成分支。系统进化树清晰地展现了鸡矢藤在茜草科内的进化位置,聚类效果良好。

图5 鸡矢藤等植物的系统进化树Fig.5 Phylogenetic tree among various plants including P.scandens

3 结论与讨论

鸡矢藤在我国已有上千年的药用历史,鉴于其药用价值,针对其进行资源保护和产品开发可以产生较高的经济和社会效益。本研究开展鸡矢藤叶绿体基因组测序及其序列解析,有望促进鸡矢藤种质鉴定、居群多样性、分子植物育种等方面的深入研究。鸡矢藤叶绿体基因组包括LSC、IRA、SSC 和IRB 4 个区域,总长度为153 456 bp。鸡矢藤叶绿体基因组共编码133 个基因,除了少数基因功能未知外,这些基因多与鸡矢藤光合作用以及叶绿体自我复制相关。鸡矢藤的叶绿体基因组结构特征和基因组成与锈毛莓[14]、紫参[15]等大多数植物相似,符合植物叶绿体基因组典型特征。

密码子偏好性是指物种在长期的进化过程中受自然选择、碱基突变、基因漂变等多种因素影响而形成有的密码子使用频率明显高于其他同义密码子的现象[16]。在鸡矢藤叶绿体基因组中,使用频次较高的密码子(RSCU>1)几乎都是以A∕T结尾(占比93.5%),使用频次高的密码子(RSCU>1.5)全部是以A∕T 结尾,表明鸡矢藤叶绿体基因组在进化过程中出现了一定的密码子使用偏好性,倾向使用末位碱基是A∕T 的密码子。此情况也出现在千果榄仁[17]、豇豆[18]等植物中。

SSR标记为共显性标记,具有种类丰富、多态性高和试验可操作性强等特点,被认为是研究品种鉴定、进化和亲缘关系的理想DNA 标记之一[19]。鸡矢藤叶绿体基因组共含有54 个SSR,主要分布在LSC和IGS,且以A∕T 单核酸重复基序最多,与鸡矢藤叶绿体基因组的低GC 含量相符。鸡矢藤叶绿体基因组SSR 的组成和分布与远志[10]、祁连圆柏[20]等多种植物类似。

序列比对结果表明,鸡矢藤等5 种茜草科植物在IR边界以及基因间隔区、内含子等非编码区均有碱基差异,且非编码区的变异水平更高,说明叶绿体基因组在茜草科不同属的植物之间有着显著的序列变异,对茜草科植物有较好的分类效果。系统进化树显示,本研究测序所得的鸡矢藤叶绿体基因组序列与2条从GenBank 下载的序列之间出现先后聚集情况,说明3条序列并非完全一致,即叶绿体基因组在鸡矢藤中存在种内差异,提示叶绿体基因组是探究不同居群∕产地鸡矢藤之间遗传多样性的潜在方法。

本研究较为全面地解析了鸡矢藤叶绿体基因组的结构组成和序列特点,比较了鸡矢藤与茜草科相关物种的叶绿体基因组差异,并基于叶绿体基因组序列探讨了鸡矢藤在茜草科的进化位置,可为今后鸡矢藤的品种栽培、进化发育、分子辅助育种等资源保护和利用研究提供基因组材料。

猜你喜欢
茜草密码子叶绿体
密码子与反密码子的本质与拓展
基于3D技术和偏光技术的茜草鉴别研究
茜草与入骨丹(东南茜草)质量比较研究
10种藏药材ccmFN基因片段密码子偏好性分析
氢核磁共振法测定中药茜草中大叶茜草素和羟基茜草素的含量
3种茜草科植物的抗寒特性
南方红豆杉叶绿体非编码序列PCR体系优化及引物筛选
茶树CsActin1基因密码子偏性分析
茶树叶绿体DNA的PCR-RFLP反应体系优化
烟草叶绿体密码子的偏好性及聚类分析