柳叶芹叶绿体基因组组装与序列特征1)

2022-04-06 06:07闫嵩柳驰任伟超刘秀波徐姣马伟
东北林业大学学报 2022年2期
关键词:叶绿体测序基因组

闫嵩 柳驰 任伟超 刘秀波 徐姣 马伟

(黑龙江中医药大学,哈尔滨,150040)(开姆尼茨工业大学,德国·开姆尼茨)(黑龙江中医药大学)

柳叶芹(Czernaevialaevigataturcz.)是伞形科多年生植物。从形态学研究可知,伞形科植物的果实,因其具有丰富的变异和稳定的结构而成为最显著的分类器官;伞形科物种果实的翅、油管、内果皮、心皮柄等特征,被用于物种的分类[1-5];但也有研究认为,这些变异的果实性状很难推断出伞形科物种内部的进化关系[6]。现代药物化学研究表明,伞形科植物具有大量的挥发油、香豆素、三萜皂苷、生物碱等多种化学成分[7]。Suleimen et al.[8]采用高效液相色谱法,成功检测到了33种挥发油成分,除此之外还含有少量香豆素。

叶绿体是植物进行光合作用的场所,是一种半自主复制的细胞器,具有单独的转录和转运系统、相对独立的遗传信息,其结构和遗传信息在研究亲缘关系方面具有重要的作用[9]。叶绿体基因组具有大小适中、便于测序,且在不同物种间有良好的共线性等特点,有利于基因组之间的比较分析[10]。近几年,随着高通量技术的发展,叶绿体基因组在多种药用植物[11-16]的物种鉴定及分类、系统发育与进化、遗传多样性分析等方面得到了广泛应用。

柳叶芹是一种重要的药用植物。以往关于柳叶芹的研究,主要集中在描述其形态变异和化学成分方面;但对柳叶芹的分子和进化方面的研究减少。为此,本研究在依据本课题组前期对柳叶芹叶绿体基因组研究[17]的基础上,以2020年5月31日采自黑龙江省伊春市的柳叶芹为试验材料,利用十六烷基三甲基溴化铵法(CTAB)提取基因组DNA,采用Illumina NovaSeq平台进行高通量测序,得到柳叶芹完整的叶绿体基因组序列,分析柳叶芹叶绿体基因组组装、序列特征、系统发育。深层次挖掘叶绿体基因组信息,对组装后的叶绿体基因组结构、长重复序列、简单重复序列(SSR)位点、密码子偏好性进行分析,并与其他伞形科植物共同构建系统发育树。旨在为研究伞形科其他植物提供较为详细、完善的资料,为该物种鉴定以及群体和个体水平的遗传差异分析提供新的方法。

1 材料与方法

试验材料:柳叶芹(Czernaevialaevigataturcz.)植物样本,于2020年5月31日采自黑龙江省伊春市。取部分新鲜叶片用液氮处理,于超低温低温冰箱中-80 ℃保存;其余部分保存在黑龙江中医药大学药学院(标本号:YCL20200531T7)。

柳叶芹的DNA提取与高通量测序方法:使用十六烷基三甲基溴化铵法(CTAB)提取的基因组DNA经检测合格后,用机械打断的方法(超声波)将DNA片段化;后对片段化的DNA进行片段纯化、末端修复、3′端加A、连接测序接头,再用琼脂糖凝胶电泳进行片段大小选择,进行聚合酶链式反应(PCR)扩增形成测序文库;建好的文库先进行文库质检,质检合格的文库用Illumina NovaSeq进行测序(测序由武汉贝纳科技服务有限公司完成)。通过SOAPnuke软件进行低质量数据过滤。

柳叶芹的叶绿体基因组组装、注释与分析方法:使用测序数据拼接软件(SPAdes)进行基因组拼接,利用序列比对软件(blastn)将拼接结果与Czernaevialaevigata(MW284876)参考基因组进行比对分析比对,依据比对情况确定候选序列组装结果。利用叶绿体基因组注释软件(PGA)[18]对柳叶芹叶绿体基因组注释后并绘图;运用叶绿体基因组边界收缩扩张在线分析软件(IRscope)对柳叶芹和同属伞形科5个物种以及拟南芥叶绿体基因组进行比较分析;使用密码子偏好性分析软件(CodonW)对密码子偏好性进行分析,统计估算相对同义密码子的使用频率;采用简单重复序列分析软件(MISA)[19]对叶绿体进行简单重复序列(SSR)检测。

柳叶芹叶绿体基因组系统进化分析方法:从美国国家生物技术信息中心(NCBI)数据库中下载伞形科6个物种的叶绿体基因组序列,分别是北柴胡[BupleurumchinenseDC.(MN893666)]、疏叶当归[AngelicalaxifoliataDiels(NC_040122)]、林当归[AngelicasylvestrisLinnaeus(MN275034)]、细苞藁本[LigusticumcapillaceumWolff(NC_049051)]、欧芹[Petroselinumcrispum(Mill.) Hill(NC_015821)]、拟南芥[Arabidopsisthaliana(L.) Heynh.]叶绿体基因组(NC_000932),并将其作为外类群参与系统进化分析。通过核苷酸序列多重比对软件(MAFFT),对上述7个物种叶绿体基因组序列进行多重比对,导出的比对序列利用系统进化分析软件(MEGA 7.0)构建邻接树;自举检测值为1 000。

2 结果与分析

2.1 柳叶芹叶绿体基因组基本特征

柳叶芹的叶绿体基因组呈现双螺旋环状结构(见图1),基因组全长146 161 bp,包括2个反向重复序列(IRa区长度为17 422 bp、IRb区长度为17 422 bp)、1个大单拷贝区(LSC区长度为93 538 bp)、1个小单拷贝区(SSC区长度为17 779 bp)。基因组中包含有2个基因间隔(Gap),DNA的4种碱基中鸟嘌呤和胞嘧啶所占的比例(GC)为37.54%,组装覆盖度为224.3。

图1 柳叶芹叶绿体基因组图谱

2.2 柳叶芹叶绿体基因注释、基因功能及分类

通过对柳叶芹叶绿体基因组进行注释,共得到113个基因(见表1),可将其分为4个大类:自身复制、光合作用、其它基因、未知功能。具有自我复制功能的基因共70个,参与光合作用的基因共33个基因,其它基因共5个,未知功能基因共5个。

表1 叶绿体基因组的基因

2.3 柳叶芹叶绿体基因组比较

柳叶芹与其他6种植物的LSC/IRb、IRb/SSC、SSC/IRa、IRa/LSC边界及基因分布见图2。柳叶芹与疏叶当归、林当归、细苞藁本的LSC/IRb的交界处,存在完整的ycl2基因。细苞藁本Ndhf基因,完整地存在于IRb/SSC交界处;而柳叶芹、疏叶当归、林当归的Ndhf基因,仅存在于SSC区一侧,且距边界11~22 bp。柳叶芹、疏叶当归、林当归3个物种在IRa区域含有完整的trnL基因,同时柳叶芹在该区域还有1个完整的ndhB基因,而在疏叶当归、林当归中不存在ndhB基因。

图2 柳叶芹叶绿体基因组的反向重复区域和单拷贝区域边界

2.4 柳叶芹叶绿体基因组长重复序列

所有的长重复序列包括3种类型,包括正向重复序列、回文重复序列、串联重复序列,这些长重复序列具有促进叶绿体基因组重排的功能,并且可以增加其居群遗传多样性。在柳叶芹叶绿体基因组中,共发现5个正向重复序列、3个回文重复序列、4个串联重复序列。其中1个回文重复序列较长(为17 422 bp),是叶绿体基因组的反向重复区(IR),其余重复序列长度较短(均在100 bp左右)。利用这些重复序列,可为后期开发种群进化标记提供研究基础。

2.5 柳叶芹叶绿体基因组简单重复序列

简单重复序列,是由基因组中1到6个核苷酸组成的基本单位重复多次构成的一段DNA序列,广泛存在于基因组的各个区域,具有结构简单、相对保守等优点,可用于遗传多态性研究[20-21]。通过对柳叶芹叶绿体基因组的分析,共有205个简单重复序列位点,包括:138个复杂重复类型,其数量最多;没有单核苷酸重复类型;52个二核苷酸重复类型;2个三核苷酸重复类型;8个四核苷酸重复类型;1个五核苷酸重复类型。97.56%的简单重复序列位点都含有腺嘌呤(A)-胸腺嘧啶(T)的碱基对,仅有5个简单重复序列位点由鸟嘌呤(G)-胞嘧啶(C)碱基对组成,说明腺嘌呤(A)-胸腺嘧啶(T)碱基对具有碱基偏好性。从碱基组成方面分析,这与柳叶芹叶绿体基因组中腺嘌呤(A)-胸腺嘧啶(T)碱基对比例较高(62.38%)相一致。

2.6 柳叶芹与同属物种的亲缘关系

叶绿体基因组的聚类分析,对植物发育进化研究具有重要意义。本研究选用5种已报道的伞形科植物叶绿体基因组,并以拟南芥的叶绿体基因组作为外类群,通过构建邻接树(NJ-tree),对柳叶芹进行进化分析,以确定其在伞形科植物中的进化位置(见图3)。由图3可见:不同科的植物分为不同的进化分支,6种伞形科植物聚在1个分支上,说明植物科间关系明确。在这个大的分支基础上,柳叶芹与同属物种聚到一支上,并且自展值为100,说明柳叶芹与同属物种在漫长的进化过程中亲缘关系最为接近。

图3 依据柳叶芹和6个物种叶绿体基因组构建的系统发育树

3 讨论

叶绿体基因组大小一般在70~220 kbp之间,随着物种的不同而不同[22-23]。已有研究表明,导致叶绿体基因组大小发生显著变化的主要原因,是反向重复区的显著扩张、收缩,甚至丢失。光合作用是影响反向重复区区大小的因素之一。有研究[24]表明,寄生植物的叶绿体基因组相对较小,主要是由于反向重复区区收缩导致的。叶绿体基因组通常含有100~120个编码基因,其中蛋白编码基因占总数80%以上,而tRNA、rRNA占比较少。在对叶绿体功能基因注释的结果也能发现,绝大多数的基因与光合作用以及基因转录翻译相关。因此,深入分析植物叶绿体基因组,有助于了解植物在光合作用过程中相关机制。

叶绿体基因组具有高度保守性,不易于重组,在一定程度上保留了植物的进化信息,因而在植物系统发育分析上,叶绿体基因组被认为是一个遗传信息丰富、有价值的多层次的分类资源。本研究对柳叶芹叶绿体基因组进行测序及数据挖掘,通过分析发现,起转录翻译作用和参与光合作用过程的基因,占被注释到基因总数的91.15%,这与多数植物叶绿体基因组中基因功能一致。柳叶芹97.56%的简单重复序列位点都含有腺嘌呤(A)-胸腺嘧啶(T)的碱基对,这与该物种叶绿体基因组整体腺嘌呤(A)-胸腺嘧啶(T)比例相一致。通过将柳叶芹与其它伞形科植物以及以拟南芥作为外类群植物构建系统发育树,结果表明:柳叶芹与疏叶当归的关系最为接近,支持率达100%。

4 结论

本研究采用高通量测序技术,对柳叶芹叶绿体进行测序,并进行了长重复序列、简单重复序列位点、密码子偏好性、近缘种叶绿体基因组比较、系统进化的分析。为伞形科植物研究提供了更为详细、完善的资料,为该物种鉴定以及群体和个体水平的遗传差异分析提供了新的方法。

猜你喜欢
叶绿体测序基因组
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
生物测序走在前
共生
人不吃饭行吗
基因测序技术研究进展
一种快速提取微藻完整叶绿体及其DNA的方法
对“叶绿体中色素的提取和分离实验”的改进