濒危植物秀丽兜兰叶绿体基因组特征与系统发育分析

2023-07-20 05:11范继征李秀玲李明智卜朝阳何荆洲曾艳华
热带作物学报 2023年6期
关键词:特征分析

范继征 李秀玲 李明智 卜朝阳 何荆洲 曾艳华

关键词:秀丽兜兰;叶绿体基因组;特征分析;系统发育分析

中图分类号:S 682.31 文献标识码:A

秀丽兜兰[Paphiopedilum venustum (Wall. exSims) Pfitzer]隶属于兰科杓兰亚科兜兰属,是第一个被人工栽培的兜兰属植物[1],主要分布于我国西藏东南部至南部,以及孟加拉国、不丹、印度东北部、尼泊尔等国家和地区,野外花期1—3月[2]。秀丽兜兰植株直立、丛生,株高7.0~9.0 cm,叶片数2~3 片,长7.5~12.0 cm,宽2.5~3.5 cm,呈狭矩圆状椭圆形,表面有网格斑,背面有密集的紫色斑点, 花葶长9.2~15.4 cm, 花朵横径5.4~8.6 cm,纵径2.9~3.4 cm,花朵色泽艳丽,花期长,花和叶均极具观赏价值。但由于人类活动以及自身生长要求和生长特点等原因,秀丽兜兰已成为濒危物种(EN),受到国际社会的严格保护[3-4]。

叶绿体是植物光合作用发生的细胞器,具有一套完整的基因组[5],与核基因组等其他基因组相比,叶绿体基因组具有高度的保守性以及自我复制机制、进化相对独立、基因组小、结构稳定、突变率低等特点[6-8]。随着二代测序技术的飞速发展,通过测序组装和注释获得的完整的叶绿体基因组序列成本降低、速度加快[9],叶绿体基因组也越来越多的为进化分析、系统发育及分类鉴定等提供信息[10]。目前有关叶绿体基因组特征分析已被广泛应用于多种兜兰属植物,有对单独一个种进行叶绿体基因组分析,例如白旗兜兰(P. spicerianum)[11]、白花兜兰(P. emersonii)[12]、格丽兜兰(P. gratrixianum)[13]、麻栗坡兜兰(P. malipoense)[14]、紫纹兜兰(P. purpuratum)[15]、飘带兜兰(P.parishii)[16]、陈莲兜兰(P. tranlimianum)[17]等,也有对多个种进行比较分析[18-19]。现有研究结果表明兜兰属植物叶绿体基因组大小为154689~162 590 bp,其结构与大多数陆生植物叶绿体结构相似,为典型的四分结构,包括大单拷贝区(large single copy, LSC)、小单拷贝区(small singlecopy, SSC)和2 个反向重复区(inverted repeat,IR),各区GC 含量差异较大,其中IR 的GC 含量较高,不同的蛋白质编码在同义密码子的使用上有所不同,偏好A 或U(T)结尾的密码子。此外,系统发育分析打破了形态学和细胞学等的局限性,能够更好地反映物种之间的亲缘关系[11-19]。

有关秀丽兜兰的研究多集中在非共生萌发和繁殖技术[20]、细胞学研究[21-23]、病害鉴定[24]、分布地区和生长环境[25]等,尚无秀丽兜兰叶绿体基因组的报道。本研究通过高通量测序方法获得秀丽兜兰完整的叶绿体基因组信息,对其进行注释,并对基因组中序列重复、SSR 位点及蛋白编码基因的密码子使用偏好性进行分析,同时分析了系统发育关系。本研究结果可为秀丽兜兰及其他兜兰属植物种质资源鉴定、系统发育、遗传育种、种群恢复以及生物多样性保护等提供理论依据。

1 材料与方法

1.1 材料

供试材料为迁地保存在广西农业科学院花卉研究所兰科植物种质资源圃(22°48′N,108°22′E)的秀丽兜兰,取长势良好、无病虫害的新鲜幼嫩叶片擦拭干净,用液氮速冻后于?80 ℃保存备用。

1.2 方法

1.2.1 DNA 提取、文库构建及测序 取叶片100 mg,采用改良CTAB 法[26]提取总DNA,样品基因组DNA 质量检测合格后,用超声波将合格的DNA 片段化,然后对片段化的DNA 进行片段纯化、末端修复、3′端加A、连接测序接头,再用琼脂糖凝胶电泳进行片段大小选择,进行PCR扩增形成测序文库,并进行文库质检,质检合格的文库用BGISEQ-500 平台进行测序(广州佰德生物科技有限公司)。

1.2.2 叶绿体基因组的组装与注释 对测序得到的原始数据(raw data)进行数据过滤,去除其中的接头序列及低质量reads 获得高质量的cleandata。使用Bowtie2 v.2.3.4.3 软件[27]比对近缘物种叶绿体基因组数据库,将比对上的reads 数量最多的3 个CDS 序列作为项目样品的叶绿体基因组起始组装序列,采用NOVOPlasty v4.2.1 软件[28]组装叶绿体基因组。利用GeSeq 和blast 软件对叶绿体基因组CDS 序列进行注释,并利用GeSeq 和hmmer 软件对叶绿体基因组rRNA序列进行注释,使用tRNAscan-SE 和ARAGORN软件对叶绿体基因组tRNA 序列进行注释,并进行手动调整和确认获得最终注释结果,最后采用OrganellarGenomeDRAW软件制作叶绿体基因组图谱[29-35]。将组装注释好的秀丽兜兰基因组序列上传至Gen-Bank 数据库,获得登录号:MZ150831。

1.2.3 叶绿体基因组SSR 分析 利用MISAv1.01(MIcroSAtellite identification tool)軟件对秀丽兜兰进行cpSSR 的分析[36]。参数设置为单核苷酸(mononucleotide)、二核苷酸(dinucleotide)、三核苷酸( trinucleotide)、四核苷酸(tetranucleotide)、五核苷酸(pentanucleotide)和六核苷酸(hexanucleotide)的重复数阈值分别为10、6、5、5、5 和5。

1.2.4 密码子使用分析 计算秀丽兜兰cpDNA 密码子的使用情况和相对密码子的偏好性(relativesynonymous codon usage, RSCU),RSCU 值则以1为限,若RSCU>1,该密码子使用频率较高;若RSCU<1,该密码子使用频率较低。

1.2.5 系统发育关系分析 从NCBI 数据库中下载16 个兜兰属和2 个杓兰属植物,利用mafft 7.0软件进行cpDNA 序列比对,使用fasttree2.1.10软件建立系统发育树,选择GTR+Gamma 模型,Shimodaira-Hasegawa 检测[37-38]。

2 结果与分析

2.1 秀丽兜兰叶绿体基因组的基本特征

秀丽兜兰叶绿体基因组具有典型的环状四分体结构,包括1 个大单拷贝区(large single-copyregion, LSC)、1 个小单拷贝区(small single-copyregion, SSC)和2 个反向重复区(IR),总长度为158 298 bp,其中LSC、SSC 和2 个IR 长度分别为87 775、949、34 787 bp,LSC、SSC 和IR 区域的GC 含量分别为32.6%、25.1%和39.1%。秀丽兜兰叶绿体基因组共含129 个基因,包括79 个蛋白编码基因,38 个tRNA 基因、8 个rRNA 基因和4 个假基因(2 个ndhD、1 个ndhJ、1 个ndhK),其中22 个完整的基因位于IR 重复区,包括10个蛋白编码基因,8 个tRNA 和4 个rRNA,1 个基因rpl22 位于LSC-IRB 连接处。IR 重复区域还含有1 个假基因ndhD 以及rps12 基因的第2 和第3 个外显子,nps12 的第1 个外显子位于LSC 区域(图1)。秀丽兜兰叶绿体基因组注释基因信息见表1。

2.2 秀丽兜兰叶绿体基因组简单序列重复

秀丽兜兰叶绿体基因组简单序列重复(SSR)信息见表2,从中共鉴定出78 个SSR 位点,未发现五核苷酸重复,最丰富的是单核苷酸重复,有66 个,占总SSRs 的84.62%,其次是二核苷酸重复8 个,占总SSRs 的10.26%,三核苷酸重复和四核苷酸重复均为1 个,六核苷酸重复2 个。其中63 个单碱基重复都是由A 或T 构成,因此,SSRs 的碱基组成偏向使用A/T 碱基。

2.3 秀丽兜兰叶绿体基因组密码子偏好性

秀丽兜兰叶绿体基因组中各氨基酸的相对同义密码子使用频率(relative synonymous codeusage, RSCU)分析结果见图2 和表3。从中可以看出,高频密码子(RSCU>1)共有32 个,其中,16 个以U 结尾,13 个以A 结尾,以G 结尾的有2 个,以C 结尾的密码子有1 个,说明秀丽兜兰叶绿体基因密码子偏好性以U 和A 结尾,与较低的基因组和蛋白编码基因GC 含量一致。

2.4 系统进化分析

基于叶绿体基因组序列对18 个兰科植物(含兜兰属物种16 个、近缘属杓兰属物种2 个)进行系统发育分析,并构建系统发育树(图3)。从图中可以看出,18 个物种分为3 大类,其中,紫花杓兰和西藏杓兰与其他物种遗传距离较远,被单独聚成一类;麻栗坡兜兰、硬叶兜兰等5 个物种均归为一类,即宽瓣亚属;秀丽兜兰和带叶兜兰、紫纹兜兰等11 个物种归为一类,属于兜兰亚属,且秀丽兜兰与紫纹兜兰关系最近。

3 讨论

兜兰是兰科(Orchidaceae)兜兰属(PaphiopedilumPfitzer)植物的统称,因具有拖鞋状的唇瓣又被称为“拖鞋兰”或“仙履兰”,具有极高的观赏价值和商业价值[1, 39-40]。本研究采用第二代高通量测序技术对秀丽兜兰叶绿体基因组进行测序、组装和注释,获得了秀丽兜兰完整的叶绿体基因组。研究发现秀丽兜兰叶绿体基因组与前人[11-19]研究的兜兰属其他植物相似,具有典型的四分体环状结构,GC 含量远小于AT 含量,其中IR 区域GC 含量最高,这与rRNA 的GC 含量较高,且全部定位在这些区域密切相关[41]。

简单序列重复(SSR)多存在于真核生物的细胞器基因组中,具有丰富的多态性,高度的重复性以及良好的可靠性和共显性,常被用于对种质资源进行遗传结构分析、物种鉴定和群体遗传学研究[19, 42]。本研究从秀丽兜兰叶绿体基因组中鉴定出78 个SSR 位点,单核苷酸有66 个,占总SSRs 的94.62%,表明单核苷酸重复可能提供了更多的系统发育信息,63 个单碱基重复和其他碱基重复都是由A 或T 构成,A/T 重复类型占据主要地位,这与前人[18-19]对其他几种兜兰属植物研究结果一致,得到的这些SSR 序列可为兜兰属植物筛选SSR 标记和指纹图谱研究提供依据。

在植物进化过程中,密码子的使用普遍表现出偏好性,自然选择、物种突变和遗传漂变是影响密码子偏好性的主要原因,密码子偏好性用相对同义密码子使用频率(RSCU)表示,若密码子无偏好性,则RSCU 值为1,如果该密码子比其他同义密码子来说出现更频繁,RSCU 值大于1,反之亦然[43-45]。本研究秀丽兜兰叶绿体基因组RSCU>1 的密码子共有32 个,其中以A 和U 结尾的有29 个,超过90.6%,而RSCU<1 的密码子则多以C 或G 结尾,表明秀丽兜兰叶绿体基因组偏向于使用以A 或U 结尾的同义密码子,与丁锐等[46]对杓兰属的研究结果一致,这可能与叶绿体基因组较低的GC 含量有关,进一步表明密码子偏好性可能受基因组GC 含量的影响[47]。根据秀丽兜兰叶绿体基因组的密码子偏好性可对目的基因进行优化,进一步提高基因转化和表达效率,这一研究结果可为秀丽兜兰遗传育种及叶绿体基因工程的外源基因高效、稳定表达提供科学依据。

从18 种兰科植物叶绿体基因组系统发育分析发现,兜兰属和杓兰属是明显分开的两大类,兜兰属又分两大类,一类包含白花兜兰、硬叶兜兰、麻栗坡兜兰、德氏兜兰和杏黄兜兰;另一类包括小叶兜兰、陈莲兜兰、格丽兜兰、白旗兜兰、紫纹兜兰、秀丽兜兰、帶叶兜兰、长瓣兜兰、飘带兜兰、同色兜兰和雪白兜兰,其中秀丽兜兰与紫纹兜兰亲缘关系密切。这一分类与其他学者利用形态学、细胞学等方法得到的分类结果相似[48-49],与SUN 等[18]和胡国家[19]通过叶绿体基因组序列建立的系统发育树基本一致,显示出叶绿体基因组序列在物种分类和进化研究中具有更高的分辨率和可靠性[50],证明了植物叶绿体基因组系统发育树的构建在物种鉴定方面的准确性,同时还需要更加全面密集的取样,才能更准确地反映发育关系。

4 结论

秀丽兜兰叶绿体基因组为典型的四分结构,总基因组大小为158 298 bp,总GC 含量为35.4%,含129 个基因,共鉴定出78 个SSR 位点,碱基组成偏向使用A/T 碱基,密码子偏好性以U 和A结尾,系统发育分析显示秀丽兜兰与紫纹兜兰为姐妹种关系。研究结果可为兜兰属植物物种鉴定、生物进化、系统发育、资源保护及分子生物学等研究提供理论参考。

猜你喜欢
特征分析
1822号台风“山竹”演变特征分析
64排CT在脑梗死早期诊断中的应用及影像学特征分析
穆夏艺术特征分析
泡罩包装挥发性有机物排放特征分析
2016年14号台风“莫兰蒂”特征分析
2012 年南海夏季风特征分析
凉山州闪电活动特征分析
近35年云贵高原暴雨特征分析
听神经瘤患者的远红外热像特征分析
肾康注射液不良反应特征分析