红花变豆菜叶绿体基因组结构及同属种间关系研究

2022-05-19 07:21姚雪莹陈志祥王奇志
植物研究 2022年3期
关键词:叶绿体红花测序

杨 晨 姚雪莹 陈志祥 王奇志

(华侨大学化工学院,厦门 361021)

叶绿体是植物进行光合作用的场所。植物叶绿体基因具有高度保守性,叶绿体基因组是由1个大的单拷贝序列(large single copy,LSC),1 个小的单拷贝序列(small single-copy region,SSC)和两个反向重复序列(inverted Repeat sequence,IRs)组成。大多叶绿体基因组大小在120~180 kB 左右,编码基因100~200 个,包括蛋白质编码基因80个左右,tRNA 基因30~32个,rRNA 基因4个。叶绿体基因组功能基因大体分为3类:光合作用有关的基因、自我复制有关基因以及其他生物合成有关基因。在LSC 和SSC 区域分布的主要是与光系统Ⅰ和光系统Ⅱ有关基因,不同的物种叶绿体包含的基因数量以及种类会有较大变化。叶绿体基因组的GC 含量通常比较低,平均在37%,并且不同植物种类的GC 含量差异大。随着叶绿体基因数据的增加,对植物的分类、进化和系统发育提供了丰富的数据。相比于单独的基因片段数据,叶绿体基因组能提供给我们更多、更完整的基因信息,对于研究植物的系统进化有着更好的前景,在植物遗传多样性和保护遗传学等方面也得到了广泛的应用。

红花变豆菜(F.Schmidt)又名鸡爪芹、大叶芹、鸭巴掌、碗儿花、紫花变豆菜等,其嫩叶可食,具解毒、止血之效,也作为露地绿化和盆栽观赏种类,具有很强的药用和园艺观赏价值。该种在恩格勒系统(Engler system)、哈钦松系统(Hutchinson system)、克朗奎斯特系统(Cronquist system)以及被子植物发育系统Ⅳ(Angiosperm Phylogeny Group Ⅳ,APGⅣ)等常用被子植物分类系统中是一个自然的种类,均隶属于伞形科(Umbelliferae)变豆菜亚科(Saniculoi⁃deae)变豆菜属(L.)植物。它是北极—第三纪孑遗的东亚—北美间断分布的变豆菜属中特殊的中国原产种类,其茎不分枝,相对原始,花色为紫红色,复伞形花序,在中国主要集中分布在东北三省。红花变豆菜的研究报道较少,仅有少量形态学和生境数据被报道,叶绿体基因组未见报道,红花变豆菜叶绿体基因组的研究对于变豆菜属属下物种鉴定、系统发育和种间演化有着重要的意义。因此,本研究通过二代高通量测序技术和生物信息学方法对红花变豆菜的完整叶绿体基因组进行测序分析,结合已报道的伞形科(Apia⁃ceae)植物叶绿体基因组进行聚类研究结果,可以为变豆菜属种类鉴定,以及不同类群的系统发育关系和种间演化提供新数据。

1 材料与方法

1.1 植物材料

红花变豆菜由浙江大学李攀副教授采集。样本采自吉林省抚松县果松山北坡(127°29′16.66″N,42°5′53.34″E),采集号Li. LP185179。洗净干燥后存于冰箱中−4 ℃备用。凭证标本存放于浙江大学植物标本馆(Herbarium of Zhejiang Univer⁃sity,HZU)内。

1.2 DNA提取、测序

用植物基因组DNA 试剂盒(Sangon Biotech,中国上海)提取红花变豆菜叶片总基因组DNA。合格的DNA 样品被打断成约350 bp 的片段,构建测序文库,最后使用Illumina HiSeq Platform(Illu⁃mina,圣地亚哥,加利福尼亚)对末端配对的读段进行测序。

1.3 叶绿体基因组的组装及注释

将棱子芹的叶绿体基因组(GenBank 登录号:NC_033343)用作参考序列。使用FastQC v0.11.7对测序所得到的Raw reads 数据进行质量控制,去除低质量序列和接头,获得高质量Clean reads 数据。将所有的Clean reads 与参考序列进行比对,获得与叶绿体基因组相关的序列。用SOAPdeno⁃vo2软件进行拼接组装,最后利用NOVOPlasty对组装结果进行补洞。利用Geneious v11.0.4软件注释,调整有误差的蛋白编码基因的启动密码子和终止密码子,调整内含子/外显子边界。使用OGDraw(https://chlorobox.mpimp-golm.mpg.de/OG⁃Draw.html)在线工具绘制叶绿体基因组的环形图谱。组装与注释完成的红花变豆菜叶绿体基因组通过Sequin软件提交至NCBI。

1.4 叶绿体基因组数据分析

利用MISA(https://webblast.ipk-gatersleben.de/misa/)在线软件分析红花变豆菜中简单重复序列(simple sequence repeats,SSR),利用CodonW 1.4.2计算红花变豆菜密码子的相对使用频率(relative synonymous codons usage,RSCU),RSCU>1 表示该密码子有偏好性,RSCU<1表示该密码子使用率较低,RSCU=1表示该密码子没有偏好性。

1.5 红花变豆菜叶绿体基因组与近缘种的进化树分析

从NCBI 中下载同科的20 种植物的叶绿体基因组序列,以五加科(Araliaceae)穗序鹅掌柴()为外类群。使用MEGA 7.0 的最大似然法(包含2 个天胡荽亚科植物,11 个芹亚科植物,7 个变豆菜亚科植物,见表1)进行系统发育分析,重复次数设定为1 000次。

表1 NCBI中伞形科20种植物以及外类群穗序鹅掌柴叶绿体基因组序列号Table 1 Chloroplast genome sequence numbers of 20 species of Umbelliferae and outgroup of S.delavayi from NCBI

2 结果与分析

2.1 红花变豆菜叶绿体基因组结构分析

红花变豆菜的绿体基因组(GenBank 登录号:MT528260)全长155 721 bp,GC 含量为38.20%。大的单拷贝(LSC)区域为85 981 bp,小的单拷贝(SSC)区域为17 060 bp,一对反向重复区域的长度分别为26 340 bp。红花变豆菜的叶绿体基因组共检测到129 个基因,包括84 个蛋白质编码基因,37个tRNA 基因和8 个rRNA 基因(见图1)。其中15个基因中含有1 个内含子,2 个基因(P 和3)含有2 个内含子(见表2)。研究表明内含子可以增强外源基因在植物特定的时间和特定的部位的表达水平。红花变豆菜的叶绿体基因组和大多的高等植物相似,编码的基因根据功能分为3 大类、18 个小类:第一类是与光合作用相关的基因,共45 个,包括光系统Ⅰ基因、光系统Ⅱ基因、细胞色素b/f 复合物基因、ATP合成酶基因、NADH 脱氢酶基因和RubisCO 大亚基;第二类是与叶绿体自我复制相关的基因73个,包含核糖体RNA基因、RNA聚合酶亚基基因、核糖体小亚基(Ribosomal Small Subunit,SSU)、核糖体大亚基(Ribosomal Large Sub⁃unit,LSU)和tRNA基因;第三类为开放阅读框(Open Reading Frame,ORF)和其他编码蛋白质的基因6个以及一些未知功能基因5个,包括成熟酶基因、被膜蛋白基因、乙酰辅酶A羧化酶基因、细胞色素C的合成基因、蛋白酶基因、转录启动因子基因(见表2)。

图1 红花变豆菜的叶绿体基因组图谱Fig.1 The chloroplast genome of S.rubriflora

表2 红花变豆菜叶绿体基因组注释基因Table 2 Genes contained in S.rubriflora chloroplast genome

2.2 红花变豆菜叶绿体基因组密码子使用分析

红花变豆菜编码基因共有51 907 个密码子(见图2)。其中编码最多的是亮氨酸5 095个(9.81%),最少的是色氨酸689 个(1.74%)。终止密码子中UAA 使用度最为频繁(UGA 2.07%;UAG 1.55%;UAA 2.15%),与直刺变豆菜()一致。红花变豆菜密码子偏好UUU、UCU、UCC、UCA、UAU、UGU、UUA、UUG、CUU、UAA、UGA、CAU、CAA、CGA、AGA、AGG、AUU、AUA、ACU、ACC、ACA、AAU、GAU、AAA、GUU、GUA、GCU、GCC、GCA、GGU、GGA、CCU、CCC、CCA、GAA,共35 种,无偏 好性为UGG、AUG 2 种,使用频率较低的为UUC 等共27 种。

图2 红花变豆菜叶绿体基因组密码子数量和相对使用度Fig.2 The number and RSCU of codons in the chloroplast genome of S.rubriflora

2.3 红花变豆菜叶绿体基因组简单重复序列分析

红花变豆菜叶绿体基因组中有32个SSR(见表3),大部分SSR 是单核苷酸重复(25个,78.13%),双核苷酸重复有6个(18.75%),复杂重复有1个。除复杂重复SSR 外,其余SSRs 均由A 或T 组成。红花变豆菜大部分简单重复序列处于LSC 区(23 个),IRa、IRb、SSC区每个区内仅含3个。

表3 红花变豆菜叶绿体基因组中的SSRTable 3 SSR in the chloroplast genome of S.rubriflora

2.4 不同类群的叶绿体基因组进化分析

系统发育树的节点都有着95%以上的置信度,可信度高。系统进化树表明,20种伞形科植物被分为3 个类群:天胡荽亚科(Hydrocotyloideae)、变豆菜亚科(Saniculoideae)和芹亚科(Apioideae)。最早分出的是天胡荽亚科的2种植物,在伞形科中是较原始的类群。芹亚科植物与变豆菜亚科植物聚成一支,形成姊妹类群,关系近缘。

变豆菜属植物分为2 支,其中首阳变豆菜()单独分为一支,而欧洲变豆菜()与其余五种变豆菜植物聚为一大支,其中欧洲变豆菜单独为一支,剩余5 种变豆菜属植物聚为一支。剩余5 种植物中红花变豆菜与黄花变豆菜()聚为一支,薄片变豆菜()、变豆菜()和直刺变豆菜分支聚为一支,置信度为95%(见图3)。

图3 基于红花变豆菜和近缘植物叶绿体全基因组序列的系统进化树(以穗序鹅掌柴为外类群)Fig.3 Phylogenetic tree based on chloroplast genome sequence of S. rubriflora and relative species(outgroup of Schefflera delavayi)

3 讨论

研究植物系统进化常用方法有形态学研究,解剖学研究和分子学研究。传统分类学主要利用花、果实等形态学数据进行进化分类研究,但是变豆菜属属下种类较多,极易混淆,难以从直观上进行分辨,并且在叶表皮微型态、果实微型态等研究中,红花变豆菜上叶表皮有大量颗粒物,下叶表皮气孔为椭圆形,果实卵形且有皮刺,其与属下其他姊妹种差异不大,因此传统形态学很难对变豆菜属属下进行准确分类。因此本研究利用分子学数据,能对属下分类与种间进化研究提供新数据。

叶绿体基因组具有母系遗传,独立进化和结构保守等特点,能够提供较完整的基因信息,为种间进化提供新的证据,且叶绿体基因组序列之间的结构差异,能够更好的显示出植物种内和植物种间的变化程度,这些信息能够让人更好地理解经济上重要作物的气候适应性,对于物种繁殖和鉴定以及有价值物种的保护具有重要的意义。随着植物基因组学研究的深入,测序序列的不断发展,常规分子序列提供信息较少,基于ITS序列,片段化分子序列提供信息较少,研究涉及的种类较少,因此利用叶绿体基因组研究植物发育进化有着重要的意义。Deng 等对青海当归()进行叶绿体基因组测序,发现其与白芷()最为近缘,Ge 等对天胡荽()进行叶绿体基因组测序并将其从伞形科中去除并将其归于五加科,Huang等利用叶绿体全基因组信息对山茶属()属下13 种物种进行重新分类。而本研究结果首次对红花变豆菜叶绿体全基因组结构进行报道,为红花变豆菜的分子鉴定提供了新数据,进一步丰富了变豆菜属植物的叶绿体基因组资料,有利于相关种类叶绿体基因组数据建树,揭示了不同类群叶绿体基因组的进化关系,为亚科间、属下分类及进化研究提供新的证据。

红花变豆菜叶绿体分为四部分,与目前已报道的被子植物叶绿体组成保持一致。红花变豆菜与变豆菜、直刺变豆菜和薄片变豆菜的叶绿体基因组的GC 含量均为38.2%,其总基因129 个,编码蛋白质基因84 个,tRNA 基因37 个,rRNA 基因8个,且出现了植物叶绿体基因组中少见的1,D,23和2基因。同时我们分析了红花变豆菜密码子偏好性,简单重复序列中红花变豆菜重复序列也主要以A/T为主,与直刺变豆菜一致,更偏向于A/T 的重复,支持SSRs 大多由A 或T 重复组成。系统发育树支持变豆菜和直刺变豆菜两者更近缘,红花变豆菜与黄花变豆菜单独分为一支,二者均生长于阴暗潮湿的小道旁,但是两者的地理分布和形态差异却较大,红花变豆菜主要分布在中国东北三省,而黄花变豆菜于2019年仅在浙江被发现,二者皆为茎不分支,黄花变豆菜高15~30 cm,而红花一般在50~100 cm,且黄花变豆菜花色为黄色,红花变豆菜花色为紫红色。变豆菜、薄片变豆菜与直刺变豆菜三者聚为一支,变豆菜主要分布于东北、华南、西南一带,而剩余2种为南方广布种,在湖北,湖南,江西,福建等省份都均有发现,三者地理分布均比红花变豆菜和黄花变豆菜更广。但进化分支结果不支持传统形态分类,传统分类中红花变豆菜由于其茎不分支而被其认为是变豆菜属中一个相对原始的物种,被分在组内,直刺变豆菜和薄片变豆菜被分在组内,首阳变豆菜和变豆菜被分在组内,而由进化树可以看出,首阳变豆菜较原始,红花变豆菜并不属于原始的类群。本研究中伞形科植物类群叶绿体基因组聚类分析支持传统亚科关系,但是变豆菜属下分支却与传统分类不相同,我们将进一步完善变豆菜属不同种类的叶绿体全基因组数据,为深入研究该属的分子系统和种间进化奠定基础。

致谢 感谢浙江大学李攀老师为本研究提供的红花变豆菜材料,感谢四川大学余岩老师、黄敏、陈振玺师兄对本文修改提出的宝贵意见。

猜你喜欢
叶绿体红花测序
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
生物测序走在前
共生
人不吃饭行吗
基因测序技术研究进展
红花鳍,白鳍豚
一种快速提取微藻完整叶绿体及其DNA的方法
天堂在天上
红花行情分析