陈琦 吉嘉铭 徐逸卿
摘 要:物种进化树的构建分析是比较基因组学中的重要研究内容,为了探索和推测烟草的进化关系和演变进程,本研究对茄目茄科的一年生野生烟草的线粒体基因组序列进行分析。其基因组中包括40个蛋白编码基因、4个rRNA基因和23个tRNA基因。基于完整的细胞器基因组和其他27种植物物种,采用MTTree构建了一棵邻接的系统发育树,借助其完备的基因组数据库和完善的可视化功能用于评估它们的系统关系和演化进程。完整线粒体基因组及系统发育树将有助于进一步分析烟草属的物种,为茄目茄科植物的进化与起源提供了重要的依据。
关键词:烟草;MTTree;系统发育树;线粒体基因组
中图分类号:Q941+.2 文献标识码:A 文章编号:1671-2064(2019)08-0041-03
0 引言
烟草Nicotiana attenuata属茄目茄科,是一种生长在北美洲西部的一年生草本植物。由于在其自身本土环境中与不同的植物、昆虫和微生物之间丰富多样的相互作用,烟草自1994年起被用作生态模式物种[1]。烟草可以诱导尼古丁、挥发物和酚醛类物质相互反应,具备一定的药用价值。
本研究采用烟草线粒体基因组构建了系统发育树。线粒体在细胞的代谢调节中起重要的作用[2],携带了遗传信息,是分析生物进化的重要材料。研究組合了完整的烟草线粒体基因组序列,提供更加完整的信息以便于分析烟草的原始生长环境和其他的烟草物种合成尼古丁的交互作用。系统发育树是一种分支图,显示了各实体之间的推断进化关系。[3]传统的系统遗传学依赖于通过测量和量化具有代表性的生物的表型特性获得的形态学数据,现今的分子系统遗传学则使用编码基因或核苷酸序列作为分类的依据。
1 材料和方法
1.1 实验数据
本实验采用了烟草Nicotiana attenuata和其他27种植物的线粒体基因组数据来构建系统发育树,从而分析研究烟草及相近物种的亲缘关系和进化过程。烟草是一个生态模式物种,基因组长约2.26Gb,高于植物模式物种拟南芥。从基因数据中选用其保守的蛋白编码基因,这些保守序列在物种进化过程中基本不变[4]且突变速率慢,是研究生物进化的可靠材料。
1.2 实验工具软件
以线粒体细胞器基因组数据来构建系统发育树是比较基因组学的重要内容。早期的软件多使用基于距离矩阵的聚类算法,不断合并距离最小的两个节点同时构建新的距离矩阵。新的算法使用最大似然法和最大简约法如RAxml[5],使用序列对比的ClustalW[6]以及使用邻接法的 MrBayes[7]等。计算之前需要使用者自主寻找并上传相应的基因数据或序列文件。上述软件侧重数据的计算,绝大多数都没有提供可视化的输出接口。MTTree(http://bio.njfu.edu.cn/MTTree/service/)是一个使用线粒体基因组构建系统发育树的在线平台。自发布以来已得到了广泛应用,便捷的数据选择和自由的计算方式以及可视化结果极大提高了效率,相比其他软件最大的优势在于无需提前从全球各数据库下载基因序列,若有自主测序所得的序列也可直接上传至平台。如表所示,经比较本研究选用MTTree构建系统发育树。
MTTree的数据库提供了所有已被NCBI收录的线粒体基因组数据,可选择物种并挑选需要的基因。许多建树软件仅提供命令行操作,不便于生物领域的科研人员使用。高通量测序逐渐普及,获取到大量基因数据并被更新到数据库,阻碍了精细化分析。MTTree整合了使用不同算法的软件,并提供了图形界面的可视化操作,计算完成后会自动将数据结果绘制成树状图,显示效果直观便于分析比对。
2 方法
本研究面向烟草的线粒体基因组数据,利用MTTree平台的线粒体基因组数据库和系统发育树构建能力对烟草和另外27个植物物种的基因数据进行匹配比对、构建系统发育树并将数据结果可视化,最终获取一幅直观的树状图,为做进一步的相关研究提供依据。系统发育树的构建流程如图1所示。研究人员从线粒体基因数据库中检索挑选所需用于实验的物种,或自主上传物种基因数据。MTTree从数据库中检索出基因数据并进行基因片段的比对,在各物种基因序列中高频出现的相同或相似的基因将被检索出来用于建树,以提高计算精度。通过数据迭代和高频检索的方式向真实的物种进化发育过程靠近。研究人员可选用邻接法、贝叶斯法、MCMC法等不同的算法来构建发育树,配置可通过图形界面完成。
首先在物种选择页使用物种名或RefSeq编号选择烟草和其他27个植物物种(Citrullus lanatus、Cucumis sativus, Cucurbita pepo,Glycine max, Lotus japonicas,Medicago truncatula,Vitis vinifera,Malus domestica,Gossypium raimondii,Carica papaya,Batis maritima,Arabidopsis thaliana,Brassica napus,Ajuga reptans, Salvia miltiorrhiza,Asclepias syriaca,Rhazya stricta,Capsicum annuum,Nicotiana tabacum,Phoenix dactylifera,Oryza sativa,Triticum aestivum,Sorghum bicolor,Zea mays,Cycas taitungensis,Ginkgo biloba,Marchantia polymorpha)。基因选择界面提供了这28个物种的全部基因供研究人员选择。该界面默认提供了自动选择的功能,能够自主计算配对选在物种间重复频率最高的基因。本研究选中23个保守的蛋白编码基因。为满足不同使用者的不同需求,如计算算法、迭代次数、是否使用核苷酸序列、生成格式等参数,所需物种序列列表,所选基因列表等原始数据都可以由研究人员自主确定。
3 結果和分析
以上的系统发育树构建方法及作图对揭示烟草及茄科的亲源关系、进化历史等过程具有积极的作用。本研究使用MTTree计算构建烟草的系统发育树数据结果如图2所示,共耗时22小时20分钟以邻接矩阵法对基因数据进行了1万次迭代计算。树的每个分支的末端是该物种的编号,节点上的数字是引导参考值。结果以Newick格式描述了各物种结点之间的分支关系和边缘长度。如图3所示,MTTree将Newick格式的数据结果进行了可视化的处理提供了直角生成树。由此树中获得的各个物种间的亲缘关系与进化历程与YiqingXu等人的研究结果大致一致[8]。
4 结果和分析
计算建树软件的出现和普及极大的推动了系统发育学的发展。近年来更多的工具能简便高效地建立一个物种的系统发育树。通过比对,我们发现烟草与同属茄目的辣椒在基因序列上具有极高的相似性,进化历程十分接近,推测这两个物种可能有着相同的祖先。本研究结合了MTTree的基因组数据库以及高质量的图形计算界面和可视化服务,直观地表现出了烟草及其他一些物种的进化历程和亲缘关系,推测了烟草和辣椒的相似性,为追溯茄目植物的起源提供了重要的依据。
参考文献
[1]]Ian T. Baldwin,Lynn Staszak-Kozinski,Robert Davidson. Up in smoke: I. Smoke-derived germination cues for postfire annual, Nicotiana attenuata torr. Ex. Watson[J].Journal of Chemical Ecology,1987,20(9).
[2]Binbin Lei,Shuangshuang Li,Guozheng Liu,Zhiwen Chen,Aiguo Su,Pengbo Li,Zhaohu Li,Jinping Hua. Evolution of mitochondrial gene content: loss of genes, tRNAs and introns between Gossypium harknessii and other plants[J].Plant Systematics and Evolution,2013,299(10):1889-97.
[3]Hodge T , Cope M J T V . A Myosin Family Tree[J]. Journal of Cell Science,2000,113 Pt 19(19):3353-3354.
[4]Ohta K T . On Some Principles Governing Molecular Evolution[J]. Proceedings of the National Academy of Sciences of the United States of America,1974,71(7):2848-2852.
[5]Stamatakis A . RAxML-VI-HPC : maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models[J].Bioinformatics,2006,22.
[6]Chenna R, Sugawara H, Koike T, et al. Multiple sequence alignment with the Clustal series of programs[J].Nucleic Acids Research,2003,31(13):3497-500.
[7]Huelsenbeck JP, Ronquist F.MRBAYES: Bayesian inference of phylogenetic trees[J].2001,17(8):754-5.
[8]Yiqing Xu,Fuquan Zhang,Kun Hu. The complete mitochondrial genome sequence of an annual wild tobacco Nicotiana attenuata[J]. Mitochondrial DNA Part B,2017,2(2).