Lotus japonicus共生固氮基因的比较基因组学

2013-08-28 06:03黄世栋冀洪芳聂旋成婷婷杨艳梅王金鹏
关键词:固氮进化树相似性

黄世栋,冀洪芳,聂旋,成婷婷,杨艳梅,王金鹏

(河北联合大学理学院,河北唐山 063009)

0 引言

生物固氮(Biological nitrogen fixation)是固氮微生物特有的一种生理功能,这种功能是在固氮酶的催化作用下进行的。固氮酶是一种能够将分子氮还原成氨的酶。近20年来生物固氮已经成为一个多学科的综合性研究项目,分别在分子、细胞、个体和生态等多层次水平上,从微观到宏观不断地展开着探索性研究。豆科植物根瘤的生化和分子生物学研究新陈代谢有大大促进了我们的知识主要是植物碳,氮代谢,以及两者之间的相互作用(万斯埃塔尔,1994)。豆科植物与根瘤菌之间是一个复杂的过程,涉及双方的合作伙伴从信号与识别,这种互利共生的植物和细菌,需要精湛的整合,以避免新陈代谢的一个伙伴剥削其他(Lodwig等,2003)。

基因倍增(Gene duplication)是指DNA片段在基因组中复制出一个或更多个拷贝,这种DNA片段可以是一小段基因组序列,也可以是整条染色体,甚至是整个基因组。基因倍增之后物种基因组的一个共同特征就是都会有大量重复基因产生。植物基因组中大量的重复基因产生于基因组的多倍化(Polyploidy),多倍化作为激变事件使基因组加倍,产生大量重复基因,重复基因的产生常会引起物种基因组大规模的变化,例如染色体重排、基因颠倒、基因丢失等等。基因倍增是基因组进化的一种重要机制,是基因功能多样化的前提,是物种演化最重要的动力源泉。基因倍增现象广泛存在,在基因倍增的研究中,通过寻找同源片段并且结合片段中丢失的基因,来判断大规模基因倍增的范围。近年来基因倍增研究发现脊椎动物、模式植物、酵母等中存在不同程度的大规模基因倍增,有的甚至是全基因倍增。许多学者对于脊椎动物、禾本科植物以及其它真核生物等的基因倍增进行了研究,揭示了其基因组中存在由基因倍增产生的大量重复基因基因倍增在酵母基因组的存在状况成为近来研究的热点之一,科学家反复深入和详尽的研究在不断揭示其基因倍增现象。

而共生固氮相关的基因家族与基因倍增的相关性研究目前尚是空白。因此我们将生物固氮和基因培增的基因组信息融合在一起,基于比较基因组学的方法初步探索Lotus japonicus基因倍增发生的规模,并统计分析影响共生固氮相关的基因与重复基因间的相关性。本文通过基因序列数据的比较分析,推断影响基因倍增发生的几个重要因素,并初步获得影响共生固氮的遗传学因素,加深对基因倍增和共生固氮的理解。

1 研究方法

1.1 Lotus japonicus基因组比较分析

首先是搜集模式植物Lotus japonicus基因组序列:Lotus japonicus基因组序列由www.kazusa.or.jp/lotus/下载得到,6条假染色体,15661个基因。下载得到的数据包含的信息有:①基因组CDS序列;②蛋白序列;③染色体序列;④基因在染色体上的位置。

序列比对(alignment)是指为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。其目的是从核酸以及氨基酸的层次去分析序列的相同点和不同点,以推测他们的结构、功能以及进化上的联系。

通过判断两个序列之间的相似性来判定两者是否具有同源性.而分析基因相似性的工具是运用基于动态规划算法BLAST软件。BLAST(Basic Local Alignment Search Tool基本局部比对搜索工具)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST采用一种局部的算法获得两个序列中具有相似性的序列。

本文运用的是BLAST的子程序blastp。blasp是蛋白序列到蛋白库中的一种查询。库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。其使用取代矩阵寻找较远的关系,进行SEG过滤。BLAST结果中的得分是对一种对相似性的统计说明。其中两个重要的参数设置:Matrix(打分矩阵)选BLOSUM62;E值(E-value)表示仅仅因为随机性造成获得这一比对结果的可能性。这一数值越接近零,发生这一事件的可能性越小。可以把每一个基因与其他任何一个基因相似性度量出来,最后筛选出具有相似性的基因。

1.2 分析确定基因同源性,统计重复基因规模

现代分子生物学中的同源性描述的是基因与基因之间相似关系,它表明的是两个相比较的序列之间的匹配程度。一般来说,如果两条基因序列相似性达80%,就可以把它们称为"同源基因(homologousgene)"。而基因重复是指在同一个基因组内存在2个或者2个以上拷贝的同源基因序列,是非常普遍的生物学现象。在已完成或即将完成全基因组测序的三大界生物(细菌、古菌和真核生物)基因组中,也已发现存在大量的重复基因。在植物界,基因重复现象更为普遍,仅在被子植物中就有大约70% ~80%的物种存在基因重复或多倍化过程,且发生在不同的进化阶段,许多物种是多次全基因组重复的产物。基因重复在生物进化过程中发挥着极其重要的作用,是基因组和遗传系统分化的重要推动力量。

基因倍增是指DNA片段在基因组中复制出一个或更多的拷贝,这种DNA片段可以是一小段基因组序列、整条染色体,甚至是整个基因组。基因倍增是基因组进化最主要的驱动力之一,是产生具有新功能的基因和进化出新物种的主要原因之一。基因倍增是基因组进化的一种重要机制,是基因功能多样化的前提,也是物种进化的主要推动力。

我们通过比较分析确定同源基因以及基因在染色体的位置,绘制出二维平面图。运用MCscan来输出共线性基因片段,其中重要的参数设置为min(-log10E_value,50)。获得重复基因的个数以及确定由全基因倍增产生的重复基因规模。

1.3 共生固氮基因的比较分析构建系统进化树

系统学分类描述了不同生物之间的相关关系,通过系统学分类分析可以帮助人们了解所有生物的进化历史过程。这一过程并不能够直接看到,人们只能通过相关线索了解历史上曾经发生了什么,而科学家就是用这些线索建立各种假说、模型,甚至是生命发生的历史。系统发育学研究的是进化关系,系统发育分析就是要推断或者评估这些进化关系。通过系统发育分析所推断出来的进化关系一般用分枝图表(进化树)来描述,这个进化树就描述了同一谱系的进化关系,包括了分子进化(基因树)、物种进化以及分子进化和物种进化的综合。在系统学分类的研究中,最常用的可视化表示进化关系的方法就是绘制系统发育进化树,用一种类似树状分支的图形来概括各种(类)生物之间的亲缘关系。通过比较生物大分子序列差异的数值构建的系统树称为分子系统树。然后利用距离建树方法是根据双重序列比对的差异程度(距离)来建立进化树。

利用以上的基因比较所得到的共生固氮相关的同源基因在四个禾本科物种中进行了系统进化分析。首先运用临近距离方法,对共生固氮基因的蛋白序列进行系统发育分析,构建系统发育树,实现是应用集成软件Phylip输出结果基因亲缘关系的括号树,并且对于获得的进化树进行了置换检验(Bootsrap test)。

其次为了实现括号树的可视化,使用的是MEGA软件得到了基因间的进化关系,来确定全基因倍增是否有利于该基因家族的扩增;为了更好地揭示基因间的进化情况,应用MEGA还构建了不同形式的进化树,若观察发现某些基因树枝长度明显较长,则表明,在生物进化过程中某些基因进化速率较快。

2 相关结论及分析

2.1 基因组序列下载信息

Lotus japonicus基因组序列由www.kazusa.or.jp/lotus/下载得到,6条假染色体,15661个基因。下载得到的数据包含的信息有:①基因组CDS序列;②蛋白序列;③染色体序列;④基因在染色体上的位置。

2.2 相似性基因的比对与筛选

对Lotus japonicus基因组比较分析:用Bioperl程序包中的用Perl程序进行翻译,得到相应的蛋白序列,应用基于动态规划算法BLAST软件的子程序blastp(参数设置:E值<1*10-5)做比较分析,把每一个基因与其他任何一个基因相似性度量出来,最后筛选出具有相似性的基因,部分结果如表1所示:

表1 Lotus japonicus基因组比对部分结果

2.3 确定重复基因规模

通过比较分析确定同源基因以及基因在染色体的位置,绘制出二维平面图,如图1所示。运用MCscan输出共线性基因片段,其中参数设置为min(-log10E_value,50),共得到2197对重复基因。研究表明在Lotus基因组中存在大量的重复基因,由全基因倍增产生的重复基因规模为2197*2/15661=28.05%。

图1 Lotus基因组中的重复基因

2.4 构建系统发育树,揭示基因间的进化情况

由NCBI下载得到12条共生固氮相关基因,与二叶短柄草、水稻、高粱、玉米这四种植物的全基因组进行比较分析,在4个物种中获得的同源基因个数分别是31,19,28,18。初步对这五种植物的共生固氮基因家族进行了定义。运用临近距离方法,对共生固氮基因的蛋白序列进行系统发育分析,构建系统发育树,实现是应用集成软件Phylip输出结果基因亲缘关系的括号树(表2),并且对于获得的进化树进行了置换检验(Bootsrap test);对于括号树的可视化,使用的是MEGA,基因间的进化关系如图(图2);值得注意的是,树中有很多重复的基因对存在,这一结果表明全基因倍增可能有利于该基因家族的扩增;另外为了更好地揭示基因间的进化情况,课题应用MEGA还构建了不同形式的进化树(图3),观察可以发现有些基因树枝长度明显较长,这一现象表明,在生物进化过程中有些基因进化速率较快。

表2 水稻、高粱、二叶短柄草、玉米、Lotus共生固氮相关基因家族括号树

3 结论

本文以Lotus japonicas作为模式植物,首先鉴定出以Lotus japonicas为研究对象的基因倍增发生的规模占有28.5%;其次搜集了Lotus japonicas、水稻、高粱、二叶短柄草、玉米这五种植物的部分共生固氮基因家族,运用临近距离方法来构建了系统发育树的,通过对可视树图的分析,得出一个结论:全基因倍增可能有利于共生固氮基因相关的基因家族的扩增;同时还发现在生物进化的过程中有些基因进化速率较快。

针对Lotus japonicas基因组进行探索性研究,以共生固氮基因相关的基因家族与基因倍增的相关性为主题,有着重要的科学意义。它有助于回答一系列重要的科学问题,认识到基因倍增的相关性、基因倍增发生的规模、发生的规律等。这一研究在方法上把数学、统计学、进化理论与基因组学紧密结合,是很有意义的交叉学科研究,富有挑战性。研究的结果使现代遗传学深化对基因倍增和共生固氮的认识。另外,这一研究有很强的可扩展性,以Lotus japonicas为研究对象建立的相关方法和软件在未来可被用于其他物种的进一步探索,从而以更大的研究范围来研究基因倍增与共生固氮的科学意义。

[1]XiyinWang,Udo Gowik,Haibao Tang,John E Bowers,PeterWesthoff and Andrew H Paterson* § .Comparative genomic analysis of C4 photosynthetic pathway evolution in grasses .Genome Biology 2009,10:R68.

[2]Gillian Colebatch?,§ ,Guilhem Desbrosses§ ,Thomas Ott,Lene Krusell,Ombretta Montanari,Sebastian Kloska?,Joachim Kopka and Michael K.Udvardi* .Global changes in transcription orchestrate metabolic differentiation during symbiotic nitrogen fixation in Lotus japonicus.Blackwell Publishing Ltd,The Plant Journal,(2004),39,487 -512.

[3]赵国屏.生物信息学[M].北京:科学出版社.2004.

[4]刘永秀、张福锁、毛达如:根际微生态系统中豆科植物——根瘤菌共生固氮及其在可持续农业发展中的应用.中国农业科技导报.

[5]艾对元:基因组中重复基因序列的意义.生命化学报.2008.

[6]黄家风、李克梅等:豆科植物——根瘤菌共生固氮的分子机理 .石河子大学学报.2002.3.

猜你喜欢
固氮进化树相似性
一类上三角算子矩阵的相似性与酉相似性
海洋生物固氮研究进展
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
浅析当代中西方绘画的相似性
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
低渗透黏土中氯离子弥散作用离心模拟相似性
杉木与固氮树种混交对土壤有机质及氮含量的影响
土壤中的天然化肥厂
——固氮微生物