高粱全基因组NRT1基因鉴定、表达与DNA变异分析

2021-11-05 02:11郭志强梁月秀朱立勋范佳丽姜晓东吕晋慧张春来
激光生物学报 2021年5期
关键词:信号肽进化树硝酸盐

郭志强,梁月秀,冯 凡,朱立勋,范佳丽,姜晓东,吕晋慧,张春来

(山西农业大学农学院,国家功能杂粮技术创新中心,山西省旱作栽培与作物生态重点实验室,山西省黄土高原特色作物高效生产协同创新中心,太谷 030801)

高粱(Sorghum bicolor)是世界上仅次于小麦、水稻、玉米和大麦的第五大粮食作物[1],主要种植在干旱和半干旱地区,属于短日照C4植物,具有抗旱、耐贫瘠和耐盐碱等特性[2],栽培面积较为广泛。高粱基因组DNA测序工作初步在2009年完成,并于最近得到更新,这使得从基因组水平来揭示高粱重要基因家族的功能成为可能[3-4]。

植物氮利用率(nitrogen use efficiency,NUE)取决于植物的需求和植物对氮的吸收、运输、积累和再分配。氮素作为植物生长发育过程中的必要元素之一,是植物体内生物大分子如蛋白质、叶绿素、核酸等的组成成分[5]。此外,氮素也是影响作物产量的因素之一[6]。氮供应水平影响植物叶片颜色、大小以及叶片数,进而影响植物对光的吸收能力,最终影响植物的生产力,特别是对于多叶蔬菜[6]。硝酸盐(NO3-)是大多数植物中最重要的氮源。提高硝酸盐吸收能力和植物氮利用率的重要步骤是识别负责硝酸盐运输的运输者的特征,然后通过传统的育种技术或基因工程操作来提高硝酸盐吸收特性。近年来,对拟南芥、水稻等植物的营养研究表明,植物吸收转运硝酸盐的过程主要由4个蛋白家族成员介导完成,分别为硝酸盐转运蛋白1(nitrate transporter 1,NRT1)、硝酸盐转运蛋白2(nitrate transporter 2,NRT2)、氯酸盐通道家族(chloride channel,CLC)以及慢离子相关通道同系物(slow anion channel- as- sociated homolog,SLAC/SLAH)[7]。除此之外,还有许多蛋白酶、激素等参与,它们相互作用构成了错综复杂的调控网络[8-10]。

硝酸盐转运蛋白(nitrate transporter,NRT),又称为寡肽转运蛋白(peptide transport,PTR),在动物、植物、酵母、古生菌以及细菌基因组中都有发现,是一种依赖于质子、具有专一性、依赖能量的转运蛋白。蛋白的质子依赖性PTR家族与ATP结合转运蛋白(ATP-binding cassette,ABC)不同,是通过对最近发现的一些肽转运蛋白进行序列分析而发现的[11]。这些蛋白质似乎主要参与小肽的摄取,同时还摄取质子[12]。

一些NRT也执行肽的运输,有的还运输抗生素,它们通过质子共运发挥作用,但底物对H+的化学计量学是可变的,如高亲和力的大鼠PepT2载体分别催化中性和阴离子二肽摄取两个和三个 H+,而低亲和力的PepT1载体催化每个中性肽摄取一个H+[13]。

本研究对SbNRT1的基因结构、系统进化树、基因表达、选择进化及其蛋白质的理化性质、亚细胞定位、二级和三级结构进行了分析,为NRT1基因调控提供一定的理论基础与试验依据。

1 材料与方法

1.1 基因检索

以水稻(Oryza sativa)和拟南芥(Arabidopsis thaliana)的NRT1氨基酸序列作为参考,在Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)和 NCBI(http://www.ncbi.nlm.nih.gov/)数据库中进行Blast搜寻和比对,获得SbNRT1基因家族的基因序列、编码序列(coding sequence,CDS)、氨基酸序列。小麦(Triticum aestivum)与甜菜(Betavulgaris)的NRT1蛋白质序列来自NCBI;藜麦(Chenopodium quinoa Willd)、玉米(Zea mays)、大豆(Glycine max)、谷子(Setaria italic)的NRT1蛋白质序列来自Ensembl Plants数据库(http://plants. ensembl. org/index.html)。

1.2 生物信息学分析方法

采用Gene Structure Display Sever数据库(http://gsds.cbi.pku.edu.cn/)[14]分析基因的结构 ;采用 Ex-PASY-ProtParam tool数据库(http://web.expasy.org/protparam)对蛋白质的理化性质进行分析;采用Sig-nalP-5.0 Server数据库(www.cbs.dtu.dk/services/SignalP/)预测蛋白质是否含有信号肽;采用PSORT数据库(psort1.hgc.jp/form.html)对蛋白质进行亚细胞定位分析预测。

采用SOPMA数据库(https://npsa-prabi.ibcp.fr/cgibin/npsa_automat.pl? page=npsa_sopma.html)对蛋白质二级结构进行预测,采用Phyre2数据库(www.sbg.bio.ic.ac.uk/)进行蛋白质三级结构模型的预测,采用Ramachandran Plot Analysis数据库(http://mordred.bioc.cam.ac.uk/)检验蛋白质三级结构预测的准确性。

利用 MEGA 7[15]软件对序列进行 Clustal W[16]比对,然后再使用邻接法(neighbour joining,NJ)构建系统进化树。利用已发表的SbNRT1基因表达Atalas数据[17-18],在phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)中获取目的基因在高粱各个生育期、不同器官部位的表达量,再利用Heml软件作出表达量的热图。利用MEGA 7软件对CDS序列进行比对,再利用TBtools软件计算出基因的进化选择压力。

2 结果与分析

2.1 SbNRT1基因家族基本信息

利用Phytozome和NCBI数据库进行筛选,结合高粱各组织的转录组测序数据,得到SbNRT1基因20个(表1)。SbNRT1基因长度为1 762~12 364 bp,分布在第SBI-01、SBI-02、SBI-03、SBI-04、SBI-05、SBI-06、SBI-07、SBI-09、SBI-10共9条染色体上,每个SbNRT1基因都有一个或多个转录本。本研究选用的为初级转录本蛋白,具体蛋白质的编号如表1所示。

表1 SbNRT1基因家族基本信息Tab. 1 Basic information for the SbNRT1 gene family

2.2 SbNRT1基因结构分析

SbNRT1基因结构分析显示:绝大多数SbNRT1均存在上下游非编码区,但其长度均比较短;CDS为编码蛋白产物的序列,大部分基因CDS数量很少,在3~4个之间,小部分基因CDS数量在5~8个之间 ;其中Sobic.001G133900、Sobic.001G276600、Sobic.007G044300、Sobic.010G175900等基因的内含子较长,由于外显子与内含子接头区存在一段高度保守的一致序列,这几个基因相对其他SbNRT1存在更多的高度保守序列数量(图1)。

图1 SbNRT1基因结构Fig. 1 SbNRT1 gene structure

2.3 SbNRT1蛋白质理化性质

由表2可知:SbNRT1蛋白质氨基酸数目在250~667个之间;分子量大小在26 334.30~72 337.95 Da之间;理论等电点在5.72~9.53之间,大部分SbNRT1蛋白质等电点大于7;不稳定系数分析表明,14个SbNRT1蛋白为稳定蛋白,6个Sb-NRT1蛋白为不稳定蛋白(不稳定系数>40);脂溶系数的高低决定了蛋白质的流动性,系数越高,流动性越好,除Sobic.009G049900蛋白外,其余19个SbNRT1蛋白的脂溶系数均大于90,表明SbNRT1蛋白的流动性较好;亲水性平均值都大于0,表明Sb-NRT1蛋白质均为疏水性蛋白[19]。

表2 SbNRT1蛋白质理化性质Tab. 2 The physical properties of SbNRT1 proteins

2.4 SbNRT1蛋白质信号肽及亚细胞定位分析

根据蛋白质信号肽分布,Sobic.004G260500、Sobic.006G251200、Sobic.007G044300、Sobic.007G081300、Sobic.009G049900、Sobic.010G099700这6个蛋白质信号肽分值(signal peptide score,S)均>0.5,表明蛋白含信号肽,为分泌性蛋白;剩余的蛋白信号肽剪切位点分值(cut score,C)、综合剪切位点分值(synthetical cut score,Y)均<0.5,表明蛋白都不含信号肽,不是分泌性蛋白。蛋白质亚细胞定位预测显示,有17个蛋白定位在质膜上,概率区间为60%~82%,有3个蛋白定位在叶绿体类囊体膜上,概率分别为94.8%、93.9%和66.4%(表3)。

表3 SbNRT1蛋白质亚细胞定位Tab. 3 Subcellular location of SbNRT1 proteins

2.5 SbNRT1蛋白二级结构分析

SbNRT1蛋白家族的二级结构主要由α-螺旋和无规则卷曲构成(二者在蛋白质中所占氨基酸数量的比例大于70%),而延伸链(β-折叠的组成结构)、β-转角比例较低(表4)。由此可以推测出,α-螺旋和无规则卷曲是SbNRT1蛋白的大量结构元件,而延伸链和β-转角则散布在整个蛋白质中。

表4 SbNRT1蛋白二级结构分析Tab. 4 Analysis of the secondary structure of SbNRT1 protein unit: %

2.6 SbNRT1蛋白三级结构模型

采用phyre 2软件预测高粱NRT1蛋白的三级结构,结果显示,NRT1蛋白三级结构主要由α-螺旋和无规则卷曲构成,与二级结构预测结果一致(图2)。采用Ramachandran plot analysis软件评估建模模型,结果显示,氨基酸残基所处的最佳区域比例为63.00%~88.50%,可接受区域氨基酸残基比率为8.90%~32.80%,SbNRT1蛋白质三级结构模型的可信度均大于93.00%(表5)。

表5 SbNRT1蛋白质三级结构模型评估Tab. 5 Evaluation of tertiary structure model of SbNRT1 protein unit: %

图2 SbNRT1蛋白质三级结构模型Fig. 2 Tertiary structure models of SbNRT1 proteins

2.7 SbNRT1基因系统进化树分析

SbNRT1基因的系统进化树分析表明,Sb-NRT1基因进化树的变异值为0.1,高粱各基因间相互存在同源性,但大部分基因同源性不高。其中Sobic.001G302800与Sobic.004G193000,Sobic.003G185100与Sobic.007G044300,Sobic.001G133900与Sobic.009G148900等旁系同源序列的同源性较高(图3)。对高粱、拟南芥、大豆、玉米和谷子的NRT1基因家族进行聚类分析(图4),不同颜色范围代表不同亚族,结果表明:NRT1基因家族分为8类,即8个亚族,Sobic.004G260500与Zm00001eb189000,Sobic.002G091800与Zm00001eb304390,Sobic.010G099700与Zm00001eb371840、KQL10112,Sobic.003G399200与KQL15490、Zm00001eb025860,Sobic.003G107100与Zm00001eb126980互为直系同源基因,说明高粱与谷子、玉米的NRT1基因在进化过程中同源关系更近;进化树中的双子叶植物(大豆、拟南芥)与单子叶植物(高粱、玉米和谷子)大多不能聚集在同一分支下,说明NRT1基因在进化过程中出现单双子叶的分化。

图3 SbNRT1基因家族聚类图Fig. 3 Clustering of SbNRT1 gene family

图4 高粱、玉米、拟南芥、大豆、谷子的NRT1基因家族的系统进化树Fig. 4 Phylogenetic tree of NRT1 gene family in Sorghum bicolor, Zea mays L., Arabidopsis, Glycine max (Linn.) Merr, Setaria italica

2.8 SbNRT1基因表达

利用高粱表达Atalas数据构建表达量热图(图5),可知SbNRT1基因的表达具有时空专一性。Sobic.010G175900、Sobic.010G099700、Sobic.009G148900、Sobic.009G049900、Sobic.007G160900等基因在整个高粱生育期表达很低;Sobic.003G295500在整个生育期表达水平较低 ;但是Sobic.001G133900、Sobic.004G193000、Sobic.001G302800在生育期某个阶段表达水平比较高,其中,Sobic.004G193000在生育期多个部位表达水平较高,尤其在左下生长花期表达水平最高,Sobic.001G302800在左叶、叶鞘生长花部位表达水平较高。从SbNRT1基因整个表达时期可以看出,表达水平由高到低依次为左下生长花期、叶片、茎中部节间、根部。

图5 SbNRT1基因家族表达热图Fig. 5 Heat map for expression of SbNRT1 gene family

在高粱根部Sobic.001G133900的表达受铵盐和尿素诱导,受硝酸盐诱导表达最强的为Sobic.001G133900、Sobic.003G295500和Sobic.001G302800,而Sobic.003G295500似乎仅在硝酸盐诱导下表达。

2.9 SbNRT1进化选择分析

在遗传学中用非同义突变率(non-synonymous mutation rate,ka)与同义突变率(synonymous mutation rate,ks)的比值作为这个蛋白质编码基因是否有选择压力作用的标准。如果ka/ks远大于1,则存在正选择效应;如果ka/ks=1,则认为存在中性选择;如果ka/ks远小于1,则存在纯化选择作用。通过对Sb-NRT1同源蛋白基因对的进化选择压力分析,得出SbNRT1蛋白编码区基因的ka/ks远远小于1,说明SbNRT1蛋白质编码基因存在纯化选择作用(表6)。

表6 SbNRT1进化选择参数Tab. 6 SbNRT1 evolutionary selection parameters

3 讨论

高粱抗旱性和耐盐性强,在贫瘠土壤上种植也能有一定的收成,是典型的“环境友好型”作物,是研究作物抗逆性的模式植物之一。由于高粱抗逆境能力比其他作物更强,所以越来越多的植物科学家将研究的重点转移到了高粱上,而其中转运蛋白基因的挖掘更是成为一个新的研究热点。目前Sb-NRT1基因的鉴定和系统分析尚未见报道。本研究从全基因组水平上对SbNRT1基因家族进行鉴定,并进行了表达分析和DNA选择分析,为研究其功能、建立分子标记辅助育种奠定了基础。

本研究结果表明:高粱全基因组内鉴定出SbNRT1基因共有20个,分布在SBI-01、SBI-02、SBI-03、SBI-04、SBI-05、SBI-06、SBI-07、SBI-09、SBI-10共9条染色体上;SbNRT1蛋白质均为疏水性蛋白,且理论等电点大于7;6个SbNRT1蛋白为不稳定蛋白,14个SbNRT1蛋白为稳定蛋白;75%以上的SbNRT1蛋白质不存在信号肽,不是分泌性蛋白,这与大多数SbNRT1蛋白亚细胞定位在质膜上的结果表现一致;SbNRT1蛋白质的二级结构主要是α-螺旋和无规则卷曲;SbNRT1蛋白质的三级结构比较复杂,但模型可信度均大于93%。

系统进化树分析结果表明,SbNRT1蛋白家族分为8个亚家族,高粱与玉米、谷子的NRT1蛋白质在进化上同源关系更近。此结果与叶玲等[20]对谷子NRT2基因家族生物信息分析结果一致。从表达热图上可以分析得出,SbNRT1基因表达具有较强的器官、生育期特异性,尤其以Sobic.004G193000基因表达水平较高。在高粱根部受硝酸盐诱导表达最强的基因为Sobic.001G133900、Sobic.003G295500和Sobic.001G302800,前者也受铵盐和尿素诱导,而Sobic.003G295500似乎仅在硝酸盐诱导下表达。以上结果为研究基因功能及氮肥响应提供了分子基础。

对SbNRT1基因的表达进行分析有助于进一步鉴定转运蛋白相关基因,为高粱相关基因的进一步鉴定与功能研究奠定理论基础,为后续分子育种提供思路,也为揭示该基因家族参与植物氮素吸收利用的调控机制提供了理论依据。

猜你喜欢
信号肽进化树硝酸盐
硝酸盐并不致癌还或有益处
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
运用计算机软件预测木质部寄生属信号肽
艾草白粉病的病原菌鉴定
烟草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信号肽预测及分析
家畜硝酸盐和亚硝酸盐中毒的诊断、鉴别和防治
内源信号肽DSE4介导头孢菌素C酰化酶在毕赤酵母中的分泌表达
短期水分胁迫影响巴旦杏植株对硝酸盐的吸收
层次聚类在进化树构建中的应用