谷子NRT2 基因家族的鉴定及生物信息学分析

2020-03-26 06:58郭永正赵雄伟王兴春
山西农业科学 2020年3期
关键词:硝酸盐氮素谷子

叶 玲,张 洁,郭永正,赵雄伟,王兴春

(1.山西农业大学生命科学学院,山西太谷030801;2.山西农业大学文理学院,山西太谷030801)

氮素作为植物生长发育过程中的必要元素之一,是植物体内多种生物大分子的组成成分,如蛋白质、核酸、叶绿素等[1];此外,氮素也是影响作物产量的因素之一[2]。对大多数旱地植物而言,植物吸收利用氮素的主要形式是硝态氮,其吸收和转运主要由硝酸盐转运蛋白来完成[3-4]。植物吸收转运硝酸盐的过程主要由4 个基因家族成员介导完成,分别为硝酸盐转运蛋白1(Nitrate transporter 1,NRT1)、硝酸盐转运蛋白2(Nitrate transporter 2,NRT2)、氯酸盐通道家族(Chloride channei,CLC)以及慢离子相关通道同系物(Slow anion channel-As-sociated Homologs,SLAC/SLAH)[5]。除此之外,还有许多蛋白酶、激素等也参与其中,它们相互作用构成了错综复杂的调控网络[6-8]。

其中,NRT2 家族是高亲和力硝酸盐转运蛋白家族,家族成员分为两大类:NO3-诱导型和NO3-组成型[9]。人们最早在1983 年就于构巢曲霉(Aspergillus nidulans)中发现和鉴定了NRT2[10]。高等植物中NRT2 基因的分子克隆最早报道于大麦[11]。其主要在外源硝态氮浓度较低时(Km为7~50 μmol/L)发挥作用,是植物氮素吸收转运系统的重要生物大分子之一。其研究多集中在拟南芥中,最具代表性的成员是AtNRT2.1 和AtNRT2.2 基因,二者对NO3-的转运极为重要,且二者是互相补偿的,当其中一个基因表达量上调时,另一个基因的表达量就会相应下调[12]。AtNRT2.3 基因主要在嫩叶中呈周期性表达;AtNRT2.4 基因主要在根部表达;AtNRT2.5 基因主要在根部和嫩叶(主要是根部)中表达,并且其表达受到NO3-供给的抑制[13-14];AtNRT2.6 基因主要在根部和嫩叶中表达[13-14];而AtNRT2.7 基因主要在种子中表达,具有NO3-贮藏的作用[15]。

谷子(Setaria italica)作为一种禾本科植物,在我国的栽培历史悠久,是我国北方的主要粮食作物之一[16]。谷子为二倍体,基因组小,与水稻、高粱、玉米的共线性较高,因此,成为C4 禾本科基因组研究的模式植物[17]。此外,谷子也是一种传统的优势作物,具有较发达的根系、狭长的叶片以及较高的水分利用率,因此,其具有耐瘠薄、耐干旱、耐储藏、营养丰富、粮草兼收等特征[18]。谷子的全基因组测序已经完成,这为谷子分子生物学研究奠定了良好的基础[19]。目前,肥料氮素利用率较低,不仅会造成资源的巨大浪费,而且还会引起严重的环境问题[20]。关于谷子的NRT2 基因家族作为高亲和硝酸盐转运子的分子生物学研究相对较少。

本研究利用生物信息学的方法和相关软件,分析鉴定了谷子的NRT2 基因家族,旨在为谷子氮素吸收利用相关基因的研究提供一定的参考。

1 材料和方法

1.1 谷子NRT2 基因家族序列鉴定及理化性质分析

从拟南芥(Arabidopsis thaliana)的基因组数据库TAIR(www.arabidopsis.org)中获得7 个NRT2 家族各成员(AtNRT2)的蛋白序列,在Phytozome 数据库(www.phytozome.org)中运用BLASTP 程序搜索水稻、高粱的NRT2 家族成员,筛选条件满足E-value<10e-10。用上述获得的拟南芥NRT2 蛋白序列通过本地BLASTP 获得xiaomi 的NRT2 蛋白序列,并用Pfam 比对得到的蛋白序列进行确定。利用Ex-PASy 在线软件对谷子NRT2 家族成员蛋白一级结构的理化性质进行预测,包括等电点(pI)、氨基酸数目、脂肪系数、不稳定系数、相对分子质量以及总平均亲水性等。

1.2 谷子NRT2 家族蛋白二级结构分析

利用SOPMA(https://npsaprabi.ibcp.fr/cgibin/np sa_automat.pl?page=npsa_sopma.html)对谷子NRT2蛋白的二级结构进行分析。

1.3 谷子NRT2 基因家族染色体定位和启动子顺式作用元件分析

根据xiaomi 基因组注释信息,利用TBtools 软件获得谷子NRT2 基因的染色体位置信息,然后通过Mapinspect 软件展示NRT2 基因在染色体上的物理位置。以谷子全基因组数据库为基础,利用TBtools 获取谷子NRT2 基因上游1 500 bp 的基因组序列;然后递交至PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),进行启动子顺式作用元件分析;最后通过TBtools 对筛选之后常见的功能元件进行可视化操作。

1.4 谷子NRT2 家族系统进化树的构建

利用ClustalW 工具将谷子、水稻、拟南芥和高粱的NRT2 蛋白序列进行多重比对;将比对结果利用MEGA 7.0 软件,采用邻接法(NJ)构建系统进化树,Bootstrap 参数设置为1 000。

1.5 谷子NRT2 基因家族基因结构及motif 分析

通过MEME 检测谷子NRT2 家族基因中相似度较高的基序,保守位点宽度设置为≥10 和≤100,最大保守序列鉴定数目设置为10。利用TBtools 绘制Xiaomi NRT2 基因家族基因结构和保守基序图。

1.6 亚细胞定位与跨膜结构域分析

利用PSORT Prediction(http://psort1.hgc.jp/form.html)对谷子NRT2 家族进行亚细胞定位预测,并通过http://www.cbs.dtu.dk/services/TMHMM/对谷子NRT2 家族进行跨膜结构域分析。

1.7 谷子NRT2 基因家族表达谱分析

为了获得NRT2 基因在谷子不同组织和不同发育阶段的基因表达谱,在http://foxtail-millet.biocloud.net/home 网站获得8 个谷子NRT2 基因TPM值;在NCBI-SRA 获得低氮处理后2 周龄的8 个谷子NRT2 基因的TPM值;最后用Tbtools 绘制谷子NRT2 基因家族的表达谱。

2 结果与分析

2.1 谷子NRT2 基因家族的序列鉴定及理化性质分析

通过同源序列比对,在谷子xiaomi 基因组水平上共鉴定到8 个NRT2 基因家族成员,分别命名为:Si1g11820、Si1g11860、Si1g11900、Si1g11910、Si1g11930、Si1g11940、Si5g20720、Si5g29250,其具体位置如表1 所示。

由ProtParam 程序预测谷子NRT2 蛋白的基本理化性质,结果如表1 所示。由表1 可知,谷子NRT2家族各成员的总平均亲水性(GRAVY)在0.292~0.585,均为正值,表明它们均为疏水性蛋白。除个别氨基酸外,大多数NRT2家族成员氨基酸的数目越多,NRT2 各家族成员的总平均亲水性值越低,表明蛋白序列越长,亲水性区域所占比例越低,但NRT2 的亲水区的长度可能是相近的。氨基酸等电点结果分析发现,谷子NRT2 蛋白等电点在7.53~9.12,这与AtNRT2.1 的等电点(pI=8.85)[21]接近,又由于NO3-带负电荷且显酸性,所以这可能与带正电荷的质子的共转运相关。由表1 可知,Si1g11940、Si1g11820 和Si1g11860 的不稳定系数均超过40,则其可能会有较多不稳定二肽结构。

表1 谷子NRT2 各家族成员及理化性质

通过对谷子的9 个NRT2家族成员蛋白的二级结构预测,结果表明,谷子NRT2 家族各成员的二级结构中均含有α-螺旋、β-折叠、直链延伸和无规卷曲。其中,α-螺旋和无规卷曲作为谷子NRT2蛋白家族成员二级结构的主要构成元件,占二级结构总量的35%~50%,有利于蛋白质特殊结构构象的形成;β-折叠和直链延伸占比则相对较少,分别为6%左右和16%左右(表2)。

表2 谷子NRT2 基因家族成员二级结构占比 %

谷子NRT2 基因家族的染色体分布如图1 所示,谷子共含有9 对染色体,NRT2 基因家族只分布在1 号和5 号染色体上,其中,Si1g11820、Si1g11860、Si1g11900、Si1g11910、Si1g11930 与Si1g11940 基因位于1 号染色体上,Si5g29250 和Si5g20720 基因位于5 号染色体上。由于1 号染色体上的6 个基因距离很近(表1),进一步对这6 个基因的蛋白序列进行比对,结果发现,Si1g11820 和Si1g11860 蛋白的序列相似性达97.52%,Si1g11900、Si1g11910、Si1g11930和Si1g11940 蛋白的序列相似性达98.29%(图2)。由此推测,Si1g11820 与Si1g11860 基因,Si1g11900、Si1g11910、Si1g11930 与Si1g11940 基因可能是串联重复序列。

2.2 谷子、水稻、拟南芥、高粱NRT2 基因家族的进化分析

为揭示谷子NRT2 基因家族的进化关系,将拟南芥(7 个)和水稻(4 个)、高粱(5 个)以及谷子(8 个)NRT2 基因家族共24 个NRT2 蛋白,在MEGA 7.0软件中采用邻接法(Neighbor-Joing)构建系统进化树,结果如图3 所示。

从图3 可以看出,谷子的8 个NRT2 蛋白可以分为4 个亚家族,Si5g20720 与Si5g2250 属于同一个亚家族,Si1g11820 与Si1g11860 属于同一个亚家族,Si1g11910、Si1g11900 与Si1g11940 属于同一个亚家族,Si1g11930 单独属于一个亚家族;Si5g20720与高粱的Sobic.003G188200、Si5g2250 与高粱的Sobic.003G270800 有直系同源的关系。可以看出,谷子与高粱的亲缘关系最近,可能是由于二者均为单子叶C4 植物;谷子与水稻亲缘关系较近,可能是因为二者均为禾本科草属植物;谷子与拟南芥的亲缘关系比较远,可能是由于谷子是C4 单子叶植物、拟南芥是C3 双子叶植物。

2.3 谷子NRT2 家族的基因结构分析

为了进一步了解谷子NRT2 基因家族成员的功能,对谷子NRT2 基因家族成员进行基因结构特性和motif 分析,结果如图4 所示,在谷子NRT2 基因家族成员的基因结构中,除Si1g11940、Si5g29250这2 个成员均不含非翻译区(UTR)外,其余6 个成员均同时具有5′端和3′端非翻译区;除Si1g11940、Si1g11860、Si5g20720 这3 个成员含有内含子外,其余5 个成员均不含有内含子。由此可见,基因Si5g29250 既不含有UTR 又不含有内含子,可能会更快地响应外界环境的变化。

从图4 还可以看出,除Si1g11940 没有motif10,Si5g20720 没有motif 4 和motif 9 外,其余均有motif 1~motif 10;且很明显地可以看出,motif 1~motif 10 在NRT2 蛋白家族中的排列位置基本一致。因此,NRT2 蛋白家族成员都是相对比较保守的。而这些保守motif 的存在,为NRT2 蛋白家族在硝酸盐吸收转运过程中行使功能和发挥作用提供了保障,具有重要意义。

2.4 谷子NRT2 基因家族启动子区顺式作用元件分析

为了更深入地了解谷子NRT2 基因家族各成员的潜在功能,对其启动子区的顺式作用元件进行了分析,结果如图5 所示,谷子NRT2 基因家族启动子区所含顺式作用元件主要为2 类,一类是与逆境响应相关的元件,另一类是与植物生长发育有关的元件;在6 个NRT2 基因中,都主要存在光响应元件;除Si1g11860 基因启动子区外,其余都存在脱落酸响应元件;Si1g11820、Si1g11930 基因启动子区存在水杨酸、生长素响应元件;Si1g11860、Si5g20720基因启动子区存在生长素响应元件;Si1g11900 基因启动子区存在水杨酸、生长素、防御应激响应元件;Si5g29250 基因启动子区存在水杨酸、低温、干旱响应元件。结合基因结构的分析,推测Si5g29250基因启动子可能会更快地响应一些逆境条件,极有可能在低氮条件下快速表达、发挥功能,其实际功能还需要进一步试验验证。

2.5 谷子NRT2 基因家族亚细胞定位及跨膜结构域分析

表3 谷子NRT2 基因家族细胞位置及跨膜结构域数目

为了确定谷子NRT2 家族各基因在细胞中发生功能的部位,进行了亚细胞定位研究,结果如表3所示。

从表3 可以看出,谷子中的8 个NRT2 家族成员均定位到了质膜上;进一步对其跨膜结构域进行了分析,结果发现,只有Si5g29250 基因存在11 个跨膜结构域,其余7 个基因均存在10 个跨膜结构域。推测Si5g29250 基因可能具有更强的硝酸盐转运功能。

2.6 谷子NRT2 基因家族表达模式分析

为了进一步了解NRT2 基因的功能,利用xiaomi在正常生长条件下的13 个不同组织转录组数据绘制了一个谷子NRT2 基因家族表达热图(图6-A)。由图6-A 可知,Si5g20720 基因在苗期整个植株中表达量比较高;Si5g29250 基因在3 d 的萌芽种子以及灌浆期的根中表达量比较高,此外,灌浆期茎中的表达量也略高。为了探究NRT2 基因能否响应低氮胁迫,利用NCBI 上传数据库中的低氮条件下的三叶期植株幼苗的表达数据,绘制了表达图谱(图6-B)。由图6-B 可知,低氮与正常相比,除Si1g11900 基因没有检测到表达外,其余均有表达,且存在一定差异。其中,Si1g11910、Si1g11820 基因与Si5g20720 基因在正常氮条件下没有表达,经过低氮诱导,基因开始表达;而Si1g11930、Si1g11940、Si1g11860、Si5g29250 基因经过低氮诱导,基因表达均上调,尤以Si5g29250 基因上调最为显著,高达92 倍。结合基因结构分析和启动子区顺式作用元件分析的结果可知,在低氮胁迫下,基因Si5g29250会快速表达,提供植物生长发育所需的氮素,将其由根向茎运输,且在灌浆期的种子合成中也起重要作用,但实际功能仍需进一步试验验证。

3 结论与讨论

谷子属于禾本科狗尾草属的二倍体作物,且其为典型的C4 作物。2012 年谷子全基因组测序工作完成,其基因组大小仅为500 Mb[22]。由于其基因组较小,且具有光合效率高、耐盐耐旱、耐瘠薄等特点,谷子逐渐成为C4 植物研究的模式植物。

NRT2 作为一种高亲和力硝酸盐转运蛋白,在植物硝酸盐吸收转运中起着重要的作用。有研究鉴定出谷子中有7 个NRT2 基因[23],但在本研究中,挖掘和鉴定出8 个谷子NRT2 基因,只分布于1 号(6 个)和5 号(2 个)染色体上,在谷子的9 条染色体中分布极不均匀。本研究通过序列比对分析发现,Si1g11820 和Si1g11860 的蛋白序列相似性达97.52%,且二者处于进化树的同一分支上,Si1g11900、Si1g11910、Si1g11930 和Si1g11940 的蛋白序列相似性达98.29%,且它们在染色体上的距离很近。因此推测,这些基因发生了串联复制。基因复制是基因家族成员增加的重要方式,基因复制事件的发生,保证了在进化过程中,具有相似功能的基因被复制,重要基因的功能被保留。

二级结构分析结果发现,谷子NRT2 家族各成员,中α-螺旋所占比例均最高,而α-螺旋又是跨膜蛋白的主要组成形式之一,所以,谷子的NRT2家族蛋白极有可能与AtNRT2 成员具有相似的跨膜结构。此外,Si1g11940 与Si1g11860 蛋白中的α-螺旋与β-折叠所占比例未超过50%,蛋白结构可能不太稳定;同时,理化性质中的不稳定系数结果显示,Si1g11940 和Si1g11860 的不稳定系数大于40,也表明这2 个蛋白不稳定,2 种分析结果一致。这些不稳定性与NRT2 蛋白行使硝酸盐转运功能紧密相关。

本研究基因结构分析发现,Si5g29250 基因既不含有UTR 又不含有内含子;亚细胞定位结果也表明,Si5g29250 基因在质膜上表达,且Si5g29250基因比谷子NRT2 基因家族中的其他成员多一个跨膜结构域,因此,Si5g29250 基因可能会更快地响应外界环境的变化,有更强的硝酸盐转运能力。不同组织中的表达分析结果也显示,Si5g29250 基因在3 d 的萌芽种子以及灌浆期的根中表达量比较高,在灌浆期茎中的表达量也略高。本研究分析低氮胁迫下谷子8 个NRT2 基因的表达情况可知,Si5g29250 基因表达量上调92 倍。有研究报道,NRT2 基因的表达会受外界氮浓度的诱导,外源氮素浓度较低时,mRNA 的含量迅速提升,并且当内源氮素达到一定水平后受反馈抑制而回到之前水平[21],Si5g29250 基因的表达符合此规律。Si5g29250基因的启动子区顺式作用元件中含有与ABA 应答相关的元件。已有研究表明,良好的氮素营养可以减少植物叶片中的ABA 水平,维持植物的气孔开度,提高光合作用[24]。Si5g29250 基因是否能提高植物光合作用,还需进一步试验验证。因此,推测Si5g29250 基因可能作为一个关键基因,在低氮条件下,能快速地响应外部环境的变化,加速表达,吸收硝酸盐从根部向茎中转运,从而保证灌浆期种子合成所需的氮素。

由于谷子研究起步较晚,目前在谷子中对NRT2 基因的功能研究远没有拟南芥研究的深入清楚。本研究对谷子NRT2 基因家族进行了初步分析,为之后的基因结构和功能研究奠定了基础,也为揭示该基因家族参与植物氮素吸收利用的调控机制提供了理论依据。

猜你喜欢
硝酸盐氮素谷子
硝酸盐并不致癌还或有益处
打谷子
不同产量潜力小麦品种氮素积累与转运的差异
硅基膜材缓控释肥在红壤中的氮素释放特征研究
不同生育期大豆品种氮素积累特性研究
施氮水平对油菜生育后期氮素吸收积累和分配的影响
奶牛硝酸盐中毒的防治
香椿食用前需焯水
晒谷子(外一首)
什么样的蔬菜硝酸盐含量高