甘草NRAMP基因家族的鉴定和生物信息学分析

2019-03-06 04:24,,,
河南农业科学 2019年2期
关键词:基序结构域甘草

,,,

(1.河南牧业经济学院 制药工程学院,河南 郑州 450046; 2.河南大学 植物逆境重点实验室,河南 开封 475004)

甘草属于豆科甘草属植物,其根茎是重要的中药材。试验和临床研究证明,甘草的药理功能丰富,具有抗炎、抗病毒、抗菌、抗氧化、治疗糖尿病、平喘和抗肿瘤等功效,同时,它还有免疫调节、护胃、护肝、保护神经、保护心肌的作用[1-2]。虽然甘草是重要的中药材,有着丰富的药用功能,但跟其他中药材一样,甘草也面临着重金属污染问题[3]。

重金属对于高等植物的生长来说非常重要,一些二价重金属离子如Cu2+、Zn2+、Mn2+、Ni2+、Co2+等,是植物生长代谢中必需的微量元素;但有些重金属元素则是不需要的,比如Cd2+、Hg2+和Pb2+等,如果转运入植物体内则会产生毒性,当中药材中含有这类重金属元素时易造成重金属污染。在植物吸收金属元素的过程中,膜转运蛋白发挥着重要作用,自然抗性相关巨噬细胞蛋白(Natural sesistance-associated macrophage protein,NRAMP)是其中一类重要的膜转运蛋白[4]。NRAMP基因家族在进化过程中高度保守,其同源基因在生命体中分布广泛,细菌、酵母、昆虫、动物和高等植物中都有这类家族成员[5-6]。目前,对多种生物NRAMP家族的研究已有报道。动物中的NRAMP1是第1个被鉴定的NRAMP家族成员,其能编码完整的膜蛋白,主要分布在巨噬细胞中[7],当发生吞噬作用时,该蛋白质快速聚集到巨噬细胞的细胞膜上,通过控制二价阳离子的吸收来调节对细菌的吞噬作用[8]。在高等植物中,对于NRAMP家族成员的研究也越来越多,这些成员的功能正被逐步揭示出来。XIONG等[9]证明,花生中AhNRAMP1对于铁的吸收发挥重要作用。在缺铁时,拟南芥中的AtNRAMP3可以启动液泡内的金属转运到细胞质中[10]。在缺锰条件下,拟南芥中的AtNRAMP3和AtNRAMP4在种子萌发期可以转运铁,还有平衡锰的作用[11]。而中药材甘草中NRAMP家族的研究,尤其是基因组水平的家族鉴定和特性分析鲜见报道。NRAMP转运的选择性不强,在转运必需金属元素的同时,一些有害金属元素也会被转运到植物体内。研究发现,通过突变拟南芥中的NRAMP4基因可以改变Cd2+和Zn2+的吸收,但不影响Fe2+的转运,这一发现为NRAMP选择性转运金属离子提供了可能性[12]。基于此,对甘草NRAMP家族成员进行鉴定和生物信息学分析,旨在为提高甘草转运金属元素的选择性,阻断其重金属污染研究奠定基础。

1 材料和方法

1.1 供试材料基因序列的获取

拟南芥的全基因组序列获取自https://www.arabidopsis.org/,大豆全基因组序列获取自http://www.phytozome.net/soybean,水稻基因组序列下载自http://rapdb.dna.affrc.go.jp,陆地棉序列获取自https://www.cottongen.org/。

1.2 甘草NRAMP基因家族的鉴定

利用甘草全基因组的核苷酸序列和氨基酸序列构建本地Blast数据库[13],利用拟南芥的AtNRAMP1—AtNRAMP6为查询条件(Query),借助软件Blast 2.4.0对构建的甘草基因组数据库进行本地Blastn和Blastp搜索(E值采用默认值),初步筛选到拟南芥NRAMP基因家族在甘草中的同源基因。从http://pfam.xfam.org/网站上下载NRAMP结构域的HMM模型(PF01566),利用Hmmer 3.0软件进一步对筛选出的基因进行NRAMP结构域的查询,手动删除冗余序列,确认甘草NRAMP家族成员。

1.3 甘草NRAMP家族成员的特性和进化分析

利用ProtParam工具(http://web.expasy.org/protparam/)分析甘草NRAMP家族蛋白质的理化性质[14],包括氨基酸数量、蛋白质分子质量、等电点,利用哈佛大学的在线分析工具(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)预测蛋白质的亚细胞定位,利用工具TMHMM分析甘草NRAMP蛋白的跨膜结构。采用GSDS在线系统(http://gsds.cbi.pku.edu.cn/)分析NRAMP基因的内含子/外显子结构。用MEME在线工具分析NRAMP蛋白的保守基序(Motif),设置20个模块(http://meme-suite.org/tools/meme)。利用SMART序列分析软件(http://smart.embl-heidelberg.de/)分析蛋白质的Nramp结构域。利用SOPMA工具分析甘草NRAMP家族蛋白质的二级结构,利用SWISS-MODEL软件构建甘草NRAMP蛋白的3D模型并用PROCHECK工具(http://servicesn.mbi.ucla.edu/PROCHECK/)计算模型的稳定性。利用甘草全基因组的CDS序列和基因组序列计算甘草NRAMP基因在染色体上的位置,用MapInspect软件绘制基因的染色体定位图。

为了解甘草和其他植物NRAMP家族成员的进化关系,利用ClustalW软件进行多种植物蛋白质全长的多序列分析[15],利用MEGA 5.05软件采用N-J 法构建进化树,采用1 000次自展检测。

2 结果与分析

2.1 甘草NRAMP基因家族的鉴定及蛋白质理化性质的分析

利用Blast本地比对筛选和对NRAMP结构域的鉴定,确定了11个甘草NRAMP基因家族成员,按照与NRAMP结构域的匹配程度命名为GurNRAMP1—GurNRAMP11。分析这些成员编码的蛋白质的理化性质(表1)发现,多数蛋白质家族成员的氨基酸数量介于300~549个,有3个成员不在此范围内,其中GurNRAMP7蛋白和GurNRAMP8蛋白的氨基酸序列较长,氨基酸个数分别为1 315个和1 269个,而GurNRAMP11蛋白仅由193个氨基酸组成。等电点分析表明,甘草NRAMP蛋白家族的等电点为4.90~9.06,说明它们可能在不同的微环境中发挥功能。通过亚细胞定位分析发现,除了分子质量更大的GurNRAMP7和GurNRAMP8定位在叶绿体外,其他成员均定位在细胞膜上,推测GurNRAMP7和GurNRAMP8这2个成员可能在不同部位发挥跨膜转运作用。

表1 甘草NRAMP蛋白理化性质分析Tab.1 The physicochemical property analysis of NRAMP proteins in Glycyrrhiza uralensis

2.2 甘草NRAMP家族的基因结构和进化分析

通过对比甘草和拟南芥NRAMP家族成员的基因结构(图1)发现,GurNRAMP1—GurNRAMP4都有4个外显子,这4个成员与拟南芥AtNRAMP2—AtNRAMP5的同源性较高,基因结构也相似,推测在功能上也有相似性;GurNRAMP5、GurNRAMP6、GurNRAMP9和GurNRAMP10拥有更多的外显子,数量为7~11个,并且与拟南芥AtNRAMP1、AtNRAMP6的进化关系更近;编码蛋白质分子质量最大的2个成员GurNRAMP7、GurNRAMP8在进化关系上单独聚为一簇,它们分别含有7、6个外显子,结合它们的理化性质尤其是亚细胞定位的差异,可以推断这些成员在功能上存在较大差异;编码蛋白质分子质量最小的GurNRAMP11与其他成员之间的进化距离均比较远,说明它们的亲缘关系较远,推断GurNRAMP11会发挥一些特殊的功能。 从进化关系分析,这11个成员含有的外显子差异较大,说明它们的保守性不高,在进化过程中发生了较大的改变。

图1 NRAMP家族成员在甘草和拟南芥中的进化和基因结构分析Fig.1 Analysis of phylogenetic relationship and gene structure of NRAMP family members between Glycyrrhiza uralensis and Arabidopsis thaliana

为了解甘草和其他植物NRAMP基因家族的进化关系,对双子叶的甘草、拟南芥、大豆、陆地棉和单子叶的水稻进行种间进化关系分析,5个物种被分为3个亚类(图2)。结果显示,同一物种在进化关系上更为亲近,每个亚类中都包含了单子叶植物和双子叶植物的家族成员,说明远在单子叶植物和双子叶植物分离前,NRAMP基因已经产生。通过对系统进化树各个分支进一步分析发现,甘草与大豆的进化距离较短,说明甘草和大豆的NRAMP家族成员的亲缘关系相较于其他物种更近。

图2 NRAMP在甘草和其他植物中的进化分析Fig.2 Phylogenetic analysis of NRAMPs in Glycyrrhiza uralensis and other species

2.3 甘草NRAMP基因的染色体定位分析

在进化过程中,基因复制是进行基因家族扩增的方式,包括片段复制、串联复制和反转录转座等,其中,片段复制和串联复制是主要的方式[16]。为了研究基因复制在基因分化和甘草NRAMP基因家族扩增中的作用,将11个GurNRAMP基因定位到9条染色体上(图3)。结果显示,GurNRAMP9、GurNRAMP10和GurNRAMP11定位在同一条染色体上,结合这3个基因在染色体上的具体位置,判断这3个基因是串联复制。另外8个基因分别定位在8条不同的染色体上,属于片段复制。说明在甘草NRAMP基因家族进化过程中,片段复制和串联复制都参与了基因的扩增,以片段复制为主。

2.4 甘草NRAMP蛋白的保守结构域和保守基序分析

利用SMART在线分析工具分析甘草NRAMP家族蛋白质的Nramp结构域,结果如图4所示,每个家族成员都含有Nramp结构域,其中,GurNRAMP8和GurNRAMP9有2个Nramp结构域。大部分成员除了含有Nramp结构域外,还有其他跨膜结构。通过GO功能注释方法分析Nramp结构域有以下特征:生物学过程为转运(GO:0006810);细胞组成部位为膜结构(GO:0016020);分子生物学功能为转运活性(GO:0005215)。说明甘草NRAMP是存在于膜上的具有转运功能的跨膜蛋白质。

为更好地了解NRAMP家族蛋白质成员的结构,用MEME在线工具对甘草NRAMP家族蛋白质进行保守基序分析,设置基序个数为20,结果如图5所示。由图5可见,亲缘关系较近的成员之间具有相似的基序,暗示它们的功能也更为接近。这些基序中有些保守性强,比如基序3,存在于每个成员中。有些基序只在某些亚家族中比较保守,比如基序16只在亚家族 Ⅰ 中存在,基序20只在亚家族 Ⅱ 中存在,这些基序在这些亚家族中可能发挥不同的功能。有些基序只有个别成员没有,比如基序4、5存在于除GurNRAMP11外的所有成员中。GurNRAMP11由于序列较短,并且与其他家族成员之间的亲缘关系较远,其基序组成差异较大,且数目少,仅有5个基序。

图3 NRAMP基因在甘草染色体上的分布Fig.3 Distribution of the NRAMP genes on chromosomes in Glycyrrhiza uralensis

图4 甘草NRAMP家族的Nramp结构域Fig.4 Nramp structural domain of NRAMP family members in Glycyrrhiza uralensis

图5 NRAMP家族蛋白在甘草中的保守基序分析Fig.5 Conserved motif analysis of NRAMP family proteins in Glycyrrhiza uralensis

2.5 甘草NRAMP家族蛋白质的二级结构和三维结构分析

蛋白质的结构与功能之间的关系密切。为更深入地了解甘草NRAMP家族的特性,利用SOPMA对甘草NRAMP蛋白进行二级结构预测(表2),结果显示,大部分NRAMP蛋白二级结构的主要结构元件是α-螺旋,其次是无规则卷曲结构,β-转角的比例最小。分子质量最大的2个成员GurNRAMP7和GurNRAMP8的无规则卷曲比α-螺旋的比例更高,说明这2个成员中的冗余氨基酸并没有形成实质的二级结构。

表2 甘草NRAMP家族蛋白质二级结构主要构成组件比例

三级结构对于蛋白质功能很重要,通过预测蛋白质的三级结构可以更好地理解其功能。利用SWISS-MODEL构建甘草NRAMP家族蛋白质的三维结构模型,结果如图6所示。由图6可见,GurNRAMP1、GurNRAMP2、GurNRAMP3、GurNRAMP4、GurNRAMP7和GurNRAMP8的三维结构最复杂,α-螺旋结构的数量最多,其次是GurNRAMP5和GurNRAMP6,这2个成员的三维结构较为复杂,拥有较多的α-螺旋结构,GurNRAMP9、GurNRAMP10和GurNRAMP11的三维结构最为简单,含有的α-螺旋结构的数量最少。这些成员的结构特征和它们的跨膜结构数(表1)有很好的对应关系,α-螺旋结构数量多的成员跨膜结构数相对也多。

利用PROCHECK程序在线预测蛋白质的稳定性,结果如表3所示,GurNRAMP10的氨基酸残基位于最佳区的比例略微小于90%,但是分布在最佳区和次允许区的比例远超过90%,其他家族成员分布在最佳区的比例也都超过90%,表明甘草NRAMP蛋白的空间构象是合理且稳定的。甘草NRAMP蛋白所有成员的G-factors值均大于-0.5,说明它们的结构预测在正常范围。

图6 甘草NRAMP家族蛋白质的三维结构Fig.6 Tertiary structures of NRAMP family proteins in Glycyrrhiza uralensis

蛋白质名称Protein name最佳区比例/%Core regions次允许区比例/%Allowed regions一般允许区比例/%Generously allowed regions不允许区比例/%Disallowed regionsG-factorsGurNRAMP194.74.80.30.30.01GurNRAMP294.24.61.00.3-0.02GurNRAMP394.94.60.30.30.02GurNRAMP493.75.60.80-0.03GurNRAMP593.66.10.30-0.04GurNRAMP692.95.80.90.3-0.11GurNRAMP793.26.30.30.3-0.08GurNRAMP891.68.20.30-0.17GurNRAMP990.37.70.51.4-0.02GurNRAMP1089.79.00.90.4-0.23GurNRAMP1196.92.40.80-0.06

注:G-factors<-0.5为罕见结构; G-factors<-1.0为十分罕见。

Note:G-factors<-0.5 unusual; G-factors<-1.0 highly unusual.

3 结论与讨论

我国中药材资源丰富,品种齐全,但中药材的安全问题给中医药的发展带来了困扰,其中重金属污染问题尤为严重。甘草作为一种重要的中药材,不但应用于医药领域,还在食品、烟草、化妆品、环境保护等方面发挥重要作用。为了提高甘草质量,降低重金属污染,了解重金属的转运机制非常必要。NRAMP是一类整合转运蛋白质家族,在重金属的转运和重新利用中发挥决定性作用[17]。通过对NRAMP基因家族进行分析,可以了解各个成员的特性,明确其功能,为阻断有害重金属的转运提供思路。

本研究从甘草全基因组序列中鉴定出11个NRAMP基因家族成员,通过对11个成员的进化分析和在染色体上的定位分析发现,片段复制是这些成员经历的主要复制事件,也存在串联复制的现象。通过将GurNRAMP家族成员与模式植物拟南芥中的AtNRAMP家族成员进行进化分析发现,GurNRAMP7、GurNRAMP8、GurNRAMP11这3个成员比较特殊,它们与AtNRAMP的亲缘关系较远,单独形成一个分支,并且它们的亚细胞定位和蛋白质大小也与其他成员差别较大,推测也许会发挥一些特殊的功能。为了解甘草和其他植物中NRAMP基因家族的起源,对甘草与几种双子叶植物和单子叶植物构建种间进化树发现,NRAMP基因产生于单子叶植物和双子叶植物分离之前,且甘草与大豆间的亲缘关系比其他物种更为接近。为更好地了解GurNRAMP蛋白成员间的关系和功能,分析各个成员的保守结构域与保守基序,结果发现,所有成员都具有Nramp结构域,故均应具备跨膜转运的功能。通过对保守基序进行分析发现,各个亚家族内部成员的组成相似,而亚家族之间的差异较大,预示不同亚家族在功能上可能存在差异。为更好地了解每个蛋白质成员的结构,对甘草NRAMP家族蛋白质的二级结构和三维结构进行分析。α-螺旋是甘草NRAMP家族成员中最主要的结构,也是蛋白质跨膜的重要结构,在甘草NRAMP家族蛋白质中,α-螺旋数量和跨膜结构数量有一定的相关性。GurNRAMP1、GurNRAMP2、GurNRAMP3和GurNRAMP4蛋白的分子质量大小相似,三维结构和α-螺旋结构数量都很相似;GurNRAMP7和GurNRAMP8的氨基酸数量比其他成员多很多,虽然α-螺旋结构所占比例最低,但α-螺旋的数量和上面4个成员相似,多出的氨基酸在二级结构上主要表现为无规则卷曲;GurNRAMP5、GurNRAMP6这2个成员的氨基酸数量分别为472、414个,比前4个成员的氨基酸数量少,因此三维结构相对简单些,α-螺旋结构也稍有减少;GurNRAMP9、GurNRAMP10和GurNRAMP11的氨基酸数量最少,所含的跨膜结构数量也最少,其转运功能或许会有所不同。

猜你喜欢
基序结构域甘草
细菌四类胞外感觉结构域的概述
拟南芥START 结构域亚家族生物信息学分析及功能
带TRS基序突变的新型冠状病毒威胁更大
NaV1.5钠通道C末端IQ基序的重组质粒构建及蛋白制备
炙甘草汤,适用于哪些病症
芥蓝Aux/IAA家族基因生物信息学与表达分析
UBR5突变与淋巴瘤B细胞成熟
A Network Pharmacology Study on the Effects of Ma Xing Shi Gan Decoction on Influenza
Systematic Pharmacological Strategies to Explore the Regulatory Mechanism of Ma Xing Shi Gan Decoction on COVID-19
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)