赵 展
(开封大学,河南 开封 475004)
烟酰胺(Nicotianamine,NA)是一种非蛋白质性氨基酸,最早在烟草中发现[1],到目前为止,已被发现存在于所有高等植物中。NA是一种金属螯合剂,对植物体内金属(铁、锌、锰、铜)螯合和转运起重要作用[2]。烟酰胺合成酶(Nicotianamine synthase,NAS)是植物体内NA合成过程中一种重要的酶,参与植物体内多种调控机制,对植物的生长发育有重要调节作用,能够将3个s-腺苷蛋氨酸分子转化成NA[3]。大量研究表明,NAS基因的过表达不仅能够增强植物体内NA的含量,而且能够增加铁、锌等金属离子的含量,目前该结论已在大豆、水稻、玉米等多个作物中被证实,如,在CaMV35S启动子的控制下,hvnas1过表达会引起转基因大豆籽粒中NA浓度是未转基因大豆的4倍,而Fe和Zn浓度分别是NT植株的2倍和1.45倍[4]。NAS基因参与植物体内多种作用机制,对植物的生长发育有重要的调控作用。如,Zhu等[5]在hap5a突变体中发现AtNAS1基因显著下调表达,但与Fe的状态不相关,进一步酵母单杂交和ChIP分析表明,HAP5A直接结合到NAS1的启动子区域,且在缺铁条件下,过表达NAS1可以挽救hap5a的褪绿表型。
据报道,目前关于NAS基因家族已经在玉米、小麦、花生等多个物种中进行了全基因组鉴定和生物信息学分析。Zhou等[2]在玉米的基因组中共鉴定出9个NAS基因家族成员,并测定了其在不同器官(包括发育中的种子)中的表达模式,根据ZmNAS基因的进化关系和组织特异性表达谱,将其分成了2类,并推测2类ZmNAS基因可能在转录水平上受到不同铁摄取、转运和稳态需求的调控。Bonneau等[6]在小麦的基因组中鉴定出21个NAS基因,并对TaNAS基因在种子萌发、幼苗生长、生殖发育过程、缺铁响应的表达模式和蛋白质序列进行了详细研究,研究结果增加了人们对禾本科植物NAS基因家族的认识,以及对面包小麦铁营养遗传学基础的理解。罗艳芳等[7]在对花生NAS基因家族进行了全基因组鉴定和生物信息学分析,共鉴定出6个AhNAS基因,并通过对AhNAS基因家族进化关系、基因结构、保守结构域、亚细胞定位、顺式作用元件、表达模式及花生响应缺铁和镉胁迫中的作用等进行分析,指出AhNAS2.1和AhNAS2.2主要参与黄色条纹样蛋白3(YSL3)介导的铁的木质部运输,而AhNAS1.2、AhNAS3.1和AhNAS3.2可能参与花生对镉的解毒机制,为揭示NAS在花生(Arachis hypogaea)铁稳态调控中的生理功能奠定基础。
西瓜是世界十大水果之一,随着西瓜基因组的测序完成,西瓜的基因组学研究也越来越深入,但是目前关于西瓜NAS基因家族的全基因组鉴定和分析研究尚不深入。本研究以西瓜NAS基因家族为研究对象,利用HMMER、MEGA、TBtools等工具对西瓜NAS基因家族进行了全基因组鉴定与生物信息学分析,其中包括西瓜NAS基因家族的染色体定位、蛋白保守基序、系统进化树、启动子顺式作用元件和共线性等,该研究能够为进一步探讨西瓜NAS基因的功能和分子机制提供重要的理论依据。
西瓜基因组数据集来源于葫芦科基因组CuGenDB数据库(Cucurbit Genomics Database(CuGenDB))。利用InterPro数据库(https://www.ebi.ac.uk/interpro/)查找并下载NAS基因的特征结构域文件PF03059。在Linux系统中利用HMMER的hmmbuild功能构建NAS蛋白结构域的隐马可夫模型,并利用hmmsearch扫描西瓜蛋白数据集。获得的NAS家族成员分别通过SMART蛋白数据库(SMART:Main page(embl-heidelberg.de))和NCBI-CDD(Home -Conserved Domains-NCBI(nih.gov))网站进行确认,在2个数据库中均包含NAS家族成员作为候选,并对候选NAS家族成员进行命名。利用DNAMAN软件对候选NAS家族成员的蛋白质分子量大小、等电点、氨基酸数量等指标进行分析。对已获取的候选NAS家族成员的位置信息利用MG2C_v2.1在线软件(http://mg2c.iask.in/mg2c_v2.1/)进行染色体定位。
利用SOPMA网站(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)对西瓜NAS家族编码蛋白质的二级结构进行预测;利用PDB数据库(https://www.rcsb.org/)中的PSI-BLAST筛选模板,利用SWISS MODLE网站(https://swissmodel.expasy.org/),以PDB数据库中筛选的模板对西瓜NAS家族编码的蛋白质进行三级结构预测。
对西瓜NAS家族蛋白的保守基序利用MEME 5.5.0在线工具(https://meme-suite.org/meme/tools/meme)进行分析,最大检索保守基序数量设为10,其他参数默认。利用MEGA7.0对候选NAS家族成员间的进化关系进行分析,并采用TBtools对候选NAS家族成员的保守基序和基因结构进行可视化。
从EnsemblPlants数据库(http://plants.ensembl. org/Arabidopsis_thaliana/Info/Index)分别下载拟南芥、水稻、番茄和甜瓜4个物种的NAS基因的蛋白序列,利用MEGA 7.0内置的ClustalW,采用邻接法(Neighbor Joining,NJ),对已获得的拟南芥、水稻、番茄、甜瓜、西瓜的NAS蛋白序列进行多序列比对,将自展法系数(Booststrap)设置为1000次重复,其他参数采用默认值,进行系统进化树的构建,并利用ITOL软件(https://itol.embl.de/)进行展示。
利用TBtools软件提取西瓜候选NAS家族成员基因转录起始位点上游2000bp的序列。利用PlantCARE对已获得的西瓜NAS家族成员基因启动子区的顺式作用元件进行预测分析,并通过TBtools对预测的结果进行可视化。
利用TBtools软件对西瓜基因组内的ClaNAS基因进行物种内的共线性分析以及西瓜与拟南芥、番茄基因组间的NAS基因进行共线性分析。
通过InterPro工具搜索,HMMER构建和查找,SMART和NCBI-CDD确认,共鉴定出4个西瓜NAS家族成员,分别命名为ClaNAS1~ClaNAS4,见表1。利用DNAMAN软件分析发现,4个西瓜NAS家族成员编码氨基酸序列长度从277aa到356aa,平均长度311aa;分子量变化范围从30.68kDa到39.88kDa,平均34.55kDa;理论等电点PI从4.71到7.46,其中ClaNAS1的等电点最小为4.71,该结果说明西瓜NAS家族成员编码的蛋白质含有较多酸性氨基酸。染色体定位结果显示,ClaNAS家族成员主要分布于第2号染色体、3号染色体、6号染色体上,其中2号染色体上有2个ClaNAS基因家族成员,分别是ClaNAS1和ClaNAS3,且2个基因在染色体上的位置很近;3号染色体和6号染色体上的西瓜ClaNAS家族成员分别是ClaNAS2和ClaNAS4。
表1 西瓜NAS基因家族成员信息
表2 西瓜NAS基因家族编码蛋白的二级结构分析预测
为了了解西瓜ClaNAS基因家族编码蛋白的二级结构,利用SOPMA进行分析预测,结果表明,4个西瓜ClaNASs家族成员编码蛋白质的二级结构主要由α-螺旋、延伸链、β-转角、无规则卷曲组成,均不含有β-折叠;ClaNAS1~ClaNAS4 4个成员中,与其他二级结构相比,α-螺旋的数量均最多,β-转角数量均最少;与ClaNAS1、ClaNAS3和ClaNAS4相比,ClaNAS2的延伸链数量最多为55;对于无规则卷曲,ClaNAS1和ClaNAS2的数量分别为112和119,而ClaNAS3和ClaNAS4的数量分别为72和86。
图1 西瓜NAS基因家族成员在染色体上的分布
为了进一步了解西瓜ClaNAS基因家族编码蛋白的三级结构,利用SWISS-MODEL,以PDB中3fpf.1.A为模板,进行分析预测并构建模型。结果表明,ClaNAS1和ClaNAS3编码的蛋白质三级结构相似度较高,具有较复杂的三级结构;而ClaNAS2、ClaNAS4与ClaNAS1和ClaNAS3编码的蛋白质整体相似度差异较大,可能与ClaNAS2和ClaNAS4 2个成员的二级结构中含有的延伸链、β-转角、无规则卷曲数量差异较大有关。
为了探究西瓜ClaNAS家族的进化关系、蛋白保守基序与基因结构,分别利用MEGA7.0、MEME、TBtools进行分析,见图2。结果表明,西瓜4个ClaNAS家族成员主要分为I、II、III 3个亚家族,其中ClaNAS1和ClaNAS3为I类,成员ClaNAS2属于II类,ClaNAS4属于III类;蛋白保守基序结果显示,4个ClaNAS家族成员中ClaNAS1和ClaNAS2均含有从Motif1到Motif10共10个Motif,而ClaNAS3和ClaNAS4均含有7个Motif,从Motif1到Motif7;基因结构分析结果显示,4个ClaNAS家族成员的外显子数均只有1和2,其中ClaNAS1和ClaNAS2均含有2个外显子,且具有相同的外显子-内含子排列方式,而ClaNAS3和ClaNAS4的外显子数均为1,说明ClaNASs家族成员的基因结构整体比较简单。
图2 西瓜NAS基因家族蛋白的二级结构预测
为了理解ClaNASs的功能和进化关系,利用MEGA7.0及其内置的ClustalW对5个拟南芥AtNASs,3个水稻OsNASs,4个甜瓜SlNASs,1个番茄SlNASs和4个西瓜ClaNASs的蛋白质序列进行多序列比对,见图3,并构建拟南芥、水稻、甜瓜、番茄和西瓜5个物种中NAS基因家族的系统进化树。结果表明,5个物种的NAS基因家族可分成3个亚家族,分别为I、II和III,其中I和II亚族均不含西瓜ClaNASs成员,而在III亚族中均是葫芦科植物,能够找到4个西瓜ClaNASs成员,分别是ClaNAS1~ClaNAS4,说明葫芦科植物与其他植物的差异较大。
图3 西瓜NAS基因家族蛋白的三级结构预测
为了探究西瓜ClaNASs家族启动子中可能的顺式作用元件及其作用,利用TBtools软件获取西瓜ClaNASs家族转录起始位点上游2000bp的序列,并进行顺式作用元件分析,见图4,结果表明,西瓜ClaNASs启动子区含有激素应答、光响应、胁迫应答、转录因子结合位点等多种顺式作用元件,其中ClaNAS1~ClaNAS4中均含有光响应和脱落酸应答相关的响应元件;除了ClaNAS4,ClaNAS1~ClaNAS3还均含有水杨酸应答元件;ClaNAS1和ClaNAS3的启动子区均含有赤霉素应答元件,而ClaNAS2和ClaNAS4中均含有生长素应答元件;对于低温胁迫应答元件,仅在ClaNAS1和ClaNAS4中含有;此外,MYB转录因子相关序列均集中在ClaNAS1、ClaNAS3和ClaNAS4中,说明西瓜ClaNASs基因家族可能对激素、胁迫等多种信号有响应。
图4 西瓜NAS基因家族编码蛋白的保守基序和基因结构析
图5 西瓜、拟南芥、水稻和番茄的NAS基因家族进化树分析
图6 西瓜NAS基因家族启动子区顺式作用元件分析
利用TBtools对西瓜基因组内以及西瓜与拟南芥、番茄基因组间的NAS基因进行共线性分析,见图7、图8,结果表明,在西瓜基因组内NAS基因没有发现串联重复和片段复制,见图7;在西瓜与拟南芥基因组间共鉴定出2个ClaNAS基因与拟南芥存在共线性关系,分别是ClaNAS1与AT1G09240.1、ClaNAS1与AT1G56430.1、ClaNAS2与AT1G09240.1、ClaNAS2与AT1G56430.1;在西瓜与番茄基因组间同样鉴定出2个ClaNAS基因与番茄存在共线性关系,分别是ClaNAS1与Solyc01g100490.3.1、ClaNAS2与Solyc01g100490.3.1。
图7 西瓜NAS基因家族成员的共线性分析
图8 NAS基因在西瓜、拟南芥、番茄基因组间的共线性分析
NAS是麦根酸(mugineic acid,MA)类家族生物合成途径中的关键酶,能够催化三分子的S-腺苷甲硫氨酸形成一分子的NA,在植物生长发育过程中具有重要的调节作用[8]。随着高通量测序技术和生物信息学技术的发展,目前已经在水稻、玉米、小麦、花生等多个物种中进行了NAS基因的鉴定和分析,并发现不同物种中NAS基因的数量与表达水平以及蛋白质的结构、长度和功能均存在显著差异[2,6],而NAS基因在西瓜中的研究及其功能尚不清楚。
本研究利用生物信息学的方法对西瓜NAS基因家族进行了全基因组的鉴定和分析,共鉴定出4个NAS基因家族成员,与水稻、玉米、小麦和花生相比,基因数量差异较大,其中水稻基因组中共鉴定出3个OsNAS基因[9],玉米全基因组中鉴定出9个ZmNAS基因[2,10],花生全基因组中鉴定出6个AhNAS基因[7],在面包小麦中共鉴定出21个TaNAS基因[6]。编码氨基酸的理化性质与其他物种差异也较大,本研究中西瓜NAS基因家族成员编码的氨基酸数量277~356aa,分子量30.68~39.88kDa,等电点4.71~7.46;而花生中AhNAS基因编码的氨基酸数量284~320aa,分子量32.03~35.65kDa,等电点5.37~6.37[7]。西瓜ClaNAS家族蛋白质的二级结构主要包含α-螺旋、延伸链、β-转角、无规则卷曲,而不含β-折叠,该结果与水稻SBP家族蛋白的二级结构组成一致[11];对西瓜ClaNAS家族蛋白质的三级结构模型构建时,最优模板是3fpf.1,该结果与花生AhNAS蛋白质的三级结构模型构建时获得的最佳模板一致[7]。对西瓜4个NAS基因家族成员的基因结构分析显示,ClaNAS1和ClaNAS2均含有2个外显子,且具有相同的外显子-内含子排列方式,而ClaNAS3和ClaNAS4的外显子数均为1,该结果与花生中AhNAS1.1和AhNAS1.2的编码区含有2个外显子,AhNAS2.1、AhNAS2.2、AhNAS3.1和AhNAS3.2只有1个外显子的结果一致[7]。对拟南芥、水稻、番茄、西瓜、甜瓜5个物种共14个NAS蛋白质进行系统发育分析发现,禾本科、葫芦科植物与其他植物均单独聚为一类,其中在禾本科与其他非禾本科单独聚为一类方面与罗艳芳等[7]、Zhou等[2]的研究结果一致。
西瓜NAS基因家族启动子区的顺式作用元件主要含有激素应答、光响应、胁迫应答等;其中,激素应答顺式作用元件主要包括脱落酸、赤霉素、水杨酸、生长素等;胁迫应答主要是低温胁迫应答,而花生的NAS基因家族启动子区还包含茉莉酸甲酯激素应答,胁迫应答还包括干旱胁迫应答[7]。本研究中,在西瓜基因组内没有发现NAS基因的串联重复和片段复制,类似结果同样在其他物种中也存在,如红花基因组内也未发现SPL基因的串联重复和片段复制[12],但在花生基因组内发现A组的AhNAS1.1、AhNAS2.1和AhNAS3.1分别与B基因组AhNAS1.2、AhNAS2.2和AhNAS3.2存在片段复制。西瓜NAS基因与拟南芥、番茄的NAS基因间分别存在2个共线性基因对,ClaNAS1与ClaNAS2分别连锁了2个基因对,表明ClaNAS1与ClaNAS2可能是保守的,在进化中发挥着重要的作用。