史 丽,吴亚茹,王晓娟,常燕楠,庞鹏湘,郜 刚
(山西师范大学 生命科学学院,山西 临汾 041000)
植物的生长发育常常受到干旱、盐度等非生物胁迫的影响[1]。转录因子调控下游基因的表达,是植物适应非生物胁迫的关键因子[2]。NF-Y转录因子可通过差异表达、选择性剪接、细胞氧化还原电位等相互作用,来调节其活性[3]。NF-YC含有组蛋白折叠基序(HFMs),并且通过 HFMs相互作用首尾相接组装形成异二聚体,再与NF-YA相互作用形成NF-Y转录因子。在DNA和NF-Y转录的结合中都发挥重要的作用[4]。NF-YC蛋白的保守域中含有1个与H2A蛋白结构类似的HFM结构域,在蛋白-蛋白和蛋白-DNA的互作中发挥重要作用。
NF-Y被称为血红素激活蛋白(HAP)或CCAAT结合因子(CBF),是所有真核生物中存在的三聚体转录因子[5]。在植物中,其生物学功能主要表现在开花进程、胚胎发育、叶绿体发育、应激反应等多方面的调控[6]。已证实,番茄NF-Y因子在调节果实成熟中起重要作用,不同的NF-Y因子在番茄果实成熟过程中的作用可能不同[7]。另外,有研究表明,NF-Y基因过表达会增强小麦的耐旱性[8]。1995年,Albani等[9]从拟南芥中分离出了第1个NF-YC家族成员AtNF-YC2。AtNF-YC2亚基的过表达加速了植物的开花过程并提高了植物的转录水平[10]。1998年Edwards等[11]首次鉴定出拟南芥中有13个NF-YC亚基。此外,E Z等[12]研究表明,NF-Y可能在单子叶植物中分化以调节胚乳发育。NF-YC亚基的过表达会增强水稻植株的抗盐性。Chen等[13]研究表明,NO、H2O2和ABA参与盐胁迫诱导的NF-YC基因的表达,当没有H2O2、NO分子或者ABA合成受阻时,NF-YC基因的表达终止。2006年,Ben-Naim等[14]研究表明,CCT存在于多数开花相关蛋白中,拟南芥中的NF-YC与CCT保守域互作,从而调控植株开花时间,番茄中的NF-YC也参与开花时间调节子的调节。AtNF-YC与AtNF-YB结合成二聚体,参与到光周期开花途径中[15]。云杉中的NF-YC亚基过表达时促进花粉管的发育[16-17]。此外,NF-YC参与小麦中有关光合作用相关基因表达的调控;在水稻中,NF-Y转录因子丧失功能后,叶绿体退化,降低了叶绿素含量[18]。
本研究从山西师范大学生命科学学院基因工程实验室前期的试验中获得1条马铃薯EST序列[19],使用电子克隆方法获得马铃薯NF-YC基因的全长cDNA,对其进行生物信息学分析。关于马铃薯青枯菌植病互作产生的NF-YC基因的研究鲜见报道。因此,分离和鉴定马铃薯与青枯菌互作诱导产生的NF-YC基因,通过相关生物信息学软件对其生物学功能和作用机制的预测和研究,旨在为后期的基因功能研究奠定理论基础。
供试植物材料选用的是青枯菌高抗基因型ED13,由中国农业科学院蔬菜花卉研究所提供,青枯菌选用的是菌株PO41、生理小种3号(race3)、生化变种2号(biovar2)。取九叶期至十叶期试管苗,参照He等[20]伤根灌菌接种法接种青枯菌。
山西师范大学生命科学学院基因工程实验室前期试验中得到1条马铃薯EST序列,长度为796 bp,通过NCBI BlastN同源比对检索,以马铃薯NFYC-1-Like(XM_015310514.1)为参考序列,运用电子克隆方法进行比对、拼接,直到序列能完整翻译,进而获得NF-YC全长序列。将其与马铃薯全基因组序列数据库中可用的序列进行比对[21]。
马铃薯NF-YC基因的核酸及氨基酸组成、编码蛋白的理化性质、开放阅读框(Open reading frame)的翻译与寻找分别采用Bioedit、Prot-Param和ProtScale服务器及ORF dinder等在线工具完成。亲、疏水性、蛋白质的磷酸化位点和亚细胞定位、信号肽和跨膜区分析利用在线工具ProtScale、NetPhos 3.1、TargetP 1.1、SignalP 4.1、TMHMM 2.0软件完成。保守结构域通过在线工具NCBI中的CDD(Conserved Domain Database)预测。蛋白质二级和三级结构预测通过SOPMA和CPH Models 3.2 Server等在线工具完成,三级结构用 Accelrys DS Visualise软件显示结果。N-J(Neighbor-Joining)法系统发育树使用MEGA软件[22]完成(表1)。
表1 生物信息学分析所用的在线分析工具Tab.1 The online tools used in bioinformatics analysis
在本实验室前期得到1条马铃薯EST序列,以马铃薯NFYC-1-Like(XM_015310514.1)为参考序列,在NCBI BlastN中通过同源比对,同源性达到99%。通过电子克隆方法,经过比对、拼接,获得NF-YC全长cDNA序列,长度为1 132 bp。通过与马铃薯全基因组数据库比对,将其命名为StNF-Y。GenBank登录号(Accession No.) :MH 919392.1。
利用ExPasy在线工具中的ProtParam预测马铃薯StNF-Y蛋白的理化性质[23],结果如表2所示,该蛋白不稳定系数为63.54,大于40,说明该蛋白为不稳定蛋白;平均疏水性为-0.503,初步判断该基因为亲水性蛋白。由图1 可知,该蛋白在第100-140个氨基酸之间出现最大疏水值2.2,在第100-120个氨基酸之间出现最小亲水值-2.833,且峰值分布在0 以下比分布在0以上的多,再次证明该蛋白为亲水性蛋白。在马铃薯StNF-Y氨基酸组成中,含量最高的为Asn(97个,占42.17%),含量最低的为Cys(1个,占0.43%)。
表2 StNF-Y蛋白一级结构预测Tab. 2 Predicting primary structure of StNF-Y protein
图1 StNF-Y蛋白亲水性/疏水性预测Fig.1 Prediction of hydrophilicity/hydrophobicity of StNF-Y protein
利用BioEdit软件分析,马铃薯StNF-Y的全长cDNA长度为1 132 bp,终止密码子为TAA,编码230个氨基酸(图2)。
使用NCBI保守结构域数据库(Conserved Domain Database,CDD)[24],分析马铃薯StNF-Y蛋白的保守结构域结果显示(图3),该蛋白含有多个保守结构域,主要属于BUR6 superfamily家族,该结构域位于第44-141个氨基酸。提交NF-YC基因的氨基酸序列,BlastP搜索StNF-Y的同源氨基酸序列。DNAMAN软件用于马铃薯StNF-Y蛋白和其他物种NF-YC蛋白的氨基酸序列的多重比对[25],利用Blast P对StNF-Y基因编码的氨基酸同源性进行检
上排为cDNA 序列,下排为氨基酸序列;ATG 为起始密码子,*代表终止密码子;下划线标注的为BUR6 superfamily结构域。
The upper lines are cDNA sequences,the lower lines are amino acid sequences; ATG is the start codon,* is the stop codon; Underlined is the BUR6 superfamily domain.
图2StNF-YcDNA序列以及推导的氨基酸序列
Fig.2StNF-Ygene cDNA sequence anddeduced amino acid sequence
索,马铃薯StNF-Y基因编码的氨基酸与番茄Solanumpennellii(XP_015070179.1)、辣椒Capsicumchinense(PHU23636.1)、马铃薯Solanumlycopersicum(NP_001234244.1)、烟草Nicotianaattenuata(XP_019248263.1)中的NF-YC蛋白的氨基酸序列具有较高的相似性,分别为94%,93%,84%,81%。结果显示(图4),StNF-Y结构域的氨基酸序列高度保守。
图3 StNF-Y蛋白的保守结构域分析Fig.3 Conserved domain prediction of StNF-Y protein
图4 马铃薯StNF-Y蛋白与其他植物 NF-YC蛋白的同源性比对Fig.4 Homology comparison of potato StNF-Y protein with other plant NF-YC proteins
使用NetPhos 3.1 Server对该氨基酸进行磷酸化位点分析,结果显示,其共有13个磷酸化位点,Ser磷酸化位点6个,分别位于第82,157,190,200,205,214个氨基酸上;Thr磷酸化位点4个,分别在第26,101,115,158个氨基酸上;3个Tyr磷酸化位点位于第24,192,215个氨基酸上。据推测,StNF-Y蛋白的活性与功能可能通过这些位点的磷酸化反应来调节。
通过使用SignalP 4.1 Server预测蛋白质序列的信号肽,结果显示无信号肽段出现。使用TMHMM Server 2.0[26]预测蛋白质的跨膜区,结果显示该蛋白是一种膜外蛋白,没有跨膜区。使用TargetP 1.1 Server服务器[27]分析蛋白质亚细胞定位,结果显示StNF-Y转录因子主要位于胞质中的概率最大。
在Expasy的SOPMA服务器[28]中在线预测马铃薯StNF-Y转录因子的二级结构,结果如图5所示,105个氨基酸可形成α-螺旋,占氨基酸总数的45.65%;13个氨基酸可形成延伸链,占氨基酸总数的5.65%;104个氨基酸可形成无规则卷曲,占氨基酸总数的45.22%。8个氨基酸形成β-转角,占氨基酸总数的3.48%。
图5 StNF-Y蛋白的二级结构预测Fig.5 Secondary structure prediction of StNF-Y protein
利用CPHmodels 3.2 Server预测StNF-Y的三级结构发现,目前PDB数据库中尚未有全长氨基酸序列匹配的模板,只能构建其保守序列的3D模型(图6),完整的StNF-Y三级结构由α-螺旋、β-转角和无规则卷曲形成,在C端是α-螺旋,在N端有一个较短的伸展肽段(EP)。
图6 StNF-Y保守序列(48-140)的三级结构Fig.6 3D structure of the conserved domain (48-140)of the predicted amino acids
通过NCBI上的BlastP获得氨基酸序列的同源序列,使用MEGA 4.0软件,采用N-J法构建系统进化树(时间截止到2018年11月15日),结果如图7所示,系统发育树分析表明,马铃薯StNF-Y转录因子编码的氨基酸序列与番茄亲缘关系最近,与辣椒亲缘关系次之,与棉花亲缘关系最远。
图7 基于StNF-Y蛋白氨基酸序列的系统进化树Fig.7 Phylogenetic tree based on amino acid sequence of StNF-Y protein
本研究在山西师范大学生命科学学院基因工程实验室前期工作中利用电子克隆技术拼接,获得了马铃薯StNF-Y基因的全长序列,并通过生物信息学方法对该基因的结构特征、功能属性和表达性质等方面进行了系统分析,其核苷酸和氨基酸序列都高度保守,核苷酸序列在茄科植物中保守性高达95%~100%,表明StNF-Y在进化上很保守,这可能与其重要功能有关。马铃薯StNF-Y转录因子全长1 132 bp,编码230个氨基酸,磷酸化位点有13个,StNF-Y是亲水性氨基酸,无信号肽。通过更进一步的预测发现,StNF-Y蛋白含有BUR6保守功能结构域,属于BUR6 superfamily家族,并且对蛋白质的结构和功能都至关重要。该蛋白质的二级结构有4种结构形式:α-螺旋、延伸链、β-转角和无规则卷曲,这为实现其功能提供了结构基础。通过氨基酸多序列比对及构建系统进化树,发现该蛋白与马铃薯、番茄、辣椒、烟草、牵牛花中的核转录因子亲缘关系较近,说明StNF-Y蛋白在生物进化过程中高度保守。
近年来,已经分离和鉴定了越来越多的植物NF-Y基因,其中包括拟南芥[29]、大豆[30]、甘蓝型油菜[31]、葡萄[32]、柑橘[33]等。目前,关于拟南芥中的NF-Y基因研究的较多,其次是番茄、小麦、水稻等。NF-Y由NF-YA、NF-YB和NF-YC亚类TF组成,已被证明参与植物许多生长发育过程的调节和对各种环境胁迫刺激的反应[34]。最新的研究发现,NF-YC转录因子在糖异生过程和植物胚乳发育中起重要作用。Zhang等[35]研究结果表明,NF-Y基因通过上调糖异生基因Pck1和G6pc来控制葡萄糖代谢的生理功能。此外,NF-Y基因也参与植物对非生物胁迫的反应[36]。拟南芥NF-YC3/4/9与ABI 5启动子的CCAAT元件结合,激活其在种子萌发过程中的表达及整合GA和ABA信号转导途径[37]。已证实,NF-Ys参与了植物响应干旱反应的ABA信号传递[38]。前几年,有研究表明,NF-Y转录因子能引起植物对干旱胁迫的反应,主要是通过影响叶绿素含量、光合作用、开花进程等对植物生理过程进行调控。这与本试验所用的原始序列来源相一致,初步推测,其可能同以往发现的其他植物的NF-YC转录因子一样参与相关防御反应。
进一步确定马铃薯StNF-Y蛋白在植株中实际的功能表达,还需要具体的分子生物学试验来验证。有必要针对该基因表达的精细细胞定位和信号调控进行进一步的深入研究,这对于解释早期马铃薯与青枯病的植病互作机制、进行马铃薯育种乃至为今后青枯病的控制提供新的目标具有重要的理论意义。