王仪明,雷艳芳,徐俊山,魏臻武,魏 佳,闵学阳
(1. 上海鼎赢农业有限公司, 上海 202178;2. 光明食品(集团)有限公司, 上海 200040;3. 扬州大学动物科学与技术学院, 江苏 扬州 225009)
腺苷酸代谢不仅是生命活动中初级代谢的重要组成部分,也是影响细胞代谢的主要因素之一。核酸代谢库前体分子单磷酸腺苷(adenosine monophosphate, AMP)是构成细胞核糖核酸的主要单核苷酸之一,AMP 的形成通常伴随着生物体内能量的释放。AMP、能量分子二磷酸腺苷(adenosine diphosphate, ADP)和糖类代谢库前体三磷酸腺苷(adenosine triphosphate, ATP) 3 种形式的比例决定了能量电荷比和碳水化合物代谢,进而直接影响植物的生长发育和对外界不良环境的适应性[1-2]。腺苷酸激酶(adenylate kinase, ADK, EC 2.7.4.3)是维持能量代谢和各种腺苷酸库大小平衡的单体磷酸转移酶,催化ATP + AMP ↔ 2ADP 的可逆转磷酸化反应[3-4]。在植物线粒体中,ADK 的活性将会显著影响细胞质和质体中游离态与结合态镁离子在腺苷酸库中的代谢平衡。
通常,ADK 蛋白由一个AMP 结构域,一个ATP结构域和一个相对保守的核心结构域(CORE)组成[5]。研究表明,ADK 在动植物中高度保守,其活性已在拟南芥(Arabidopsis thaliana)、水稻(Oryza sativa)、玉米(Zea mays)、豌豆(Pisum sativum)、马铃薯(Solanum tuberosum)等植物中得到证实, 而ADK的亚细胞定位在不同植物中差异很大,如在细胞质、线粒体、细胞核、质体中等均有报道[6-10]。在拟南芥中,鉴定到一个重要的茎生长调控因子AAK6,T-DNA 插入纯合突变体(Salk_015281)与野生型植株相比,突变体茎的生长减缓[11];拟南芥ADK(At2g37250)基因的T-DNA 插入纯合突变体,表现出氨基酸含量提高和根生长增强的特性[12];另一项相关研究表明,拟南芥ADK(At5g47840)基因的T-DNA 插入纯合突变体,植株叶绿体完整性丧失,从而导致早期胚胎到幼苗发育过程中出现白化苗,表明ADK基因在拟南芥的生长发育过程中发挥重要调控作用[13]。在马铃薯中的研究表明,沉默StADK基因的表达后,转基因植株的腺苷酸含量和淀粉含量得到显着提高[14]。此外,ADK3可以与叶绿体3-磷酸甘油醛脱氢酶相互作用,在绿藻(Chlorophyta)的叶绿体中形成稳定的复合物[15]。除了在调控植物生长和发育方面发挥重要功能,ADK还广泛参与植物对非生物胁迫的应激反应。以豌豆种子为模型,研究了种子脱水吸水过程中腺苷酸的平衡情况,结果表明ADK的活性在保持种子干燥和成熟过程中腺苷酸的平衡中发挥关键作用[16]。大豆(Glycine max)GmADK基因受到盐胁迫后,在耐盐品种中的表达高于盐敏感性品种,推测大豆GmADK基因参与盐胁迫的应答[17]。然而在番茄(Solanum lycopersicum)中,基因的微阵列分析显示,ADK同源基因(SGN-U214214)在盐处理的番茄组织中表达受到抑制,在耐旱番茄品种中,ADK基因(SGN-U232826)的表达受到干旱胁迫的诱导[18]。目前,已在拟南芥、番茄和水稻中分别鉴定到7、10 和11 个ADK基因,不同成员间的亚细胞定位,表达模式存在差异,具体的生理功能还需进一步研究[19-20]。虽然ADK基因在生物体能量代谢中发挥重要功能,但是在豆科牧草中的研究尚未见报道。
紫花苜蓿(Medicago sativa)是奶牛等草食动物的重要优质饲草,素有“牧草之王”的美誉[21]。近年来,国家实施振兴奶业苜蓿发展行动,有力促进了苜蓿产业的发展。尽管已在其他植物中鉴定、分析了ADK基因家族,但是紫花苜蓿ADK基因的功能仍有待进一步阐明。在本研究中,利用生物信息学方法从紫花苜蓿基因组中鉴定了ADK基因,并分析了序列特征、基因结构、染色体定位、进化关系、顺式作用元件,以及ADK基因在不同组织和非生物胁迫下[干旱、低温、盐和脱落酸(abscisic acid,ABA)]的表达模式。研究结果将为进一步研究MsADK家族的功能和调控机制提供有用信息。
紫花苜蓿基因组序列、蛋白质序列、CDS 序列,以及gff 文件下载自figshare 数据库(https://figshare.com/projects/whole_genome_sequencing_and_assembly_of_Medicago_sativa/66380)。ADK 蛋白的保守结构域序列(PF00406)下载自pfam 数据库(http://pfam.xfam.org/),在bio-linux 系统下通过“Hmmsearch”命令鉴定紫花苜蓿ADK家族成员,并在CDD 数据库(https://www.ncbi.nlm.nih.gov/cdd/)进一步验证是否含有ADK 蛋白的保守结构域。最后,利用CD-HIT(http://weizhong-lab.ucsd.edu/cd-hit/)软件去除冗余序列,序列特征参数为98%。
利用在线工具ProtParam (https://web.expasy.org/protparam/)预测MsADK 蛋白质的氨基酸数、分子量、等电点、疏水性指数、稳定指数等理化性质。在WoLF PSORT II 网站(https://www.genscript.com/wolfpsort.html)预测MsADK 蛋白成员的亚细胞定位。通过在线工具SOMPA (https://prabi.ibcp.fr/htm/site/web/home)预测MsADK 蛋白质二级结构,SWISS-MODE(https://swissmodel.expasy.org/)预测MsADK 蛋白质三级结构。
利用MEGA 7 软件构建34 个ADK 蛋白序列的系统进化树,包括紫花苜蓿(10 个MsADK)、拟南芥(7 个AtADK)、蒺 藜 苜 蓿(Medicago truncatula,7 个MtADK)和水稻(10 个OsADK)。采用最大似然法(maximum likelihood estimate, MLE),步长值(bootstrap values)为1 000 次,其他参数设置默认。
GSDS 2. 0 (http://gsds.gao-lab.org/index.php)工具用于分析MsADK成员的基因结构。MEME (https://meme-suite.org/meme/tools/meme)用于预测蛋白的保守基序,保守基序数为10,其他参数默认。PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)工具用于启动子序列(2.0 kb)顺式作用原件分析,并通过TBtools 工具进行可视化分析[22]。
在Phytozome 13 (https://phytozome-next.jgi.doe.gov/)网站分别下载拟南芥、蒺藜苜蓿以及大豆的全基因组序列和gff 文件,利用TBtools 工具对MsADK基因成员进行共线性、基因重复事件和染色体定位分析,并实现结果的可视化。
利用BLAST 比对工具在Alfalfa Breeder’s Toolbox(https://www.alfalfatoolbox.org/)数据库鉴定MsADK最匹配的转录本序列,得到MsADK基因分别在紫花苜蓿和黄花苜蓿中不同组织的表达量[23]。通过本地BLAST 程序检索紫花苜蓿‘中苜1 号’的转录本序列,获取MsADK基因分别在干旱、低温、ABA 以及盐胁迫下的表达模式[24-26],并利用TBtools 工具绘制热图。
紫花苜蓿基因组中共鉴定到10 个MsADK基因,并按照染色体上排序命名为MsADK1-MsADK10(表1)。MsADK 蛋白的平均长度为273.4 aa,其中MsADK2 最长(504 aa),其余序列的长度均在250 aa 左右。MsADK 蛋白的平均分子量30.5 kDa,其中MsADK2 的分子量最大为56.8 kDa,其余蛋白均小于31 kDa;蛋白质理论等电点介于5.46 (MsADK10)~9.33 (MsADK8)。MsADK 蛋白的疏水性指数(GRAVY)的平均值为-0.31,均小于0,表明MsADK 为亲水性蛋白。亚细胞定位预测表明,MsADK2、MsADK5、MsADK9 和MsADK10 定 位 于 细 胞 质;MsADK1 和MsADK3 定位于叶绿体;MsADK7 和MsADK8 定位于线粒体;MsADK4 定位于过氧化体;MsADK6定位于细胞核。除MsADK9 (Ⅱ = 35.91)蛋白的稳定指数小于40,表现为蛋白稳定外,其余MsADK蛋白均表现为不稳定。与拟南芥基因组序列进行BLAST 比对,结果表明,MsADK包含了拟南芥中全部的ADK同源基因。
表1 紫花苜蓿ADK 基因家族信息Table 1 Information of ADK gene family in Medicago sativa
MsADK与拟南芥(双子叶)、水稻(单子叶)、蒺藜苜蓿(豆科)ADK的进化关系表明,10 个MsADK被划分为5 个(Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ)亚家族(图1)。每个亚家族均包含上述4 个物种的ADK成员,表明ADK在不同物种间高度保守,在单双子叶物种分离前就已存在。MsADK 蛋白与蒺藜苜蓿ADK 蛋白高度同源,拟南芥次之,水稻最远。紫花苜蓿MsADK数目大于蒺藜苜蓿,其中MsADK6和MsADK10被划分为单独的分枝,说明ADK在紫花苜蓿中更为复杂。在Ⅰ亚家族中包含MsADK1、MsADK7和MsADK8;在Ⅱ亚家族中包含MsADK2和MsADK5两个成员;在Ⅲ亚家族中仅有MsADK9;在Ⅳ亚家族中包含MsADK3、MsADK4和MsADK10;在Ⅴ亚家族中包含MsADK6一个成员。
图1 紫花苜蓿、蒺藜苜蓿、拟南芥和水稻ADK 蛋白的系统进化分析Figure 1 Phylogenetic tree of ADK genes from Medicago sativa, M. truncatula, Arabidopsis thaliana, and Oryza sativa
依据MsADK基因的进化距离进行基因结构和保守基序分析(图2),结果表明,MsADK 蛋白的10 个基序(Motif 1~Motif 10)在不同亚家族中分布具有差异,每个基因都含有4~7 个保守基序不等。MsADK 蛋白均含有Motif 1 和Motif 3 两个基序,表明这两个基序是MsADK家族的核心组成。Motif 4 和Motif 7 仅 在Ⅰ和Ⅴ亚 家 族 中 存 在;Motif 9 仅在Ⅱ和Ⅲ亚家族中存在;Motif 8 仅在Ⅳ和Ⅴ亚家族中存在;不同亚家族特定的基序可能决定了MsADK基因的功能多样性。MsADK基因的外显子-内含子结构图表明(图2B),各成员间外显子数目4~18 个,以3~6 个居多(60%),MsADK2基因序列最长,含外显子数目最多为18 个。
图2 MsADK 基因家族的保守基序(A)及基因结构分析(B)Figure 2 Analysis of conserved motifs (A) and gene structure (B) of MsADK genes
对10 个MsADK基因进行染色体定位分析,家族成员随机的分布在32 条同源染色体中的7 条上(图3)。大多数MsADK基因位于染色体的近端或远端,chr4.4、chr7.1 和chr8.3 染色体上均有两个MsADK基因;chr1.4、chr2.2、chr4.3 和chr7.3 染色体上均只有1 个MsADK基因。对MsADK基因进行共线性分析,基因对MsADK1/MsADK7、MsADK3/MsADK4和MsADK7/MsADK8之间存在共线性关系,并被划分到同一亚类,推断上述3 对基因是经过全基因组复制而形成的。
图3 MsADK 基因的染色体上的分布Figure 3 Chromosomal location of MsADK genes
为了进一步推断ADK基因成员的系统发育机制,分别构建了MsADK基因与拟南芥、水稻、蒺藜苜蓿和大豆4 个代表性物种的比较共线性图谱,其中MsADK基因和水稻基因间不存在共线性关系(图4)。紫花苜蓿和大豆,蒺藜苜蓿都属于豆科植物,同源性更近。MsADK基因与21 个大豆间存在共线性关系(MsADK7/Glyma.03G176800/Glyma.10G048200/Glyma.13G136000/Glyma.19G177500、 MsADK1/Glyma.10G0 48200/Glyma.03G176800/Glyma.13G136000/Glyma.19 G177500、 MsADK3/Glyma.12G004200/Glyma.09G232 300、 MsADK6/Glyma.19G088000/Glyma.16G059400、MsADK8/Glyma.10G048200/Glyma.03G176800/Glyma.13G136000/Glyma.19G177500、MsADK4/Glyma.09G23 2300/Glyma.12G004200、 MsADK2/Glyma.15G203100/Glyma.09G096800、MsADK5/Glyma.09G234300);10 个MsADK基因与蒺藜苜蓿间存在共线性关系(MsADK7/Medtr7g100530/Medtr1g067050、 MsADK1/Medtr7g100 530/Medtr1g067050、 MsADK3/Medtr4g035850、 MsAD K8/Medtr7g100530/Medtr1g067050、 MsADK4/Medtr4g 035850、MsADK2/Medtr2g461290、和MsADK5/Medtr4g 035170);5 个MsADK基因与拟南芥基因存在共线性关 系 (MsADK1/AT2G37250/AT2G37250、 MsADK6/AT3G01820、 MsADK8/AT2G37250、 MsADK7/AT2G3 7250)。
图4 紫花苜蓿与拟南芥、大豆、蒺藜苜蓿和水稻之间ADK 基因的共线性分析Figure 4 Synteny analysis of MsADK genes with Arabidopsis thaliana, Glycine max,Medicago sativa, and Oryza sativa species
MsADK基因顺式作用元件预测分析结果显示(图5),上游2.0 kb 的启动子序列中含有大量与激素和生长发育(如植物激素、非生物胁迫、光照、生理生长等)有关的作用元件,但是成员间含有的顺式元件的类型和数量均有所差异。其中MsADK1和MsADK6所含元件种类最多为10 种。所有MsADK家族成员的启动子序列中都含有与植物激素相关的元件,如MsADK1、MsADK2、MsADK6、MsADK7、MsADK8含有生长素(TGA-element、TGA-box)响应元件;MsADK2、MsADK3、MsADK4、MsADK5、MsADK6、MsADK7、MsADK8含 有 赤 霉 素(P-box、TATC-box、GARE-motif)响应元件;MsADK1、MsADK3、MsADK4、MsADK5、MsADK7、MsADK8、MsADK9含有脱落酸(abscisic acid responsiveness, ABRE)响 应 元 件;MsADK1、MsADK3、MsADK4、MsADK6含有水杨酸(salicylic acid responsiveness,SARE 和TCA-element)响应元件;MsADK1、MsADK2、MsADK3、MsADK5、MsADK6、MsADK10含 有 茉 莉 酸(CGTCA-motif 和TGACG-motif)响应元件。响应胁迫相关作用元件在MsADK家族中同样分布比较广泛,所有基因均含有厌氧诱导元件(anaerobic induction,ARE)和光响应元件(AAAC-motif、ACE、AE-box、AT1-motif、ATC-motif、 ATCT-motif、 Box 4、 chs-CMA1a、 chs-CMA2a、 GA-motif、 Gap-box、 GATA-motif、 G-box、GT1-motif、 GTGGC-motif、 I-box、 LAMP-element、MRE、TCCC-motif、TCT-motif),MsADK6、MsADK9、MsADK10含有防御与应激响应元件(TC-rich repeats),MsADK1、MsADK2、MsADK3、MsADK4、MsADK9、MsADK10含有干旱诱导元件(MYB binding site involved in drought-inducibility, MBS);MsADK1、MsADK2、MsADK4、MsADK6含 有 低 温 响 应 元 件(low temperature responsiveness,LTR);此外,启动子区域还有与生长发育和合成代谢相关的作用元件,如昼夜节律调控(Circadian)、黄酮生物合成(MYB binding site involved in flavonoid biosynthesis,MBSI)、分生组织表达(GCN4_motif)和根特异性(Motif I)等,表明MsADK同样在紫花苜蓿的生长发育过程中发挥重要功能。
图5 MsADK 基因的启动子序列顺式作用元件分析Figure 5 The promoter cis-acting analysis of MsADK genes
蛋白质结构的变化将会直接影响其功能的改变,SOMPA 预测结果显示,MsADK 蛋白的蛋白二级结构以α-螺旋和无规则卷曲为主,β-转角和延伸链所占比例较低。蛋白质的α-螺旋占37.40%~53.72%,平均值为46.43%;无规则卷曲占27.35%~45.93%, 平 均 值 为33.89%; 延 伸 链 占10.71%~12.98%,平均值为11.84%;β-转角绝大多数低于10%,介于5.69%~10.29%,平均值为8.24% (表2)。推测MsADK 蛋白序列的二级结构中,α-螺旋和无规则卷曲起主要作用。
表2 MsADK 蛋白二级结构Table 2 Secondary structure of MsADK proteins
研究表明,不同种属ADK 蛋白的三维结构具有相同的,由α/β 折叠构成的“三明治”状结构。利用SWISS-MODEL 在线工具预测MsADK 蛋白的三级结构,MsADK 蛋白都含有α-螺旋、β-折叠、无规则卷曲等空间构象,MsADK6 和MsADK7 构象最为接近,其余同成员间结构具有差异性(图6)。另外,各MsADK 成员含有的螺旋-转角-螺旋(HTH)数目存在差异。
图6 MsADK 蛋白三级结构Figure 6 Tertiary structure of MsADK proteins
分析了MsADK基因在紫花苜蓿和黄花苜蓿不同组织中的表达量,MsADK基因在两个品种间具有相同的表达模式(图7)。MsADK1、MsADK3、MsADK7基因在不同组织间的表达量一致。MsADK5、MsADK8、MsADK9 基因在所有组织中均有较高的表达水平,尤其在根瘤中高表达。MsADK2的表达具有组织特异性,在根瘤和根中均不表达,而在叶片中的表达量最高。同样,MsADK6在地上组织中的表达量要显著的高于地下组织。MsADK4和MsADK10则在茎中的表达量高于其他组织。表明MsADK基因在调节紫花苜蓿生长发育中发挥不同的作用。
图7 MsADK 基因在紫花苜蓿和黄花苜蓿不同组织中的表达模式Figure 7 Expression profile of MsADK genes bewteen Medicago sativa spp. sativa and M. sativa spp. falcata
为了进一步解析MsADK基因在不同非生物胁迫的潜在功能,分析了它们分别在ABA、干旱、低温和盐胁迫下的转录表达谱(图8)。用ABA 处理紫花苜蓿3 h 后,除MsADK1和MsADK8在12 h 表达量增加,剩余MsADKs基因的表达量在各处理时间段均明显下调。同样,在干旱和盐胁迫下,MsADK4、MsADK6、MsADK7、MsADK9和MADKs10的表达在处理早期(干旱胁迫:1~6 h;盐胁迫:0.5~1 h)和对照保持相对一致的表达量,但随着处理时间的延长,上述5 个基因明显下调。在两种渗透胁迫下,MsADK1、MsADK3和MsADK8随着处理时间的增加,均出现了不同程度的上调表达,其中MsADK1和MsADK8对胁迫的反应更为敏感。值得注意的是,低温胁迫下MsADK基因表现出了不同于其他非生物胁迫的表达模式,除了MsADK2、MsADK5下调表达外,其余基因从6 h 开始,出现不同程度的上调表达。
图8 紫花苜蓿ADK 基因分别在不同非生物胁迫下的表达模式Figure 8 Expression profile of MsADK genes under different abiotic stresses
腺苷酸类化合物在生物体内的含量变化被认为是引起细胞能量代谢的主要因素,其中腺苷酸激酶是生成ADP 和平衡磷酸化反应的关键酶,在细胞质、线粒体和叶绿体等细胞器中均有分布[20,27]。研究表明ADK基因的转录表达,将直接影响腺苷代谢库容大小。目前已从大豆、甘薯(Dioscorea esculenta)、番茄等多种植物种中克隆了ADK基因。然而,尚未在紫花苜蓿中对ADK基因家族进行全基因组水平的鉴定与分析。在紫花苜蓿、拟南芥、水稻、蒺藜苜蓿、番茄和马铃薯中分别鉴定到10、7、10、7、11 和12 个ADK基因,不同物种间ADK基因的数目接近,表明ADK基因在物种间高度保守,与物种基因组大小无关。用拟南芥、水稻、蒺藜苜蓿和紫花苜蓿的ADK 蛋白构建系统进化树,将34 个ADK 蛋白划分为5 个亚家族,每个亚家族均包含了上述4 个物种的ADK 蛋白。蒺藜苜蓿和紫花苜蓿间表现出了高度的同源性,且每个紫花苜蓿的ADK蛋白都有一个高度同源的蒺藜苜蓿蛋白。此外,单双子叶植物间无明显的分离,表明ADK 蛋白在单双子叶植物分化之前就已存在。紫花苜蓿MsADK基因的亚细胞定位多样,在叶绿体、线粒体、细胞质、细胞核等细胞器中均有分布,主要位于细胞质中(40%),与番茄和木薯(Manihot esculenta)中主要定位于线粒体中的研究结果不同[14,20]。基 序 分 析 显 示Motif 1 和Motif 3 在 所 有MsADK 蛋白序列中都含有,但是不同亚家族成员间含有特异的基序。同样,聚类到相同亚家族成员的外显子数目接近,推测MsADK成员间可能存在功能差异。
非生物胁迫是影响全球农作物产量的主要原因,每年约有50%的作物减产是由非生物胁迫造成的。ADK除了直接影响能量代谢外,还影响植物的其他方面,包括生长、发育、开花、抗逆等[11,27]。研究表明ADK基因的下调将会导致腺苷酸库积累增加,进而影响亚细胞的氧化还原状态,并刺激AGPase (淀粉合成的关键酶)的二硫键断裂,将其从非活性形式转化为活性形式[28-29]。拟南芥细胞核定位的AAK6基因调控茎的生长速度[11];马铃薯质体中的ADK基因下调表达,使淀粉的积累量增加60%[14]。紫花苜蓿MsADK基因在不同组织中均有表达,茎中的表达量普遍高于其他组织,其中MsADK5、MsADK8和MsADK9在根瘤中高度表达,表明MsADK基因在调控紫花苜蓿地上和地下组织的生长发育中均发挥重要功能。
通过分析ADK在干旱、盐、ABA 和低温胁迫下的表达模式,MsADK1和MsADK8在所有非生物胁迫下具有明显的上调表达外,多数MsADK基因在干旱、盐和ABA 胁迫下与低温胁迫呈现相反的表达模式,如MsADK4,MsADK7,MsADK9和MsADK10等在干旱、盐和ABA 胁迫中下调表达,但是在低温胁迫下上调表达。MsADK基因与大豆间的共线性关系最强,有研究分析了耐盐(南农1138-2)和盐敏感(科丰1 号)品种在盐胁迫下GmADK基因的表达模式,结果表明GmADK基因在盐敏感品种中表达量降低,而在耐盐品种中升高[17]。在番茄的研究中表明,大多数SlADK基因受干旱诱导上调表达[20]。非生物胁迫下,ADK基因在不同物种间的表达模式存在差异,具有正向和负向两种调控机制,推测可能与选择的研究材料和胁迫类型有关,精确的调控机理还有待进一步深入研究。
本研究在全基因组水平鉴定了紫花苜蓿ADK基因家族,并对其理化性质、基因结构、进化关系、顺式作用元件等进行分析。在此基础上,对其不同组织和不同非生物胁迫下的表达模式进行分析,在不同胁迫类型下ADK基因表现出正、负两种调控机制。MsADK基因在进化过程中高度保守性,参与调控紫花苜蓿生长发育和逆境胁迫响应,本研究对于MsADK成员功能验证,将为紫花苜蓿基于基因工程的遗传改良提供一定基础。