杨森要 张修月 毛文文 戴 晋 高 杉 王 丹 刘勇鹏 胡建斌 李丽丽*
(1 河南省漯河市农业科学院,河南漯河 462000;2 河南农业大学园艺学院,河南省果树瓜类生物学重点实验室,河南郑州 450002)
热激蛋白(heat shock proteins,HSPs)是一种古老的、高度保守的分子伴侣,广泛存在于原核和真核生物体中(Sun et al.,2002)。当生物体受到高温、干旱、重金属和高盐等胁迫时,HSPs可以通过稳定细胞结构、运输和折叠辅助蛋白来维持细胞功能从而提高生物体对胁迫的适应能力(Tyedmers et al.,2010;Yadav et al.,2021)。 根据氨基酸序列同源性和分子量,热激蛋白可分为5类,分别是HSP100、HSP90、HSP70、HSP60 和HSP20 家族(Waters,2013)。HSP20s 也被称为小热激蛋白,是植物HSPs 中最普遍、最丰富的蛋白质,分子量在15~42 kDa 之间(Ji et al.,2019)。HSP20s 含有保守的α-晶体蛋白结构域(ACD),该结构域由约90 个氨基酸组成,包含多个β-链结构和2 个保守区:位于N-端的保守结构域Ⅰ(CR Ⅰ)和位于C-端的保守结构域Ⅱ(CR Ⅱ)(Bondino et al.,2012;Lin et al.,2019)。研究表明,HSP20s 参与植物的发育过程和非生物胁迫,如高温、高盐和干旱等。在高温和高盐胁迫下,过表达OsHSP20的转基因水稻发芽率和根长都高于对照植株(Guo et al.,2020)。在拟南芥中过表达PtHSP17.8可增强其对高温和盐胁迫的耐受性,转基因拟南芥的幼苗存活率、根长、相对含水量、抗氧化酶活性、脯氨酸和可溶性糖含量都有所提高(Li et al.,2016)。sHSP22与生长素的极性运输有关,并在高温胁迫下参与生长素调节的下胚轴伸长(Li et al.,2018)。CaHSP16.4通过增强植物清除活性氧的能力来提升辣椒对高温和干旱的耐受性(Huang et al.,2019)。
随着高通量测序和生物信息学的快速发展,HSP20基因家族在拟南芥(Scharf et al.,2001)、番茄(Yu et al.,2016)、 水稻(Ouyang et al.,2009)、 黄瓜(Huang et al.,2022)、 西瓜(He et al.,2018)、南瓜(Hu et al.,2021)等多个作物中已被鉴定。甜瓜(CucumismeloL.)是重要的园艺作物,其栽培面积和产量在世界范围内稳中有升,但各种不利的栽培环境因素导致了甜瓜产量和品质的下降。在拟南芥和水稻等作物中研究发现,HSP20 蛋白在多种生物和非生物胁迫中发挥着重要作用(Li et al.,2016;Guo et al.,2020),然而尚未对甜瓜HSP20基因家族进行系统地研究。本试验基于甜瓜基因组信息,通过生物信息学手段,鉴定了甜瓜HSP20基因家族,并对其染色体分布、基因结构、系统发育关系和亲缘关系进行了详细分析,以期为深入研究甜瓜HSP20基因家族功能和在响应逆境胁迫中的作用提供基础信息。
2023年3-6月,从葫芦科基因组数据库(http://cucurbitgenomics.org/)下载甜瓜全基因组数据和西瓜、黄瓜、南瓜HSP20基因家族的蛋白序列。分别从拟南芥数据库(https://www.arabidopsis.org/index.jsp) 和番茄基因组数据库(https://solgenomics.net/)下载拟南芥和番茄HSP20基因家族的蛋白序列。利用下载的HSP20基因家族序列对甜瓜的蛋白序列进行本地BLASTP 比对(E-value<1e-5),获得候选蛋白序列。根据Pfam数据库(http://pfam.xfam.org/)获得HSP20 蛋白的隐马尔可夫模型(Pf00011),通过HMMER 软件包的hmmsearch 程序筛选甜瓜蛋白数据库得到候选蛋白序列。将两种方法获得的候选蛋白序列提交Pfam 数据库和NCBI 数据库进行结构域鉴定,利用ExPASy(http://web.expasy.org/compute_pi)计算候选蛋白序列的分子量等生化属性。通过Wolf Psort网站(https://www.genscript.com/wolf-psort.html)进行亚细胞定位预测。
通过TBtools(Chen et al.,2020)软件将鉴定到的CmHSP20s基因染色体位置显示出来,利用MCScanX 软件对甜瓜、黄瓜、西瓜和南瓜之间的HSP20基因家族进行共线性鉴定,并通过TBtools进行可视化。
利用MEME 在线软件(https://meme-suite.org/meme/tools/meme)预测甜瓜HSP20 家族蛋白的保守基序,最大Motif 设置为10,其余参数默认。使用MEGAⅩ软件中的MUSCLE 程序进行多序列比对,采用邻接法(Neighbor-joining Tree)构建进化树,bootstrap 设置为1 000(司修洋 等,2020)。将通过TBtools 提取的基因上游2 000 bp 序列提交PlantCARE(https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)进行顺式作用元件分析。
以拟南芥、番茄、黄瓜、西瓜和南瓜HSP20蛋白序列为参考,本地BLASTP 比对得到43 个候选蛋白。HMM 搜索甜瓜蛋白数据库得到33 个候选蛋白,2 次结果合并共得到45 个候选蛋白。通常认为功能结构域决定了蛋白功能的发挥,将含有完整α-晶体蛋白结构域(ACD)的基因保留,最终得到42 个CmHSP20s基因,并根据其在染色体上的位置信息进行编号命名(表1)。甜瓜HSP20基因家族编码氨基酸长度为71(CmHSP20-36)~510(CmHSP20-18)aa;理论等电点(PI)为4.43(CmHSP20-40)~9.72(CmHSP20-35);分子量范围 在8 390.40(CmHSP20-36)~57 350.14(CmHSP20-37)Da 之间;蛋白亲水性指数均为负值,表明CmHSP20s基因均编码疏水性蛋白;亚细胞定位预测显示17 个CmHSP20s基因(40.48%)定位于细胞质,13 个CmHSP20s基因(30.95%)定位在叶绿体,另外12个CmHSP20s基因(28.57%)定位于细胞核。
42 个CmHSP20s基因不均匀地分布在甜瓜12条染色体上(图1)。每条染色体上分布数量为1~7个,6号和10号染色体上分布最多(7 个),11号染色体上分布最少(1 个);大多数CmHSP20s基因分布于染色体两端,这与基因密度的分布相似。对CmHSP20s进行串联重复分析显示,6号、7号和10号染色体上分别存在1 个串联复制基因对(CmHSP20-19/CmHSP20-20、CmHSP20-21/CmHSP20-22和CmHSP20-30/CmHSP20-31),12号染色体上包含2 个串联复制基因对(CmHSP20-38/CmHSP20-39和CmHSP20-38/CmHSP20-40)。
图1 甜瓜HSP20 基因家族的染色体分布
为进一步分析葫芦科HSP20基因家族的系统发育机制,分别构建了甜瓜与黄瓜、西瓜、南瓜的共线性图谱。结果表明(图2),32 个CmHSP20s基因与黄瓜、西瓜和南瓜中的基因存在共线性关系。其中,30 个CmHSP20s基因与黄瓜中的46 个基因存在共线性(图2-A),29 个CmHSP20s基因与西瓜中的48 个基因存在共线性(图2-B),26个CmHSP20s基因与南瓜中的53 个基因存在共线性(图2-C)。另外,CmHSP20-3和CmHSP20-15只与黄瓜中的基因有共线性关系,CmHSP20-29只与南瓜中的基因有共线性关系。然而,还有10 个CmHSP20s基 因(CmHSP20-4、CmHSP20-13、CmHSP20-20、CmHSP20-22、CmHSP20-23、CmHSP20-31、CmHSP20-33、CmHSP20-35、CmHSP20-36、CmHSP20-38) 与黄瓜、 西瓜、南瓜中的基因均无共线性关系,表明它们是甜瓜HSP20基因家族中的保守成员。
图2 甜瓜与黄瓜(A)、西瓜(B)、南瓜(C)HSP20 基因家族的共线性关系
为了进一步探究甜瓜HSP20基因家族的同源进化关系,利用拟南芥、番茄和甜瓜HSP20家族成员的蛋白序列构建进化树。由图3 可知,103 个HSP20家族成员(拟南芥19 个,番茄42 个,甜瓜42 个)被分为5 个类群(Ⅰ~Ⅴ)。其中,Ⅰ类群包含1 个CmHSP20和4 个SlHSP20s;Ⅱ类群包含10 个CmHSP20s、5 个SlHSP20s和1 个AtHSP20;Ⅲ类群包含6 个CmHSP20s和8 个SlHSP20s;Ⅳ类群包含7 个CmHSP20s、7 个SlHSP20s和7 个AtHSP20s;Ⅴ类群最大,包含18 个CmHSP20s、18 个SlHSP20s和11 个AtHSP20s。且系统进化树显示,甜瓜与拟南芥存在2 对直系同源基因对,与番茄存在7 对直系同源基因对;甜瓜HSP20家族成员共形成8 对旁系同源基因对。以上结果表明,甜瓜HSP20家族成员与番茄HSP20家族成员具有较近的亲缘关系,且甜瓜HSP20家族成员在进化过程中发生了多次基因复制事件。
图3 甜瓜、拟南芥和番茄HSP20 基因家族进化分析
甜瓜HSP20家族成员基因结构存在较大差异,外显子数量1~12 个,内含子数量0~12 个(图4)。其中,除CmHSP20-11和CmHSP20-18含有2 个以上内含子外,其余CmHSP20s基因内含子数量为0~2 个(图4-C)。分析甜瓜HSP20家族成员保守基序,共鉴定到10 个保守基序,宽度为8~50 个氨基酸,其中Motif 7 宽度为8 个氨基酸,Motif 5 和Motif 6 宽度为50 个氨基酸(图4-B,表2)。Motif 1(81.0%)和Motif 2(90.5%)在甜瓜HSP20家族成员中出现频次较高,经Pfma比对发现这2 个Motif 对应于ACD 结构域,可能在甜瓜热激反应中发挥重要作用。
图4 甜瓜HSP20 基因家族的聚类分析(A)、保守基序预测(B)和基因结构(C)
对42 个CmHSP20s基因上游2 000 bp 区域进行顺式元件预测,共鉴定到4 类顺式作用元件,包括激素响应、应激响应、植物发育和光响应元件(图5)。所有甜瓜HSP20家族成员启动子均含有大量光响应元件,大多数成员启动子包含激素响应(ABRE、CGTCA-motif、TGACG-motif 和TCAelement)和应激响应(ARE、LTR、TC-rich repeats和MBS)相关顺式作用元件,说明甜瓜HSP20基因家族可能参与调控植物响应光周期和非生物逆境等。此外,部分CmHSP20s基因启动子包含1~4个植物发育相关顺式作用元件,可能参与植物生长发育的调控。
图5 甜瓜HSP20 基因家族启动子区域的顺式作用元件
热激蛋白不仅在植物生长发育中发挥着至关重要的作用,而且在调节多种形式的细胞应激反应中也发挥着重要作用(Neto et al.,2020)。HSP20s广泛存在于植物中,并在环境胁迫下快速合成并参与应激反应(Wang et al.,2004)。目前,在多个物种中已完成HSP20基因家族的鉴定,如拟南芥(19 个)(Scharf et al.,2001)、水稻(39 个)(Ouyang et al.,2009)、番茄(42 个)(Yu et al.,2016)、苹果(41 个)(Yao et al.,2020)、桃(42个)(Lian et al.,2022)、 黄瓜(30 个)(Huang et al.,2022)、西瓜(44 个)(He et al.,2018)和南瓜(33 个)(Hu et al.,2021)。本试验从甜瓜基因组数据中鉴定出42 个CmHSP20s家族成员,在葫芦科作物中仅次于西瓜的44 个,明显多于黄瓜和南瓜,这表明基因组的大小与HSP20家族成员的数量无关;大部分CmHSP20s基因分布于染色体两端,与黄瓜、西瓜和南瓜HSP20基因家族在染色体上的分布不同,这可能有助于甜瓜HSP20基因家族重复事件的发生,本试验鉴定到的5 对串联复制基因对均位于染色体两端。
基因结构分析表明,大多数CmHSP20s基因没有内含子(40.5%)或者只有1 个内含子(45.2%),基因结构相对简单。同样,大多数黄瓜(93.3%)、西瓜(93.2%) 和南瓜(90.9%)HSP20s基因没有内含子或者只有1 个内含子,这可能有利于HSP20s基因可以被各种应激反应所快速激活(Bahler et al.,2008)。此外,研究发现含有少量或没有内含子的基因往往在植物中具有较高的表达水平(Chung et al.,2006)。保守基序研究表明,64.3%的CmHSP20s基因具有3 个以上的Motif,对应于ACD 结构域的Motif 1 和Motif 2 出现在大多数CmHSP20s基因中。此外,还发现位于同一亚群的CmHSP20s基因具有相似的保守基序和基因结构,这与它们的进化关系和亚群分类结果一致。
在甜瓜HSP20家族成员启动子区域鉴定到大量激素响应、应激响应、植物发育和光响应相关的顺式作用元件,表明甜瓜HSP20基因家族可能广泛参与调控植株生长发育与逆境响应。其中,所有CmHSP20s基因启动子均包含大量光响应元件,暗示了甜瓜HSP20基因家族在植株生长发育和光周期调控等方面可能发挥重要作用。有趣的是,甜瓜、黄瓜和南瓜HSP20s基因的启动子区域均未发现热响应元件,但黄瓜和南瓜的HSP20s基因能够响应热应激(Hu et al.,2021;Huang et al.,2022),据此推测甜瓜HSP20基因家族可能存在类似的功能,仍需进一步试验证明。植物激素是调节植物生长、发育和应激反应的关键信号化合物,研究发现生长素、脱落酸、赤霉素、油菜素甾醇和茉莉酸在植物热应激响应中发挥着重要作用(Waadt et al.,2022)。高温胁迫下,BR 信号通路中的关键转录因子BES1被激活,并直接与HSFs基因启动子上HSEs元件结合,诱导HSPs的表达(Albertos et al.,2022)。sHSP22 热激蛋白可被生长素诱导参与高温下拟南芥下胚轴的伸长(Li et al.,2018)。由此可见,植物激素与热激蛋白的表达密切相关。本试验通过分析CmHSP20s基因的启动子区域,发现了大量激素响应相关顺式作用元件,如ABRE、CGTCA-motif、TGACG-motif、TCA-element 等,这些元件是否参与以及如何参与甜瓜响应高温胁迫仍需进一步深入研究。