朱楚霞,廖伟民,刘建萍,胡朝阳,刘世强,周 勇
(江西农业大学 生物科学与工程学院/江西省农业微生物资源开发与利用工程实验室,江西 南昌 330045)
【研究意义】植物在自身生长以及适应环境的过程中,需要从外界摄取营养以及产生一系列的代谢物质,这些物质的运输需要多种转运蛋白共同完成。多药和有毒化合物排出(multidrug and toxic compound extrusion,MATE)转运蛋白广泛存在于动物、植物以及微生物中,参与各种外来营养物质和代谢物的运输。【前人研究进展】第一个MATE 蛋白于1998 年在副溶血弧菌中发现[1],随后在不同的动植物中也被陆续发现。但是动物中通常只含有少量的MATE成员,植物中MATE成员的数量则远多于其他生物[2-3]。迄今为止,已在水稻(Oryza sativa)[4]、玉米(Zea mays)[5]、拟南芥(Arabidopsis thaliana)[4,6]、大豆(Glycine max)[7]、蒺藜苜蓿(Medicago truncatula)[8]、番茄(Solanum lycopersicum)[9]、土豆(Solanum tuberosum)[10-11]、辣椒(Capsicum annuum)[10]、烟草(Nicotiana tabacum)[12]、陆地棉(Gossypium hirsutum)、雷蒙德氏棉(G.raimondii)和亚洲棉(G.arboreum)[13-15]等植物中对MATE基因家族进行了鉴定分析。这些结果发现植物MATE蛋白通常由400~700个氨基酸组成,普遍含有12个跨膜螺旋结构,少数含有8~13个跨膜结构[9]。【本研究切入点】大量研究结果表明:MATE 蛋白广泛参与植物器官发育、离子转运、次生代谢产物的转运和累积等过程。如拟南芥AtALF5 是第一个被发现的植物MATE 转运蛋白,主要在根中表达,参与拟南芥侧根的形成以及根系毒素的解毒过程[16]。AtDTX1 可将有毒物质(镉、黄连素、诺氟沙星等)外排,并参与细胞次级代谢产物的运输[17]。TRANSPARENT TESTA12(TT12)是第一个被发现可以运输黄酮的MATE蛋白,参与拟南芥种子液泡中花青素合成物质的转运,调控花青素的合成与积累[18]。拟南芥AtFRD3具有柠檬酸外排活性,对铁离子在花粉粒和胚胎中的运输调控有重要作用[19],还参与锌离子与锰离子的动态平衡[20]。水稻基因组中存在4个与拟南芥AtFRD3同源的基因,其中OsFRDL1在铁以铁-柠檬酸盐的形式向地上部有效运输过程中发挥重要作用。OsFRDL1的敲除突变不仅会造成叶片黄化,叶片中铁的含量降低[21],还会降低花粉活性和籽粒育性[22]。另外,一些来自不同物种的MATE 蛋白,如高粱SbMATE[23]、大麦HvAACT1[24],荞麦FeMATE1[25],野生大豆GsMATE[26],玉米ZmMATE1 和ZmMATE6 等[27],参与铝诱导的根系柠檬酸分泌,以此参与植物的铝解毒过程。此外,植物MATE蛋白还参与调控生长素[28]、脱落酸[29-30]、水杨酸[31-32]等介导的信号转导途径。【拟解决的关键问题】黄瓜作为全球广泛种植的瓜类蔬菜作物之一,因其口感清脆、营养丰富、热量低等特点深受消费者的喜爱。但是在黄瓜的生长发育过程中,极易受到根结线虫和白粉病等生物胁迫的危害,严重影响黄瓜的产量和品质。在本研究中,利用生物信息学方法对黄瓜MATE基因家族成员进行鉴定,并对它们的蛋白理化性质、系统发育、基因结构、组织与胁迫表达模式等进行分析,以期为挖掘黄瓜中重要的生物胁迫调控基因和探索MATE家族基因的具体功能提供理论基础。
在Pfam数据库(http://pfam.xfam.org/search#tabview=tab1)中下载MATE结构域(PF01553)的隐马尔科夫模型(Hidden Markov Model,HMM),利用HMMER3.0 软件搜索黄瓜全基因组蛋白序列,得到黄瓜MATE基因的候选蛋白,通过PFAM 和SMART(http://smart.embl-heidelberg.de)预测筛选具有MATE 结构域的蛋白即为黄瓜MATE家族成员。
在黄瓜基因组数据库(CuGenDB,http://cucurbitgenomics.org/organism/2)中查询黄瓜MATE基因家族的基因在染色体上的位置及长度,采用TBtools 软件绘制染色体定位图。此外,运用MCScanX 软件对黄瓜全基因组进行共线性分析,确定黄瓜物种全基因组的共线性区域,从其中筛选得到MATE 家族成员区域,最后利用TBtools软件绘制黄瓜MATE家族共线性基因的位置关系图。
在黄瓜全基因组数据库中下载MATE 家族成员的gDNA 序列、编码序列(CDS 序列)、以及编码的蛋白序列。通过Expasy 在线分析软件中的ProtParam 工具(https://web.expasy.org/protparam/)预测黄瓜MATE 家族成员蛋白质的氨基酸长度(amino acids length)、相对分子量(molecular weight,MW)、等电点(isoelectric point,pI)以及总平均亲水值(grand average of hydropathicity,GRAVY)。利用Plant-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)网站预测黄瓜MATE蛋白的亚细胞定位。
在MAFFT 在线软件(https://www.ebi.ac.uk/Tools/msa/mafft/)中提交黄瓜MATE 蛋白序列,采用默认参数进行比对,将比对结果导入MEGA7.0 中进行系统发育树的构建。在MEME 网站(https://meme-suite.org/meme/tools/meme)提交黄瓜MATE 蛋白序列,运行默认参数,将最大基序数目设置为10,分析保守基序的分布。
在黄瓜基因组数据库下载黄瓜基因序列信息,利用TBtools 软件将基因结构的结果可视化[33]。利用TBtools软件提取黄瓜MATE基因起始密码子上游2.0 kb的DNA序列,并提交至PlantCARE 数据库(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)中,分析黄瓜MATE家族基因启动子区域内与生长发育、激素响应以及胁迫响应相关的顺式作用元件。
从NCBI 数据库中下载黄瓜组织(根、茎、叶、雄花、雌花、子房和卷须等,编号为PRJNA80169)[34]、华北型黄瓜(Chinese Long)南方根结线虫高感和野生角瓜(Cucumis metuliferus),南方根结线虫高抗,接种南方根结线虫(Meloidogyne incognita)3 d(编号为PRJNA707668)[35]、以及D8(高感白粉病受体亲本)和SSL508-28(高抗白粉病且能稳定遗传的片段代换系)接种白粉病菌(Sphaerotheca fuliginea)48 h(编号为GSE81234)[36]的转录组数据,分析黄瓜MATE基因的组织和胁迫表达模式。根据之前的文献方法,将基因表达数据以log(2TPM+1)值表示[37],然后利用TBtools软件绘制基因表达热图。
通过HMMER3.0 软件以及功能域分析验证得到47 个黄瓜MATE家族基因,并根据其在染色体上的位置分布,将它们命名为CsMATE1~CsMATE47(表1),它们在黄瓜7条染色体上分布不均(图1)。其中黄瓜第1号染色体上分布的MATE基因最多,数量为10个,第3、4、6号染色体上分布的基因较少,分别为5、4、5个,第2条染色体上有7个,第7号染色体上有8个MATE基因。
表1 黄瓜MATE家族成员信息Tab.1 The information of MATE family members in cucumber
续表Continued tab.
为了进一步了解MATE基因家族成员中的复制关系,利用MCscanX 软件对黄瓜全基因组进行共线性分析。黄瓜基因组共线性结果分析可得,黄瓜MATE家族基因存在5 个片段重复(CsMATE4与Cs-MATE31、CsMATE10与CsMATE11、CsMATE16与CsMATE37、CsMATE18与CsMATE28、CsMATE21与Cs-MATE47)。此外,17个CsMATE基因存在串联复制事件,形成了6个基因簇(图1)。
图1 黄瓜MATE家族成员染色体定位分析Fig.1 Chromosome location analysis of MATE family members
黄瓜MATE家族蛋白理化性质结果表明,CsMATE 蛋白由129个(CsMATE20)~602(CsMATE40)个氨基酸残基组成,蛋白分子量在14.63(CsMATE20)~64.57 ku(CsMATE40)不等,等电点在4.7(CsMATE28)~9.42(CsMATE12)内广泛分布,根据蛋白亲疏水性分析可知CsMATE 蛋白的GRAVY 值全部为正数,表明CsMATE 蛋白全部为疏水蛋白。利用Plant-mPLoc 网站对黄瓜MATE 蛋白成员进行亚细胞定位预测,结果表明,大多数CsMATE 蛋白定位于细胞膜,少数CsMATE 蛋白定位于细胞膜和叶绿体(CsMATE4、Cs-MATE17、CsMATE43、CsMATE44),另外CsMATE28定位于细胞膜和细胞核。
为了解黄瓜MATE 家族蛋白的保守性,利用MEME 在线网站分析得到保守基序的分布。一共鉴定到了10 个保守基序,命名为motif 1~motif 10,其中motif 6、motif 2、motif 8、motif 5 位于CsMATE 蛋白的N端,而motif 9、motif 3、motif 4、motif 10、motif 1、motif 7 位于CsMATE 蛋白的C 端(图2)。结合进化分析结果,Group A、Group C和Group D的大多数成员含有motif 1~motif 10,而Group B的所有成员均只含有少量的保守基序。在Group A 中,CsMATE22、CsMATE46、CsMATE36、CsMATE29 不含motif 5;在Group D 中,CsMATE20 仅含3 个基序(motif 2、motif 5 和motif 8)。此外,CsMATE44 蛋白的N 端出现了一个motif 5 的复制,暗示CsMATE44 可能具有特殊的功能(图2)。Group B 中的所有成员含有的基序种类少,其中Cs-MATE15 和CsMATE25 仅含motif 6。Group C 中的CsMATE1 仅含有N 端的4 个保守基序(motif 6、motif 2、motif 8、motif 5),而CsMATE2、CsMATE12和CsMATE19则正好相反,只含有C端的保守基序(图2)。
图2 黄瓜MATE家族成员系统进化及蛋白质保守结构分析Fig.2 Phylogenetic relationship and conservative structure analysis of MATE family members in cucumber
从黄瓜基因组数据库下载黄瓜基因的序列信息,利用TBtools 对基因结构可视化。结果发现,除Cs-MATE10、CsMATE11、CsMATE18、CsMATE28、CsMATE29不含内含子外,其余CsMATE基因都含有1~14 个内含子(图3)。结合黄瓜MATE 蛋白进化分析,Group A 中具有较少的内含子(0~2 个),Group C 和Group D内含子分布较均匀(1~8个),Group B具有较多的内含子(2~14个),且亲缘关系较近的成员具有相似的基因结构。
图3 黄瓜MATE家族成员系统进化及基因结构分析Fig.3 Phylogenetic relationship and gene structure analysis of MATE family members in cucumber
为研究CsMATE基因的潜在的生物学功能,利用PlantCARE数据库分析CsMATE基因启动子序列,并筛选得到7 种、11种和13种分别与生长发育、激素响应以及胁迫响应相关的顺式作用元件(图4)。在生长发育顺式作用元件中,as-1 的数量明显多于其它的元件(其中CsMATE8含有4 个)。在胁迫响应元件中,MYB 和ARE 在CsMATE基因中出现频率最高,这表明CsMATE在抗旱和厌氧诱导中可能发挥重要作用。在激素响应元件中,ABRE、ERE、TCA-element、AuxRR-core 和TGA-element 以及TATC-box 等元件与ABA、乙烯、MeJA、水杨酸、生长素和赤霉素等激素反应密切相关,其中ARE和ERE广泛分布在较多的MATE成员中。这些结果表明,CsMATE基因可能参与黄瓜胁迫响应和激素应答过程。
图4 CsMATE基因启动子顺式作用元件分析Fig.4 Cis-regulatory elements analysis of CsMATE promoter regions
分析了CsMATE各成员在7 个不同组织(根、茎、叶、雄花、雌花、子房、卷须)的表达数据,结果表明:47 个CsMATE基因在至少一个组织均检测到表达(TPM 值>1,图5)。其中,一共有16 个基因(CsMATE3、CsMATE5、CsMATE6、CsMATE8、CsMATE13、CsMATE14、CsMATE15、CsMATE24、CsMATE25、CsMATE26、Cs-MATE33、CsMATE34、CsMATE36、CsMATE40、CsMATE45和CsMATE47等)在7 个组织中均检测到表达。一些CsMATE基因的表达量呈现明显的组织特异性。如CsMATE9仅在叶中有明显的表达,CsMATE35仅在雄花中检测到表达,而CsMATE10、CsMATE11、CsMATE18、CsMATE22、CsMATE28和CsMATE31在根中特异表达,表明它们与这些组织的发育密切相关。此外,一部分CsMATE基因,如CsMATE5、CsMATE7、CsMATE8、CsMATE15、CsMATE32、CsMATE35、CsMATE36、CsMATE39、CsMATE41和CsMATE44等,在雄花和雌花中的表达量存在明显的差异(图5)。值得注意的是,一些CsMATE基因在卷须中的表达量明显高于其它组织,如CsMATE5、CsMATE12、CsMATE16、CsMATE33、CsMATE41、CsMATE42和CsMATE44等,表明这些MATE基因可能参与黄瓜的卷须发育。
图5 黄瓜CsMATE基因组织表达谱Fig.5 Tissue expression profiles of cucumber CsMATE genes
根据前人关于黄瓜根结线虫和白粉病菌侵染下表达的转录组数据,得到黄瓜MATE基因在两种生物胁迫下的表达热图,如图6 所示。结果表明,在RKN 高感Q24(华北型黄瓜Chinese Long)中,CsMATE11、CsMATE30的表达量明显上升,而CsMATE16的表达量明显降低,其余基因的表达没有明显的差异(图6A)。而在RKN 高抗CM(野生角瓜Cucumis metuliferus)中,CsMATE6、CsMATE8、CsMATE10、Cs-MATE13、CsMATE15、CsMATE17、CsMATE18、CsMATE23、CsMATE26、CsMATE28、CsMATE31、CsMATE32、CsMATE33、CsMATE43和CsMATE45基因的表达量明显升高,CsMATE22和CsMATE47的表达量则明显降低(图6A)。
图6 黄瓜MATE基因在根结线虫(A)和白粉病处理(B)下的表达分析Fig.6 Expression analysis of cucumber MATE genes under root-knot nematode(RKN)(A)and powdery mildew infection(B)
白粉病是影响黄瓜产量与品质的重要因素之一,笔者同时分析了黄瓜MATE基因在白粉病菌接种后表达量的变化,结果如图6B 所示。在感性品种D8 接种白粉病菌后,共有11 个CsMATE成员(CsMATE5、CsMATE6、CsMATE7、CsMATE8、CsMATE23、CsMATE25、CsMATE28、CsMATE32、CsMATE39、CsMATE41、Cs-MATE45)的表达量明显升高,而CsMATE1和CsMATE3的表达量在接种后明显降低(图6B)。在抗性品种SSL508-28 中,共有9 个CsMATE成员(CsMATE6、CsMATE7、CsMATE10、CsMATE17、CsMATE24、Cs-MATE25、CsMATE26、CsMATE28、CsMATE45)的表达量在接种后明显上升,而没有发现表达量明显降低的CsMATE基因(图6B)。
MATE基因家族是植物中最大的次级转运蛋白家族之一,近年来已在很多物种中得到鉴定,但在黄瓜中的研究还未报道。本研究在黄瓜全基因组中鉴定出47 个编码MATE 蛋白的基因(表1),它们在黄瓜的7 条染色体上均有分布(图1)。通过构建系统进化树,可将CsMATE 蛋白分为4 类:Group A~Group D(图1)。其中,同源性较高的CsMATE 成员具有相似的保守基序分布和基因结构(图2,图3),推测它们的功能具有相似性。前人也将MATE 家族分为4 个亚家族,而且发现同一亚家族的某些成员具有相同或相似的结构和功能[5,13]。此外,与拟南芥(56 个)[4]、土豆(60 个)[10]、番茄(67 个)[9]、陆地棉(72 个)[13]、大豆(117 个)[7]、烟草(138 个)[12]等植物相比,黄瓜MATE基因家族成员数量明显偏少,这可能是由于基因复制引起的。如拟南芥有10 个AtMATE基因(占比17.9%)存在片段重复,有20 个AtMATE基因存在串联复制(占比35.7%)[4]。大豆中更是有82%的MATE基因存在基因复制事件,其中21%的基因存在串联复制,61%的存在片段重复[7]。在本研究中,笔者发现黄瓜CsMATE基因存在6 个串联复制和5 个片段重复事件,涉及到25 个CsMATE基因,占比53.2%(图1),低于拟南芥和大豆等植物。因此,基因复制事件的差异是不同植物中含有数量不等MATE基因成员的主要原因之一,从而使基因功能具有特异性和多样性。
为了研究CsMATE基因的潜在功能,笔者首先分析了CsMATE启动子区域的顺式作用元件,共鉴定出7 个与生长发育相关的顺式作用元件(图4)。进一步的组织表达谱分析发现,很多CsMATE基因的表达具有组织特异性(图5),暗示它们可能在不同组织中发挥不同作用,这与前人的研究结果相符[3]。如CsMATE9仅在叶片中检测到表达,暗示其参与叶片的发育或参与某些次级代谢产物的转运。之前在拟南芥中的研究也发现,ELS1参与调控叶片衰老进程和铁离子的动态平衡[38];AtEDS5定位于叶绿体内膜,参与叶绿体中水杨酸的排出[32,39]。烟草NtJAT2参与转运生物碱,可以将根中长途运输而来的尼古丁转运至叶片液泡中积累[40]。此外,一些CsMATE基因在雄花和雌花中的表达量存在明显的差异,或在子房中有明显的表达(图5),暗示着它们参与黄瓜花的发育甚至调控果实的发育进程。在水稻中,DG1编码一个MATE转运蛋白,在节和小花轴参与调控ABA从叶片到颖果的长距离运输,从而促进高温下水稻籽粒的正常灌浆[41]。最近的研究表明水稻TGW12a也编码一个MATE 蛋白,该基因外显子和剪接位点的突变会导致粒型和粒重的变化,表明它是一个调控水稻粒型和粒重的关键基因[42]。此外,还有6个CsMATE基因(CsMATE10、CsMATE11、CsMATE18、CsMATE22、CsMATE28和CsMATE31)仅在根中特异表达(图5),推测这些基因主要在根中发挥作用。之前的研究也发现拟南芥AtALF5主要在根中表达,其突变体会影响侧根的形成,并提升根对多种抑制化合物的敏感性[16]。高粱SbMATE可调控铝毒胁迫下高粱根尖的柠檬酸分泌,柠檬酸和苹果酸等有机酸的转运与植物耐受铝胁迫程度呈正相关[23,43];在大麦中表达SbMATE也能提升转基因植株耐铝毒的能力[44]。百脉根(Lotus japonicus)LjMATE1也编码一个柠檬酸转运蛋白,在根瘤中特异表达,参与将铁离子从根转运到根瘤的过程[45]。野生大豆(Glycine soja)GsMATE在根中的表达量明显高于其它组织,过表达GsMATE的转基因拟南芥其耐铝毒的能力也显著增强[26]。因此,黄瓜Cs-MATE基因的特异组织表达模式表明它们可能在某些次级代谢产物的转运、叶片的生长与衰老,以及根、花和果实等器官的发育过程中发挥重要作用。
黄瓜对逆境的响应能力直接影响其产量与品质,因而在黄瓜中挖掘逆境胁迫响应基因显得尤为重要。之前的研究表明不同植物的MATE基因能广泛参与调控各种生物逆境胁迫。如拟南芥eds5突变体在致病菌侵染的过程中表现出抗性下降,且抗性的下降可能是由于水杨酸外排减少所导致[31,46]。另一个基因AtADS1则负调控水杨酸的积累和同源致病相关基因1(Pathogenesis-Related 1,PR1)的表达,过表达AtADS1转基因植株中的水杨酸含量明显下降[47]。在本研究中,笔者在CsMATE启动子区域分别鉴定出11个与激素响应相关和13个与胁迫响应相关的顺式作用元件(图4)。之前在不同植物中的研究结果也表明MATE基因家族成员起始密码子的上游存在着多种与激素和胁迫响应相关的顺式作用元件[7,10,48]。因此,CsMATE基因可能在黄瓜响应逆境胁迫中发挥重要作用。为了解黄瓜MATE基因家族成员在生物逆境中的潜在功能,笔者分析了CsMATE基因在根结线虫和白粉病菌侵染下的表达模式。结果表明在RKN 侵染后的高感Q24 和高抗CM 中,分别有3 个和17 个CsMATE基因的表达量发生明显的变化(图6A)。在这些基因中,有8个CsMATE基因(CsMATE15、CsMATE22、CsMATE23、CsMATE30、CsMATE31、Cs-MATE33、CsMATE43、CsMATE45)的表达量在未被RKN侵染的高感Q24和高抗CM中存在明显的差异(图6A)。因此,这些差异基因可能在黄瓜响应RKN 侵染过程中发挥重要作用。此外,一些CsMATE基因的表达量在接种白粉病后发生明显的变化,暗示着它们可能参与黄瓜白粉病的调控过程(图6B)。其中Cs-MATE6、CsMATE7、CsMATE25、CsMATE28、CsMATE45的表达量在感性品种D8 和抗性品种SSL508-28 接种白粉病后均有明显的上升(图6B),说明这些基因可能作为白粉病抗性基因,在后续黄瓜抗白粉病分子育种中具有重要的应用价值。