玛依拉·玉素音,阳 妮,徐海江,杨延龙,张大伟,李春平,石必显,赖成霞
(新疆农业科学院经济作物研究所,乌鲁木齐 830091)
【研究意义】棉铃虫(HelicoverpaarmigeraHubner)是鳞翅目,夜蛾科昆虫,是棉花蕾铃期中最主要的害虫之一[1]。棉花受到棉铃虫、棉蚜等有害生物时,会产生多种代谢组分来躲避侵害,而这些代谢组分的变化与基因组调控密切相关,同一代谢物质可受一种或多种防御基因调控[2]。挖掘棉花中响应虫害胁迫的基因并探究其功能对棉花基因工程研究有重要意义。【前人研究进展】糖基转移酶(glycosyltransferases,GT; EC 2.4.x.y)是生物体内广泛存在的一种进行糖基化反应的转移酶,能够将糖基从核苷酸糖供体转移到次生代谢物、激素类、蛋白类等化合物上[3],其中最常见的一种糖供体是尿苷二磷酸糖基转移酶(UGT)[4]。在植物应答虫害胁迫过程中,糖基转移酶在调控基因、蛋白、代谢的变化和表达发挥着重要作用[5]。Jing等[6]研究发现,在糖基转移酶的作用下,顺-3-己烯醇能生成顺-3-己烯醇糖苷,激活茶树茉莉酸和乙烯信号通路,并由此提高茶树对茶尺蠖的直接和间接防御反应。Augustin等[7]报道了在害虫胁迫下,枸杞UGT73C10~13基因表达上调催化了常春藤皂苷元和皂素齐墩果酸发生3-O-葡萄糖基化,增加了枸杞对害虫的抗性,并且在基因下调时,其对害虫的抗性减弱。Zhang等[8]研究报道,糖基转移酶GmUGT的过表达会改变类黄酮化合物的含量和生物合成、及防御相关基因的表达模式,增加了大豆品种对嚼叶昆虫的抗性。在水稻中发现的糖基转移酶UGT707A3的过表达能增加柚皮素转和尿苷二磷酸葡萄糖化为柚皮素-7-O-β-d-葡萄糖苷的反应,从而阻止了昆虫的对水稻的摄食[9]。目前,关于棉花中糖基转移酶的研究主要集中于维持激素平衡,脱毒代谢上,如UGT73C14参与ABA调控,GalT1参与细胞壁果胶合成,UGT41B3和UGT40D1能调控棉子酚的脱毒代谢[10-12]。【本研究切入点】对糖基转移酶参与棉花虫害防御反应的研究尚未见报道。目前,对受棉铃虫诱导的棉花糖基转移酶的研究与利用多局限于资源收集,而棉铃虫抗性功能方面的研究尚未见报道。【拟解决的关键问题】以受棉铃虫诱导的5个糖基转移酶基因UGTG01、UGTG02、UGTGo4、UGTGo6和UGTGo7为研究对象,采用生物信息学手段从基因组水平、进化关系、各家族成员蛋白的理化性质、保守基序以及表达模式对各家族成员及进行分析,为棉花糖基转移酶UGT基因在抗棉铃虫功能研究提供的理论基础。
从NCBI基因组数据库下载棉花糖基转移酶UGT蛋白序列,利用NCBI的(Conserved Domain Search Service(CD Search)分析蛋白结构域。利用Protpararm在线程序(http://au.expasy.org/tools/protparam.html)分析其蛋白质的理化特性。利用在线工具ExPASY(http://www.expasy.org/tools)预测蛋白质的氨基酸数量、相对分子质量、等电点及蛋白的亲疏水性。使用Softberry(http://linux1.softberry.com/berry.phtml)预测蛋白质的亚细胞定位。
1.2.1 棉花糖基转移酶UGT蛋白系统发育树构建
通过Clustal X 2.0软件对棉花糖基转移酶UGT基因家族的氨基酸序列比对;利用MEGA11.0.13软件对来自拟南芥、水稻、大豆及棉花等作物的糖基转移酶进行邻接法(neighbor--joining)构建系统发育树,重复次数设置为1 000次,其他参数为默认值。
1.2.2 蛋白质二级结构预测
通过在线软件NCBI使用基因的保守结构域工具CD-search(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)快速找到相关基因上的保守结构域,将基因的蛋白质序列以FASTA文件导入,在线软件NCBI的找到基因保守结构域,利用TBtools V.1098726软件进行糖基转移酶基因家族的保守结构预分析。使用MEME在线网站(https://meme-ie,rg/meme/tools/meme)和TBools软件对糖基转移酶基因家族蛋白质进行基因结构分析;S0PMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl/page=npsa_sopma.html)分别对基因的蛋白质序列进行二级结构预测。
1.2.3 基因的荧光定量表达
采用实时荧光定量PCR确定棉花中UGT基因的表达模式,利用TaKaRa反转录试剂盒将不同棉花组织样品RNA反转录为CDNA。RT-PCR引物使用NCBI Primer-BLAST进行设计,以Histone为内参基因。RT-PCR反应体系如下:cDNA 1 μL,Premix ExTaqTMⅡ 10 μL,ddH2O 7 μL,Rox Reference Dye 0.4 μL,上下引物10 μmol/L各0.8 μL。反应程序设定为:预变性95 ℃,5min;变性95 ℃,1 min;退火56~58.5 ℃,30 s;延伸72 ℃,1 min 30 s,30个循环,每个基因设置3次生物学重复,用2-ΔΔCT法计算糖基转移酶家族基因的相对表达量,采用Excel统计数据及作图。表1
表1 定量PCR 引物序列
1.2.4 基因的物种来源及基因登录号
来自棉花的基因UGTG01(基因登录号,KX398934)、UGTG02(基因登录号,KX398935)、UGTGo4(基因登录号,MN701073)、UGTGo6(基因登录号,MN812721),UGTGo7(基因登录号,MN820705);来自山芥的基因BvUGT1(基因登录号,JQ29161)、BvUGT73C9(基因登录号,JQ291612)、BvUGT73C10(基因登录号,JQ291613)、BvUGT73C11(基因登录号,JQ29161)、BvUGT73C12(基因登录号,JQ291615)、BvUGT73C13(基因登录号,JQ291616)、BvUGT73C21(基因登录号,MF448360)、BvUGT73C22(基因登录号,MF448363)、BvUGT73C23(基因登录号,MF448369)、BvUGT73C24(基因登录号,MF448364)、BvUGT73C25(基因登录号,MF448366)、BvUGT73C26(MF448353)、山芥BvUGT73C27(基因登录号,MF448357);来自拟南芥的基因AtUGT73C1( 基因登录号,NM_129230)、AtUGT73C2(基因登录号,NM_129231)、AtUGT73C5(基因登录号,CP002685),AtUGT73C6(基因登录号,NM_129234)、AtUGT73C7(基因登录号,NM_115176),大豆GmUGT(基因登录号,MG846900),水稻UGT707A3(基因登录号,PF00201.11)。
研究表明,UGTG01、UGTG02、UGTGo4、UGTGo6、UGTGo7的氨基酸数为468~534个,相对分子质量为52 743.1~60 208.62 kDa,其中氨基酸数和分子质量最大的是UGTG01,最小的是UGTGo7;等电点范围在4.97~5.58,脂溶性指数为84.58~93.75,不稳定系数为40.18~49.85,其中UGTG01、UGTG02、UGTGo7均为不稳定蛋白;并且5个UGTs亲疏水性均为负值,5个基因所编码的蛋白质均为亲水性蛋白。表2
表2 棉花糖基转移酶UGT蛋白基本理化参数
研究表明,基因的长度不同,外显子和内含子也存在差别。5个基因均无内含子,其中基因UGTG01和UGTGo7均含有1个外显子和2个上下游;基因UGTG02、UGTGo4、UGTGo6只含1个外显子,无内含子和上下游。
5个蛋白质主要由α-螺旋、无规则卷曲、延伸链和β-转角组成,顺序均是由α-螺旋>无规则卷曲>延伸链>β-转角。α-螺旋在DNA结合基序中发挥重要作用,无规则卷曲易受侧链相互作用,构成活性部位和功能部位。利用Softberry在线工具对糖基转移酶UGT基因家族中的5个基因进行亚细胞定位,大多数的蛋白质均被定位在细胞外和质膜上。图1
注:A:UGT家族基因结构分析;B:UGT家族基因蛋白质二结构预测
研究表明,UGT基因家族的5个基因的氨基酸具有63.23%平均相似性。其中UGTC02的氨基酸序列与UGTCo7的具有最高相似性为84.86%,UGTC02的氨基酸序列与UGTCo6的相似性为79.08%,UGTCo6的氨基酸序和UGTCo7相似性为77.89%。而UGTC01的氨基酸序列与UGTCo4相似性为47.01%,UGTC01的氨基酸序列与UGTCo6相似性最低为24.70%,UGTCo4的氨基酸序列和UGTCo6相似性较低为24.9%。图2
图2 棉花糖基转移酶的氨基酸序列比对
研究表明,3个保守基序分别为Motif1~Motif3。5条序列均含有全部3种Motif,聚在同一组的蛋白成员,3类Motif的保守性较强。其Motif的组成是相同的,同一组成员功能相同,该家族蛋白保守性强,5个UGT蛋白均含有Glycosyltransferase_GTB-type superfamily结构域,且均位于蛋白的N端,棉花糖基转移酶UGT同源基因对的蛋白长度及结构域位置有很高的相似性。图3
注:A:UGT家族蛋白质保守基序;B:UGT家族基因保守结构域分析
研究表明,UGTC01在根、茎、子叶、真叶、花、棉桃均为表达量较低;UGTC02在子叶中的表达量显著高于其他组织,其次是茎、棉 桃、真叶、根和花中几乎表达;UGTCo7有着相同的组织表达模式,在子叶中的表达量相对较高,其次是茎、真叶、棉桃,在根和花中的表达量相对较低;UGTCo4在茎中的表达量相对比其他组织表达量较明显;UGTCo6在子叶中的表达量较高于其他组织,其次是真叶、茎、根、花、棉桃中几乎表达,棉花糖基转移酶UGT具有明显的表达特异性,在子叶和茎中的表达量相对较高,其次是真叶和棉桃,在其他组织中的表达量相对较低,在棉花不同组织中可能具有不同的生物学功能。图4
图4 5个UGT基因在棉花不同组织的表达
研究表明,不同植物来源糖基转移酶被聚类分为2个分支,克隆到的棉花糖基转移酶UGTG01、UGTCo4与枸杞UGT73C基因家族的蛋白相近,棉花的UGTC02、UGTCo6及UGTCo7蛋白与水稻的UGT707A3蛋白和大豆的GmUGT蛋白相邻分支中,棉花糖基转移酶的五个蛋白可能具有与UGT73C家族基因,水稻的UGT707A3基因、大豆GmUGT基因具有相似的功能。图5
注:不同物种UGT不同颜色标记,拟南芥、山芥、水稻、大豆及棉花分别由绿色三角形、蓝色菱形、橙色方形、黄色倒三角形及红色圆形标记。
3.1糖基化是植物次生代谢产物中最为广泛存在的一种修饰方式。该反应是由糖基转移酶的催化生物功能实现的。其生物学功能涉及植物到植物多个阶段,如参与植物的防御防御,脱毒反应等[13-15]。目前,有关UGT基因家族的研究大多集中于藏红花[16]、烟草[17]、拟南芥[18]中,而在棉花受棉铃虫诱导的反应中研究非常少。
生物信息学在抗性基因研究及新抗性基因鉴定的应用中发挥了重要的作用[19],Huang等[20]利用生物信息学技术,在雷蒙德氏棉(Gossypium raimondii)、亚洲棉(Gossypium arboreum)和陆地棉(Gossypium hirsutum)中分别鉴定出了142、146和196个糖基转移酶基因。研究利用生物信息学方法从棉花基因组中鉴定出5个受棉铃虫诱导的UGT基因家族成员。通过理化性质分析得出,棉花糖基转移酶UGT基因家族蛋白质基本为碱性氨基酸,且5个蛋白质均为亲水性蛋白质,蛋白质长度在468~534,等电点在4.97~5.58,相对分子质量区域为52 743.1~60 208.62。
3.2蛋白质的结构决定其生物学功能,结构相似其功能相似。在研究中,棉花糖基转移酶UGT基因家族的5个蛋白质主要由α-螺旋、无规则卷曲、延伸链和β-转角构成,位于同一家族成员的结构具有一致性。在亚细胞定位中发现大多数大部分的蛋白质均被定位在细胞外和质膜上,表明这些基因合成生长素基本是在细胞外和质膜中完成的,与翟琼等[21]的研究结果一致。结构域和Motif的种类和数量可以从侧面反应该基因的生物功能多样性,具有相同种类和数量Motif的基因功能可能相似[22]。研究通过分析棉花糖基转移酶UGT基因家族蛋白质保守基序发现,5个蛋白质有3个motif,基因家族的功能具有相似性。在彭洪娴等[23]的研究中也同样发现了位于同一亚族的基因含有大致相同的Motif,并证实了这些含有相同Motif的基因成员可能具有类似的功能。
3.3与糖基转移有关的酶类或蛋白的表达丰度与寄主抗性机制有关,Wang等[24]的研究发现2种糖基转移酶的过量表达参与了大麦对麦蚜抗性的形成。李健英[25]在研究棉花响应烟粉虱胁迫的分子机制中发现,糖基转移酶基因在烟粉虱胁迫后表达发生上调变化。研究中,受棉铃虫诱导的5个棉花糖基转移酶具有明显的表达特异性,在子叶和茎中的相对表达量较高,在其他组织中的相对表达量较低,5个棉花糖基转移酶中UGTC02在组织中的表达大于其他基因,不同棉花组织对棉铃虫的抗性具有差异,与前人的研究一致[26]。
3.4系统进化树种聚集在一起的亚组具有相似的进化源和基因功能[27]。在研究中,通过构建系统进化树发现棉花糖基转移酶UGTG01、UGTCo4与枸杞UGT73C基因家族的蛋白相近,棉花的UGTC02、UGTCo6及UGTCo7蛋白与水稻的UGT707A3蛋白和大豆的GmUGT蛋白相邻分支中,同一分支中的基因可能具有相同的生物学功能。UGT73C基因家族成员、GmUGT、UGT707A3在植物抗虫胁迫中发挥着重要的作用,其中UGT73C基因家族成员能通过调控皂苷元等物质来增加枸杞对害虫的抗性[7],GmUGT可以通过改变类黄酮的变化,参与赋予了大豆对昆虫的抗性[8],UGT707A3通过调控柚皮素糖基化减少昆虫对水稻的摄食[9]。5个蛋白质能通过调控皂苷元、类黄酮、柚皮素等物质响应棉花的抗虫性。
获得5个棉花糖基转移酶基因,UGTG01、UGTG02、UGTGo4、UGTGo6、UGTGo7的蛋白质长度在468~534,等电点在4.97~5.58,相对分子质量区域为52 743.1~60 208.62,亚细胞定位在细胞质外,均为亲水性蛋白质。基因结构均含有1个外显子,二级结构主要由α-螺旋、无规则卷曲为主,均含3个Motif基序和有Glycosyltransferase_GTB-type superfamily结构域。5个基因具有明显的组织表达差异性,不同棉花组织对棉铃虫的抗性具有差异。进化树构建5个基因具有与UGT73C家族基因,水稻的UGT707A3基因、大豆的GmUGT基因具有相似的抗虫功能,能通过调控皂苷、类黄酮、柚皮素等物质响应棉花的抗虫性。