屈新运,秦苗苗,赵桂红,2,张天翼,胡向阳,李 焘*
(1 西北濒危药材资源开发国家工程实验室,药用资源与天然药物化学教育部重点实验室,陕西师范大学,西安 710119; 2 长安区第八中学,西安 710106)
芥子油苷(glucosinolates,GS)主要存在于十字花科植物,是一种具有抗虫、抗病活性的次级代谢产物[1]。在植物体内天然存在的芥子油苷达200多种[2-3],其生物合成前体主要是氨基酸,根据侧链的不同分为脂肪族芥子油苷、吲哚族芥子油苷和芳香族芥子油苷[4]。拟南芥(Arabidopsisthaliana)中芥子油苷的生物合成途径主要包括前体氨基酸侧链延伸、核心结构形成和次级修饰3个步骤。在侧链延伸过程中,前体氨基酸在CYP79F家族的侧链专一性细胞色素P450单加氧酶的催化作用下产生相应的醛肟;之后在CYP83家族的细胞色素P450催化下,醛肟被氧化成不稳定的酸式硝基化合物或氧化腈[5]。在拟南芥脂肪族芥子油苷的合成过程中,CYP79F1和CYP79F2能够催化甲硫氨酸等脂肪族前体氨基酸转化为相应的醛肟[6],其中CYP79F1调控长链或短链脂肪族芥子油苷的合成,而CYP79F2主要调控短链脂肪族芥子油苷的合成[7];过表达CYP79F1和CYP79F2能够使得短链脂肪族芥子油苷的含量增加7倍,同时吲哚族芥子油苷的含量也有一定程度的上升[8]。此外,CYP79F1在西兰花(BrassicaoleraceaL.var.italica)中的过表达研究结果表明,转基因植株中短链脂肪族芥子油苷4MSOP和4MSOB均有显著增加[9]。在中国白菜(Brassicapekinensis)中过表达脂肪族芥子油苷合成的关键酶基因MAM1、CYP79F1和CYP83A1,可以显著提高脂肪族乃至总芥子油苷的含量[10]。由此可见,CYP79F1基因在不同的十字花科植物芥子油苷的生物合成过程中均发挥了十分重要的作用。
菘蓝(IsatisindigoticaFort.)是十字花科(Cruciferae)菘蓝属(Isatis)二年生草本植物,其干燥的根和叶即“板蓝根”和“大青叶”,二者均为历版药典所收录,具有清热解毒、抗菌消炎[11-12]、增强免疫力[13]、防癌抗癌[14-15]等功效。目前从菘蓝中分离得到的化学成分主要包括生物碱类、含硫化合物、有机酸类及芥子苷类化合物等[16],芥子油苷类化合物则因其具有抗癌功效而被广泛关注,关于这一物质在菘蓝中的生物合成过程和分子调控机理鲜有报道。迄今为止,菘蓝中部分参与芥子油苷生物合成过程的关键酶基因及相关转录因子已被相继克隆,包括CYP450基因家族的IiCYP83A1[17]和IiCYP83B1[18],以及转录因子IiMYB34[19]等。此外,CYP79F1也先后在小白菜(BrassicacampestrisL. ssp.chinensisvar.communis)[20]、西兰花[9]和芥蓝(BrassicaalboglabraL. H. Bailey)[21]中被克隆,但其生物学功能还有待进一步研究。
本研究首次从菘蓝中克隆得到与脂肪族芥子油苷合成相关的CYP79家族的IiCYP79F1基因,为后期该基因的功能研究奠定了基础,同时也为后期培育芥子油苷含量升高的菘蓝新品种提供了可能。
菘蓝(IsatisindigoticaFort.)种子为本实验室留存,播种于实验室温室大棚中,培养条件为:温度(25±2)℃;昼/夜光周期16 h /8 h;湿度60%~80%。
1.2.1菘蓝总RNA提取和cDNA合成取菘蓝新鲜叶片,置液氮中速冻,并于-80 ℃保存。按照植物总RNA提取试剂盒(购自西安淳风生物科技有限公司)流程提取菘蓝叶片总RNA,并通过琼脂糖凝胶电泳检测其纯度;再利用反转录试剂盒(购自宝生物工程有限公司),对总RNA进行反转录得到cDNA,-20 ℃保存。
1.2.2菘蓝基因组DNA提取取菘蓝植株的新鲜叶片,按照植物基因组DNA提取试剂盒(购自天根生化科技有限公司)流程提取菘蓝叶片gDNA,-20 ℃保存。
1.2.3基因克隆与鉴定依据本实验室的菘蓝转录组数据库信息,搜索CYP79F1基因序列,利用Primer Premier 5.0软件设计上游引物F(5′-ATGACAATGATGATGATGAGC-3′)和下游引物R(5′-TCAAGAGCGGAATTTTGGAT-3′),送至西安擎科泽西生物技术有限公司合成。分别以菘蓝cDNA和gDNA为模板,参考PrimeSTAR®HS DNA 聚合酶试剂盒说明进行PCR扩增。扩增程序:94 ℃预变性2 min;94 ℃变性30 s;58 ℃退火30 s;72 ℃延伸2 min;共30个循环;72 ℃延伸10 min;4 ℃保存。将所得 PCR产物进行琼脂糖凝胶电泳,并利用琼脂糖凝胶回收试剂盒(购自天根生化科技有限公司)进行目的片段纯化,最后采用AidLab零背景pTOPO-Blunt Simple平末端克隆试剂盒(购自艾德莱生物科技有限公司)将载体与目的片段连接,重组质粒转化大肠杆菌DH5α,并送测序鉴定。
1.2.4生物信息学分析利用ORF Finder(https://www.ncbi.nlm.nih.gov/orffinder/)查找目的基因的开放阅读框,Perot-Param(http://web.expasy.org/protparam/)分析相应蛋白的理化性质,TMHMM 2.0 Server(http://web.expasy.org/protparam/)分析该蛋白的跨膜结构域,Psort Prediction(http://psort.hgc.jp/form.html)预测该蛋白的亚细胞定位,SignalP-4.1(http://www.cbs.dtu.dk/services/SignalP/)预测该蛋白是否具有信号肽,ExPASy NetPhos 2.0(http://www.cbs.dtu.dk/services/NetPhos/)分析该蛋白的磷酸化位点,ScanProsite tool(http://prosite.expasy.org/scanprosite/)分析该蛋白的保守结构域,SOPMA(https://npsa-prabi. ibcp.fr/cgi-bin/secpred_sopma)和Swiss Model(https://www.swissmodel.expasy.org/)分别分析该蛋白的二、三级结构。从NCBI搜索亲缘关系较近物种的CYP79F1序列,利用MEGA 5.0软件构建系统发育树。
1.2.5基因表达模式分析分别以菘蓝根、茎、叶、花、果,萌芽期(10 d)、幼苗期(30 d)、生长期(90 d)和花期的叶片,500 μmol/L MeJA、10 mmol/L Ag+、4 ℃低温、9.0%葡萄糖(质量分数)、300 μmol/L SA,及机械损伤处理后的叶片cDNA为模板,根据目的基因保守区序列设计荧光定量上游引物F(5′-GGAGTTAGACGAAGTGGTGGGA-3′)和下游引物R(5′-CCGAGGGTGGTATCTTGACG-3′)。以管家基因IiActin(AY870652.1)作为内参基因,其引物序列为F(5′-AGGAATCGCTGACCGTATG-3′)和R(5′-TGGACCCGACTCATCGT-ATT-3′)。采用qRT-PCR技术,分别检测目的基因在菘蓝不同组织部位、不同发育时期,以及不同诱导子处理条件下的表达情况。
分别以菘蓝的cDNA和gDNA为模板,利用特异性引物进行PCR扩增,获得长度约为1 600和2 200 bp扩增片段(图1),产物经回收纯化、测序分析后显示,该基因的基因组全长为2 109 bp,含有3个外显子及2个内含子;ORF区为1 626 bp,编码541个氨基酸(图2)。Blast比对发现,该基因与西兰花CYP79F1核酸序列的相似性达93%,将其命名为IiCYP79F1,GenBank登录号为KY774689.1。
利用Perot-Param软件对IiCYP79F1编码蛋白质理化性质进行分析,IiCYP79F1蛋白分子量为61.58 kD,分子结构式为C2759H4358N756O783S29,等电点为8.61,属于碱性蛋白质;不稳定系数为39.43,说明该蛋白较为稳定,N-端为甲硫氨酸(Met);总平均亲水性GRAVY值为-0.296,为亲水性蛋白。进一步对IiCYP79F1跨膜结构域、信号肽、亚细胞定位及磷酸化位点进行分析显示,该蛋白含有2个跨膜结构域,分别位于氨基酸第15~37位(由外向内)和476~498位(由内向外),无信号肽,属于非分泌蛋白,主要定位于内质网膜(可信度:0.685)和质膜(可信度:0.640)上;含有25个Ser位点、13个Thr位点和5个Tyr位点,共有43个蛋白激酶磷酸化位点,推测IiCYP79F1可能受蛋白磷酸激酶的调控。
利用ScanProsite在线软件对IiCYP79F1保守结构域进行分析,发现该蛋白具有保守的血红素结合域FGtGRRGCVG,位于470~479之间(图3)。二级结构预测显示,该蛋白主要由α-螺旋(alpha helix,43.81%)、无规则卷曲(random coil,35.49%)、延伸链(extended strand,13.68%)和β-转角(β-turn,7.02%)组成。利用Swiss Model构建该蛋白的三维结构(图4)发现,α-螺旋和无规则卷曲所占比例较高,其次为延伸链和β-转角,与二级结构预测结果相一致。
M. DL2000; 1. cDNA; 2. gDNA图1 IiCYP79F1基因的扩增结果Fig.1 PCR amplification results of IiCYP79F1
图2 IiCYP79F1的核酸及氨基酸序列Fig.2 Nucleotide and amino acid sequences of IiCYP79F1
利用NCBI的Blast程序分析菘蓝IiCYP79F1与近缘种蛋白的氨基酸同源性。结果表明,IiCYP79F1编码蛋白的氨基酸序列与西兰花(Brassicaoleracea, ACB59213.1)的相似性为94%;与欧洲油菜(Brassicanapus, AGO59948.1)、芜菁(Brassicarapa, ACR10252.1)和芝麻菜(Erucasativa, AGS49166.1)的相似性均为93%。由多序列比对结果(图6)可知,菘蓝IiCYP79F1与十字花科其他物种CYP79F1的结构相似,均具有保守的血红素结合域(Heme-binding motif,FGTGRRGCVG)、PERF序列(PERH)和K螺旋(K-helix,ETFR)。利用MEGA 5.0对菘蓝IiCYP79F1和近缘种的CYP79F1进行系统进化分析,发现IiCYP79F1与芝麻菜(Erucasativa, AGS49166.1)的亲缘关系最近(图5)。
图4 IiCYP79F1蛋白的三级结构预测Fig.4 Predicted 3D structure model of IiCYP79F1
图5 IiCYP79F1蛋白的系统进化树Fig.5 Phylogenetic tree analysis of IiCYP79F1
图3 IiCYP79F1蛋白的保守结构域分析Fig.3 Conserved domain analysis of IiCYP79F1
黑色方框表示CYP450的保守结构域图6 IiCYP79F1与其他物种CYP79F1氨基酸序列比对Black box represents the CYP450’s conserved motifsFig.6 Amino acid sequence alignment of CYP79F1 and other species
采用qRT-PCR法对IiCYP79F1在根、茎、叶、花和果等不同组织部位,以及萌芽期、幼苗期、生长期和花期等不同发育阶段的表达情况进行分析,结果表明:IiCYP79F1在菘蓝茎中的表达水平最高,叶和花次之,其表达量由高到低依次为茎>叶>花>果>根(图7,A)。此外,IiCYP79F1在菘蓝不同发育阶段均有表达,幼苗期、生长期和花期的相对表达量显著高于萌芽期,且以幼苗期表达量最高,达到萌芽期表达量的7.28倍(图7,B)。由此可见,IiCYP79F1在菘蓝不同组织部位和不同发育时期均有一定的差异表达,具有明显的时空特异性。
不同小写字母代表相对表达量在0.05水平上差异显著。图7 IiCYP79F1基因在菘蓝不同组织、不同发育时期和不同诱导处理下的表达分析Different normal letters indicated significant difference for the relative expression at 0.05 levelFig.7 Expression patterns of IiCYP79F1 of I. indigotica Fort. for different tissues, stages and elicitors
此外,本研究还对IiCYP79F1在不同诱导子处理后的表达情况进行了分析。由图7,C可知,IiCYP79F1在MeJA处理3 h后表达量显著升高,并在6 h达到峰值,为对照组的11.09倍,此后,随着处理时间的延长,其表达水平下降,并于72 h降至对照水平;Ag+也能够有效促进IiCYP79F1的表达,处理12 h后该基因的表达量达到最大值,为对照的14.05倍,总体呈现先升高后下降的变化趋势;葡萄糖对IiCYP79F1基因的表达呈明显的促进作用,IiCYP79F1基因在葡萄糖处理3 h后达到峰值,为对照的11.33倍;机械损伤也可以明显促进IiCYP79F1的表达,其表达水平在机械损伤48 h后出现峰值,为对照的7.93倍。相反地,低温处理对IiCYP79F1基因的表达呈现一定的抑制效应,处理1 h后该基因的表达降至对照的3.12%,48 h后仅为对照的1.66%;同时,其表达也受到SA的抑制作用,处理1 h后其表达即开始下降,并在6 h后下降至对照的14.78%。因此,IiCYP79F1基因显著响应MeJA、Ag+、低温(4 ℃)、葡萄糖、SA和机械损伤等信号的诱导,低温(4 ℃)和SA对该基因的表达呈现明显的抑制效应,而各类诱导子对该基因的具体诱导机制有待于进一步的深入研究。
芥子油苷及其水解产物在植物的生长发育过程发挥多种生物学功能,既能有效地帮助植物抵御昆虫和病原菌的侵袭,又能参与调节植物生长素的代谢,并具有明显的抗癌活性[22-23]。因此,筛选和改良富含芥子油苷的植物品种已成为十字花科植物研究的热点。本研究以菘蓝为试验材料,成功克隆了参与芥子油苷生物合成的关键酶基因IiCYP79F1,并进行了生物信息学分析,探讨了其在不同组织、不同生长发育阶段,以及各种诱导子处理条件下的表达情况,相关研究结果均为首次报道。
芥子油苷的生物合成途径主要有细胞色素P450的CYP79和CYP83两个家族参与[24]。CYP79家族催化氨基酸形成相应的乙醛肟,CYP83家族进一步催化乙醛肟生成不稳定的酸式硝基化合物[25]。CYP79F1编码的蛋白主要负责催化甲硫氨酸向芥子油苷前体乙醛肟的转化,且对短链脂肪族芥子油苷的合成起重要作用[26]。本研究结果表明,菘蓝IiCYP79F1基因属于细胞色素P450基因家族成员,编码541个氨基酸,与西兰花CYP79F1的序列具有较高的相似性;该蛋白属于碱性亲水蛋白,含有2个跨膜结构域,无信号肽;主要定位于内质网膜和质膜上,含有25个Ser位点、13个Thr位点和5个Tyr位点,共计43个蛋白激酶磷酸化位点;此外,该蛋白具有保守的血红素结合域:FGtGRRGCVG,位于470~479位点之间;其氨基酸序列与西兰花CYP79F1的氨基酸序列相似性最高,并与芝麻菜的亲缘关系最近。
芥子油苷的合成受到许多非遗传因素的影响。如茉莉酸甲酯能够促进油菜(BrassicanapusL.)和芥菜(BrassicajunceaL.)中I3M的积累[27];经水杨酸处理的油菜叶片中芥子油苷总量显著提高[28]。在甘蓝型油菜中,子叶、叶和茎中CYP79F1的转录水平高于花和角果,而在叶的发育过程中,其转录水平在年幼阶段表达量较低[29];芥蓝中CYP79F1在茎、叶片和子叶中的表达量高于花和种子中的表达量[15]。本研究对菘蓝IiCYP79F1在不同组织部位的表达模式进行了分析,发现其在茎中的表达量最高,其次为叶、花、果和根;此外,该基因在幼苗期的表达量最高,显著高于其他生长发育阶段,为萌芽期的7.28倍。因此,IiCYP79F1的表达具有明显的组织特异性,但与已报道的十字花科其他植物中CYP79F1基因的表达模式存在不同。茉莉酸可以显著增强拟南芥中芥子油苷生物合成相关的CYP79家族基因的表达[30];羽衣甘蓝(Brassicaoleraceavar.acephalaf.tricolor)中,CYP79F1基因的表达被MeJA诱导上调[31];芥蓝中脂肪族芥子油苷合成相关基因CYP79F1在葡萄糖处理后6 h表达上调,并在18 h达到最大值[32];而低温胁迫能显著降低羽衣甘蓝中总芥子油苷的含量[33]。本研究结果发现,MeJA、Ag+、葡萄糖、机械损伤上调了IiCYP79F1的表达,而SA、低温则抑制其表达,该基因的表达模式与十字花科其他植物存在一定的相似之处,但也有其特异性,具体的响应机制仍需要深入探讨。
本研究对菘蓝IiCYP79F1进行了克隆,通过生物信息学分析和表达模式的研究,为该基因的功能研究奠定了基础,也为进一步开展菘蓝芥子油苷生物合成与调控机理的研究提供了依据。随着更多的CYP79家族成员基因的克隆和功能验证,将有助于切实阐明菘蓝芥子油苷的合成机理,为生物合成芥子油苷提供有效途径,也为通过基因工程手段提高菘蓝和十字花科其他植物的芥子油苷含量提供新的思路和途径。