刘 娜,田雨菁,冯哲瀚,李虎良,张 蕾,黄金海,华德平
(天津大学 生命科学学院,天津 300072)
花青素来源于植物,水溶性良好,属黄酮类化合物。植物被其赋予鲜艳的颜色,从而吸引昆虫授粉[1-2]。此外,花青素在医药和工业生产中也具有很重要的作用,如预防糖尿病、肥胖、心血管疾病、神经退行性疾病等,甚至可能预防癌症[3],被普遍用于食品着色剂,营养品、化妆品添加剂等[4]。传统获得花青素的方法是从植物组织中提取[5],但植物中花青素的含量易随季节和区域波动、存在质量很难控制、纯度相对较低等问题[6-7],这使得利用微生物进行花青素生物合成具有潜在优势。
3-O-葡萄糖基转移酶(3GT)是花青素合成通路中催化活化的糖分子从核苷二磷酸向低分子量底物上转移的关键酶,能将不稳定的花青素转化为稳定的彩色花色苷[8]。3GT作用于活化的糖分子作为供体底物在花青素的O(OH-和COOH-)、N、C、S原子上进行花青素的糖基化,最常见的供体分子为UDP-葡萄糖[9]。
已有对3-O-葡萄糖基转移酶的研究表明,3GT对于维持花青素含量至关重要,在研究牵牛花色的变化时发现,3GT缺陷的牵牛花花瓣颜色不如之前颜色鲜艳[10]。有研究发现,花青素在3号位的糖基化对于葡萄浆果和葡萄酒的红色色素沉着至关重要。对葡萄3GT进行克隆与特征分析,发现红色葡萄品种的果皮和果肉在转红期表达3GT,并且随着3GT表达的上调,果皮颜色逐渐加深,而白色葡萄品种中未见表达[11]。亦有研究证实,3GT的活性增加导致花青素在苹果和荔枝中积累增加[12]。深色葡萄3GT的表达受到多种因素的影响,仅在转色期后进行表达,且随时间的变化,表达水平也会改变[13]。这些研究都证实了3GT对花青素积累的重要性。
目前已经在许多植物中克隆得到了糖基转移酶编码基因,如拟南芥(Arabidopsisthaliana)、荷兰鸢尾(Irishollandica)、草莓(Fragariaananassa)、矮牵牛(Petuniahybrida)和葡萄(Vitisvinifera)等。蓝莓(Vacciniumcorymbosum)果实在成熟过程中会积累大量的花青素,然而对于蓝莓中3GT基因的研究还未有报道,本研究克隆了蓝莓3GT(Vc3GT)基因并利用在线分析网站和生物信息学软件对Vc3GT及其编码氨基酸进行了理化性质、磷酸化位点、信号肽与跨膜结构域预测、酶和底物分子对接预测和启动子顺式作用元件预测等,旨在研究该基因的特征和功能,为后续进一步研究糖基转移酶的作用及花青素异源合成表达提供基础。
高丛蓝莓(市场购置),Hifair Ⅲ 1st Strand cDNA Synthesis Kit(gDNA digester plus)试剂盒(上海翊圣生物科技股份有限公司,CAT:11139ES60),pClone007克隆载体(北京擎科生物科技有限公司,CAT:TSV-007S),质粒小提试剂盒(北京天根生化科技有限公司,CAT:DP103-03),大肠杆菌DH5α感受态细胞(天津大学黄金海教授实验室制备),LB培养基。
1.2.1 蓝莓3GT克隆
1.2.1.1 蓝莓mRNA的提取及cDNA的合成 利用TRIzol-KAc法提取蓝莓mRNA,利用Hifair Ⅲ 1st Strand cDNA Synthesis Kit试剂盒将其合成第一链cDNA,于-20 ℃保存备用。
1.2.1.2Vc3GT基因扩增 根据转录组数据库中蓝莓3GT序列(Gene Bank:MH321467.1)设计引物,上游引物3GT-F:5′-ATGTCCAACTTCTCAAAAGACCGGC-3′;下游引物3GT-R:5′-GCGGCGTTCATTTCTAAATGTTGTACC-3′。反应体系为20 μL,上下游引物(10 μmol/L)各0.5 μL,模板1 μL,2×Hieff Robust PCR Master Mix 10 μL,ddH2O 8 μL。反应程序,95 ℃预变性5 min;95 ℃变性30 s,54 ℃退火30 s,72 ℃延伸80 s,35个循环;72 ℃终延伸10 min。扩增程序结束后,取4 μL PCR产物检测琼脂糖凝胶电泳,查看PCR扩增产物的大小及特异性。
1.2.1.3Vc3GT基因T载体连接及测序 取上述Vc3GTPCR扩增产物1 μL,pClone007 0.5 μL,10×Topo Mix 1 μL,ddH2O 7.5 μL混匀,16 ℃过夜连接。第2天,准备大肠杆菌DH5α感受态细胞将连接产物转入其中,经菌落PCR、质粒酶切及测序,确定已成功将3GT连接入T载。
1.2.2Vc3GT及其编码蛋白的生物信息分析 根据测序获得的Vc3GT序列及其翻译的氨基酸序列,使用 NCBI 数据库ORF Finder(http://www.ncbi.nlm.nih.gov/projects/gorf/)分析Vc3GT开放阅读框数据;利用NCBI在线数据库中Blast工具中的 Conserved Domains(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)分析程序,获得Vc3GT蛋白保守域分析数据;利用DNAMAN软件对Vc3GT氨基酸序列及其他植物3GT氨基酸进行多重序列比对分析;运用ProtParam(http://web.expasy.org/protparam/)在线网站,获得Vc3GT的理化性质分析数据;通过 NetPhos 3.1(http://www.cbs.dtu.dk/services/NetPhos-2.0/)在线分析网站,对Vc3GT的磷酸化位点进行预测;使用ProtScal(http://web.expasy.org/protscale/)在线网站,获得Vc3GT亲水性和疏水性分析的预测数据;利用TMHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM/)在线网站,获得Vc3GT跨膜域的预测数据;利用 SignalP 5.0(http://www.cbs.dtu.dk/services/SignalP/)在线网站,获得Vc3GT信号肽的预测数据;运用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=%20npsa_sopma.html)网站,获得Vc3GT二级结构的预测数据;通过SWISS-MODLE(http://swissmodel.expasy.org/)在线网站,获得Vc3GT三级结构的预测模型;利用MEGA 7.0对蓝莓3GT氨基酸序列和选取的其他植物3GT氨基酸序列构建系统进化树;使用PLANTCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)在线网站,获得Vc3GT启动子区顺式作用元件分析数据。
1.2.3 Vc3GT与底物矢车菊素分子对接模拟 3-O-葡萄糖基转移酶能将矢车菊素(C15H11O6)转化为稳定的3-O-矢车菊花色苷。通过自动化拓扑构建器和存储库小分子ATB网站(https://atb.uq.edu.au/index.py)直接获得矢车菊素的三维结构,并保存为PDB格式,通过SWISS-MODLE获得Vc3GT蛋白的三维结果。利用Auto Dock(https://autodock.scripps.edu/)软件实现分子对接,将获得结果利用Discovery Studio visualizer进行图形化展示。
以蓝莓cDNA为模板扩增获得的PCR产物,经琼脂糖凝胶电泳,发现在1 000~1 500 bp存在单一特异性条带(图1-A),与Vc3GT的大小相符(1 371 bp)。将PCR产物与T载体连接,经菌落PCR与质粒酶切鉴定,初步证明Vc3GT成功连接入T载体(图1-B)。通过测序及序列比对,发现Vc3GT位于蓝莓的4号染色体末端,含有3个外显子和2个内含子[14]。开放阅读框从ATG到TAG全长1 371 bp,编码456个氨基酸(图 1-C),与NCBI公布的序列相比,扩增获得的Vc3GT在411 bp处的T突变为C,对应的氨基酸未发生改变。
A.Vc3GT基因PCR扩增产物的琼脂糖凝胶电泳检测示意图;B.Vc3GT连接入T载体质粒图谱;C.Vc3GT位于蓝莓的4号染色体,含有3个外显子与2个内含子。A.The diagram of agarose gel electrophoresis for the PCR amplification of Vc3GT gene;B.The map of the Vc3GT-T vector;C.The Vc3GT localizes on chromosome IV and contains 3 exons and 2 introns.图1 蓝莓Vc3GT的克隆Fig.1 The cloning of Vc3GT from the cDNA of blueberry
2.2.1 不同物种3GT氨基酸同源性分析 Vc3GT蛋白保守域分析是利用NCBI数据库 Blast程序中的Conserved Domains程序进行的,Vc3GT属于植物糖基转移酶家族,具有典型的GTB-型结构域(图2-A)。GTB-型糖基转移酶能使活化的糖基供体转移到特定的蛋白质、脂肪、杂环化合物、碳水化合物或其他碳水化合物的残基等这些受体分子上,形成糖苷键。受体分子多样,所形成的糖复合物结构多样且具有广泛的生物学功能。利用DNAMAN软件对Vc3GT氨基酸序列及其他4种植物3GT氨基酸进行多重序列比对分析,结果表明,Vc3GT与猕猴桃(Actinidiachinensis, ADC34700.1)、桑树(Morusalba, AOV62766.1)、矮牵牛(Petunia×hybrida, BAA89008.1)、玉米(Zeamays, ABF72120.1)的相似性分别为67.47%,50.76%,47.17%和36.21%(图2-B)。
A.Vc3GT氨基酸保守域分析;B.多个物种中Vc3GT氨基酸序列比对。A.The diagram of conserved domain for Vc3GT;B.The amino acid sequence of Vc3GT protein in several species.图2 Vc3GT氨基酸序列分析Fig.2 The amino acid sequence analysis of Vc3GT
糖基转移酶家族的C-末端都含有PSPG结构域(PSPG-box),是UDP-葡萄糖的结合区域[15],其中包含的高度保守的HCGWNS残基(图2-B黑框)[16],是与UDP-葡萄糖尿嘧啶残基相互作用的区域。PSPG结构域由44个氨基酸组成(图2-A、B黑色下划线部分),其最后一位氨基酸种类决定了糖分子供体的特异性,若第44位是谷氨酰胺(Gln),则糖基供体为UDP-葡萄糖,若是组氨酸(His),则糖基供体为UDP-半乳糖[17]。Vc3GT氨基酸序列中,PSPG结构域中第44位是组氨酸(图2-B星号标识),预示Vc3GT的糖基供体可能为UDP-半乳糖。Vc3GT活性位点由14个氨基酸组成,分别为第19,20,22,178,181,182,186,211,281,351,353,355,356和359位氨基酸残基(图2-B箭头、菱形和三角),包括TDP结合位点(TDP-binding site)(图2-B箭头)和受体底物结合位点(Acceptor substrate-binding pocket)(图2-B菱形)
2.2.2 Vc3GT编码蛋白的性质预测 利用ProtParam在线网站,分析Vc3GT的理化性质,发现Vc3GT含有456个氨基酸,其中亮氨酸(Leu)和丝氨酸(Ser)最多,均占总体的8.8%,其次为缬氨酸,占8.6%。蛋白的分子式为C2279H3521N595O650S15,相对分子质量为50 136.52,理论等电点(pI)为6.14,带负电荷的氨基酸残基数为48,带正电荷的氨基酸残基数为42,不稳定系数为43.16(>40),推测Vc3GT可能为不稳定蛋白。蛋白质磷酸化指由蛋白激酶催化的把ATP等的磷酸基转移到底物蛋白质特定氨基酸残基(丝氨酸、苏氨酸、酪氨酸)上的过程,通过NetPhos 3.1预测Vc3GT的磷酸化位点发现,Vc3GT可能含有37个磷酸化位点,包括25个丝氨酸磷酸化位点,8个苏氨酸磷酸化位点,和4个酪氨酸磷酸化位点。
对蛋白质的亲/疏水性的预测可以反映蛋白质内部结构的折叠情况和蛋白质中区域跨膜的倾向与结合蛋白倾向。利用ProtScal在线分析网站预测Vc3GT的亲水性和疏水性,大于0.5的区域为疏水区,小于-0.5的区域为亲水区,在0.5和-0.5之间的区域为两性区域(图3-A)。亲水指数越大,说明该氨基酸疏水性越强,小于零为亲水蛋白,Vc3GT蛋白总平均亲水指数为-0.029,推测为亲水蛋白。信号肽一般是由15~30个氨基酸组成的肽链,在蛋白的亚细胞定位中起重要的作用,采用在线工具SignalP 5.0预测Vc3GT的信号肽,结果显示,该蛋白可能无信号肽(图3-B)。利用TMHMM进行蛋白跨膜结构域分析,结果显示,Vc3GT无明显跨膜域(图3-C)。
A.预测Vc3GT为亲水性蛋白;B.Vc3GT蛋白无信号肽;C.Vc3GT蛋白无跨膜结构域。A.Vc3GT is predicted to be a hydrophilic protein;B.Vc3GT has no signal peptide;C.Vc3GT has no transmembrane region.图3 Vc3GT蛋白亲/疏水性、蛋白信号肽和跨膜结构域预测Fig.3 Hydrophilic/hydrophobic analysis, signal peptide prediction and transmembrane region prediction of Vc3GT
2.2.3 Vc3GT蛋白质的结构预测 利用SOPMA在线网站分析Vc3GT的二级结构,结果显示,该蛋白质二级结构由α-螺旋(Hh)、延伸链(Ee)、β-转角(Tt)和无规则卷曲(Cc)4种结构形式组成,其中α-螺旋占比最高,达40.13%,其次为无规则卷曲,占37.72%,延伸链占16.67%,β-转角占5.48%,这些结构散布于整个蛋白质中(图4-A)。
A:蓝色.α-螺旋,红色.延伸链,绿色.β-转角,黄色.无规则卷曲;B.葡萄3GT蛋白质三级结构(PDB ID:2C1X);C.Vc3GT蛋白质的三级结构预测。A:Blue.α-helix, Red.Extended chain, Green.β-turn, Yellow.Random coiling;B.Tertiary structure of grape 3GT(PDB ID: 2C1X);C.Prediction of tertiary structure for Vc3GT.图4 Vc3GT蛋白质的结构预测Fig.4 Structure prediction of Vc3GT
利用SWISS-MODLE在线网站预测Vc3GT的三级结构(图4-B),Vc3GT蛋白模型未形成多聚体和配体结构,且与葡萄中的3GT蛋白质结构(PDB ID:2C1X)(图4-C)最为相似,相似性为 56.70%。
2.2.4 Vc3GT氨基酸聚类分析 通过MEGA 7.0软件的邻近结合法(Neighbor-Joining,NJ)比较不同植物中的3-O-糖基转移酶(3GT)和5-O-糖基转移酶(5GT)之间的亲缘关系,构建系统进化树,Bootstrap初始值设定为1 000。节点数字为自展值(Bootstrap value),用于评估该分支的可信度,数值越大表示可信度越高(图5)。这些蛋白可以聚类为两个大类:第一类为3-O-糖基转移酶,第二类为5-O-糖基转移酶。另外,苹果、马铃薯和水稻中3GT具有2个拷贝。结果显示,Vc3GT与双子叶植物中3-O-糖基转移酶同源性高于单子叶植物(水稻、玉米、大麦)。Vc3GT与猕猴桃同源关系最近,同源性为67%。苹果和马铃薯中3GT的双拷贝之间的同源性反而较低,说明在部分物种中,3GT并不是通过直接复制实现的多拷贝。
图5 Vc3GT氨基酸序列系统进化树Fig.5 The phylogenetic tree was constructed using the amino acid sequence of Vc3GT in multiple species
2.2.5 分子对接模拟 通过ATB网站下载的矢车菊素构象,将Vc3GT与矢车菊素进行模拟对接,获得两者能量最低时的结合位点(图6-A),该模型所对应的模拟相互作用力二维平面结果显示Vc3GT可能主要通过第17位苯丙氨酸(Phe)、第18位丝氨酸(Ser)、第51位苏氨酸(Thr)、第84位天冬氨酸(Asp)、第85位异亮氨酸(Ile)和第282位缬氨酸(Val)残基与矢车菊素对接(图6-B)。从对接结果可以看出,Vc3GT与底物矢车菊素之间可能存在传统的氢键作用力、Pi-Sigma神经网络作用力、Pi-Pi T-shaped相互作用力和Pi-Alkyl相互作用力。
A.Vc3GT酶和矢车菊素分子对接最低能量模型;B.Vc3GT酶和矢车菊素分子对接存在的模拟相互作用力及二维结果。A.The lowest energy model of molecular docking between Vc3GT and cyanidin;B.Simulated interaction and two-dimensional results were shown using molecule docking between Vc3GT and cyanidin.图6 Vc3GT和矢车菊素分子对接模拟Fig.6 Simulation of docking between Vc3GT and cyanidin
2.2.6Vc3GT基因启动子区顺式作用元件预测 利用PLANTCARE启动子预测网站,分析Vc3GT上游约1 500 bp内的顺式作用元件,发现Vc3GT上游区域含有启动子转录因子核心元件CAAT区和TATA区。另外,还含有MYB转录因子结合位点, ACE、G-Box、GT1-motif、Box 4、TCCC-motif、Sp1和TCT-motif、I-box等光响应元件,DRE1、WRE3与STRE等非胁迫响应元件以及P-box、TCA-element、ABRE和TGA-element等胁迫相关激素的响应元件。根据以上分析结果可以推测,Vc3GT表达可能受到光、胁迫、激素等多种信号的调控,从而影响植物花青素的合成(表1)。
表1 Vc3GT启动子区顺式作用元件预测Tab.1 Prediction of cis-acting elements in the promoter region of Vc3GT
花青素属黄酮类化合物,颜色鲜艳。植物中花青素的合成途径涉及多种酶的功能,在苯丙氨酸裂解酶(PAL)、肉桂酸羟化酶(C4H)和4-香豆酰辅酶A连接酶(4CL)的连续催化下苯丙氨酸转化形成香豆酰辅酶A[18-19]。查尔酮合成酶(CHS)催化香豆酰辅酶A,形成黄色的查尔酮[20],随后在查尔酮异构酶(CHI)的作用下异构化,形成黄烷酮[21]。黄烷酮在黄烷酮-3-羟化酶(F3H)的作用下生成二氢黄烷酮[22],二羟黄酮醇还原酶(DFR)随后发挥作用,催化产生无色花青素,即原花青素[23]。原花青素在花色素合酶(ANS)的催化作用下,转化为有色的花青素,但此时生成的花青素结构不稳定。最后3-O-糖基转移酶(3GT)发挥作用,花青素经糖基化形成稳定的花色苷[24-25],这时生成的花色苷会转移到植物液泡中,这一步骤在增加花青素的稳定性的同时也增加了水溶性。
本研究克隆获得蓝莓3GT基因,发现该基因含有3个外显子和2个内含子,CDS全长1 371 bp,编码456个氨基酸。通过生物信息学预测,Vc3GT可能含有37个磷酸化位点,可能为亲水性蛋白,无跨膜区和信号肽结构域,二级结构由α-螺旋、延伸链、β-转角和无规则卷曲等组成。Vc3GT具有植物糖基转移酶家族(GTB-型)的典型结构域,GTB蛋白具有不同的N-和C-末端结构域,每个结构域包含一个典型的Rossmann折叠,这2个结构域具有高度的结构同源性,但序列同源性很低[26]。Vc3GT C-末端含有由44个氨基酸组成的PSPG-box特征性结构域,该结构域的最后一位是组氨酸,推测Vc3GT的糖基供体是UDP-半乳糖。Vc3GT与猕猴桃中的3GT亲缘关系最近,同源性为67%。通过分子对接发现Vc3GT和矢车菊素之间可能存在传统的氢键作用力,Pi-Sigma神经网络作用力,Pi-Pi T-shaped相互作用力和Pi-Alkyl相互作用力。
光照、胁迫等对植物花青素的合成具有调控作用。Vc3GT是蓝莓花青素合成途径中的关键酶,基因的表达模式受启动子顺式作用元件的调控,Vc3GT启动子区预测发现存在14个光响应元件,推测Vc3GT的表达受到光照的影响,已有研究证实光能够诱导花青素的合成,一般来说,光照对花青素的积累具有正向调控作用,尤其是蓝光和紫外光[27]。在花青素积累时期3GT基因的表达上调也间接表明,Vc3GT表达量的增加可能与光照有关。有研究表明,血橙在4 ℃贮藏时果皮中的UFGT基因表达量显著增强,花青素的含量也随之增多[28]。对葡萄卷叶病的研究发现,干旱情况下,MYBA1和UFGT的表达上调,导致感染葡萄卷叶病相关病毒3(GLRaV-3)后叶片变紫的症状增强。Vc3GT转录因子预测发现有4个胁迫响应元件,推测胁迫环境下可能会增强Vc3GT的表达,与上述研究结果一致。有研究表明,脱落酸(ABA)处理能够促进苹果果皮叶绿素降解和花青苷合成[29],而ABA合成抑制剂处理苹果果实会抑制花青苷的积累[30]。适当浓度的茉莉酸[31]和细胞分裂素[32]处理也能够促进花色苷的生物积累,高浓度的生长素[33]抑制花青苷的合成。Vc3GT上游区域转录因子预测有6个激素响应元件,由此可见脱落酸、生长素、赤霉素和水杨酸均能影响Vc3GT的表达。此外该启动子区序列还存在 MYB转录因子的识别位点,在花青素生物合成途径中,MYB转录因子被认为是最重要的调控因子,所有花青素生物合成途径中的基因均是其下游基因[34]。
3-O-糖基转移酶是催化活化糖基从UDP-葡萄糖(或UDP-半乳糖)转移到花青素的3-羟基或5-羟基处的一类转移酶。近年来,越来越多的研究表明3GT是花青素生物合成途径中的关键酶,该基因的表达强度严重影响花青素的生成,与控制其他酶相比,控制3GT活性更能调控花青素的积累。本研究克隆得到了蓝莓3GT基因,通过在线网站和预测软件对其进行生物信息学分析和功能预测,旨在为研究该基因的特征和功能,为后续进一步研究糖基转移酶的作用及花青素异源合成研究提供基础。