王佳蕊 孙培媛 柯瑾 冉彬 李洪有
(1. 贵州师范大学荞麦产业技术研究中心,贵阳 550001;2. 贵州师范大学生命科学学院,贵阳 550025)
类黄酮化合物是一类广泛存在于植物中的次生代谢物,在植物生长发育、生物与非生物胁迫抵抗中起着至关重要的作用[1-2]。此外,类黄酮化合物还具有降“三高”、消炎、抗氧化、抗病毒、抗动脉硬化、抗糖尿病、抗癌防癌等多种保健功能[3-4]。根据化学结构差异,将类黄酮化合物分为黄酮、异黄酮、黄酮醇、黄烷酮、黄烷醇和花青素六大类[5]。在植物中,大多数类黄酮化合物以糖苷类化合物形式存在。通常,植物中类黄酮化合物的糖基化由糖基转移酶催化完成,糖基化的位置主要发生在3-O位或7-O位,少部分也发生在5-O位和4'-O位。此外,还有少部分类黄酮化合物直接在苯环上的6-C位或8-C位发生糖基化,这类化合物称为类黄酮C-糖苷[5]。
目前,植物中已报道的类黄酮C-糖苷主要有牡荆素(芹菜素-8-C-葡萄糖苷)、异牡荆素(芹菜素-6-C-葡萄糖苷)、荭草素(木犀草素-8-C-葡萄糖苷)、异荭草素(木犀草素-6-C-葡萄糖苷)等[6]。它们在植物中具有较强的生物活性,不易水解,对植物生长和发育、非生物和生物胁迫的响应以及环境防御等发挥的作用[7]。在植物中,类黄酮C-糖苷的生物合成主要是在C-糖基转移酶的催化作用下,直接将糖基供体转移到底物黄酮的苯环骨架的C上。目前,在植物中已有多个C-糖基转移酶被鉴定[6]。He等[8]在金莲花(Trollius chinensis Bunge)中鉴定到的C-糖基转移酶TcCGT1,可以特异性地催化黄酮类、黄酮醇等黄酮类化合物的8-C糖基化黄酮类化合物。Wang等[9]在大豆(Glycine max(Linn)Merr.)毛状根中过表达葛根(Pueraria montana var.lobata)的PIUGT43,发现其编码蛋白酶具有将大豆苷元催化为葛根素的活性,且对异黄酮具有底物专一性。Mashima等[10]将山葵(Wasabia japonica(Miq.)Matsum.)的WjGT1在大肠杆菌中重组表达发现,该酶可将芹菜素或木犀草素催化合成异牡荆苷或异荭草苷。Brazier-Hicks等[11]发现水稻(Oryza sativa L.)OsCGT可通过与脱水酶协同作用催化2-羟基黄酮合成黄酮C-糖苷。在甜荞(Fagopyrum esculentum moench)的研究中发现,糖基转移酶FeCGTa和FeCGTb均以2-OH黄烷酮为底物催化生成黄酮C-糖苷[12]。
苦荞(Fagopyrum tataricum Gaertn)属于蓼科荞麦属,是起源于我国西南地区的一年生小杂粮作物,含有丰富的高活性类黄酮化合物(1.0%-3.0%),具有较高的保健作用[3-4]。目前,在苦荞种子中已鉴定到90余种类黄酮化合物,其中一半以上为黄酮糖苷类化合物,包括类黄酮C-糖苷中的牡荆素、异牡荆素、荭草素和异荭草素等[3]。在苦荞中,目前已有多个糖基转移酶被功能鉴定催化了黄酮糖苷的合成[13-17],但未见参与类黄酮C-糖苷生物合成的C-糖苷糖基转移酶基因的相关报道。课题组前期对苦荞糖基转移酶基因家族进行系统鉴定,通过系统进化分析发现候选基因与已鉴定功能的C-糖基转移酶聚在一支(数据未发表)。本研究利用RT-PCR技术,从苦荞品种‘品苦1号’中克隆一个可能参与苦荞类黄酮C-糖苷生物合成的C-糖基转移酶基因FtUGT143,并对其进行生物信息学、系统进化、分子对接、基因表达、基因表达量与类黄酮C-糖苷含量关系分析,以期为苦荞类黄酮C-糖苷生物合成中的功能研究奠定基础。
1.1.1 植物材料 苦荞品种‘品苦1号’,由山西农业大学提供。
1.1.2 载体 pMD19-T,购自大连宝日医生物公司。大肠杆菌(Escherichia coli)DH5α由本实验室保存。
1.2.1 RNA提取 RNAprep Pure 多糖多酚植物总RNA提取试剂盒提取‘品苦1号’芽苗期的根、茎、叶,6叶期植株的根、茎、叶,成年期植株的花、种子的总RNA,具体操作按照试剂盒说明书进行。
1.2.2 cDNA(complementary DNA)获取 以叶片的总RNA为模板,PrimeScript II 1st Strand cDNA Synthesis Kit反转录试剂盒进行反转录,用于基因全长CDS序列克隆的第一链cDNA。根据PrimeScriptTMRT reagent Kit with gDNA Eraser 试剂盒说明书,分别以‘品苦1号’芽苗期的根、茎、叶,6叶期植株的根、茎、叶,成年植株的花、种子的总RNA为模板,合成用于荧光定量的第一链cDNA。
1.2.3 FtUGT143全长CDS的克隆 根据已知苦荞基因组数据中注释的FtUGT143的核酸序列,BioXM 2.7和DNMAN软件设计扩增目的基因片段全长的CDS序列的特异性引物FtUGT143-F和FtUGT143-R(表1),以1.2.2中叶cDNA为模板,高保真KOD酶进行PCR扩增。PCR产物加A尾反应后,经1.5%的琼脂糖凝胶电泳检测后胶回收、连接目的产物、连接pMD19-T载体、转化大肠杆菌感受态DH5α。PCR检测阳性菌株后,送至上海生工生物工程股份有限公司测序。
表1 本研究中所用引物序列Table 1 List of primers'sequences in this study
1.2.4 FtUGT143的生物信息学分析 CodonW 1.4.2对FtUGT143基因密码子偏好性参数分析;BioXM 2.7查询其最大开放阅读框(open reading frame, ORF),预测其编码的蛋白序列及编码蛋白的等电点和分子量大小;NCBI中的BLAST比对查找FtUGT143蛋白的同源蛋白,DNAMAN进行蛋白序列多序列比对;MEGA 7.0软件采用NJ法构建FtUGT143与其他已知的植物黄酮糖基转移酶基因构建系统进化树;AutoDock Vina 1.1.2对FtUGT143与4种类黄酮代谢小分子进行分子对接模拟实验,Pymol 2.4.0可视化分析对接结果。
1.2.5 FtUGT143在苦荞不同组织部位中的表达分析 BioXM 2.7软件和DNAMAN软件分析设计FtUGT143的实时荧光定量PCR(quantitative realtime PCR)引物qFtUGT143-F和qFtUGT143-R,设计内参基因FtUPL7的荧光定量引物qFtUPL7-F和qFtUPL7-R(表1),以1.2.1中‘品苦1号’芽苗期的根、茎、叶,6叶期植株的根、茎、叶,成年植株的花、种子的总RNA为模板,苦荞的FtUPL7作为内参基因,SYBR® Premix Ex TaqTMII试剂盒进行荧光定量分析,伯乐bio-rad实时定量PCR仪CFX96扩增,每个样本设置3个生物学重复和3个技术重复。2-ΔΔCt法计算基因的相对表达情况。具体操作参照Li等[18]的方法进行。参照王璐瑗等[19]方法提取和测定各组织部位中总黄酮含量。GraphPad Prism 9.0分析FtUGT143在苦荞不同组织部位中的表达量与总黄酮含量间相关性。
以‘品苦1号’叶片cDNA为模板,基因特异性引物FtUGT143-F和FtUGT143-R扩增出一条约700 bp的目的条带(图1)。目的条带经测序比对,发现其与参照序列完全一致,CDS全长为678 bp,编码226个氨基酸。Protparam在线软件对FtUGT143进行分析,结果显示,相对分子质量为25.16 kD,理论等电点为4.76,是稳定的疏水蛋白。
图1 苦荞FtUGT143基因全长CDS克隆Fig. 1 Full-length CDS clone of the FtUGT143 gene of buckwheat(Fagopyrum tataricum)
2.2.1 FtUGT143的密码子偏好分析 Codon W分析FtUGT143基因序列的密码子偏好性,其序列的有效密码子数(ENC值:范围20-61)为51.17,表明FtUGT143的密码子偏好性较弱;密码子适应指数(CAI值:范围0-1)为0.1574,进一步表明该基因的密码子偏好性较弱。FtUGT143的GC与GC3s含量均小于50%,该ORF序列中GC含量小于AT含量,说明苦荞的糖基转移酶基因在编码时偏好使用A或T结尾的密码子。对FtUGT143密码子RSCU值分析(图2),其中有26个密码子的RSCU值大于1,是FtUGT143的偏好密码子;有13个密码子的RSCU值大于1.5,为高频率密码子;而AGA和CCG的RSCU值最大(2.67),表明FtUGT143基因对AGA和CCG具有极强的偏好性。
图2 FtUGT143密码子RSCU值分析Fig. 2 Analysis of FtUGT143 codon's RSCU values
2.2.2 FtUGT143同源蛋白的多序列比对系统进化分析 FtUGT143蛋白序列在NCBI数据库进行BLASTp比对搜寻发现,FtUGT143与多种植物的糖基转移酶序列有较高的同源性。蛋白多序列比对发现,FtUGT143的蛋白序列在C-末端结构域附近存在一个由44个氨基酸组成的PSPG box(图3-A)。该PSPG box中包含高度保守的氨基酸序列HCGWNS(图3-B),与前期研究的结论一致。PSPG box区域第44个氨基酸是谷氨酰胺(Gln,Q),推测FtUGT143可能偏好以UDP-葡萄糖作为糖供体,具体情况还需要进一步研究。根据文献和NCBI数据库,获得多种植物已鉴定功能的糖基转移酶,用MEGA7.0软件构建NJ系统进化树。结果(图4)显示,FtUGT143和催化黄酮化合物C位糖基化的糖基转移酶聚在同一分支上且与金莲花TcCGT1亲缘关系最近。
图3 植物UGT蛋白氨基酸的序列多重比对与PSPG box比对分析Fig. 3 Sequence multi-alignment of plant UGT protein amino acids and comparative analysis of PSPG box
图4 FtUGT143系统进化树分析Fig. 4 FtUGT143 phylogenetic tree analysis
2.2.3 FtUGT143蛋白与底物分子对接 SWISSMODEL对FtUGT143进行同源建模并使用AutoDock Vina 1.1.2对FtUGT143与山奈酚、表儿茶素、木犀草素、芹菜素(其中芹菜素和木犀草素是苦荞中主要黄酮C-糖苷的合成底物)进行分子对接分析,结果(表2)表明,FtUGT143的最适底物受体为木犀草素,其次是芹菜素。将FtUGT143的对接结果导入Pymol中进行可视化分析(图5)。FtUGT143与底物木犀草素通过传统氢键与氨基酸残基(Thr21、Gln22、Arg84、His98、Trp101、Asn102、Glu106、Gln123)相互作用;FtUGT143与底物芹菜素通过传统氢键与氨基酸残基(Thr21、Gln22、Arg84、His98、Trp101、Asn102、Glu106、Gln122、Gln123)相互作用,推测以上残基是FtUGT143与小分子相互作用的关键残基,主要作用力为氢键。这说明了FtUGT143可以与木犀草素和芹菜素发生相互作用,推测其可能具有催化木犀草素和芹菜素合成黄酮C-糖苷的功能。
图5 FtUGT143和木犀草素、芹菜素对接示意图Fig. 5 Schematic diagram of FtUGT143 docking with luteolin and apigenin
表2 FtUGT143与4种类黄酮代谢小分子的对接结果Table 2 Docking results of FtUGT143 with four flavonoids metabolizing small molecules
2.2.4 FtUGT143在苦荞不同组织部位中的表达量与总黄酮含量间的相关性分析 实时荧光定量PCR检测结果显示,该基因在苦荞芽苗期的叶中表达量最高,其次是芽苗期的茎和根,而在6叶期植株的根、茎、叶和成年期植株的花、种子中表达量相对较低(图6-A)。各组织部位中的4种C-黄酮-牡荆素、异牡荆素、荭草素和异荭草素相对含量分析结果显示芽苗期植株的叶、茎和根含量相对最高,在其他时期的不同组织部位中含量较低(图6-B)。FtUGT143在不同组织部位中的表达量与4种C-黄酮相对含量间的相关性分析显示,FtUGT143的表达量与牡荆素(R2=0.9614)、异牡荆素(R2=0.9649)、荭草素(R2=0.9714)和异荭草素(R2=0.9630)4种C-黄酮含量间显著正相关(图6-C),表明FtUGT143可能参与这4种C-黄酮的合成。
图6 FtUGT143在苦荞不同组织部位中的表达量与4种C-黄酮含量间的相关性Fig. 6 Correlation between the expressions of FtUGT143 in the different tissue sites of buckwheat and the content of four C-flavonoids
苦荞药食同源,富含高生物活性的黄酮类化合物。黄酮糖苷化合物的生物合成主要由糖基转移酶完成[20]。黄酮C-糖苷是苦荞类黄酮生物合成途径中的次级代谢产物,因此,研究苦荞中C-糖基转移酶基因,对于深入了解苦荞中黄酮C-糖苷的生物合成机制具有重要意义。
本研究通过RT-PCR技术成功克隆到一个可能参与苦荞中黄酮C-糖苷生物合成的糖基转移酶基因FtUGT143,其编码蛋白序列由224个氨基酸残基组成,是一个稳定的疏水蛋白。对FtUGT143的密码子偏好模式进行分析,ENC值为51.17,CAI值为0.1574。FtUGT143的GC与GC3s含量均小于50%。为后续FtUGT143蛋白结构预测与定向突变功能鉴定提供了理论基础。黄酮苷元主要包括芹菜素及其羟基或甲基化产物木犀草素、黄芩素等[5],其被UGT作为底物催化其糖基化形成黄酮糖苷。例如,水稻[21]的OsUGT706D1和 OsUGT707A2 分别以芹菜素作为底物,在7-O和5-O位置催化形成黄酮糖苷。长春花[22](Catharanthus roseus(L.)G.Don)的aUGT3以黄芩素作为底物在7-O位置催化形成龙胆糖苷。黄酮C-糖苷主要为牡荆苷、异牡荆苷、荭草苷和异荭草苷,分别是芹菜素和木犀草素在C-6位或者C-8位在C-糖基转移酶作用下连接一分子的葡萄糖形成的黄酮C-糖苷[23]。目前,C-糖基转移酶在金莲花[8]、葛根[9]、山葵[10]、甜荞[12]等多种植物中被功能鉴定。研究表明糖基转移酶基因家族在C端有44个氨基酸所组成的高度保守PSPG box序列[24]。本研究通过对蛋白氨基酸序列进行多重比对发现,FtUGT143具有相同的保守序列。系统进化树分析表明,FtUGT143与玉米、大豆、水稻、甜荞的C-糖基转移酶聚在一支,表明FtUGT143是糖基转移酶基因家族的C-糖基转移酶成员,这暗示该基因可能具有直接催化黄酮化合物骨架的C位形成黄酮糖苷的功能。
研究认为当蛋白与底物分子的自由结合能(ΔG)小于-29.288 kJ/mol有强烈的结合能力[6,25]。为了解苦荞FtUGT143在C-黄酮生物合成中可能催化的底物及功能,本研究对FtUGT143蛋白进行同源建模与分子对接模拟,结果显示FtUGT143能与合成C-黄酮糖苷牡荆素、异牡荆素、荭草素和异荭草素的底物木犀草素(ΔG= -33.8904 kJ/mol)和芹菜素(ΔG=-32.2168 kJ/mol)相互作用,这与课题组前期在苦荞与甜荞的代谢组比对分析中的结论相同[3],进一步表明FtUGT143可能具有催化苦荞中这4种C-黄酮生物合成的功能。通过Pymol分析后推测FtUGT143受体蛋白与芹菜素相互作用的关键氨基酸残基为Thr21、Gln22、Arg84、His98、Trp101、Asn102、Glu106、Gln123,这些关键残基位于配体与大分子结合的活性口袋中,为后续对FtUGT143的活性位点研究提供了参考价值。
荧光定量表达分析显示,FtUGT143主要在苦荞芽苗期的叶、茎和根中表达,与甜荞中C-黄酮糖基转移酶同源基因FeCGTa和FeCGTb表达模式相似[12]。研究发现在甜荞的体外酶活实验中以2-OH黄烷酮为底物催化生成黄酮C-糖苷[12]。进一步分析显示,FtUGT143在苦荞不同组织部位中的表达量与4种C-黄酮牡荆素、异牡荆素、荭草素和异荭草素的含量显著正相关。有关FtUGT143在苦荞C-黄酮生物合成中的详细功能还需进一步地研究。
苦荞FtUGT143是糖基转移酶基因家族的一员,具有C-糖基转移酶的特征,可能催化苦荞中C-黄酮牡荆素、异牡荆素、荭草素和异荭草素的生物合成。