孙宇蛟,陈 欣,李 悦,徐慧莹,董 源,王 左,康雨琦
(东北农业大学 生命科学学院,黑龙江 哈尔滨 150030)
甜叶菊是一种含糖量很高的作物,叶片中的甜菊醇糖苷(steviol glycosides,SGs)是一种天然的甜味剂,其甜度是蔗糖的300倍左右,但热量只有蔗糖的1/3 000[1],因此,甜叶菊深受糖尿病、肥胖症等相关疾病患者的关注。近些年来,甜叶菊被大规模运用到食品、医药等相关领域。它作为一种新型的食材和药材,在国内外均广受关注。有研究表明,作为甜菊醇糖苷生物合成途径中的关键酶,尿嘧啶二磷酸-糖基转移酶(UDP-glycosyltransferase,UGT)通常以甜菊醇为前体,合成不同的甜菊醇糖苷,对甜叶菊甜度和品质的提高有关键作用。
UGT基因种类多样,在许多经济和模式作物中均有研究。Brazier等人通过T-DNA插入手段,获得了拟南芥T3代UGT72B1基因敲除株,发现ugt72b1植株(At4g01070)对3,4-二氯苯胺(3,4-dichloroaniline,DCA)和2,4,5-三氯苯酚(2,4,5-trichlorophenol,TCP)的结合能力显著下降,证明了UGT基因在植物体内的脱毒作用[2];Jackon等人通过对拟南芥UGT84B1基因过表达植株的研究,发现其具生长激素缺陷的现象,推测该基因可能参与植物激素平衡[3];Chong等人通过抑制糖基转移酶TOGT基因在烟草中的表达,发现在其植株中出现组织坏死、抗性降低等表型。推测该基因可能与植物防御相关[4]。
在世界范围内,多数学者对甜叶菊糖苷转运代谢、合成及其功能进行了研究,但在基因及蛋白质层面对甜叶菊尿嘧啶二磷酸-糖基转移酶的研究却不多。本研究依托于生物信息学分析,以甜叶菊3个UGT基因为研究对象,对其蛋白质进行了理化性质分析、初级及高级结构的预测、多序列比对分析,并与康乃馨、陆地棉等其他物种的UGT基因一同构建了分子进化树,以期为甜叶菊作物UGT蛋白质研究及分子辅助育种提供参考及依据。
甜叶菊3个尿嘧啶二磷酸-糖基转移酶基因UGT76G1(AY345974)、UGT85C2(AY345978)、UGT91D1(AY345980)及其他物种UDT基因均来源于NCBI(https://www.ncbi.nlm.nih.gov/)。
采用在线软件ProtParam(http://web.expasy.org/protparam/)预测UGT蛋白序列的一级结构,通过ProtScale在线工具(http://web.expasy.org/protscale/)分析蛋白质的亲疏水性,利用SOPMA在线软件(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)预测UGT蛋白序列的二级结构,采用SWISS-MODEL软件(http://www.swissmodel.expasy.org/)预测蛋白质的三级结构。
通过Clustal X2和DNAMAN进行多序列比对分析,采用MEGA 7.0软件对所有蛋白质编码序列进行分子进化树的构建,采用邻接法(Neighbor-jioning,NJ)建树,其中,校正值(bootstrap)设置为1 000,其他均为默认值。
UGT76G1、UGT85C2、UGT91D1对应蛋白序列通过https://web.expasy.org/protparam/进行分子量、等电点、氨基酸数量、带正负点的残基总数、分子式、不稳定指数和脂肪酸指数预测,相关结果如表1所示。经分析,从表1中可以看出,等电点集中于6左右,氨基酸数量为520~550个不等,不稳定指数集中于45左右,脂肪族指数为100左右。
表1 UGT基因一级结构分析
通过https://web.expasy.org/protparam/预测所有蛋白质亲疏水性(GRAVY)。UGT76G1、UGT85C2、UGT91D1对应的GRAVY值分别为-0.089,-0.077,-0.104,这初步说明3个蛋白质呈一定的亲水性;通过http://web.expasy.org/protscale/网站,采用 Hphob./Kyte&Doolittle算法进一步进行亲疏水性预测,图1进一步认证了其均为亲水性蛋白质。
图1 UGT蛋白质亲疏水性预测
利用SOPMA在线软件(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)预测UGT蛋白序列的二级结构。经过分析,从表2和图2中可以看出,各UGT蛋白含有35%~45%左右的α-螺旋及无规卷曲,含有15%左右的链延伸结构,较少的β-转角。其中,UCT85C2、UCT76G1这2个蛋白除了含有较相近的β-转角外,其余相似度高。
表2 UGT蛋白序列二级结构
图2 UGT蛋白二级结构预测
通过SWISS-MODEL预测所得序列蛋白质高级结构,3条序列均通过同源建模获得结构预测。从图3中可以看出,3个UGT蛋白结构均有所差异,推测可能是基因在进化过程中内含子插入或丢失造成的。
将甜叶菊中3个UDT基因序列通过Clustal X2及DNAMAN进行多序列比对分析,序列的总体相似度为42.60%.从图4中可以看出,完全一致的序列占较小部分,序列间总体相似度不高,由此推测其在进化过程中存在一定的差异。
将甜叶菊(Stevia rebaudian)、陆地棉(Gossypium hirsutum)、康乃馨(Dianthus caryophyllus)、棉豆(Phaseolus lunatus)和烟草(Nicotiana tabacum L.)中已报道的UGT基因通过MEGA 7.0软件进行分子进化树的构建。从图5中可以看出,各分支自展值均大于80,说明建树信息可靠。除此之外,对于同一物种,甜叶菊中的3个UGT基因进化关系比较远;对于不同物种来说,甜叶菊AY345974基因与康乃馨BAD52007基因具有一定的亲缘关系。总体可以看出,不同物种与同一物种间UGT基因均存在一定的进化关系。
图3 UGT蛋白质高级结构预测
图4 甜叶菊3个UGT基因序列比对
图5 分子进化树的构建
本研究通过生物信息学手段对甜叶菊3个UGT蛋白质进行了一级结构亲疏水性分析,二级结构、高级结构的预测,多序列比对和系统进化树的构建。在亲疏水性方面,甜叶菊中UGT蛋白质均为可溶蛋白质,呈较强的亲水性。
向丽等人用5’-RACE和 RT-PCR方法克隆了1条三七UDP-糖基转移酶基因,该基因编码495个氨基酸,蛋白分子量为55 kD,属于不稳定蛋白。其二级结构中α-螺旋占36.16%,β-转角占11.31%,无规卷曲占52.53%,这与本研究中甜叶菊3个UGT基因二级的预测较为相符[5]。除此之外,郭书巧等人在甜叶菊中分离出与本研究同源性很高的UGT76G2基因,研究发现其与玉米、康乃馨、水稻等5种均存在一定的进化关系,但进化地位相差较远,与本研究的进化树结果较为相符[6]。
UGT基因为多拷贝、多家族基因,家族中基因数目比较多,功能不尽相同。近年来,多种UGT基因被渐渐发掘,例如李微微等人在甜叶悬钩子中克隆了18条UDP-糖基转移酶基因,在大肠杆菌中进行了异源表达,并对克隆的基因进行了初步的序列分析,为进一步挖掘和验证甜叶悬钩子中UGT基因功能奠定了基础[7]。随着生命科学和微机科学的迅速发展,生物信息学作为一门独立学科,在发掘新基因、研究生物大分子功能方面发挥着重要作用[8]。本研究依托生物信息学手段,在甜叶菊作物中鉴定3个UDP-糖基转移酶基因,并对其进行蛋白质功能的初步研究,为甜叶菊UGT基因的发掘、提高作物经济效益方面的研究提供了新的思路。
[1]Brandle,J.E.,P.G.Telmer.Steviol glycoside biosynthesis[J].Phytochemistry,2007,38(42):1855.
[2]Brazier-Hicks,M.,R.Edwards.Functional importance of the family 1 glucosyltransferase UGT72B1 in the metabolism of xenobiotics in Arabidopsis thaliana[J].Plant Journal,2005,42(4):556-566.
[3]RG Jackson,M Kowalczyk,Y Li,et al.Over-expression of an Arabidopsis gene encoding a glucosyltransferase of indole-3-acetic acid: phenotypic characterisation of transgenic lines[J].Plant Journal,2002,32(4):573-583.
[4]J Chong,R Baltz,C Schmitt,et al.Downregulation of a pathogen-responsive tobacco UDP-Glc:phenylpropanoid glucosyltransferase reduces scopoletin glucoside accumulation,enhances oxidative stress,and weakens virus resistance[J].Plant Cell,2002,14(5):1093-1107.
[5]向丽,郭溆,牛云云,等.三七PnUGT1基因的全长cDNA克隆和生物信息学分析[J].药学学报,2012,47(08):1085-1091.
[6]郭书巧,杨郁文,倪万潮.甜叶菊葡糖基转移酶基因UGT76G2的克隆及生物信息学分析[J].基因组学与应用生物学,2009,28(03):422-428.
[7]李微微,孙雨伟,杨靖亚,等.甜叶悬钩子(Rubus suavissimus S.Lee)中UDP-糖基转移酶基因的克隆、表达及序列分析[J].工业微生物,2017,47(04):1-10.
[8]齐安智.计算机算法在生物信息学中的应用研究[J].中国新通信,2018,20(02):171.