沙棘CAT家族基因的生物信息学分析

2019-06-11 03:36徐世琦李贺邓伊亦朱元玲邓金兰
天津农业科学 2019年5期
关键词:生物信息学分析

徐世琦 李贺 邓伊亦 朱元玲 邓金兰

摘    要:CAT (Cationic amino acid transporters)是植物体内参与氨基酸的吸收与转运的一类跨膜转运蛋白。为探究CAT   家族基因及其所编码蛋白的结构特征,本研究依据前期所获得的不同发育期沙棘果实的转录组测序数据,经过功能注释与分析后获得3 个CAT家族成员基因,分别命名为HrCAT1、HrCAT2和HrCAT3,并对其进行生物信息学分析。结果表明,沙棘果实HrCA  T  家族基因均含有完整的开放阅读框,编码二级结构以α-螺旋为主、不含信号肽的非分泌蛋白,其中HrCAT 1和HrCAT 2蛋白的三级结构之间具有较高相似性。研究结果可为后续研究沙棘果肉HrCAT基因的表达调控提供理论依据。

关键词:沙棘果实; 氨基酸转运体; 家族基因; 生物信息学分析

中图分类号:S663.9         文献标识码:A            DOI 编码:10.3969/j.issn.1006-6500.2019.05.001

Bioinformatic Analysis of CAT Gene Family in Sea Buckthorn

XU Shiqi, LI He, DENG Yiyi, ZHU Yuanling, DENG Jinlan

(College of Environment and Resources, Dalian Minzu University, Dalian, Liaoning 116600, China)

Abstract:  Cationic amino acid transporter (CAT) is involved in the uptake and transport of amino acids in plants. The aim of this paper was to study the CAT family genes and structural characteristics of encoded proteins. According to our previous RNA sequencing data from developing fruits of sea buckthorn, the genes encoding for the CAT transport proteins were functionally annotated and a total of three genes were characterized to encode for the CAT family, named as HrCAT  1, HrCAT2 and HrCAT3, respectively. The results of bioinformatics analysis showed that all the identified HrCAT genes contained complete open-reading frame(ORF), which could encode α-helix secondary structure, and non-secretory protein without signal peptide. There was a high similarity in tertiary structure between of HrCAT1 and HrCAT2 proteins. These results could provide a theoretical basis for further studies on the expression regulation of HrCAT genes in sea buckthorn fruit.

Key words: sea buckthorn fruit;cationic amino acid transporter;family gene; bioinformatics analysis

氨基酸是生物大分子蛋白質的基本单位,小分子极性物质的本质造成其在生物体内无法自由通过细胞质膜,需要相关转运蛋白的协助才能完成跨膜转运。植物中的氨基酸转运蛋白依据基因序列的同源性可分为ATFs (the amino acid transporter family) 和 APCs (the amino acid polyamine cholinetransporter) 两大家族[1-2] ,其中阳离子氨基酸转运体(CAT, Cationic amino acid transporters)属于后者。目前,对于CAT的研究主要集中在拟南芥[3]、杨树[4]和番茄[5]等少数植物,有关沙棘果实CAT家族基因方面研究尚未见报道。

沙棘 (Hippophae rhamnoides L.) 是一种落叶性灌木,耐旱抗风沙,生命力极强,在我国分布广泛,常应用于水土保持。其果实含有丰富的营养物质和生物活性物质,如必需氨基酸、维生素C、维生素E、类胡萝卜素、不饱和脂肪酸等,广泛应用于食品、医药、化妆品和保健品等领域,具有很高的经济价值[6-7]。沙棘果肉中的氨基酸具有种类多和必需氨基酸较高等特点,是良好的植物蛋白来源[8]。因此,开展沙棘果实发育过程中氨基酸转运蛋白的功能研究,为将来果实中功能蛋白的开发具有重要意义。

本研究以前期获得的不同发育期沙棘果实的转录组数据为基础,挖掘CAT 家族基因成员并进行生物信息学分析,对沙棘果肉中HrCAT蛋白的结构特征和功能进行预测,研究结果可为探索沙棘果实不同发育时期CAT蛋白的累积规律及调控机理研究奠定理论基础。

1 材料和方法

1.1 蛋白累积相关基因的筛选

对前期所获得的不同发育时期沙棘果实转录组测序数据进行基因注释、GO分析、KEGG代谢通路分析等一系列后续分析,筛选出样品间差异表达的基因,基于这些差异表达基因进行GO功能显著性富集分析和Pathway显著性富集分析,最后筛选出蛋白质累积途径中的CAT家族基因序列。

1.2 生物信息分析

利用各类生物信息在线工具和软件对目的基因的测序结果进行分析。筛选出HrCAT家族的核酸序列,用NCBI网站的在线工具ORF finder确定其开放阅读框,使用DNASTAR软件将核苷酸序列转换成氨基酸序列。之后利用ExPASy网站的ProtParam和ProtScale工具分析HrCAT家族基因编码蛋白的理化特性。ProtScale在线分析中,对蛋白质的氨基酸序列及其折叠后的空间结构进行分析测算,结果为负值说明该蛋白为亲水性蛋白,反之为疏水性蛋白。预测阈值常设定为1.6~2.0,窗口大小推荐设定为7,9,11(通常为单数)。使用SignalP[9]和TMHMM 2.0 Server[10]对蛋白中的信号肽序列和跨膜区进行预测。利用SOPMA和Phyre2[11]预测HrCAT蛋白的二级结构并进行三级结构的建模。

2 结果与分析

2.1 HrCAT家族基因的注释及生物信息学分析

对沙棘转录组测序得到的数据进行注释与筛选,获得了CAT家族基因中的3个成员,分别命名为HrCAT  1、HrCAT   2和HrCAT  3。通过NCBI网站上的 ORF finder 工具,分析3种 HrCAT   基因的核酸序列。結果表明,3种HrCAT 基因分别具有长度为3 646,1 373,2 387 bp的完整开放阅读框(open reading frame, ORF),分别编码 540,353,648个氨基酸,表明3种 HrCAT 基因均具有编码完整基因的独立性(表1)。疏水性总体平均值分别为0.547,0.429和0.557,属于疏水性蛋白。

2.2 HrCAT家族基因编码蛋白质的理化性质分析

利用ProtParam工具分析后可知,3种HrCAT基因编码的蛋白具有相似的分子式,不稳定指数均为Ⅱ级,表现为稳定蛋白。预测6种HrCAT基因所编码蛋白的分子量分别为137.90,88.87,162.91 kD,理论等电点为5.01,5.15,4.97 (表2)。

2.3 HrCAT家族蛋白信号肽和跨膜区的预测

应用SignalP.4.1对PsCAT家族蛋白进行信号肽的预测和分析,结果发现,3种HrCAT蛋白的C值和Y值均小于+1,S值无明显变化,且无明显的信号肽特征(图1),表明3种HrCAT蛋白均不含信号肽,属于非分泌蛋白。

利用TMHMM 2.0 Server进行HrCAT家族蛋白的跨膜区分析,结果显示,HrCAT1、HrCAT2和HrCAT3分别含有14个、10个和14个跨膜结构域,均属于跨膜蛋白(图2)。预测结果与疏水性结果分析一致,表明3个蛋白均为跨膜转运蛋白,承担氨基酸在膜内外的运输工作。

2.4 HrCAT家族蛋白的结构预测

应用在线工具SOPMA预测PsCAT家族蛋白的二级结构(表3)。通过比较分析后发现,3种HrCAT蛋白的二级结构均由α-螺旋、β-折叠和无规卷曲4种结构元件组成,其中α-螺旋所占比例均为最高、其次为无规卷曲,β-折叠所占比例最少,根据蛋白结构类型的分类方法,3种HrCAT蛋白均属于混合型蛋白,且二级结构彼此之间具有较高相似性。另外,3种HrCAT蛋白中均含有较高比例的无规卷曲结构,而无规卷曲结构常受侧链影响从而构成蛋白质的活性部位[12-13]。

通过Phyre2服务器同源构建模型预测PsCAT蛋白的三维结构[14],经序列对比分析后,分别以C4DJIA蛋白和C4M57A蛋白的核磁模型为模板构建模型。结果表明,在3种HrCAT蛋白的三级结构中占比最多的均为α-螺旋,其次为无规卷曲,这与其二级结构预测的结果一致。另外,HrCAT1和HrCAT2蛋白的三级结构之间具有较高相似性,二者与HrCAT3蛋白的三级结构的相似度较低(图3)。

3 结论与讨论

CAT是一类碱性跨膜转运蛋白,属于 APCs 家族,主要参与植物体内氨基酸的吸收与转运。近年来,在拟南芥和杨树中已发现多个CAT 家族成员,CAT家族基因的调控与表达水平,突变体功能缺失等方面已成为研究热点[15]。由于蛋白质累积过程中调控机制十分复杂,CAT 调控蛋白相关功能基因表达的分子机制尚不明确,蛋白理化性质和结构解析等方面鲜有报道。本研究中采用生物信息学方法对沙棘果实HrCAT   家族所编码蛋白的理化性质、结构和功能等方面进行分析与预测,探索植物CAT家族蛋白的结构与功能特点。

沙棘果实中HrCAT   家族编码蛋白均含有跨膜区,这与其吸收与转运氨基酸的功能密切相关。二级和三级结构分析表明,HrCAT家族基因编码蛋白的二级结构均由α-螺旋、β-折叠和无规卷曲3种结构组成,HrCAT1和HrCAT2蛋白的三级结构具有较高的相似度。这揭示沙棘果肉中的HrCAT1和HrCAT2基因在功能方面可能具有较高的相似性,而HrCAT3蛋白初步推测可能具有某些特异性功能。推测沙棘果肉中的3种CAT基因在调控不同种类氨基酸的吸收和转运时发挥的功能存在多样性与特异性。本研究结果为进一步探索沙棘果肉蛋白的累积规律及调控机理提供科研依据与基础,具有重要的学术价值和应用前景。

参考文献:

[1]FISCHER W B, ANDRE B, RENTSCH D, et al. Amino acid transport in plants[J]. Trends plant sci, 1998, 3:188-195.

[2]WIPF D, LUDEWIG U, TEGEDER M, et al. Conservation of amino acid transporters in fungi, plants and animals[J]. Trends biochem sci, 2002, 27: 139-147.

[3]TEGEDER M. Transporters for amino acids in plant cells: some functions and many unknowns[J]. Curr opin plant biol, 2012, 15(3):315-321.

[4]COUTURIER J, DOIDY J, GUINET F, et al. Glutamine, arginine and the amino acid transporter Pt-CAT11 play important roles during senescence in poplar[J]. Ann bot, 2010, 105(7): 1159-1169.

[5]杨丽婷. 番茄SlCAT2 基因的克隆及功能研究[D]. 重庆:重庆大学,2014.

[6]BAL M L, MEDA V, NAIK N S, et al. Sea buckthorn: A potential source of valuable nutrients for nutraceuticals and cosmoceuticals[J]. Food res intl, 2011, 44:1718-1727.

[7]CHEN C, XU X M, CHEN Y, et al. Identification, quantification and antioxidant activity of acylated flavonol glycosides from sea buckthorn(Hippophae rhamnoides ssp. sinensis)[J]. Food chem, 2013, 141:1573-1579.

[8]谭亮, 赵静, 马家麟, 等. 青海玉树沙棘不同部位营养成分分析与营养价值评价[J]. 天然产物研究与开发, 2018, 30: 807-816, 899.

[9]PETERSEN T N, BRUNAK S, VON HEIJINE G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature methods, 2011, 8(10): 785-786.

[10]MOLLER S, CRONING M D, APWEILER R. Evaluation of methods for the prediction of membrane spanning regions[J]. Bioinformatics, 2001, 17(7): 646-653.

[11]KELLEY L A, STERNBERG M J. Protein structure predictionon the web: a case study using the Phyre server[J]. Nature protocols, 2009, 4(3): 363-371.

[12]李曉琴, 王守源, 罗辽复. 蛋白质的二级结构序列和结构型[J]. 内蒙古大学学报(自然科学版), 2002, 33(1): 21-25.

[13]马帅, 王勤, 李晓琴. α/β类蛋白质折叠类型的分类方法研究[J]. 生物信息学, 2014, 12(2): 123-132.

[14]BOHNUUD T, LUO L, WODAK S J, et al. A benchmark testing ground for integrating homology modeling and protein docking[J]. Proteins, 2017, 85(1): 10-16.

[15]SU Y H, FROMMER W B, LUDEWIG U. Molecular and functional characterization of a family of amino acid transporters from Arabidopsis[J]. Plant physiol, 2004,136(2): 3104-3113.

猜你喜欢
生物信息学分析
陕西杨凌地区TYLCV病毒生物信息学分析研究