陈锦玲 徐媛 陈玉梅 李璐璐 李惠敏 秦新民
摘要 [目的] 研究沙田柚类蛋白激酶基因编码的蛋白质序列所包含的生物信息学。[方法] 利用高通量测序对沙田柚自交和异交花柱进行转录组测序,通过差异分析得到沙田柚类蛋白激酶基因序列。采用生物信息学方法,对其编码的蛋白质从序列特征、理化性质、跨膜结构域、高级结构以及功能域等方面进行预测和分析。[结果] 该基因全长为2 323 bp,开放阅读框(ORF)全长为1 560 bp(Genbank登录号:MG925820),共编码519个氨基酸,分子质量为57.39 kD,等电点PI为8.55。该蛋白质含有1个植物STKc IRAK蛋白家族的保守结构域,为亲水性稳定蛋白。氨基酸序列分析表明,其编码的氨基酸与克莱门柚和甜橙的同源性分别为 100%、99%。系统进化树表明沙田柚类蛋白激酶基因与克莱门柚和甜橙亲缘关系很近,屬于同一进化分支。[结论] 该研究结果可为今后深入研究沙田柚自交不亲和机理提供参考。
关键词 沙田柚;类蛋白激酶基因;生物信息学分析
中图分类号 S188文献标识码 A文章编号 0517-6611(2018)16-0088-05
Abstract [Objective]To study the biological information contained in the protein sequence encoded receptorlike protein kinases gene.[Method]The transcriptome of the selfpollinated style and crosspollinated style of Citrus grandis var.Shatinyu Hort were sequenced by highthroughput sequencing technology.Receptorlike protein kinases gene sequence of C.grandis var.Shatinyu Hort was obtained though differential analysis method, and some characters of the receptorlike protein kinases protein were analyzed and predicted by bioinformatics method, including the composition of amino acid sequence, physicochemical parameters, hydrophobicity, transmembrane domain, secondary structure and function of protein,etc. [Result] Receptorlike protein kinases gene was 2 323 bp in length with an open reading frame (ORF) of 1 560 bp, encoding 519 amino acids with deduced molecular weight of 57.39 kD, and theoretical pI value of 8.55, and contained a STKc IRAK domain.Bioinformatics analysis showed that receptorlike protein kinases protein was a hydrophobic and stable protein.The homology analysis of amino acid sequence indicated that the receptorlike protein kinases protein shared high homology with that of Citrus clementina (100%) and Citrus sinensis (99%).Phylogentic analysis revealed that receptorlike protein kinases gene showed closer kinship with that of C.clementina and C.sinensis,indicating that they belong to the same evolutionary branch.[Conclution]The results could provide a theoretical reference for further study of selfincompatibility molecular mechanism in C.grandis var.Shatinyu Hort.
Key words Citrus grandis var.Shatinyu Hort;Receptorlike protein kinases gene;Bioinformatics
沙田柚(Citrus grandis var.Shatinyu Hort)隶属于芸香科柑橘属,具有配子体自交不亲和的特性。植物自交不亲和(selfincompatibility, SI)是指具有完全花且能够产生雌雄配子,雌蕊的柱头或花柱能特异性识别与自体基因型相同的花粉,导致花粉不萌发或花粉管停止生长的一种现象[1]。这种现象在避免植物近亲繁殖方面具有重要的意义。目前,关于芸香科植物的自交不亲和性机理尚不明确,但在沙田柚自交不亲和的形态学、细胞学和蛋白质化学等方面的研究已取得了一定进展[2]。秦新民等[3]分离并鉴定了沙田柚花粉管特异蛋白;杨继华等[4-5]利用IEF/SDS-PAGESHUA双向电泳的方法测定了沙田柚自交花柱特异蛋白的分子量、等电点以及N-末端氨基酸序列;薛妙男等[6-7]确定了沙田柚自交花粉管在花柱中生长的受阻部位;秦新民等[8-9]还确定了花柱通道细胞中特异蛋白和花粉管中特异蛋白的产生部位及分布。
植物中的类蛋白激酶通过磷酸化和去磷酸化作用调节植物的代谢,这些过程几乎涉及所有的生理和病理过程[10],主要作用于植物的细胞抗逆反应[11] 、生长发育[12-13] 、抗病防卫[14-15] 、自交不亲和[16]以及胞外信号转导[17]等方面。笔者通过对沙田柚自交和异交花柱进行转录组测序,获得了沙田柚类蛋白激酶基因,并对该基因编码的蛋白质理化特征和基因表达进行了分析,旨在为深入研究沙田柚自交不亲和的分子机理提供分子理论依据。
1 材料与方法
1.1 材料
所用材料为广西灵川县潮田乡大山口村果园内10年生的沙田柚果树花柱,分别采集使用人工自交(沙田柚×沙田柚)和异交(酸柚×沙田柚)方式授粉后1~3 d的花柱,立即放置于液氮中,随后存放到超低温冰箱(-80 ℃)中備用。
1.2 方法
1.2.1 RNA的提取。根据改良的 Trizol 法对植物总 RNA 进行提取[18]。
1.2.2 测序。通过检测选择合格RNA送至深圳华大基因科技服务有限公司进行建库和测序。 用 Illumina HiSeqTM 2000 对制备好的文库进行测序。
1.3 序列分析和系统树构建
将得到的测序结果序列在NCBI的Blast程序上进行基因序列的同源性比较分析;并利用DNAman、Finder、TMpred、Swissmodel、NetPhos2.0等软件进行序列和蛋白质理化分析;在GenBank上下载与该序列同源性相近的其他物种的序列,用DNAman软件对类蛋白激酶基因编码的氨基酸序列构建系统进化树。
2 结果与分析
2.1 基因的生物信息学分析
沙田柚类蛋白激酶基因(Unigene10208_All)序列全长2 323 bp(GenBank登录号:MG925820),在NCBI在线数据库(https://blast.ncbi.nlm.nih.gov/Blast.cgi)中进行比对,寻找该基因的开放阅读框(ORF),用DNAman软件对该基因进行翻译,结果显示:该序列有1个1 560 bp的开放阅读框,编码的蛋白质含519个氨基酸(图1)。
2.2 编码蛋白质的分析和疏水性预测
将类蛋白激酶基因编码的蛋白质序列放入理化性质在线预测网站(http://web.expasy.org/protparam/)中进行蛋白质理化性质的预测分析,结果显示:该基因编码的蛋白质分子式为C2569H4044N698O745S24,分子质量为57.39 kD,等电点PI为8.55。构成该蛋白质的氨基酸中,亮氨酸(Leu)所占比例最大,达13.7%,组氨酸(His)所占比例最少,仅为1.5%。蛋白质不稳定系数(instability index)为33.94(<40),表明该蛋白质为稳定蛋白。其中,该蛋白质携带的负电荷氨基酸(Asp + Glu)总数为 52,正电荷氨基酸(Arg + Lys)总数为58。利用DNAman软件对该蛋白质进行疏水性分析,结果见图2。从图2可以看出,该基因编码的肽链中疏水性最大值约为3.48,位于第141位氨基酸,最小值约为-3.71,位于第172位氨基酸。该蛋白质疏水性平均值为-0.12,鉴定该蛋白质为亲水性蛋白。
2.3 跨膜预测 运用跨膜蛋白数据库 TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)对沙田柚类蛋白激酶跨膜区域进行预测,结果表明该蛋白质属于跨膜蛋白,其中1~141位部分位于膜外,142~164位部分跨膜,165~519位部分位于膜内(图3)。
2.4 蛋白质磷酸化位点预测
蛋白质磷酸化位点采用在线预测软件NetPhos 3.1 Server(http://www.cbs.dtu.dk/services/NetPhos/)进行预测,结果显示,类蛋白激酶基因编码的蛋白质共有39个可能的磷酸化位点,其中丝氨酸(Ser)磷酸化位点共有26个,分别位于蛋白质的第4、23、53、77、85、94、107、135、183、191、200、220、244、297、298、303、370、371、374、375、398、442、443、446、483、493位;苏氨酸(Thr)磷酸化位点共有9个,分别位于蛋白质的第68、103、230、232、234、235、253、300和415位;酪氨酸(Tyr)磷酸化位点仅4个,分别位于蛋白质的第236、386、391、404位。
可知此蛋白质的磷酸化以丝氨酸磷酸化为主,其次为苏氨酸和酪氨酸。
2.5 功能结构域分析
将编码的氨基酸序列用NCBI上的Structure/cdd/wrpsb.cgi)进行分析,发现该蛋白质具有1个与STKc IRAK蛋白相同的保守结构域,属于PKc like超家族,预测结果如图4所示。
2.6 蛋白质二级以及三级结构的预测
运用在线分析软件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)对类蛋白酶蛋白二级结构进行预测,结果表明,在该蛋白质的二级结构中, α-螺旋所占比例为38.54%,延伸链13.29%,无规则卷曲48.17%,二级结构预测结果如图5所示。
利用在线软件Phyre2 [19]对RING Finger蛋白氨基酸序列三级结构进行预测,结构见图6。
2.7 同源性分析
从NCBI上下载其他9种植物的类蛋白激酶基因编码的氨基酸序列,利用DNAman构建系统发育树,结果表明沙田柚类蛋白激酶基因编码的蛋白质与芸香科的克莱门柚(Citrus clementina)和甜橙(Citrus sinensis)的类蛋白激酶基因编码的蛋白质相似性很高,相似度约为100%和99%。该同源树显示该物种与克莱门柚和甜橙亲缘关系很近,属于同一分支(图7)。
2.8 類蛋白激酶基因在沙田柚自交和异交花柱中的表达
该研究克隆的类蛋白激酶在沙田柚自交花柱和异交花柱中的表达有较为明显的差异:在未授粉花柱中其表达量(reads per kb per million reads,RPKM) [20]为 0.01,自交1 d花柱中的表达量上升至1.61,自交2 d花柱中的表达量继续上升至5.97,自交3 d的其表达量上升至6.23。而在异交1 d花柱中的表达量上升至4.06,异交2 d花柱中的表达量继续上升至6.41,但异交3 d花柱中的表达量迅速下降至1.81。从上述结果可以看出无论自交授粉还是异交授粉,第1天花柱中类蛋白激酶基因的表达都表现为迅速升高,利用 RPKM对该基因在自交和异交花柱中的表达水平进行估算,设定错误检测率(false discovery rate,FDR)≤0.001 且差异倍数 ≥2 倍的基因视作显著差异表达基因, 以 RPKM 值取 2 的对数值(log2)对自交1 d/异交 1 d、自交2 d/异交2 d,以及自交3 d/异交3 d花柱中类蛋白激酶基因的表达水平进行统计,其数值分别为-1.33、-0.10、1.78。
3 讨论
蛋白激酶是一类催化蛋白质磷酸化反应的酶,能将腺苷三磷酸(ATP)上的γ-磷酸转移到蛋白质分子的氨基酸残基上[21]。类蛋白激酶蛋白的磷酸化以丝氨酸磷酸化为主,其次为苏氨酸和酪氨酸,且与STKc IRAK蛋白有相同的保守结构域,属于PKc like超家族。该研究通过序列同源性分析,沙田柚类蛋白激酶基因编码的氨基酸与克莱门柚(Citrus clementina)和甜橙(Citrus sinensis) 的同源性分别为 100%、99%,表明Unigene10208_All为类蛋白激酶基因。
植物蛋白激酶在植物体内起着信号转导的作用[17,22-23]。杜秀贞等[10]发现小麦类蛋白激酶基因片段TA50-10可以诱导植物抗病,且具有谱性。蛋白激酶在生长发育方面也有显著的作用。李涛等[24]发现类蛋白激酶基因OsAGWI可以通过控制水稻颖壳外表皮细胞以及维管束的发育来实现对籽粒大小的控制。该研究获得的类蛋白激酶基因自交1 d花柱中的表达量上升至1.61,自交2 d花柱中的表达量继续上升至5.97,自交3 d的表达量仍上升至6.23。而在异交1 d花柱中的表达量上升至4.06,异交2 d花柱中的表达量也继续上升至6.41,但异交3 d花柱中的表达量却下降至1.81。自交 1 d/异交 1 d、自交3 d/异交3 d花柱的 log2(RPKM ratio)分别为-1.33,1.78,达到差异表达的水平。此外,该基因与沙田柚授粉相关,在未授粉花柱中其表达量非常低(0.01),自交授粉1 d时达1.61,异交授粉1 d也达4.06。但该基因与沙田柚自交不亲和性的关系尚待进一步研究。
参考文献
[1] DE NETTANCOURT D.Incompatibility in angiosperms[J].Sexual plant reproduction,1997,10(4):185-199.
[2] 秦新民,张渝,刘玉洁,等.沙田柚S-RNase基因的克隆及序列分析[J].广西师范大学学报(自然科学版),2015,33(1):139-145.
[3] 秦新民,李惠敏,薛妙男,等.沙田柚自交、异交花粉管蛋白的双向电泳分析[J].广西植物,2004,24(6):566-569.
[4] 杨继华,李红艳,薛妙男.沙田柚花柱S- 糖蛋白的分离及鉴定[J].广西师范大学学报(自然科学版),2000,18(4):66-70.
[5] 杨继华,饶桂荣,薛妙男.沙田柚花柱S- 糖蛋白的纯化和 N-端序列测定[J].广西师范大学学报(自然科学版),2001,19(1):72-79.
[6] 薛妙男,陈腾土,杨继华.沙田柚自交和异交亲和性观察[J].园艺学报,1995,22(2):127-132.
[7] 薛妙男,李义平,张杏辉,等.沙田柚自交花柱中识别蛋白的免疫金定位[J].园艺学报,2001,28(1):59 -61.
[8] 秦新民,莫花浓,万珊,等.沙田柚花粉管特异蛋白的免疫细胞化学研究[J].广西师范大学学报(自然科学版),2008,26(4):112-115.
[9] 秦新民,莫花浓,石菁萍,等.沙田柚花粉管 S1-RNase 免疫胶体金定位研究[J].广西农业科学,2009,40(5):483-485.
[10] 杜秀贞,李培培,潘小玫,等.小麦类蛋白激酶基因片段TA50-10的克隆及其TMV抗性诱导功能[J].江苏农业学报,2011,27(6):181-185.
[11] KOMATSU S,YANG G X,KHAN M,et al.Overexpression of calcium-dependent protein kinase 13 and calreticulin interacting protein 1 confers cold tolerance on rice plants[J].Molecular genetics & genomics,2007,277(6):713-723.
[12] MIZUNO S,OSAKABE Y,MARUYAMA K,et al.Receptorlike protein kinase 2 (RPK 2) is a novel factor controlling anther development in Arabidopsis thaliana[J].Plant journal,2007,50(5): 751-766.
[13] BECRAFT P W.Receptor kinases in plant development [J].Trends in plant science,1998,3(10): 384-388.
[14] YOSHIMURA S,YAMANOUCHI U,KATAYOSE Y,et.al.Expression of Xa1,a bacterial blightresistance gene in rice,is induced by bacterial inoculation[J] Proc Natl Acad Sci USA,1998,95(4):1663-1668.
[15] CHEN X W,SHANG J J,CHEN D X,et.al.A Blectin receptor kinase gene conferring rice blast resistance[J].Plant journal,2006,46(5): 794-804.
[16] MORILLO S A,TAX F E.Functional analysis of receptorlike kinases in monocots and dicots[J].Current opinion in plant biology,2006,9(5): 460-469.
[17] TORII K U.Leucinerich repeat receptor kinases in plants:Structure, function, and signal transduction pathways [J].International review of cytology,2004,234:1-46.
[18] 孙德权,郭启高,胡玉林,等.改良Trizol法提取香蕉叶片总RNA[J].广东农业科学,2009(5):162-164.
[19] KELLEY L A, MEZULIS S, YATES C M, et al.The Phyre2 web portal for protein modeling, prediction and analysis [J].Nature protocols, 2015, 10(6):845-858.
[20] MORTAZAVI A,WILLIAMS B A,MCCUE K,et al.Mapping and quantifying mammalian transcriptomes by RNASeq[J].Nature methods,2008,5(7):621-628.
[21] 张春宝,赵丽梅,赵洪锟,等.植物蛋白激酶研究进展[J].生物技术通报 ,2011(10):17-23.
[22] NAKAGAMI H,PITZSCHKE A,HIRT H.Emerging MAP kinase pathways in plant stress signaling[J].Trends in plant science,2005,10(7):339-346.
[23] STONE J M,WALKER J C.Plant protein kinase families and signal transduction[J].Plant physiology,1995,108(2):451-457.
[24] 李涛,江洁明,张盛春,等.类蛋白激酶基因OsAGSW1调控水稻籽粒发育的研究[C]//广东省遗传学会.广东省遗传學会第九届代表大会暨学术研讨会论文及摘要汇编.广州:广东省遗传学会,2014:1.