端木慧子 ,牛志新 ,李海英 *
(1.黑龙江大学 农业微生物技术教育部工程研究中心,哈尔滨150500;2.黑龙江大学生命科学学院/黑龙江省普通高校分子生物学重点实验室,哈尔滨150080)
甜菜是双子叶藜科(Chenopodiaceae)甜菜属(Beta)的二年生异花授粉作物,是世界上重要的经济作物之一,供应着世界上约35%的糖[1]。同时,甜菜也是发展畜牧业的优良饲料以及新兴的能源作物,具有重要的研究价值。目前,我国对于甜菜的研究多集中于生理、生化和表型的研究,分子水平的研究相对较少。近年来高通量测序技术的发展为研究者从全基因组水平筛选功能基因,培育优质甜菜品种提供了可能。
丝氨酸/苏氨酸蛋白激酶(serine/threonine protein kinase,STPK)是一种特异催化蛋白质底物上的丝氨酸/苏氨酸残基磷酸化,从而调节该蛋白质功能的酶。其重要的功能之一就是参与环境胁迫信号的转导过程[2-3]。目前,已经有多个STPK在拟南芥、水稻、小麦等植物中被鉴定出在非生物胁迫的过程中起着重要的作用[4-8]。然而,全基因组水平上甜菜STPK家族的分析和功能预测研究相对较少。因此,本研究通过生物信息学的方法及工具,从全基因组的水平鉴定甜菜STPK,并从序列和蛋白互作水平对其进行系统的分析,为今后甜菜遗传育种提供理论支持与优质基因资源。
利用HMMER[9]软件构建STPK家族的序列特征模型,并利用该模型在NCBI(https://www.ncbi.nlm.nih.gov/)数据库中搜索可能的甜菜STPK家族成员,进一步利用SMART(http://smart.embl-heidelberg.de/)数据库对结果进行验证,最终获得甜菜STPK家族成员。
利用ClustalX[10]对甜菜STPK进行多序列比对,并利用MEGA 5.0软件[11]建立甜菜STPK家族的系统发育树。所采用的方法为最大似然法(Maximum likelihood,ML)和最大简约法(Maximum parsimony,MP),并将两种方法的结果进行整合,最终利用Bootstrap方法对结果进行检验(随机1000次)。
利用STRING数据库 (https://string-db.org/cgi/input.pl)构建甜菜STPK蛋白互作网络,并利用MCL(Markov Clustering Algorithm)聚类算法识别网络中的子网。通过agriGO[12](http://systemsbiology.cau.edu.cn/agriGOv2/)数据库对网络中的蛋白质进行功能富集分析。
利用HMMER软件结合基因注释与SMART数据库,共在甜菜基因组中鉴定得到148个STPK。多序列比对结果显示,这148条序列所具有的保守结构集中在第100个氨基酸到第500个氨基酸之间,共有11个保守的结构域,与已知蛋白激酶结构域相符[13]。
分别使用最大似然法(ML)和最大简约法(MP)构建甜菜STPK的系统发育树,选择两种方法共有的结构进行整合,最终获得的系统发育树分为9个亚类,这些不同亚类中的基因具有不同的结构特点,可能行使不同的功能(图1)。比如亚类I中共有13个成员,主要由丝氨酸/苏氨酸蛋白激酶AFC和MHK及其异构体组成,而亚类II主要包含WNK等蛋白激酶。
图1 甜菜STPK家族系统发育树Fig.1 Phylogenetic tree of STPKs in sugar beet
图2 甜菜STPK蛋白互作网络Fig.2 Protein-protein network of STPKs in sugar beet
利用STRING数据库构建甜菜STPK蛋白互作网络并分析,共识别了8个子网(图2)。值得注意的是,最大的子网是由 WNK8、SnRK2.8、SnRK2.3、SnRK2.7、SnRK2.2、SnRK2.5、SnRK2.1、SnRK2.4、OST1 和 HT1 等蛋白激酶构成。其中,SnRK2蛋白激酶是植物中非常常见的一种丝氨酸/苏氨酸蛋白激酶[14],它属于蔗糖非酵解型-1(SNF1)型,土壤中的盐分或者脱落酸可以使SnRK2蛋白激酶激活,从而调控下游基因表达。因此,SnRK2蛋白激酶与植物抗逆境生存有很大关联。
对网络中的节点进行功能富集分析的结果显示,这些STPK家族成员主要富集在“细胞过程”、“代谢过程”、“发育过程”等生物学功能上(图3),说明STPK家族参与了广泛的生物学过程。值得注意的是,一些STPK家族成员显著富集在了刺激响应功能上,说明一些STPK参与植物的胁迫应答过程。
图3 甜菜STPK功能注释Fig.3 Functional annotation of STPKs in sugar beet
本研究以甜菜全基因组序列为基础,通过HMMER方法进行甜菜STPK家族鉴定。与传统的BLAST方法相比,HMMER能够更加准确找到亲缘关系较远的同源序列。另外,本研究采用SMART数据库对HMMER鉴定的STPK家族成员做进一步的检验,最大程度上确保了鉴定的甜菜STPK的全面性和准确性。
通过多序列比对的方法对鉴定得到的甜菜STPK家族成员进行序列特征分析,结果显示鉴定得到的甜菜STPK家族成员均具有蛋白激酶所特有的11个激酶结构域,再次证明了鉴定结果的可靠性。分别采用最大似然法(ML)和最大简约法(MP)两种方法构建进化树,并仅选取两种方法结果中相同的部分构建系统发生树,并在构建进化树过程中采用了BootStrap方法进行验证,确保了构建进化树的科学性与准确性。
甜菜STPK蛋白互作网络分析的结果显示,STPK之间存在复杂的互作关系,不同的STPK可能行使不同的功能。而功能富集分析的结果显示,除了正常的生物学功能,一些STPK还参与了植物发育与刺激响应过程。
本研究从甜菜基因组中鉴定得到148个甜菜STPK家族成员,这些甜菜STPK家族成员分为9个亚类,每个亚类可能行使不同的功能。甜菜STPK互作网络包括8个子网,网络中的蛋白质与发育和刺激应答功能相关。本研究结果可为甜菜遗传育种提供理论支持与基因资源。