邹奕 ,闫彩燕 ,邳植 ,2,3*
(1.黑龙江省普通高等学校甜菜遗传育种重点实验室,哈尔滨150080;2.中国农业科学院甜菜研究所/黑龙江大学农作物研究院,哈尔滨150080;3.中国农业科学院北方糖料作物资源与利用重点开放实验室,哈尔滨150080)
蛋白质翻译后修饰是指mRNA翻译为蛋白质后对蛋白质上个别氨基酸残基进行共价修饰的过程,在生命体中具有十分重要的作用。这一过程使蛋白质结构更复杂,功能更完善,调控更精准。在真核细胞中常见的蛋白质翻译后修饰约有20多种。其中,蛋白质的可逆磷酸化修饰是最为常见的蛋白质翻译后修饰。Fisher和Kerbs研究证实蛋白质的可逆磷酸化在生物调控机制中的重要地位,该项研究最终获得1992年的诺贝尔生理医学奖[1-2]。蛋白质磷酸化主要发生在蛋白质的Ser、Thr、Tyr残基,调控酶活性、亚细胞定位,蛋白质相互作用涉及细胞信号转导、细胞增殖、发育和分化等生理过程[3-4]。值得注意的是在植物中编码蛋白激酶的基因约占功能基因总数的4%,相当于人类基因组中所占比例的2倍[5]。这暗示着植物这种缺乏逃避逆境能力的生物具有复杂磷酸化级联反应网络感应外界环境变化,从而精准、快速地调节自身代谢途径以适应逆境。
蛋白质的可逆磷酸化修饰由蛋白激酶和蛋白磷酸酶参与,在蛋白激酶的作用下ATP中的磷酸基团被转移到蛋白质氨基酸残基的羟基[6]。相反,蛋白磷酸酶可将蛋白质中的磷酸基团转移至ADP,使蛋白质发生去磷酸化作用。以往研究表明,植物基因组中约含有1400个编码蛋白激酶的基因,而编码磷酸酶的基因数目仅有为蛋白激酶的1/10左右[7]。这就意味着单一蛋白磷酸酶可能负责多个蛋白激酶的可逆磷酸化过程,对于植物适应外界环境具有重要意义。根据其底物特异性蛋白磷酸酶可分为丝氨酸/苏氨酸蛋白磷酸酶类(protein serine/threonine phosphatases,PSP)和酪氨酸蛋白磷酸酶类(protein tyrosine phosphatases,PTP)两大类[8]。
系统进化分析可以将 PSP分为 PPP (plant protein phosphatase) 和 PPM (metal-dependent protein phosphatases)两支[9]。 PPP 支主要包括 PP1、PP2A、PP2B(PP3)、PP4、PP5、PP6、PP7、Kelch、SLP 以及 PPP Unique共10个家族。PP1家族蛋白活性主要受热稳定蛋白l1和l2抑制,PP2A和PP2B(PP3)家族成员均不受蛋白l1和l2抑制,但PP2B(PP3)家族蛋白活性需要Ca2+激活,PP2A家族蛋白活性则不依赖2价金属离子[10]。PP4家族成员含有两个高保守的调控亚基R1和R2,PP5家族成员则在N-末端含有一个具有决定蛋白互作关系的TPR结构域,PP6家族成员则含有高保守的SAPS调控亚基和锚蛋白重复亚基,PP7家族成员则催化亚基同时分布在C-和N-末端,且同时含有EF结构域。Kelch家族成员主要包括BSU1、BSL1、BSL2,在N-末端含有重复Kelch结构,主要参与BR信号通路[11]。PPM支主要包活PP2C和PDP两大家族。PDP家族成员含有PP2C催化结构域,主要与丙酮酸脱氢酶结合,催化该酶的去磷酸化过程[12]。PTP类根据含有磷酸酶功能结构域和催化功能不同可以分为 classical PTP、DSP、Asp Based PTP、CDC25、LMWPTP、PTPLA 几支[13]。
甜菜为藜科二年生植物,是我国三北地区最主要的糖料作物,也是北方最具竞争力和潜力的经济作物,具有栽培技术体系完善,机械化程度高,不与主粮争地,土地利用率高,兼顾生态效益等多方面优势。然而,国内利用生物信息学对于甜菜基因家族的研究相对较少。自甜菜基因组信息发布以来,尚无关于磷酸酶超家族分析的相关报道。因此,本研究利用生物信息学的手段对甜菜磷酸酶超家族进行分析。
首先,从甜菜基因组数据库(http://bvseq.molgen.mpg.de)下载甜菜蛋白质组信息[14]。利用EKPD数据库(http://ekpd.biocuckoo.org)中29个蛋白磷酸酶HMM模型检索甜菜蛋白质组序列,E-value阈值设为<1[15-16]。随后,将检索到的候选甜菜磷酸酶分别进行Pfam、Interpro和SMART蛋白结构域分析,剔除不含有磷酸酶功能结构域的序列。最后,利用在线软件Compute pI/Mw和TargetP对筛选到的蛋白磷酸酶分子量、等电点和亚细胞定位进行预测[17-18]。
根据hmmsearch结果提取甜菜磷酸酶蛋白中得分最高的磷酸酶结构域序列。随后,利用Cluster Omega对挑选出的磷酸酶结构域序列进行序列比对,所有参数采用默认值[19]。对比对结果进行人工校正后,以甜菜果糖-1,6-二磷酸酶(Bv2_024290 rmpf.t1)果糖二磷酸结构域序列作为外类群,采用iqtree软件构建Maximum likelihood进化树[20]。根据ModelFinder计算结果选择WAG+F+G4为最优模型,bootstrap设置为1000[21]。建树结果利用Evolview软件进行可视化及注释[22]。
甜菜各磷酸酶家族基因数目根据hmmsearch和进化树结果统计,其他物种磷酸酶家族数目来源于EKPD数据库。为了避免基因组大小对不同物种磷酸酶基因家族比较的干扰,计算各磷酸酶家族在基因组中所占比例,并以拟南芥作为对照。根据甜菜及各物种磷酸酶家族大小进行层次聚类分析。
利用HMMER软件对甜菜基因组进行分析,总共检索到163个候选蛋白磷酸酶。进一步通过Pfam、Interpro、SMART蛋白结构域分析,最终从中筛选出143个编码蛋白磷酸酶的基因,约占甜菜基因组编码基因的0.5%。其数目略低于拟南芥(162个)、玉米(225个)、水稻(164个)等模式植物,但与其他物种所占基因组比例相近(0.35%~0.59%)。其中,编码蛋白磷酸酶序列长度范围454 aa~1555 aa,分子量范围5.8 kDa~169.1 kDa,等电点范围3.9~10.3。利用TargetP对甜菜蛋白磷酸酶亚细胞定位进行预测,结果显示分别约有19.3%、10.3%和5.5%的蛋白磷酸酶定位于叶绿体、线粒体和细胞核。
以143个甜菜蛋白磷酸酶结构域序列构建进化树,甜菜蛋白磷酸酶超家族可分为PSP和PTP两个大支(图1)。PSP一支涉及PP2C、PPP和CDC25家族。其中,PP2C家族含有63个基因,远多于PPP家族(16个)和其他磷酸酶家族基因数目;PP2C家族成员蛋白活性主要依赖于Mn2+和Mg2+,是植物中家族成员最多的一类蛋白磷酸酶[11]。CDC25家族含有两个基因,以往研究表明CDC25家族在植物中的成员相对较少,特异识别依赖性激酶(CDK),催化Thr14和Thr15的去磷酸化[23]。在甜菜中CDC25家族被分入PSP,其原因可能是甜菜CDC25结构域不完整导致。PTP一支包括Asp based PTP、DSP、LMWPTP、PTPLA 和 NRPTP,5 个磷酸酶家族。其中,Asp based PTP和DSP磷酸酶家族基因数目较多,分别为31个和25个。Asp Based PTP家族成员参与催化反应需要Asp作为亲核基团[11]。DSP家族成员不仅能够催化酪氨酸残基去磷酸化,还能催化丝氨酸和苏氨酸去磷酸化,进一步催化底物和结构域不同的7个家族[24]。LMWPTP、PTPLA和NRPTP家族所含基因数目较少,总共仅包含6个基因。LMWPTP家族是近些年新发现的一类蛋白磷酸酶家族,该家族成员具有较小的分子量,一般约为18 kDa[25]。PTPLA家族成员中酪氨酸磷酸酶保守基序CXXXXXR变异为CXXXXXA,对植物器官的发育、分化和维持具有重要作用[26]。
图1 甜菜蛋白磷酸酶超家族系统进化树Fig.1 Phylogenetic tree of protein phosphatase superfamily in sugar beet
根据hmmsearch和进化树结果统计各磷酸酶家族基因数目,通过层次聚类分析(图2)发现甜菜磷酸酶超家族基因分布状况与衣藻(Chlamydomonas reinhardtii)、 小 立 碗 藓(Physcomitrella patens)和红藻(Cyanidioschyzon merolae)等孢子植物更近。这说明甜菜磷酸酶超家族成员在甜菜进化过程中较为保守。与其他物种相比,甜菜具有PPP家族较小的特点,PP1、PP2A、PP2B、PP4、PP5、PP6、PP7、Kelch 亚家族所含基因数目均只有拟南芥的一半。此外,CDC14、CDC25和 MDP1家族基因数目分别含为5个、2个、2个,而在其他物种中数目较少,甚至没有。CDC14家族成员在N-末端具有一个高度保守的特异结构域,能够催化CDK激酶底物发生去磷酸化作用[11]。MDP1家族成员在催化中心存在数个氨基酸的变异,能够结合更多种类的底物[23]。
图2 不同物种间蛋白磷酸酶超家族聚类分析Fig.2 Cluster analysis of protein phosphatase superfamily among different species
本研究利用生物信息学对甜菜蛋白磷酸酶超家族进行初步分析,从甜菜基因组中共筛选出143个蛋白磷酸酶,构建甜菜磷酸酶超家族系统进化树。与拟南芥、玉米等植物相比,甜菜各蛋白磷酸酶家族基因数目基本呈现较少或持平的形势。有趣的是甜菜磷酸酶家族成员分布与衣藻、红藻和小立碗藓等孢子植物相近,说明甜菜物种起源较早且蛋白磷酸酶超家族在物种进化中较为保守。
与其他高等植物相比,甜菜中CDC14、CDC25和MDP1家族数目具有一定优势,这些家族成员在进化过程中未被淘汰,暗示其对甜菜生长发育和形态建成具有一定作用。大多数植物基因组中没有或极少量含有编码CDC14和CDC25的基因,而在甜菜中分别发现5个和2个编码CDC14和CDC25的基因。CDC14家族是调控细胞周期的关键因子,在DNA复制、有丝分裂退出和胞质分裂中起重要作用。在DNA修复期间可以促进纺锤体稳定,是中期纺锤体维持、修复过程的关键[27]。CDC25家族同样是细胞周期的关键调节因子,能够催化CDK中的Thr14和Tyr15发生去磷酸化,从而激活CDK活性,达到驱动整个细胞周期的作用[23,28]。虽然,在甜菜中还未发现具有CDC25家族全长的同源基因,但是存在与C末端磷酸酶结构域直系同源的短序列成员。Spadafora等通过分析拟南芥CDC25突变体发现,缺失CDC25基因后拟南芥突变体对羟基脲引起的DNA损伤更为敏感,抑制拟南芥根部生长[29]。相反,过表达CDC25基因有助于提高拟南芥对DNA损伤修复的能力。因此,甜菜基因组中含有较多的CDC14和CDC25家族磷酸酶可能与甜菜逆境损伤修复和根部细胞增殖相关。在甜菜基因组中发现两个编码MDP1(Magnesium-dependent phosphatase 1)的基因,而在植物中相关功能报道较少。Yin等利用基因干扰手段对肿瘤细胞中MDP1功能进行研究发现,MDP1参与细胞增殖过程,其表达受抑制后细胞G0/G1细胞周期阻滞,导致大量细胞停滞在G1期[30]。但是,MDP1是否参与甜菜细胞增殖仍未见报道,值得进一步研究。