王 凡,徐世明,鄢 雯,古同男,王宏娟
首都医科大学燕京医学院生物化学与分子生物学教研室,北京 101300
在蛋白质代谢过程中,泛素化修饰是蛋白质翻译后修饰的重要方式之一,底物与泛素可通过E1泛素活化酶、E2泛素结合酶和E3泛素连接酶催化的酶促级联反应建立共价连接,进而影响底物蛋白的活性[1]。E3泛素连接酶是泛素化反应中的关键酶,介导泛素-蛋白酶体系统中底物的识别,确定泛素化反应的特异性,并通过调控调节蛋白的泛素化过程参与细胞内的多种生理过程[2]。有研究表明,E3泛素连接酶可利用泛素-蛋白酶体系统,调节肿瘤相应基因启动子或抑制子,影响肿瘤细胞生长[3-4]。目前已发现600余种E3泛素连接酶,其中E3泛素蛋白连接酶1(MIB1)可通过泛素化NOTCH蛋白受体正向调节信号通路,进而促进内吞作用[5]。在人胚胎干细胞中,MIB1蛋白能催化八聚体结合转录因子4(OCT4)的泛素化,调控OCT4蛋白处于适宜的表达水平,并介导OCT4经26S蛋白酶体途径的降解,从而维持胚胎干细胞的自我更新[6]。此外,钙黏着蛋白关联蛋白可被MIB1蛋白泛素化进而调控细胞迁移[7],MIB1蛋白还可以调控胰腺向腺泡细胞或导管分化[8]。
斑马鱼是模式脊椎动物之一,其基因组与人类基因相似度达到87%,数据库中有其相关信息供查询下载,可作为人类疾病模型,其已成为生命科学研究的新宠[9]。本研究通过对斑马鱼MIB1基因的生物信息学研究,包括非编码RNA(ncRNA)预测、转录因子结合位点(TFBS)分析、互作基因与互作蛋白预测,以及基因功能富集分析等,探究斑马鱼MIB1基因的相关功能。
1.1材料来源 斑马鱼MIB1基因序列的获取:美国国家生物技术信息中心(NCBI)(http://www.ncbi.nlm.nih.gov/)。ncRNA预测:国家基因组科学数据中心(NGDC)(http://ngdc.cncb.ac.cn/lgc/calculator)。TATA盒预测网址:SoftBerry(http://linux1.softberry.com/berry.phtml)。TFBS预测网址:Alggen(http://alggen.lsi.upc.es),AnimalTFDB(http://bioinfo.life.hust.edu.cn/AnimalTFDB4/#/)。互作基因预测网址:GeneMANIA(http://genemania.org)。基因本体(GO)与京都基因与基因组百科全书(KEGG)分析数据来源:DAVID(https://david.ncifcrf.gov)。互作蛋白预测网址:STRING(http://cn.string-db.org)。
1.2方法
1.2.1斑马鱼MIB1基因及其启动子序列的获取 在NCBI数据库中搜索斑马鱼MIB1基因,读取相关基因信息,在“工具”下拉按钮中选择“序列文本视图”,从中选取转录起始位点上游1 500 bp内的DNA序列,获取MIB1基因的启动子序列。将MIB1基因启动子及5′非翻译区的序列上传至SoftBerry中,预测TATA盒。
1.2.2ncRNA的预测 登录NGDC网站,在ncRNA模块中将斑马鱼MIB1基因启动子及5′非翻译区的序列一同输入文本框进行预测。
1.2.3斑马鱼MIB1基因TFBS预测 登录Alggen网站,点击“启动子”按钮,在“设置因子”与“设置位点”中均选择“真核生物”。点击“查询位点”按钮,上传斑马鱼MIB1基因的启动子序列,设置“最大矩阵差异率”为0,点击“提交”进行预测,该数据库使用的是TRANSFAC 8.3版本。登录AnimalTFDB网站,点击“预测TFBS”,在对话框中输入启动子序列进行预测,下载预测结果。该网站使用的是动物转录因子数据库4.0版本。综合结果中的“得分”与“P值”,筛选“得分”≥16且“P值”≤10-6数量级的TFBS,将筛选结果与Alggen网站的预测结果进行合并整理。
1.2.4预测斑马鱼MIB1蛋白与其转录因子的作用关系 登录STRING网站,选择“多种蛋白质”,将预测得到的TFBS与MIB1蛋白的名称共同输至对话框中,物种选择“斑马鱼”,点击“搜索”进行预测。
1.2.5GeneMANIA预测斑马鱼MIB1的互作基因 登录GeneMANIA网站,在主页物种下拉菜单中选择“斑马鱼”,并在右侧对话框中输入MIB1基因的名称进行预测,筛选具有相互作用关系或调节作用的基因信息,需要说明的是该网站预测的信息更偏向GO功能。
1.2.6STRING预测斑马鱼MIB1的互作蛋白 登录STRING网站,选择“按蛋白序列”搜索,在对话框中输入MIB1蛋白序列,同时在“生物”选项中选择“斑马鱼”,点击“搜索”。在弹出的网页中选择目的蛋白后,点击“继续”进行预测,再次通过输入MIB1蛋白名称的方式进行预测,将两次预测结果汇总。
1.2.7斑马鱼MIB1基因的GO与KEGG可视化分析 登录DAVID网站,在“开始分析”中,将预测得到的互作基因名称粘贴至“基因列表”中进行富集,下载有关生物过程(BP)、细胞组分(CC)、分子功能(MF)及KEGG中的图表数据,利用 Fisher检验得到P值后进行GO与KEGG可视化分析,绘制直方图与气泡图,并在KEGG富集的图表数据中,点击相应链接,分析信号通路图。
2.1斑马鱼MIB1基因及启动子序列特点 斑马鱼MIB1基因ID为352910,位于2号染色体,全长87 102 bp,包含22个外显子,其编码序列共编码1 040个氨基酸。预测结果显示,在转录起始点上游53 bp处(即启动子序列第1 448 bp处)存在TATA盒。斑马鱼MIB1基因的5′非翻译区长度为1 001 nt。
2.2ncRNA预测结果 由于斑马鱼MIB1基因的5′非翻译区较长,推测有编辑ncRNA的可能性,对此进行了预测验证,见图1。结果显示,“Coding Potential Score”得分为-0.28,“Coding Label”结果为ncRNA。综合预测结果提示,MIB1基因的启动子区及5′非翻译区可转录出ncRNA。
注:ORF Length为最长开放阅读框长度;GC Content为最长开放阅读框的GC碱基水平;Coding Potential Score中得分大于0为mRNA,小于0为ncRNA,等于0表示转录出mRNA或ncRNA的概率相等;Coding Label中“Coding”代表mRNA,“Noncoding”代表ncRNA,Pc为开放阅读框存在于编码序列中的可能性,Pnc为开放阅读框存在于非编码序列中的可能性。
2.3Alggen网站预测结果 经Alggen网站预测,在斑马鱼MIB1基因启动子序列中得到86种TFBS,见图2,图中已标出各种TFBS及对应的位置,但有重复。通过手动去重后得到76种TFBS,其中AML1、ATF-2、CRE-BP2、DFD、DOF2、EVE、FOXP3、GAGA FACTOR、GT-1、HOXD家族、Oct-B1、MNB1a、P53、POU家族、SXR:RXR-ALPHA等在启动子区出现的频率较高。
图2 TFBS预测结果
2.4AnimalTFDB预测结果 在斑马鱼MIB1基因启动子区TFBS预测结果中,包含每个TFBS的位置、得分、P值、Q值及相应位点的序列信息,经过筛选并去重后,得到50种TFBS。将该结果与Alggen预测结果合并去重后,得到ABF1、ATF、C/EBP、CREB、CUTL1、DBP、DFD、DMRT3、EVE、FOSL、GA-BF、GAGA factor、GATA、GR、HNF、HOX、HSF1、IRF、JUN、MYB2、NFATC1、NFATC2、NIT2、OCT-B1、P53、PBF、POU、RC2、SQUA、STAT2、TFIID、TGGCA-binding protein、TLL、TRP53、UNC-86、WT1 I、XBP-1、ZFP28、ZNF等共计121种TFBS。
2.5MIB1与转录因子的作用关系 P53是抑癌基因TP53的转录编码蛋白,具有转录因子活性。通过STRING预测发现,斑马鱼MIB1蛋白只与其转录因子P53有互作关系,与其余转录因子间无互作关系。有趣的是,作为反式作用因子,P53不仅能与MIB1基因启动子结合,还可与MIB1蛋白相互作用。见图3。
图3 P53因子与MIB1的作用关系
2.6GeneMANIA预测结果 经GenaMANIA预测,共得到20种斑马鱼MIB1的互作基因:ABAT、ACTN2b、ACTN3a、ACTN4、ATP2b4、CSNK2b、CYT1L、DLA、DLC、DLD、EXOC1、EXOC3、FAM76b、HSPA8、LRPAP1、MIB2、TOMM20b、USO1、YAF2、YWHAQA。结果显示,MIB1基因与ACTN2b、CSNK2b、HSPA8、DLA和DLD基因有共表达的关系,见图4。经GenaMANIA进一步查询还发现,MIB1与DLG1基因有共表达的关系,DLG1又可与DLG4b共享蛋白结构域。
图4 MIB1互作基因的作用关系
2.7STRING预测结果 通过输入斑马鱼MIB1蛋白序列的方式预测得到11种MIB1互作蛋白,结果见图5A;再输入MIB1蛋白名称,进行预测,结果见图5B。将两次预测结果汇总,得到以下20种互作蛋白:DLD、DLA、DLC、ENSDARP00000050857、NOTCH1a、JAG2b、NEURL1b、NEURL1ab、NEURL1aa、LOC566455、MIB、LOC556551、SHROOM4、ABHD3、SHROOM2a、STK3、GREB1Ⅰ、ATOH1b、FTR82、SHROOM1。经分析发现,SHROOM1蛋白分别可与SHROOM2a、SHROOM4、STK3共表达,NOTCH1a与DLA可共表达,见图6。 但STRING与GeneMANIA的预测结果并不完全是一一对应的关系,前者主要描述蛋白质之间的互作关系,后者更偏向于基因间的互作关系,如共表达、遗传相互作用和物理相互作用等。
注:图A为MIB1蛋白序列预测结果;图B为MIB1蛋白名称预测结果。
图6 MIB1互作蛋白共表达关系
2.8斑马鱼MIB1互作基因GO与KEGG分析 通过对MIB1互作基因的GO分析,见图7A,发现MIB1基因及其互作基因在BP方面具有调控细胞、组织、器官生长分化、NOTCH信号通路及神经元的发生发展等功能。在CC方面,MIB1基因主要在细胞质核周区、细胞膜、顶端连接复合体、细胞骨架和突触后致密区等部位富集。在MF方面,具有结合NOTCH蛋白和PDZ结构域蛋白等功能。KEGG分析得到4条代谢途径,见图7B。
注:A为GO分析;B为KEGG分析。
2.9信号通路分析 除NOTCH蛋白本身,有两种斑马鱼MIB1互作蛋白(DELTA和SETTATE)直接参与到NOTCH 信号通路中,见图8,但是在前面的预测中并未发现MIB1与SERRATE有直接的互作关系。为此,通过GeneMANIA分析MIB1与SERRATE的作用关系发现,SERRATE与剪切多聚腺苷酸化特异性因子(CPSF3)、DEAD盒解旋酶(DDX5)、非ATP 酶蛋白酶体26S亚基1(PSMD1)、复制蛋白A2(RPA2)、剪接因子3a(SF3a)具有共表达的关系,且MIB1与上述5种基因都具有物理相互作用关系,MIB1与SERRATE存在间接作用关系。
图8 MIB1互作蛋白在NOTCH信号通路中的位置关系
ncRNA广泛涉及不同水平的基因调控,与基因沉默和转录后调控密切相关,ncRNA的异常表达常与某些侵袭性病变有关[10]。经预测发现,斑马鱼MIB1启动子区及5′非翻译区可转录出ncRNA,而这些ncRNA的具体功能尚需进一步探索。
斑马鱼MIB1基因的TFBS的预测结果中得到了121种TFBS,其中包含转录因子P53。P53发挥着监控细胞分裂和影响细胞周期启动的作用。细胞出现损伤后,P53蛋白会阻止DNA复制,并对损伤DNA进行修复。如果P53基因发生突变,会导致机体失去对细胞增殖的控制,引起细胞癌变[11]。分析预测结果发现,P53不仅是斑马鱼MIB1基因的转录因子之一,还可与MIB1蛋白相互作用,推测P53可通过这种双重调控方式抑制MIB1在癌细胞中的过表达[12]。这种方式在P53参与的基因表达调控中并不常见,值得进一步深入研究。通过预测还发现,斑马鱼MIB1基因启动子区存在IRF 1~3的结合位点。而IRF家族成员是一类重要的转录因子,可结合到干扰素基因(IFN)启动子上,在机体受到病毒感染时IRF可调控IFN基因的表达[13]。据此推测斑马鱼MIB1基因在免疫调节方面发挥一定的作用。
GeneMANIA预测结果显示,斑马鱼MIB1与MIB2存在互作关系,推测斑马鱼MIB1与MIB2应是相互结合后,介导通路中信息的传递。此外,MIB1与HSPA8也存在互作关系。有研究称,在细胞应激反应中,MIB1可被迅速灭活,导致AZI1、PCM1、CEP290非泛素化[14]。通过进一步查询发现,MIB1还与HSPA5和HSPA9相互作用。在此过程中,推测MIB1的灭活应该是由热应激蛋白介导的。此外,经预测发现MIB1还与DLG4b有间接作用关系。DLG4b基因的表达产物为突触后致密区蛋白 95(PSD95),其对兴奋性神经元的突触强度和可塑性至关重要,与突触信号传导、发育和生存密切相关[15]。笔者推测MIB1可能是通过PSD95的介导,进而影响神经系统发育的。
STRING预测结果显示,MIB1有6种互作蛋白未在实验中证实,包括ABHD3、GREB1l、LOC556551、SHROOM1、SHROOM2a与SHROOM4。在胚胎发育后期,SHROOM家族蛋白在上皮器官中广泛表达,可使上皮细胞被拉长,且SHROOM2的异位表达能够增加细胞长度,而SHROOM2功能缺陷则导致神经上皮细胞伸长失败,SHROOM家族蛋白对于上皮组织的形态发生起着重要作用[16]。所以,笔者推测SHROOM家族蛋白可能通过介导MIB1影响细胞的形成分化,二者对于细胞分化及胚胎发育至关重要。
GO分析发现,造血干细胞分化这一生物过程所涉及的基因有DLC、NOTCH1a、DLD和MIB1,推测MIB1基因与造血干细胞分化存在一定关系。在MF方面,富集到MIB1的互作蛋白(DLC、DLD)具有与PDZ结构域蛋白结合的功能。PDZ结构域与细胞运输、各种离子通道、细胞-细胞连接及细胞迁移关系密切,且对神经元信号传导、记忆和学习至关重要。鉴于其重要的生物学作用,PDZ结构域蛋白被用于开发小分子抑制剂,可作为治疗药物的潜在靶点[17],推测MIB1可能由DLC或DLD介导,与PDZ结构域蛋白发生间接作用,影响细胞进程。
研究表明,MIB1蛋白介导DELTA受体的泛素化,其作为NOTCH蛋白的配体,通过泛素化DELTA胞内结构域,使DELTA受体发生内吞作用,正向调控DELTA介导的NOTCH信号通路[18],而NOTCH信号通路与多种癌症的细胞转化和肿瘤发生有关[19]。MIB1还参与NOTCH信号通路调控的许多过程,如胚层的形成、耳中感觉细胞的分化、后脑的神经发生、肠分泌和细胞迁移等,其对早期胚胎的发育至关重要[20]。信号通路分析结果表明,斑马鱼MIB1可能通过与SERRATE的间接作用,从而调节NOTCH信号途径。
本研究从斑马鱼MIB1启动子、互作基因、互作蛋白和信号通路入手,由基因表达的上游至下游,系统地探讨了MIB1的潜在生物学功能。随着生物信息学的不断发展,基因功能的预测将更为精确,可为今后的研究提供更有价值的信息。