王芬,裴会敏,文狄,李静
(黔南民族师范学院 生物与农学院,贵州都匀 558000)
人类基因组计划完成之后,蛋白质组学[1]的研究方兴未艾,其是探索生物体内所有蛋白质表达模式的科学,对蛋白质相互作用网络(PPIN)[2]的探索是其中重要领域之一。蛋白质相互作用(PPI)是指互相碰触或者功能相关的蛋白分子,如在同一条信号通路中的蛋白质可能具有互作关系。蛋白间的互作有多种表现形式,在亚细胞定位、基因座位、表达时相、序列特征、进化过程、表达量等很多方面具有相似或相关的性状。过去人们研究的重点主要集中在单个蛋白质或少数几个蛋白质上,限制了从整体上对生物过程的了解。因而,对蛋白质相互作用网络的研究可以让人们从总体上对生物过程有系统的了解,意义重大。
科研人员在研究PPI时会按照实验目的和实验要求采用相应的实验方案。对已发现的PPI,研究者往往注重的是其互作模式,一般采用验证性的实验方案。例如,科研人员欲获得某个蛋白质在细胞中的互作情况,可以采用酵母双杂交[3]技术,或是得到与这个蛋白质具有相互作用的蛋白复合物,然后分离复合物并对其成分进行鉴定验证。目前,用来构建PPI的技术主要有串联亲和纯化、质谱分析的亲和捕获[4]、酵母双杂交、免疫共沉淀、化学交联[5]、噬菌体展示技术[6]、激酶交互化验、双分子荧光互补技术[7]和蛋白质芯片[8]等,这些技术各有优缺点。例如,串联亲和纯化技术[9]的优点是既可以减少复合体在细胞内的修饰和结合状态,也可以减少非特异性蛋白质的结合;缺点是不能高效检测到较弱或瞬时的互作,且价格昂贵。酵母双杂交则相反,能捕捉到较弱或瞬时的互作而且性价比高,但准确性不高。免疫共沉淀[10]虽然具有酵母双杂交的优点,然而特异性却不高。双分子荧光互补技术兼具酵母双杂交和免疫共沉淀的优点,但是不能实时反映蛋白的互作情况。蛋白质芯片技术的通量高,但特异性低。为了对在实验中得到的数据进行有效分析,利用生物信息学方法来研究PPI势在必行。
目前,优先结合模型和复制分歧模型[11]、蛋白序列系统发生过程[12]、贝叶斯网络[13]、蛋白质表达[14]、亚细胞定位[15]、基因组上下文关系[16]、文献挖掘和归纳总结[17]、同源比对[18]等计算方法主要用来预测PPI。因此,科研人员要根据自己的实验要求合理选择相关的技术方法。若PPI在生物过程中发生异常,会引起相关疾病的发生。因此,开发阻止PPI的药物也是蛋白质相互作用网络研究的热点之一。
目前,已发现蛋白质在功能注释方面还存在很大空白,湿实验预测蛋白质的功能耗时耗力。因此,利用生物信息学的方法来预测蛋白质的功能任重而道远。蛋白质是细胞功能的执行者,几乎参与细胞的所有生物过程,对蛋白质功能的预测意义重大。(1)在蛋白质相互作用网络中形成功能模块的蛋白具有类似功能;(2)与已知功能蛋白具有互作的蛋白具有相似的功能;(3)具有类似进化图谱的蛋白具有相似的功能。因此,可以通过以上3种方式来预测蛋白质的功能。
在PPIN中,关键蛋白质是连接度最大的节点,如果去除关键蛋白,整个网络就会瘫痪。因此,关键蛋白在生命活动中具有重要的作用,而关键蛋白一般表现为疾病蛋白。因此,研究关键蛋白对于开发预防和治疗相关疾病的药物具有重要的意义。
蛋白质组学是从整体水平上对生物系统进行研究。系统的理解信号传导网络使治疗癌症等疾病成为可能。然而,这在某种程度上依赖于对PPIN的探测。单独的一个蛋白质或几个蛋白质在生物体内不能发挥作用,蛋白质都是通过形成网络或复合体来行使其功能的。因此,研究PPIN面临的第1个挑战是获得纯化的蛋白质组数据。现存的PPIN数据库主要有 STRING、DIP、BioGrid、BIND、HPRD、IntAact、MIPS和MINT等,包含了各个物种的PPIN,但是这些数据大部分都是通过计算方法得到的,准确性不高,这是PPIN面临的第2个挑战。第3个挑战是虽然现存的PPIN数据量非常庞大,但是PPI数据并不完整,有些物种的PPI甚至是空白。完成以上3个挑战是PPIN未来研究和发展的主要方向。
PPIN是从基因组到转录组再到蛋白组不可缺少的一环,在生物系统中主要起调控、修饰的作用,是生命活动的体现者。对预测蛋白质的功能、挖掘关键蛋白、理解代谢通路具有重要的意义,更可为设计药物靶标、开发新药物提供理论依据。