王兴华,王光耀,Te Kian Keong,TehSiew Hoon,OoiCiat Hui,叶儒佳,王智航
蛋白质组学研究的原理、技术与应用
王兴华1,2,王光耀1△,Te Kian Keong2,TehSiew Hoon2,OoiCiat Hui2,叶儒佳1,王智航1
(1.南京中医药大学基础医学院,江苏南京210023;2.UniversitiTunku Abdul Rahman,Kajang,Malaysia)
蛋白质组包括细胞或生物所表达的全部蛋白质,蛋白质组学是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平、翻译后的修饰、蛋白与蛋白之间的相互作用等。借以探析生命活动的生理基础及其内在规律,了解疾病发生、发展与细胞代谢过程,在蛋白质水平上获得整体而全面的认识,它是蛋白质(多肽)谱研究以及基因产物图谱研究的进一步延伸。蛋白质组学的核心技术是双向电泳、质谱及生物信息学,相关技术还涉及相对和绝对定量同位素标记、蛋白质芯片,多维色谱等。已被广泛应用于生命科学研究的诸多领域,尤其是癌症等危害人类较大的疾病防治,受到越来越多的关注。
蛋白质组学;双向电泳;质谱;生物信息学;同位素标记;蛋白质芯片;多维色谱;癌症
蛋白质组是一种基因组所表达的全套蛋白质,包括一种细胞或一种生物所表达的全部蛋白质。蛋白质组的外文名(Proteome)源于蛋白质(protein)与基因组(genome)两个实词的重新组合,其本质是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平、翻译后的修饰、蛋白与蛋白之间的相互作用等。借助这种研究,就可以探析生命活动的生理基础及其内在规律,了解疾病发生、发展与细胞代谢过程,在蛋白质水平上获得整体而全面的认识[1]。蛋白质组学的核心技术是双向电泳(two-dimensional electrophoresis,2-DE)、质谱(mass spectrometry)及生物信息学(bioinformatics)等,已被应用于生命科学研究的诸多领域,受到越来越多的关注。
研究正常生理个体间的蛋白质组,同时也研究异常病理个体间的蛋白质组,将二者进行对比、分析,找出相同点与差异点,就有可能发现某些疾病的特异性蛋白质分子,以提供疾病早期诊断的分子标志。将此作为分子靶点,设计新药物,深入研究,以求攻克[2]。由此可见,蛋白质组学的研究,能为生命活动规律提供物质基础,也能为阐明疾病发生、发展的机理提供根据,作为寻找解决问题的有效途径,以利于消除这些疾病。
蛋白质组学探索,是生命科学进入后基因时代的研究新途径,是未来科学揭示生命奥秘的先进方向,能与其它科学研究一样,更好地为人类的健康事业服务,并有可能发挥更大的社会效益,甚或由之产生巨大的经济利益。
蛋白质组不等同于基因组,二者之间有较大差别。蛋白质会伴随组织、环境等状态的差别而改变。在转录过程中,一个基因可以多种信使核糖核酸(mRNA)形式剪接,同一蛋白也可能以多种形式进行翻译后的修饰。在蛋白质组中,蛋白质的数目,有时可以超过基因组的数目。蛋白质组学不是单纯的方法学,不是一个封闭的知识体系,而是一个更大范围、更大规模的研究领域。蛋白质组学集中于基因调节的动态描述,定量测定基因表达的蛋白质水平,观察疾病对生命过程的影响,鉴定药物对病理的作用靶点,解释基因表达的调控机制[2]。蛋白质组学研究,是蛋白质(多肽)谱研究以及基因产物图谱研究的进一步延伸。
人类基因组计划,经过多个国家的科学工作者的团结协作和共同努力,人类基因的全序列测定,最终得以完成。其研究的标志性业绩是:人类基因组工作草图与初步分析结果。这些内容已经被人类基因组计划组织和美国Celera 公司公布,先后刊载于世界顶级自然科学刊物《Nature》与《Science》上。研究成果是巨大的,其重要贡献是为人类在基因活性与疾病的相关性方面,提供了客观证明和微观依据。现在的问题是,不少疾病的发生,并非全由基因的改变所引起,还有导致多种疾病发生与发展的其它病原和影响因素。基因表达的方式多种多样,相当复杂。如果条件不同,或者时间不同,即使是完全相同的基因,也有可能起到异样作用,会随时发生变化,有的甚至可以发生突变、畸变,甚至癌变,差别非常大。关于这些方面的难题,仅仅依靠基因组学的研究,是不可能攻克的。因此,后基因组学的研究,就显示出必要性。鉴于蛋白质在人体生理病理中产生的重要作用,科学工作者已经将探索目标转移到蛋白质功能的研究上来。尤其是蛋白质组学的研究,更有希望解决以上难题,也正顺应了这个发展趋向,并突显出蛋白质组学研究在攻克人类众多疾病中的重大意义。
蛋白质组学研究是一项更为复杂、更具有挑战性的科学探索,需要国际间的协作与配合。专门研究人类蛋白质的组织(HUPO)已经在美国建立,并由此拉开了国际合作研究的序幕。世界各地的生命科学研究工作者,广泛开展了各种生物体的蛋白质组学研究。为了避免重复,减少浪费,各个国家开展的蛋白质组学研究,既有协作,又有侧重,以集中人力、物力、财力等方面的优势资源,寻求重点突破。例如:人类肝脏蛋白质组学的研究计划就由中国牵头,其它国家辅助,互相配合,协作攻关。余如人类血液蛋白质组学的研究计划,则由美国科学界牵头;人类脑蛋白质组学的研究计划,即由德国科学界牵头。在中国,政府非常重视这一工作,在蛋白质组学的研究工作方面,投入了大量的优质资源,给予人力、物力、财力等方面的鼎力支持,已经将其列为目前到2020年的研究重点,并收入《国家中长期科学与技术发展纲要》。在国家现阶段设立的四个重大科学研究计划中,蛋白质组学计划就是其中之一,成为当前国家科学研究的重点突破方向。
基因组包含的遗传信息,经转录产生信使核糖核酸(mRNA),mRNA经过翻译之后,产生相应的蛋白质。翻译后修饰是蛋白质调节功能的重要方式。在特定生理条件或病理状态下,某一细胞表达的各种蛋白质,构成其蛋白质组。在不同生理条件或病理过程中,各种细胞所表达的蛋白质的种类,有一定差别。研究蛋白质的结构、定位以及它们之间的相互作用,将为观察和阐释生命现象,揭示疾病发生、发展、变化的本质,提供直接的微观的客观的证据。
二维电泳与质谱技术的巧妙结合,形成蛋白质组学研究中的理念结合与技术佳配,具有相辅相成的促进作用和协同效果,为科学工作者研究蛋白质的表达规律提供了理想的可行的技术支持[3]。探索蛋白质与蛋白质之间的相互作用,将是这一研究领域的重要方面。
蛋白质组学系基因能表达全部蛋白质,其研究是针对不同时间和/或空间上发挥功能性的特定蛋白质群组,探索其作用机理、功能模式及其群组内的相互作用、调节与调控,为生理研究、病理分析、临床诊断、新药开发、药品筛选、代谢途径等,提供客观依据,建立理论基础[4]。蛋白质组学研究的重点目标和发展方向,主要是为了促进分子医学的发展,如寻找药物靶分子,消除致病基因,修复正常生理基因,以利于攻克疾病,促进机体恢复健康。
2-DE是双向凝胶电泳技术。蛋白质有2个重要的理化特性,一是等电点,二是分子量。根据样品中的这2个蛋白质理化特性,可以将其分离。原理:一是向基于蛋白质PI不同用等电聚焦分离,二是按MW的不同用聚丙烯酰胺十二烷基硫酸钠凝胶电泳分离。这样,复杂蛋白混合物中的蛋白质,就会依据其理化特性,在二维平面上自行分离。差异凝胶电泳,是提取2个不同样品中的蛋白质,分别标记以不同的荧光染料,再将标记后的2个样品混合,进行双向凝胶电泳。因发光波长不同,同一块胶上2个样品的蛋白质,可以自行分离,并能测出其含量。因其通量高,分辨率好,具有可重复性,可与质谱分析技术联用,故成为当今最流行的蛋白质组学的研究手段,属于最可靠的实验方法。2-DE技术,可以广泛应用于各种蛋白质组学的研究,成为研究结构蛋白质组与功能蛋白质组的重要方法[5],最具有实际应用价值。在蛋白质组学研究的实验技术中,属于不可或缺的项目,占据着十分重要的地位。
质谱分析,是唯一可以确定分子质量的方法。在高分辨率质谱仪中,能够准确测定质量,而且可以确定化合物的化学结构式,并进行结构分析。质谱法的灵敏度极高,鉴定的最小量可达10-10g,检出限可达10-14g。质谱仪的种类多样,如:有机质谱仪、无机质谱仪、同位素质谱仪等。其中有机质谱仪有气-质、液-质、富变质谱仪,激光解吸飞行时间变质谱仪等。质谱分析是用高速电子,撞击气态分子或原子,将电离后的正离子加速,导入质量分析器。试样在离子源内被气化、电离。用电子轰击法在10-5Pa高真空下,以50-100eV能量的电子流轰击试样,有机物常常被击出一个电子。若加速电压和磁场强度都一定时,不同m/z的离子,由于运动的曲线半径不同,在质量分析器中彼此分开。在磁场中,按质荷比(m/z)大小,进行收集和记录,得到质谱图。根据质谱峰的位置,进行物质的定性,作结构分析。还可根据峰的强度,进行定量分析。其原理是受试样品,从进样器进入离子源,在离子源中产生正离子。正离子加速进入质量分析器,质量分析器将离子按质荷比大小不同进行分离。分离后的离子先后进入检测器,检测器得到离子信号,放大器将信号放大,并记录在读出装置上。通过正确测定蛋白质分子的质量,进行蛋白质分子鉴定、修饰和相互作用的研究[6-7]。基质辅助激光解析电离飞行时间质谱,可检测离子,并确定分子量,能反映被检测样本中蛋白质的全部情况,找到多个蛋白质标志物。
生物信息学技术,是分子生物学与信息技术的结合体,是利用数学、统计学、应用信息学、计算机科学等方法,研究生物学中的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机。研究方法,包括对生物学数据的搜索、收集、筛选、处理,包括编辑、整理、管理和显示,利用、计算和模拟等。目前主要的研究有:基因识别、基因重组、基因表达、序列比对、蛋白质结构预测、蛋白质反应预测,以及建立进化模型等。生物学技术生成大量的复杂数据,生物信息学利用数学工具,从大量数据中提取有用的生物学信息。生物信息学处理的问题:重新组装在霰弹枪定序法测序过程中被打散的DNA序列,从蛋白质的氨基酸序列预测蛋白质结构,利用mRNA微阵列或质谱仪的数据检验基因调控的假说。生物信息学技术通过蛋白质微阵列技术或高通量质谱分析,对生物标本进行测量,获得数据,其中包含有大量生物标本内蛋白质的信息。生物信息学被广泛应用于这些数据的分析[8]。Michael Waterman是这方面的行家里手,他率先将数学和计算方法引入生物学研究,将数学、统计、计算机科学应用于各种分子生物学问题的研究中,开辟了多个重要的研究方向,在生物信息领域有不少创新性的贡献。他受聘于清华大学,为清华大学的生物信息学学科发展作出了突出贡献。2013年,他荣获了外国专家在中国从事研究工作的国际友谊奖。
相对和绝对定量同位素标记,是一种体外同种同位素标记的相对与绝对定量技术,利用多种同位素试剂,标记蛋白多肽N末端或赖氨酸侧链基团,经用高精度质谱仪串联分析,可同时比较多达8种样品之间的蛋白表达量,是定量蛋白质组学常用的高通量筛选技术。将蛋白质裂解为肽段,然后用试剂进行差异标记。由于试剂是等量的,用不同同位素,标记同一多肽后,在第一级质谱检测,分子量完全相同。用串联质谱方法,对在第一级质谱检测到前体离子,进行碰撞诱导解离,产物离子,通过第二级质谱进行分析。通过数据库查询和比较,可以鉴定出相应的蛋白质前体[9]。技术特点是:定量精确、高效率样品分离、高鉴定率、适用范围广、仪器性能优良,可获得更加准确的结果。
蛋白质芯片,是一种高通量的蛋白功能分析技术,用于蛋白质表达谱的分析,研究蛋白质与蛋白质的相互作用,筛选药物作用的蛋白靶点。蛋白质芯片技术研究的原理,是对固相载体进行特殊的化学处理,再将已知的蛋白分子产物,如酶、抗原、抗体、受体、配体、细胞因子等,固定在其上面。根据这些生物分子的特性,捕获能与其特异性结合的待测蛋白,经洗涤、纯化,再进行确认和生化分析。为获得重要生命信息,如未知蛋白组分、序列,体内表达水平,生物学功能,分子相互调控关系,药物筛选,药物靶位选择等,提供有力的技术支持。蛋白芯片主要有三类:蛋白质微阵列、微孔板蛋白质芯片、三维凝胶块芯片。应用于基因表达的筛选、抗原抗体检测、筛选及研究、生化反应检测、药物筛选、疾病诊断等。优点是直接分析粗生物样品,如血清、尿、体液等,同时快速发现多个生物标记物,小量样品,高通量的验证能力,发现低丰度蛋白质,测定疏水蛋白质,在同一系统中集发现和检测为一体,特异性高,减少测定蛋白质序列的工作量,可以定量,功能广,可测定细胞内的抗原,而且灵敏度高[10-11]。蛋白芯片技术与质谱技术相结合,展现出独特的优势。
多维色谱,是利用不同物质,在不同相态下的选择性分布,以流动相洗脱固定相中的混合物。在色谱分析中,一旦遇到难分离的物质对,首先考虑改变固定相的选择性。高度复杂混合物,可能包含不同沸点、不同极性的化合物。更换色谱柱,其中的部分物质分离效果就会得到改善,其它物质的分离效果可能变差。要改善总体分离效果,就需要采用多维气相色谱。原理是两根独立控制、极性不同的色谱柱,通过切换手段,将第一根色谱柱的馏分,选择性地转移到第二根色谱柱,进行二次分离,以获得比单柱更强大的分离能力。多维色谱技术在峰容量方面提供了更广阔的空间,其中多维气相色谱和多维液相色谱较为常用。根据样品组分的性质差别,选择几种色谱分离模式组合,对样品进行分离,与质谱技术联合,获得分子量信息,用以分析蛋白质[12-13]。多维液相色谱具有高分辨率、高灵敏度和高速度等优点,可用于分离复杂样品,并可广泛应用于生物大分子等复杂样品的分析及分离鉴定,是蛋白质组学研究技术中的重要方法之一。
癌症的发生,是环境与遗传等多重因素,相互作用,激活体内原癌基因,导致抑癌基因失活,或表达被抑制,细胞失去原有的生理调节,产生异常增生。应用蛋白质组学技术,能系统、全面、动态地分析癌症样本蛋白质种类与含量,结合肿瘤发生、发展过程中的分子作用网络,阐明癌症发生机制,寻找不同肿瘤的诊断、治疗、预后的特异性标志物,为临床医疗提供线索与依据。为了研究肝癌的发生、发展机制,应用蛋白质组学方法,对患者人源性肝癌组织与正常人体肝组织之间的蛋白质进行比对分析,发现RAS-RAF-MEK-ERK信号通路与肝癌发生、发展机制有相关性。通过对肝癌患者肝组织标本的细胞株进行蛋白质研究,发现转移性肝癌患者,肝组织样本的细胞株中,AGR2表达异常增高,推测AGR2的过度表达,可促进肝癌转移。使用液相色谱串联质谱和二维荧光差异凝胶电泳法,检测不同分化程度的胃腺癌患者,分析出肿瘤组织中差异表达的蛋白质。用定量聚合酶链式反应、蛋白质印迹法技术,对结果进行验证,确认这些因子的表达水平,与蛋白质组学鉴定结果一致,不同分化程度胃腺癌中的蛋白表达,存在显著差异性,差异蛋白质所对基因,与胃腺癌的发生以及分化程度相关。使用定量蛋白质组学技术,对金雀异黄素诱导蛋白在胃癌细胞中的改变与具有抗癌作用的染料木素的分子机制进行分析,显示KIF20A在染料木黄酮的防癌作用中发挥了重要作用,可能是胃癌药物治疗干预的分子靶点。比较MKN45胃癌细胞株和敲除了CXCR1基因的MKN45细胞,分析二者之间的蛋白质表达谱变化,发现CXCR1在胃癌的侵袭、增殖、转移、耐药、预后等方面,发挥重要作用。利用液体芯片-飞行时间质谱技术,检测健康志愿者、食管癌患者的血清,作蛋白质组学分析,发现患者体内细丝1、微管蛋白β链、细胞色素b-c1复合亚基、α-异构体等,表达明显增高,这些表达失调的蛋白质/多肽,可能参与了食管癌的发病机制,可作为食管鳞状细胞癌血清学诊断的生物标志物。利用蛋白质组学技术,对外周血蛋白谱进行分析比较,对差异表达的蛋白质,应用MALDI-TOF-MS技术进行鉴定,发现慢性胰腺炎患者、胰腺癌患者、胰腺癌病情得到控制的患者,表达存在显著性差异,用WesteRn Blot法再次验证,发现识别体蛋白C3可作为胰腺癌特异性血清标志物。乳腺囊性疾病是诱发乳腺癌的乳腺良性病变,应用MALDI-TOF质谱分析法,研究后来发展成乳腺癌的GCDB患者,进行冻存血清分析,发现实验组与对照组相比,C3f片段有显著增加,认为C3f可作为预测指标,用于健康人群和有癌前病变妇女患乳腺癌风险的评估[14-15]。
蛋白质组学是揭示生命现象和规律的有效技术方法,已经广泛应用于生命科学研究的各个领域,已成为当前生命科学研究与生物技术探索的重要战略前沿和主要突破口。蛋白质组学研究的技术与应用,为癌症等疑难疾病的研究开辟了新途径,对揭示癌症的发生、发展机理有重要意义。利用蛋白质组学技术,可观察到癌症早期侵袭、免疫逃逸、发生、发展、血管形成和转移等变化。早期发现癌症生物标志物,确立药物治疗靶点,消除耐药,有利于提高临床疗效。高通量蛋白质组学技术,为更多蛋白质相关变化疾病的研究提供了技术基础。蛋白质组学研究的原理、技术与应用,已经受到生命科学与生物学界的广泛关注,有良好的发展与运用前景。
[1]Wilkina MR,Pasquali C, Appel RS, et al.Fom proteins toproteomes: large-scale protein identification bytwo-dimensional electrophoresis and amino acid analysis.Biotechnology (NY),1996.14(1):61-65.
[2]Sun H,Chen GY,Yao SQ. Recent advances in microarray technologies for proteomics[J].ChemBiol,2013, 20( 5): 685-699.
[3]LIU Junlian,LIYongzhi, GAO Jianyi, et al. The Progress of the Proteomic Technology.SpaceMedicine&MedicalEngineering,2009, 22(2):151 - 156.
[4]ZHONG Jingmin, LI Jing, LIU Zhihong, et al.Advances in the Proteomic Technology Application in Malignancy Research[J]. Progress in Modern Biomedicine.2015,15(18):3593-3596.
[5]Grandjean M,Dieu M,Raes M,et al. A new method combining sequential immunoaffinity depletion and differential in gel electrophoresis to identify autoantibodies as cancer biomarkers[J]. JImmunol Methods,2013,396( 1-2): 23-32.
[6]Hortin GL. The MALDI-TOF mass spectrometric view of the plasmaproteome and peptidome[J].ClinChem,2006,52( 7): 1223-1237.
[7]Park J,BlickRH. A Silicon NanomembraneDetectorfor Matrix-AssistedLaser Desorption /Ionization Time-of-Flight Mass Spectrometry(MALDI-TOF MS) of Large Proteins[J]. Sensors( Basel),2013,13( 10): 13708-13716.
[8]Young JY,Feng Z,Dimitropoulos D,et al. Chemical annotation ofsmall and peptide-like molecules at the Protein Data Bank[J]. Database(Oxford), 2013,2013: bat079.
[9]Hagglund P,Bunkenborg J,Maeda K, et al.dentification of thioredoxin target disulfides using isotope-coded ffinity tags[J]. Methods MolBiol,2014( 1072): 677-685.
[10]Chandra H,Reddy PJ,Srivastava S. Protein microarrays and novel detectionplatforms[J]. Expert Rev Proteomics, 2011,8( 1):61-79.
[11]Lottspeich F,Kellermann J. ICPL labeling strategies for proteome Research[J]. Methods MolBiol,2011,753: 55-64.
[12]Xu X,Liu K,Fan ZH.Microscale 2D separation systems forproteomicanalysis[J]. Expert Rev Proteomics, 2012,9( 2): 135-147.
[13]Ye L,Wu Q,Dai S,et al. Development of a droplet-interfaced highperformance liquid chromatography-capillary electrophoresis two dimensionalseparation platform[J]. Se Pu, 2011,29( 9): 857-861.
[14]Qian Xiujuan,Wu Qiong.Advances in proteomics technology and its application in the study of malignant tumors[J].Chinese Journal of General Practice , 2014,22(9):1478-1481.
[15]WANG Limeng, XIE Liqi, LU Haojie.Isobaric terminal labeling tandem mass spectrometricquantification:A high throughput and accuratebiomarker screening technique[J].Science China PRESS,2016,61(4-5):432-441.
Principles,Techniques and Applications of Proteomics
WANG Xinghua1,2, WANG Guang-yao1△,Te Kian Keong2,TehSiew Hoon2,OoiCiat Hui2,YE Ru-jia1,WANG Zhi-hang1
(1.Nanjing University of Chinese Medicine,Jiangsu, China,210023 ;2.UniversitiTunku Abdul Rahman, Kajang,Malaysia)
The proteome includes all the proteins expressed by cells or organisms.Proteomics is the study of the characteristics of protein on a large scale, including the level of protein expression, the modification of protein, the interaction between protein and protein.This paper does the study in order to explore the physiological basis of life activity and its inherent law, to understand the occurrence, development and cellular metabolism of the disease, to gain a over-whole and comprehensive understanding of the protein level.It is a further extension of the research of protein (peptide) spectrum and the research of gene product map.The core technology of proteomics is two-dimensional electrophoresis, mass spectrometry and bioinformatics and related technology also relates to the relative and absolute quantitative isotope labeling, protein chip and multidimensional chromatography .It has been widely used in many areas of life science research, especiallyprevention and control of cancer and other harmful disease , and has attracted more and more attention.
Proteomics; Two-dimensional electrophoresis; Mass spectrometry; Bioinformatics; Isotope labeling; Protein chip; Multidimensional chromatography; Cancer
国家中医药管理局重点学科,江苏省重点学科。Centre for Research in Traditional Chinese Medicine,UTAR.
王兴华,资深教授,博士,博士研究生导师,人事部等七部委“百千万人才工程”国家级一二层次,江苏省“三三三工程”领军人才,国家中医药管理局重点学科学术带头人,江苏省重点学科学术带头人,江苏省突出贡献专家,国务院政府特殊津贴专家。
王光耀,男,博士研究生,硕士,讲师,主治中医师。