基于生物素连接酶的邻近标记技术在蛋白质组学中的研究进展

2022-11-27 07:26张雨欣
中国药科大学学报 2022年1期
关键词:蛋白质蛋白细胞

张雨欣,丁 明,柳 军**

(1中国药科大学新药筛选中心,南京 210009;2中国药科大学生命科学与技术学院,南京 210009)

蛋白质是生命体中真正发挥作用的物质,大多数蛋白质不能单独发挥作用,它们与其他蛋白质的相互作用决定了细胞的功能。因此,详细了解蛋白质间相互作用(PPI)是破译细胞网络和调控途径的关键。在用传统的亲和纯化方法分离纯化蛋白复合物时,会导致许多蛋白质间的相互作用被破坏。同时,传统方法会破坏细胞器的完整性,很难评估所得的纯化产物是否保持了其在体内的原始结构[1]。近年来不断发展的蛋白质邻近标记技术极大地补充了寻找蛋白互作的方法。本文将介绍近期出现的基于生物素连接酶BirA 开发的蛋白质邻近标记技术的研究进展。

1 邻近标记技术

邻近标记技术是通过在需要研究的“诱饵”蛋白上融合一个能够非特异性标记周围蛋白质的酶,被打上标记的蛋白质可以形象的称为“猎物”蛋白。目前基于邻近标记酶的蛋白质标记技术有了快速的发展,有依赖生物素连接酶(BirA)建立的生物素连接酶突变体的非序列依赖标记技术(proximity-dependent biotin identification,BioID),在存在生物素的条件下BirA 可以将邻近蛋白质的赖氨酸残基上带上生物素标签;依赖工程化抗坏血酸过氧化物酶(APEX)建立的生物素标记,APEX 在过氧化氢的存在下可在短时间内实现快速的生物素化,有利于研究空间和时间上的蛋白质相互作用网络。依赖于PUP 连接酶PafA 的邻近标记技术PUP-IT[2],通过元基因组数据定点突变BirA 来制造的新邻近标记酶——AirID[3],研究RNA 与蛋白相互作用的RaPID[4],以及将CRISPR和PUP-IT 相结合的CRUIS[5]蛋白质邻近标记技术等。这些方法所要求的pull-down 条件没有传统方法所需的条件苛刻,在分析蛋白质复合物时也不需要其保持结合的状态,能够耐受更激烈的裂解条件,可以在正常生理状态下对细胞中蛋白进行标记,且不会在裂解和亲和纯化的步骤中将相互作用的蛋白错配,减少了假阳性的结果[6]。自其报道以来已经在哺乳动物细胞[7-8]、植物[9-10]、寄生虫[11-12]、黏菌[13]、小鼠[14]、酵母[15]、斑马鱼[16]、果蝇和蠕虫[17]等中成功应用。

2 邻近标记技术的分类

2. 1 BioID

BioID 是一种在真核细胞中近距离依赖标记的蛋白质的技术。该方法可以将物理空间上靠近诱饵蛋白附近的蛋白标记上生物素,以作为蛋白质相互作用的证据,生物素化蛋白可通过链酶亲和素俘获分离并通过质谱鉴定。该技术的核心功能组件是生物素连接酶,在大肠杆菌中,生物素连接酶BirA(231 AA)识别的底物具有特异性,仅能生物素化一段特定的氨基酸序列。如果将BirA 的118 位进行突变(R118G,表示为BirA*,也被称作BioID1[18]),会极大降低其识别底物的特异性,使其作用的蛋白不需要带有特定的氨基酸序列也能被生物素化[7]。能够高活性低特异性的生物素化诱饵蛋白的相互作用蛋白,当生物素连接酶被活化时可以破坏活性生物素分子(生物素酰-5-AMP),使其与连接酶分离,并能与邻近蛋白中暴露的赖氨酸残基上的游离伯胺发生反应,从而将生物素共价结合在底物蛋白的赖氨酸残基上,生物素化在细胞内是一个很罕见的修饰,所以通过生物素特异性亲和纯化分离生物素化蛋白,再通过LCMS/MS分析就可以鉴定候选蛋白[6]。

2. 2 Split-BioID

Split-BioID 是一种基于BirA*酶的蛋白质片段互补分析方法,可以从空间和时间上分析蛋白质复合体[19]。Split-BioID 通过将BirA*分为两个片段,分别连接到两个相互作用的蛋白上,在两个相互作用的蛋白融合在一起时,BirA*可以重新组装恢复活性。在运用该方法时,可以通过实验选择合适的分裂位点,常用的方法有将分裂后的BirA*分别与FKBP12-rapamycin 复合物的结合位点(FKBP12-rapamycin binding,FRB)和FK506结合蛋白(FKBP)融合,在加入雷帕霉素后,FRB 可以和FKBP 相互作用,使BirA*的两个片段重新连接,以此可以验证其生物素化活性的恢复情况[19-20]。BioID 在体内可以给10 nm 范围内感兴趣的蛋白标记上生物素,无论其是否产生了相互作用[21]。而Split-BioID 只有在两种蛋白质相互作用时,才会在天然细胞环境中被激活,能够在单一和简单的分析中无偏见地检测一对相互作用的蛋白质形成的复合物,因此该方法在PPI分析方法中是独一无二的[19]。De Munter[20]等运用该方法将BirA*分为两个无活性的部分,分别融合到蛋白质磷酸酶PP1的催化和调节亚基上,用于筛选PP1全酶的底物和其他蛋白相互作用物。

2. 3 Contact-ID

Contact-ID 也是split-BioID 的一种,将BirA*分为N-G78(B1)和G79-C(B2)两个片段,并将这两个片段分别与位于ER 膜(ERM)的SEC61B 氮端(B1-SEC61B)和位于线粒体膜的外膜(OMM)的TOM20碳端(TOM20-B2)融合[22],生物素化活性依赖于线粒体相关膜(MAM)的形成,用于研究线粒体膜与内质网膜的接触位点的蛋白质组。只有当它们在膜接触位点物理地相互作用和重组时才能恢复生物素化能力。在原位标记两个细胞膜接触点的蛋白质组时,必须满足以下两个条件:(1)Split-BioID系统的生物素化活性仅在两片段邻近后恢复,并可以通过邻近可控的生物系统验证,例如雷帕霉素诱导的蛋白质-蛋白质相互作用;(2)两个分裂片段之间的内在亲和力应忽略不计,以避免人为的MAM 形成和随后的假阳性鉴定[22]。该方法专门对定位在MAM 上的蛋白质进行生物素化,并通过质谱鉴定生物素化的位点,从而明确揭示了活细胞中的MAM蛋白质组。

2. 4 BioID2

BioID2(231 AA)是来源于A.aeolicus的生物素连接酶R40G突变体,自然缺乏DNA结合结构域的生物素连接酶,比BioID 小约三分之一,体积的减小增强了与其融合的蛋白的靶向性和定位性[7,23]。与BioID 相比,BioID2 诱导生物素化所需要的生物素浓度更低,所需要的时间更短,这一特性有利于其在难以补充生物素的体系中运用,且BioID2 的最适反应温度约50 ℃(BioID 最适温度约37 ℃),适用于嗜热菌的标记,当目标蛋白质显著大于BioID2 的标记半径或当融合蛋白是较大的蛋白质复合物时,可以通过增加柔性连接链扩大其标记范围[6]。目前也有将BioID2 运用在体内的研究,Feng 等[14]通过CRISPR-Cas9 将BioID2 敲入小鼠连接蛋白-2(JPH2)用于识别体内心脏二联体蛋白质组,发现了JPH2 的多个突变与人类心肌病的相关性。

2. 5 2C-BioID

所有的标记蛋白与靶蛋白融合都需要考虑一个问题,即融合蛋白是否会影响靶蛋白的功能与定位。BioID1 的大小为35 kD,有研究表明BioID1的存在可能会限制内核膜(INM)蛋白通过核孔复合物(NPC),从而干扰它们的正确靶向,在INM 蛋白的核质结构域延伸超过60 ~ 70 kD 时,它们进入细胞核的过程就会受到阻碍[24]。即使是天然缺失DNA 结合结构域的BioID2 的大小也达到了26. 6 kD,对于许多INM 蛋白来说,BioID2 仍然会影响其在内核膜的分选和定位[18]。

为了解决这个问题,Chojnowski 等[18,25]开发了新的方法——双组分BioID(2C-BioID),该方法将生物素连接酶与靶蛋白分别表达,但在生物素连接酶上融合了FKBP,在靶蛋白上融合了FRB,在加入无生物活性的雷帕霉素模拟物AP21967 后,AP21967 可以利用FKBP-FRB 二聚系统将FKBP:FRB 低聚化,以达到将生物素连接酶与内核膜蛋白连接且不影响其定位的效果。以INM 蛋白层相关多肽2β(LAP2β)为例,LAP2β 的核质结构域的大小约46 kD,由于大小的限制,将BioID1 或BioID2 连接到LAP2βN 末端可能会限制融合蛋白进入INM。 将FKBP 与BioID2 融合,将FRB 与LAP2b 的N 端融合,FRB 结构域为11. 2 kD,因此,FRB 结构不会影响LAP2β 在INM 上的定位。2CBioID 的设计确保了生物素连接酶与感兴趣蛋白的结合只发生在加入AP21967之后,加入AP21967之前的体系可以作为对照,排除非特异性结合。因此,与传统的BioID 相比2C-BioID 改善了融合蛋白的靶向问题,并减小了假阳性的可能,增强了生物素连接酶标记的特异性。

2. 6 TurboID & miniTurbo

TurboID 和miniTurbo 是 由Branon 等[17]以R118S 突变的BirA 通过出错率高的PCR 产生并通过将其表达在酵母表面而筛选出来的,它们的催化效率比BirA 的更高,在添加生物素10 min内即可起到邻近标记的作用。TurboID的大小也为35 kD,相较于野生型的BirA 具有15 个突变;miniTurbo的大小为28 kD,缺少N 末端结构,相较于野生型BirA 有13 个突变[17]。虽然miniTurbo 的生物素化活性比TurboID 低,但在添加外源生物素之前,其标记较少,背景干净,在需要精确控制标记时间的实验中miniTurbo 是一个更好的选择。 在HEK 293T细胞的细胞核、线粒体基质、内质网内腔和内质网膜这4 个细胞结构中,TurboID 的邻近标记效果均优于miniTurbo,且稳定性更强,另外TurboID也可用于果蝇和蠕虫的体内邻近标记[17]。

Split-TurboID[26]与split-BioID 相似,通过将TurboID 分成有较高重组能力的两个非活性片段并将其分别与FRB-FKBP连接,再将其分别与不同亚细胞区室表达的蛋白融合,建立了生物素和雷帕霉素依赖性的表达体系,研究了内质网-线粒体接触位点的蛋白质组成。当蛋白-蛋白相互作用时或膜-膜接触时,TurboID 的两个组分重组被激活,达到邻近标记的作用。

May 等[27]建立了稳定表达BioID 和TurboID 融合蛋白的细胞系,并通过免疫印迹、免疫荧光和基于生物素亲和纯化的蛋白质组学对两者进行了对比。发现TurboID 存在蛋白质不稳定的迹象,在没有外源生物素的情况下也可以进行持续的生物素化,实际标记半径也有所增加。不过,在内质网腔中TurboID的生物素化较BioID作用更强。

2. 7 AirID

AirID在2020年被首次报道,是Kido等[3]从自己建立的文库(由Blastp Web 服务器和自定义Python脚本建立的一个和E.coliBirA 有30% 同源性的文库)中筛选得到,是在原始BirA 的基础上设计的新型生物素标记酶。BirA*的近端生物素化活性明显低于TurboID 和AirID,AirID 标记时较TurboID需要的生物素量低(TurboID 需要50 μmol/L 生物素,而AirID 在5 μmol/L 生物素甚至不含生物素的体系中也能达到邻近标记的目的[3,17]),且AirID 的生物素化发生在邻近的赖氨酸残基上,并且没有特殊的序列优先性,生物素化准确性高还可用于检测药物对PPI的抑制作用。

3 BioID在蛋白质组研究中的应用

3. 1 亚细胞结构

亚细胞结构的蛋白质组和转录组传统上是通过免疫共沉淀(Co-immunoprecipitation,Co-IP)和生化分离分析的。然而,这两种方法都需要先裂解细胞,这容易失去低亲和与短暂的蛋白质相互作用,同时co-IP也受到可用抗体的限制,生化分离往往做不到纯化完全[28]。此外,并不是所有的亚细胞结构都能够被分离[29]。BioID 在最开始开发出来即被Roux 等[7]用于研究组成核层的组成部分——层蛋白A(lamin-A,LaA),鉴定出名为SLAP75的新核膜相关蛋白。两年后,开发者将BioID 与核孔的Nup107-160 复合体和Nup93 复合体中的成分融合,利用稳定的Nup107-160结构作为分子标尺,定义了BioID的实际标记半径[8]。该技术也已成功的应用于中心体纤毛复合体[30-31]、线粒体[22]、应力颗粒和加工体[32]等亚细胞结构。

3. 2 病毒宿主相互作用

病毒进入宿主细胞后,病毒-宿主蛋白相互作用是病毒生命周期进行调控的主要方式[33]。V′Kovski 等[34]对BioID,APEX 等的小分子邻近标记技术在冠状病毒中的应用做了总结,通过将BioID、TurboID 和APEX2 与冠状病毒的nsp2 蛋白融合,能够识别冠状病毒复制酶/转录酶复合物微环境中包含的关键宿主因子。可能有助于揭示被严重急性呼吸综合征冠状病毒2(SARS-CoV-2)改变或劫持的细胞过程,提供有希望的药物治疗靶点。邻近依赖生物素化还可以用于研究与病毒相关的肿瘤进展过程或病毒的靶向细胞器等[35-36]。

3. 3 在体内的运用

Rudolph 等[37]将BirA*敲入到小鼠的肌联蛋白中,以识别连接肌节与信号转导和新陈代谢的蛋白质网络,并描绘了可能的肌丝滑行的动态过程。Uezu 等[38]通过向出生第1 天的小鼠中注射腺相关病毒(AAV)将BirA*与抑制性突触后致密物(post⁃synaptic density,PSD)的主要支架蛋白Gephyrin 和PSD-95 在小鼠体内融合表达,发现了InSyn1 和InSyn2 是对GABA 能抑制具有重要功能的iPSD 蛋白。除了小鼠体内运用外,其在斑马鱼[16]、果蝇和蠕虫[17]体内也有应用。

3. 4 药物靶标发现

RAS 是一个药物难以干预的癌基因,Kovals⁃ki[39]将BioID 与CRISPR 筛选相结合,发现了一组新的功能性RAS 相关蛋白,并将mTORC2 定义为直接RAS效应因子,干扰Ras-mTORC2相互作用可削弱体内RAS 依赖性肿瘤的发生,为难治性癌基因的治疗提供了可能选择。人类免疫缺陷病毒1型(HIV-1)Gag多蛋白是组装非感染性颗粒所必需的,Le Sage等[40]通过BioID筛选其邻近蛋白发现了DDX17 和RPS6 与HIV-1 Gag 的相互作用,为抗逆转录病毒治疗提供了潜在靶点[41]。除此之外,也有研究者将其运用到了药物耐药性研究的方面。BioID 适用于研究不溶性蛋白质的相互作用,这一特点在分析以蛋白质聚集为特征的神经退行性疾病时特别有用,泛素-蛋白酶体系统(UPS)是细胞内主要的蛋白质降解系统之一,泛素连接酶突变导致的异常调节通常与神经退行性疾病有关[42]。而E3 泛素连接酶底物的鉴定由于其低亲和、相互作用短暂、靶标易降解一直具有挑战性,Coyaud等[43]借助BioID 技术,验证了E3 泛素连接酶的12种新底物,并揭示了β-TrCP在维持核膜完整性、加工体转换和翻译控制中的作用。

3. 5 其 他

Wu 等[44]运用BioID 研究了石斑鱼中新加坡石斑鱼虹彩病毒(SGIV)的发病机制,研究了ICP18,一种由SGIV ORF086R 基因编码有调节细胞增殖和病毒组装来促进病毒复制的蛋白,发现并证实了其与周期蛋白依赖性激酶1(CDK1)之间的相互作用,进一步阐明了SGIV的发病机制。BioID在植物中的运用也越来越受到重视,特别是在研究烟草花叶病毒的方面,研究了烟草对病毒的免疫[10],作用靶点[45],蛋白质组研究模型[46]等,极具经济价值。

4 BioID和APEX

邻近依赖的生物素化方法,除BioID 外还有APEX,邻近生物素化标记克服了经典方法纯化的局限性,近年来在各个方面得到了广泛的应用。将过氧化物酶用于生物素化,可以在1 min 内完成邻近蛋白质的标记[47]。过氧化物酶可以从酚芳基叠氮化物衍生物、酪胺衍生物和H2O2分子中产生短寿命的自由基,这些自由基可以共价连接到氨基酸的电子富侧链(例如色氨酸或酪氨酸的芳环侧链),通过这种方式,过氧化物酶可以通过生物素-酪胺或生物素-酚芳基叠氮化物衍生物介导生物素或荧光素标记蛋白质[48]。通过改造APEX 得到的改进突变体APEX2 具有更高的催化效率,可以在融合蛋白表达量更低的情况下达到邻近标记的作用。

5 讨 论

近年来,基于生物素酶的蛋白质邻近标记技术逐渐被研究人员应用在各个研究领域。邻近标记酶不仅可以单独运用,还可以与其他方法结合,如将BioID 与AP-MS 融合产生的MAC-tag[49]能够更加全面地映射蛋白质的结构与功能的相互作用。邻近标记技术不仅可以用于研究蛋白质-蛋白质的相互作用,Ramanathan等[4]基于枯草芽孢杆菌(Bacillus subtilis)设计了一种新的BirA*突变体,称为BASU,它的动力学速度较BirA*提高了1 000 倍以上,可以在短至1 min 的时间内直接研究活细胞中RNA-蛋白质的相互作用。虽然邻近标记酶具有捕获微弱和/或瞬时蛋白质相互作用的能力,但识别的相互作用不仅限于直接结合物,还可以包括空间上接近的蛋白质,这是它们共同的缺陷。除此之外,由于链酶亲和素与生物素的亲和力极高,导致鉴定出的大部分是非生物素化的肽[50]。研究者针对亲和力过强的问题提出了一些解决方法[50-51],BioID 标记蛋白的能力取决于这些蛋白质中伯胺的数量和可用性,因此,生物素化蛋白的丰度不可用来表示相互作用的强度或丰度[7]。也因为这样,BioID 介导的生物素化不能用于验证实际的蛋白质相互作用,只能用作筛选手段。活细胞中的邻近标记已经成为研究蛋白质行为、亚细胞结构和蛋白质结构组成的一种强有力的方法[48]。蛋白质邻近标记技术的蓬勃发展与其应用范围的拓展,不仅为蛋白质组学研究者提供了新的思路,也为药物靶点的发现提供了新的选择。

猜你喜欢
蛋白质蛋白细胞
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
蛋白质自由
锌指蛋白与肝细胞癌的研究进展
人工智能与蛋白质结构
DANDY CELLS潮细胞
细砂糖对法式蛋白糖的质量影响研究
走近细胞——组成细胞的分子
潮细胞
Dandy Cells潮细胞 Finding a home
水通道蛋白的发现