刘永湄,谭 明,雷 鸣
上海交通大学医学院附属第九人民医院上海精准医学研究院,上海200125
mRNA从细胞核到细胞质的转运是真核基因表达的重要调控步骤之一,该过程与mRNA生物合成的多个步骤相联合,以确保只有加工成熟的mRNA能被运送到细胞质中翻译[1-4]。TREX(transcription-export)复合物是一种进化上高度保守的多蛋白亚基复合物,位于这种功能联合的中心;顾名思义,该复合物包含了转录和出核的相关调控因子,参与了mRNA的转录、5'端加帽、剪切、3'端加工以及出核等一系列过程,是实现mRNA生物合成和质量监控的关键复合物[5-7]。
TREX复合物由核心的THO复合物以及RNA解旋酶UAP56(U2AF65-associated protein 56)和mRNA结合蛋白质Aly(Aly/REF export factor)组成。不同的物种中,THO复合物的组分也有所差异;在哺乳动物中THO复合物由6个蛋白质亚基组成(THOC 1~3,5~7);其中THOC1、THOC2、THOC3在酵母中存在同源物蛋白质[8-9]。作为THO复合物的高度保守的亚基,THOC1、THOC2、THOC3中任何一个组分的缺失,都会不同程度地影响细胞mRNA的出核转运[10-11]。此外有文献报道,许多遗传疾病和肿瘤的发生与这3个THO复合物亚基的功能异常有关。例如,THOC1在原发性卵巢癌、结肠癌、乳腺癌和肺癌细胞内的表达水平异常升高;而在睾丸癌和皮肤癌的细胞中THOC1的表达量却很低[12-13]。THOC2的突变与神经系统发育障碍有关,会导致不同程度的智力残疾并表现出包括言语延迟、身材矮小、癫痫发作、步态紊乱和震颤等特征[14-15]。THOC3含有多个重复的WD40序列,用于介导蛋白质之间的相互作用[6,16]。目前THO复合物的组装过程尚不清楚,但是THO亚复合物是作为一个整体,参与TREX的功能。UAP56具有ATP水解酶的活性[17-18],然而,其所具有的ATP水解酶和RNA解旋酶活性在mRNA出核过程的作用并不明确。Aly作为mRNA的出核配基(adaptor),通过与下游出核受体NXF1/NXT1(nuclear RNA export factor 1/nuclear transport factor 2 like export factor 1)结合,引导信使核糖核蛋白体(messenger ribonucleoprotein,mRNP)的正常出核[19-20]。
尽管TREX复合物在mRNA出核转运过程中发挥着十分重要的作用,相关的结构生物学研究却进展缓慢,仅有UAP56及Aly的高分辨率晶体结构以及酵母THO复合物的低分辨率晶体及负染电镜结构被报道[21-23],这极大地限制了对TREX复合物组装、招募、参与mRNA出核运输的分子机制的研究。人源THO复合物与酵母THO复合物在组分上存在较大差异,并且招募机制也有所不同[8]。解析人源THO复合物的结构,对于揭示其功能和招募机制具有重要的意义,同时能为TREX复合物调控异常引起的疾病提供新的诊疗依据。本研究通过建立完善的昆虫细胞表达和蛋白质体外纯化体系,获得人源THO复合物中由THOC1、THOC2、THOC3形成的亚复合物的高质量的蛋白样品,借助透射电子显微镜(电镜)和单颗粒重构技术,得到了该亚复合物的三维结构模型,从而为后续解析完整的THO复合物及TREX复合物的高分辨率结构奠定了坚实的基础。
1.1.2 载体、菌株和细胞 pFastBac Dual载体、E.coli DH10Bac菌种、Sf9昆虫细胞、High Five昆虫细胞均由本实验室保存。
1.1.1 主要试剂和仪器 限制性核酸内切酶、T4 DNA连 接 酶(TaKaRa),HEPES、PMSF、 咪 唑、 生 物 素(Sigma),杆状病毒(Baculovirus)gp64 抗体(AcV5)PE(phycoerytherin)(Santa Cruz ,sc-65499PE),Ni-NTA 琼脂 糖 凝 胶(QIAGEN),Strep-Tactin®XT Superf l ow 凝 胶(IBA),Superose 6 Increase 10/300 GL、AKTA FPLC快速纯化液相色谱系统(GE Healthcare),超高压均质机(上海励途机械设备工程有限公司),立式离心机(Beckman Coulter),冷冻离心机(Eppendorf),电泳仪与电泳槽(Bio-Rad),细胞计数仪(Invitrogen,CountessⅡ),细胞流式分析仪(BD,FACSCalibur Flow Cytometer),高分辨轨道阱质谱仪(Thermo Scientific,Q-Exactive HF),碳膜铜网(北京中镜科仪技术有限公司,普通碳支持膜),透射电子显微镜(FEI,Talos L120C)。
1.2.1 引物合成和DNA序列测定 均由上海铂尚生物技术有限公司完成。
1.2.2 重组质粒的构建 利用PCR获得人源THOC1全长(氨基酸残基:1~657)、THOC3全长(氨基酸残基:1~351)的编码序列,先后插入pFastBac Dual载体,并在THOC1的C端加入Strep纯化标签,获得pFastBac Dual-THOC1-Strep-THOC3重组质粒;利用PCR获得人源THOC2的N端(氨基酸残基:1~1 190)编码序列,插入pFastBac Dual载体,并在其N端加入10×His纯化标签,获得pFastBac Dual-10×His-THOC2重组质粒。
1.2.3 重组蛋白质表达 按照Invitrogen公司Bac-to-Bac®Baculovirus Expression System说明书进行,将pFastBac Dual-THOC1-Strep-THOC3重组质粒与pFastBac Dual-10×His-THOC2重组质粒分别转化DH10Bac感受态菌株,制备重组杆状病毒质粒(Baculovirus plasmid),转染昆虫细胞Sf9,获得相应的初代杆状病毒;初代病毒经过2代扩增后,收集含病毒的细胞培养液,4 ℃低温短暂存储;经免疫法测定病毒滴度后,将2种病毒按1∶1的滴度混合,以MOI(multiplicity of infection,病毒与细胞的比例)等于10的比例侵染新鲜的、密度为3×106个/mL的High Five昆虫细胞。侵染后的High Five昆虫细胞在27 ℃条件下低速振荡培养72 h,后收取细胞进行蛋白纯化。
1.2.4 免疫法测定病毒滴度 取新鲜的High Five昆虫细胞,计数后,按一定的稀释倍数加入待测病毒;16 h后,收集细胞,用PBS清洗3次后,取约1×106个细胞于100 μL PBS,加入 2 μL gp64 抗体,室温孵育 1 h;加入400 μL PBS,进行细胞流式分析,统计携带红色荧光的细胞占总细胞的比率;得到的比率乘以起始细胞数目及病毒液的稀释倍数,计算出病毒的滴度。
1.2.5 THO蛋白质复合物纯化 表达目的蛋白质复合物的High Five细胞2 000×g离心15 min,弃上清,用lysis buffer(20 mmol/L pH 7.5的 HEPES、200 mmol/L NaCl、10%甘油)重悬,采用超高压均质机600 bar高压裂解细胞;细胞裂解后经39 000×g高速离心30 min,取上清与Ni-NTA 琼脂糖凝胶在4 ℃低速旋转混合2 h,柱料用含20 mmol/L咪唑的wash buffer(20 mmol/L pH 7.5的HEPES、200 mmol/L NaCl)洗去杂蛋白质,再用含25 mmol/L咪唑的wash buffer洗脱目的蛋白质。得到的目的蛋白质溶液与Strep凝胶在4 ℃低速旋转混合至少6 h,用wash buffer洗去杂蛋白质,用含50 mmol/L生物素的wash buffer洗脱目的蛋白质。将蛋白质样品浓缩至1 mL,通过Superose 6 Increase 10/300 GL(用wash buffer平衡柱子),分开收集流出组分,经十二烷基磺酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析鉴定后,合并目的蛋白质溶液。
1.2.6 蛋白质组分的质谱鉴定 取约20 μg蛋白质,经三(2-羧乙基)膦还原和碘乙酸铵烷基化处理后,加入胰蛋白酶过夜酶解;酶解肽段利用C18柱子除盐后,通过液相色谱 - 串联质谱法(liquid chromatography-tandem mass spectrometry,LC-MS/MS)进行分析;质谱原始数据提交到Proteome Discoverer 2.3软件中,使用UniProt数据库中的人(Homo sapiens)和粉纹夜蛾(Trichoplusia ni)蛋白质数据库进行检索。
1.2.7 负染样品制备、数据收集及模型构建 因甲酸双氧铀(uranyl formate,UF)溶液较细腻的颗粒度及其较高的浸透能力,故选择其作为样品的负染色液。负染电镜实验步骤如下:对碳膜铜网进行亲水化处理后,取3.5 μL蛋白质(50 μg/mL)溶液滴于碳膜铜网,吸附1 min;用滤纸从碳膜铜网边缘轻轻吸去多余的溶液,滴加15 μL 0.75%(质量体积比)UF负染色液,染色1 min;用滤纸吸去多余液体,室温晾干;晾干后将样品置于120 kV透射电镜中观察,放大倍数设置为73 000倍,欠焦值设置为-1~-2 μm;选择样品颗粒分散性和均一性较好的区域进行数据收集。随后利用数据处理软件EMAN2[24]和RELION3[25]对所收集的图像进行处理并产生一个三维模型。
1.2.8 THOC3蛋白结构预测 I-TASSER(Iterative Threading ASSEmbly Refinement)是由密歇根大学开发的在线蛋白质结构与功能预测的工具,它能从PDB(Protein Data Bank)数据库里识别结构模板,通过基于迭代模板的片段组装模拟来构建完整的结构模型。根据网站提示,提交THOC3蛋白质序列,获得相应的蛋白质三级结构预测数据。
THOC1、THOC2、THOC3亚基在哺乳动物和酵母中均非常保守,但是组分之间的相互作用尚不清楚(图1A);人源THOC2全长为1 593个氨基酸,在进行全长蛋白的外源表达过程中,未能检测到蛋白表达(数据未显示)。通过在线软件FoldIndex[26]对THOC2折叠倾向性进行预测分析发现,在THOC2的C端存在一段很大的无序区域(氨基酸残基:1 191~1 593)(图1B),因此截取THOC2(氨基酸残基:1~1 190)进行外源表达;THOC1和THOC3则选择全长进行表达。THOC2的N端带有10×His标签,THOC1的C端带有Strep标签,用于两步亲和层析。第一步通过Ni-NTA亲和层析获得的目的蛋白质带有少量的杂蛋白质,经过第二步Strep-Tactin亲和层析后得到纯度较高的目的蛋白质样品(图1C)。为了提高样品的均一性,目的蛋白质样品通过Superose 6 Increase 10/300 GL进一步分离提纯(图1D),收集所有的流出组分,经SDS-PAGE鉴定(图1E),合并含有目的蛋白质复合物的组分。纯化的样品经过LC-MS/MS鉴定,结果表明纯化所得的样品是THOC1-THOC2-THOC3亚复合物(表1)。经过整个分离纯化步骤,从300 mL的High Five细胞里可纯化出约1 mg的目的蛋白质复合物。
图1 重组人源THOC1-THOC2-THOC3亚复合物的表达及纯化Fig 1 Expression and purification of the recombinant human THOC1-THOC2-THOC3 subcomplex
表1 纯化的THOC1-THOC2-THOC3样品蛋白质组分质谱分析结果Tab 1 Analysis of protein components in purified THOC1-THOC2-THOC3 subcomplex by LC-MS/MS
在获得高纯度且均一性较好的THOC1-THOC2-THOC3亚复合物后,采用负染电镜技术和单颗粒重构技术分析目的复合物的三维模型。样品吸附到碳膜铜网后,经重金属UF染色处理过后,在120 kV透射电镜下观察,结果表明样品在负染条件下颗粒完整,大小均一,且分散性好,长度约为2.2 nm,和预期相对分子质量(约250 000)大小相符合(图2A)。在同样条件下收集负染照片129张。利用EMAN2[24]软件手工挑选11 762个颗粒,之后使用RELION3[25]软件进行二维分类平均和三维分类计算。分类结果表明复合物结构特征明显(图2B),整体呈现长条形状(图2C),在不同的区域有不同的优势取向,角度分布较为均匀(图2D)。
图2 负染电镜分析THOC1-THOC2-THOC3亚复合物Fig 2 Negative-staining electron microscopy analysis of the THOC1-THOC2-THOC3 subcomplex
三维分类计算结果经过进一步优化,最终得到分辨率为29 Å的人源THOC1-THOC2-THOC3亚复合物的负染三维模型(图3A);图像中颗粒棱角更加清晰,复合物整体结构延展,呈“F”型,整个复合物的尺度为200 Å×120 Å×80 Å(图 3B)。由于目前尚未有 THOC1、THOC2、THOC3任何一个组分的高分辨率数据,因此,低分辨率的负染结构并不能确定各组分的相互位置。已有的研究[27]预测THOC3含有若干个WD40重复序列,所有的WD40重复序列组成一个β螺旋桨结构。我们借助结构预测软件I-TASSER[28]模拟产生了一个THOC3(氨基酸残基:46~351)的原子结构模型(图3C)(THOC3 N端1~45位氨基酸未发现任何已知的同源结构域);通过软件UCSF Chimera[29]自动匹配,确认了THOC3在亚复合物里的位置(图3D)。发现人源THOC3在THOC1-THOC2-THOC3亚复合物中的位置和已报道的低分辨率酵母THO复合物电镜结构中THOC3的定位相同[30],这表明在人和酵母中THOC1-THOC2-THOC3亚复合物的结构保守。
图3 THOC1-THOC2-THOC3亚复合物负染三维模型和THOC3的定位Fig 3 Three-dimensional reconstruction of the THOC1-THOC2-THOC3 subcomplex and localization of THOC3
自从首次在酵母和人细胞中被发现,THO/TREX复合物一直就是mRNA的加工和出核转运研究领域的一个重要靶标[19]。相对于已报道的THO/TREX复合物功能研究,与之相关的结构生物学研究则进展缓慢,严重限制了对该复合物在发挥生物学活性分子机制的理解[31]。在2012年有研究者[30]发表了酵母中THO复合物(Hpr1/Tho1、Tho2、Tex1/Tho3、Mft1、Thp2)的低分辨率结构,但是至今尚无关于人源THO复合物结构的报道。与酵母不同的是,人源THO复合物含有6个亚基(THOC 1~3,5~7),其中THOC5、THOC6、THOC7在酵母中并没有同源物,只有THOC1、THOC2、THOC3在酵母中有高度保守的同源物[8-9]。此外有研究[8]表明THO/TREX复合物在酵母和人细胞里的招募机制有所不同,因此解析人源THO/TREX复合物的结构也势在必行。我们尝试在体外表达重组完整的人源THO复合物,但并未得到稳定的复合物。因此,我们首先研究保守性较高的人源THOC1-THOC2-THOC3亚复合物的结构。与酵母的Tho2类似,人源的THOC2的C端包含一段高度无序的序列[30],不参与THOC1、THOC2、THOC3之间的相互作用,所以只截取THOC2 亚基1~1 190的序列用于表达纯化。
我们采用两步亲和层析和一步凝胶过滤层析分离提纯目标复合物,对纯化的样品进行质谱分析鉴定,确定其中的主要成分是THOC1-THOC2-THOC3亚复合物,只有极少量的70 kDa热休克蛋白(heat shock 70 kDa protein)等杂蛋白质的污染(表1);此外,凝胶过滤层析保证实验获得的是整体的目标复合物,而不是分散的各个组分(图1D),可直接用于电镜分析。通过单颗粒重构技术,获得了THOC1-THOC2-THOC3亚复合的低分辨率结构。除了有报道[27]表明THOC3含有典型的由WD40重复序列组成的β螺旋桨结构以外,THOC1和THOC2没有任何结构信息,因此我们借助分子对接的方式,确定了THOC3在整个亚复合物的位置。
我们的研究首次获得了人源THOC1-THOC2-THOC3亚复合物的负染三维模型,朝着阐明人源TREX复合物的组装和招募的分子机制的方向踏出了关键的一步。与已报道的酵母的低分辨率THO复合物进行对比[30],该亚复合物呈“F”型,且THOC3/Tex1位于亚复合物的中间部位。下一步我们将优化样品的制备条件,尝试冷冻电镜分析,以期获得THOC1-THOC2-THOC3亚复合物的高分辨冷冻电镜结构。同时,我们将优化纯化条件,制备完整THO复合物并解析其冷冻电镜结构,全面地解释THO复合物组装过程以及内部的相互作用。
[收稿日期]2019-10-10
团队负责人介绍
雷鸣 LEI Ming
博士、研究员、博士生导师
Ph.D, Principle Investigator, Doctoral Supervisor ORCID ID:0000-0002-1153-4791
雷鸣(1971—),中组部“千人计划”特聘专家。2001年博士毕业于美国哈佛大学。2001至2004年在美国科罗拉多大学波尔德分校从事博士后研究。2004至2011年在美国密西根大学医学院生物化学系工作,历任助理教授、副教授。2011年6月至2017年8月,担任国家蛋白质科学中心(上海)主任,中科院生化细胞所副所长。2017年9月至今,担任上海交通大学医学院附属第九人民医院上海精准医学研究院执行院长。现任亚太蛋白质协会执行委员、中国生物物理学会副理事长。目前担任Biological Chemistry杂志副主编、Science Bulletin杂志执行编委。
特约创新团队介绍
创新团队名称
面向临床应用的精准医学分析与精准医学设计
团队主要成员
雷鸣(研究员/博士) 匡延平(主任医师/博士) 曹禹(研究员/博士)
卞迁(研究员/博士) 武健(研究员/博士) 张家毓(研究员/博士)
邓玮(副研究员/博士) 廖日晶(副研究员/博士)
LEI Ming (1971—), distinguished expert of the Recruitment Program of Global Experts by the Organization Department of the CPC Central Committee. Dr.LEI received a doctor degree of Biophysics from Harvard University in 2001.During 2001 and 2004, he received the postdoctoral training at University of Colorado at Boulder. From 2004, he began the academic career at the University of Michigan as an assistant professor and became tenured associate professor at 2010. From 2011 to 2017, he was the Deputy Director of Shanghai Institute of Biochemistry and Cell Biology, Chinese Academy of Sciences and Director of National Center for Protein Science Shanghai, China. From 2017 to present, he has been the Executive Director of Shanghai Institute of Precision Medicine, Shanghai Ninth People’s Hospital, Shanghai Jiao Tong University School of Medicine. He is the Executive Committee member of Asia Pacific Protein Association and the Deputy Secretary of Biophysical Society of China. He is also the Associate Editor of Biological Chemistry and the Executive Editor of Science Bulletin.
Dr. LEI is focusing on understanding the organization and dynamics of macromolecular assemblies important for genome regulation and stability and have made significant progress in this fi eld. He had the experience of leading the Ministry of Science and Technology 973 Program of China and the National Natural Science Foundation Key Program and Joint Funds of Key Program of China, and participating in the Strategic Priority Research Program of the Chinese Academy of Sciences and the National Science and Technology Major Project ‘Key New Drug Creation and Manufacturing Program’ of China. He was supported by the National Natural Science Foundation for Distinguished Young Scholars of China in 2015 and by the Outstanding Academic Leader Program of Science and Technology Commission of Shanghai Municipality in 2016.
雷鸣研究员长期致力于蛋白质复合体为主的生物大分子的结构和分子机制及其在癌症和衰老中的作用等科研工作,取得了多项突破性的研究成果。自回国以来,承担多项国家级和省部级科研任务,作为首席科学家主持国家科技部“973”重大研究计划项目1项,主持国家基金委重点项目2项,主持国家基金委大科学装置联合基金项目1项,参与中科院战略性先导技术专项(B类)1项,参与国家科技部重大新药创制专项计划1项,参与国家科技部蛋白质科学重大研究计划项目2项,并得到2015年度国家杰出青年科学基金、2016年度上海市优秀学科带头人等人才项目支持。
主要研究方向
综合应用结构生物学、生物化学以及细胞生物学等多种技术手段,雷鸣研究员领导的团队深入探讨了以蛋白质复合体为主的生物大分子的结构和分子机制及其在癌症和衰老中的作用。在染色体研究特别是端粒、长链非编码RNA以及表观遗传学等领域做出了多项突破性的工作,取得了丰硕的研究成果,受到了国际同行的广泛关注与认可。在Cell、Nature、Science、Mol Cell、Nat Struct Mol Biol等国际顶级学术期刊上发表论文70余篇,论文他引次数达3 000次以上。上述成果为我们更好地理解这些蛋白质复合物相关的生理进程奠定了重要的基础,并为相关的疾病机制探索及新型药物研发提供了理论依据。
The goal of Dr. LEI’s group is to understand the organization and dynamics of macromolecular assemblies important for genome regulation and stability. With combination of structural analyses, such as X-ray crystallography, nuclear magnetic resonance and electron microscopy, coupled with biophysical, biochemical and cellular approaches, Dr. LEI’s group has made important progress on telomeres, long noncoding RNAs (lncRNAs)and epigenetics among others. During the last fi ve years, this group has published more than 70 SCI-indexed papers in Cell, Nature, Science, Mol Cell, Nat Struct Mol Biol, et al, with a total citation number of more than 3 000. These studies provide a solid foundation for our understanding of the molecular basis associated with the important protein complexes and open a new horizon on novel drug development.
近2年代表性成果
1) Chen H, Xue J, Churikov D, et al. Structural insights into yeast telomerase recruitment to telomeres[J]. Cell, 2018, 172(1/2): 331-343.
2) Lan P, Tan M, Zhang Y, et al. Structural insight into precursor tRNA processing by yeast ribonuclease P[J]. Science, 2018, 362(6415). DOI: 10.1126/science.aat6678.
3) Wu J, Niu S, Tan M, et al. Cyro-EM structure of human ribonuclease P holoenzyme[J]. Cell, 2018, 175(5): 1393-1404.
4) Wang Y, Chen Y, Chen J, et al. The meiotic TERB1-TERB2-MAJIN complex tethers telomeres to the nuclear envelope[J]. Nat Commun, 2019, 10(1):564.
5) Wan F, Wang Q, Tan J, et al. Cryo-electron microscopy structure of an archaeal ribonuclease P holoenzyme[J]. Nat Commun, 2019, 10(1): 2617.
6) Wan B, Wu J, Meng X, et al. Molecular basis for control of diverse genome stability factors by the multi-BRCT scaffold Rtt107[J]. Mol Cell, 2019,75(2): 238-251.