吴赵龙 毛有东
2017年,瑞典皇家科学院将诺贝尔化学奖授予3位生物物理学家,Jacques Dubochet,Joachim Frank和Richard Henderson,以表彰他们在发展冷冻电子显微镜(cryoelectronmicroscopy,cryo-EM)方法学用于解析生物大分子高分辨结构方面的杰出贡献。冷冻电子显微镜技术经过近50年的持续发展,通过实验与计算方法的结合,在无需生物大分子结晶或标记的天然生理状态下,可以解析出生物大分子的原子分辨率三维结构,因而超越X射线晶体学和核磁共振技术,成为生物大分子精细结构解析中应用最为广泛的关键技术之一。
早在Ernst Ruska(1986年诺贝尔物理学奖得主)发明电子显微镜后不久,Marton便提出,由于电子束对生物细胞与细胞器的轰击,利用这一新设备对生物样品进行研究时,必然会对样品造成损伤。与此同时,为避免空气分子对电子束的散射,电子显微镜工作时需抽成高真空,导致腔内样品中的水分难以保持,丢失大量结构信息。因此,如何减小电子束对生物大分子样品的辐射损伤以获得其尽可能高分辨的结构信息,成为了电子显微镜技术解析生物大分子结构的一大难题。Marton提出构想,利用冷冻或类似负染的样品制备方法,提高样品的抗电子辐射损伤的能力。
然而,利用冷冻电子显微镜研究生物大分子结构时,生物样品的制备和拍摄过程仍面临许多困难。与X射线晶体衍射法相比,单颗粒冷冻电子显微镜技术最为显著的优势在于不需要生物样品结晶。但同时也对样品的制备提出了其他要求,为得到不重叠的单颗粒图像,生物样品必须非常薄,理想情况下只有一个生物大分子层的厚度。在拍摄电镜图像的过程中,由于电子束的作用和热运动的影响,生物大分子通常会发生漂移,尤其是使用摄像模式不做修正地记录图像时,将导致图像模糊,高分辨结构信息丢失。此外,冷冻样品中生物分子与水分子的化学组成元素相似,且成像时必须使用低电子剂量以减小电子辐射损伤,故图像衬度和信噪比通常很低。获得大量生物大分子的二维投影图像后,根据构象和欧拉角取向进行准确分类是单颗粒冷冻电子显微镜技术进行三维结构重建的核心问题。但是,原始单颗粒图像的低信噪比对分类算法提出了严峻的挑战。
电子显微镜的生物样品制备方法先后经历了负染到冷冻的发展过程。20世纪40年代,负染技术问世,并在其后的20年内得到不断地应用和完善。负染操作是将生物材料嵌入重金属盐的非晶薄膜,在其周围形成一层能够抵御电子损伤的轮廓,且水分流失时不发生变化,所以能够保持生物细胞或细胞器的结构信息。然而,通过负染制样方法解析的生物大分子结构分辨率低,因而应用范围受到限制,现在一般用来检查样品或建立初始模型,而高分辨结构的解析有必要寻求更有效的制样方法。
20世纪70年代中叶,Henderson和Unwin在制样技术上迈出了新的一步。Henderson和合作者不对生物样品染色,而是使用葡萄糖溶液代替水来保存样品,并使用约1e-/Å2的低剂量电子束将样品的损伤降到最小,实现了室温下对天然蛋白晶体的解析。通过这种制样方法,Henderson和合作者得到了过氧化氢酶晶体和紫膜中细胞视紫红质二维晶体的投影图像,并且旋转样品以获取不同方向的投影图像,建立了细胞视紫红质的三维结构密度图,揭示了蛋白质的一般结构特征,但是这种方法只能解析到较低的分辨率。直到冷冻样品制备技术成熟以后,Henderson等人继续发展冷冻条件下的二维晶体电子成像和电子衍射方法,终于在1990年得到了近原子分辨的细胞视紫红质三维冷冻电子显微镜结构。
1981年,Dubochet和McDowall系统地提出了非晶态冰冷冻的制样方法。冷冻的制样流程,首先将生物大分子的水溶液均匀地喷涂在铜网表面的碳膜上,而后迅速浸入约-170℃的液态乙烷(液氮降温)中,生物大分子周围形成一层非常薄的非晶态冰,可以提高样品的抗电子能力,并保持水分不流失。Dubochet等人的研究还发现,非晶态冰在温度低于-160℃的环境中不会发生结晶,为单颗粒冷冻样品的稳定保存奠定了基础。
Dubochet和合作者提出的单颗粒冷冻制样技术适用范围十分广泛,并且能够在拍摄电子显微镜时保持生物中含量最多、占比最大的水分不流失,解决了自电子显微镜发明以来近50年未能克服的技术难题,因而从20世纪80年代该方法问世开始就迅速发展,现已成为冷冻电子显微镜单颗粒重构与电子断层成像技术中不可或缺的标准制样方法。
冷冻电子显微镜单颗粒重构技术的数据处理包括:单颗粒图像抽取、图像分类、三维重建和高分辨密度图精化。在数据处理算法的发展过程中,Frank和合作者做出了开创性的贡献。20世纪70年代中期,Frank和合作者提出了基于互相关系数(cross-correlation)的电子显微镜单颗粒图像分类算法。该算法的原理是计算单颗粒图像之间的互相关系数,将相关性最高的欧拉角取向作为实际投影取向进行分类平均。通过该算法的分析可以提高单颗粒图像的信噪比,识别图像的取向信息,并与Aaron Klug(1982年诺贝尔化学奖得主)提出的三维重建方法相结合,使生物大分子高分辨结构的重建成为可能。然而,生物样品通常具有异质性,导致单颗粒投影并不来自于同一个三维构象。1981年,Frank和van Heel提出了单颗粒图像的聚类方法。这种基于K-means的分类算法将每张具有n×n个像素的图像看作是n2维的数据,对应于n2维超平面中的一个点,计算这些点之间的距离使最临近的点聚为一类,最后对每一类中的图像做平均得到低噪声的单颗粒图像。此后,Frank和Michael Radermacher在1986—1987年提出圆锥任意倾角方法(random conical tilt),van Heel在1987年提出公共线方法(common line),用于解析生物大分子的三维电子显微镜初始模型。Frank和他的同事们发展了单颗粒冷冻电子显微镜技术中重要的数学工具,奠定了生物样品高分辨重建的基础。值得一提的是,Frank和合作者在20世纪70年代就将这套数据处理算法实现为SPIDER软件包,供其他研究者使用。
1998年,Sigworth提出了基于最大似然(Maximum Likelihood)的图像排列算法。Scheres等人在Frank等人建立起来的冷冻电子显微镜图像数据分析框架下,将最大似然算法拓展到单颗粒图像的分类,并用于改进电子显微镜三维密度图的高分辨精化算法。在最大似然方法实现过程中,每一张图像并不具有确定的取向,而是给出其在各个取向上的概率作为似然函数,通过优化似然函数进行图像分类。该算法有效降低了电子显微镜图像背景噪声的影响,提高了分类准确度,由Scheres开发成RELION程序,并迅速得到了广泛的应用。
自从20世纪90年代Henderson解析了细胞视紫红质的近原子分辨结构、对单颗粒高分辨重建做了理论分析并指出需要克服的技术瓶颈以来,越来越多的生物大分子通过冷冻电子显微镜技术得到高分辨解析。2013年以来,由于直接电子探测器(direct electron detector)的应用,冷冻电子显微镜三维重建的分辨率水平取得了重大突破。这种新型的电子探测装置不仅可以记录单电子(counting mode),得到很高的量子探测效率(detective quantum efficiency,DQE),而且响应速度很快,可以在摄像模式(movie mode)下实时记录生物样品的变化,并由此对生物大分子的漂移做出修正。直接电子探测器和并行计算机等新技术在冷冻电子显微镜成像分析中的运用,将单颗粒三维重建的分辨率提升到前所未有的精度,因而使单颗粒冷冻电子显微镜技术在生物大分子的结构解析方面得到了非常广泛的应用。在小蛋白、超大复合体和膜蛋白方面,单颗粒冷冻电子显微镜都可以达到近原子分辨,典型的比如二十面体病毒颗粒,瞬态感受器电位阳离子通道子类V成员1(TRPV1)和G蛋白偶联受体(GPCR)。少数情况下,该技术几乎达到原子分辨,可与X-ray晶体衍射媲美,如1.8 Å的谷氨酸脱氢酶(GDH)。采用相位板的冷冻电子显微镜技术甚至将65 kD的血红蛋白解析到了3.2 Å。与此同时,Frank及其合作者还将冷冻电子显微镜与机器学习相结合,用于还原生物大分子机器的低分辨能量景观,为冷冻电子显微镜的未来应用拓展提供了新的可能。
我国冷冻电子显微镜发展起步相对欧美较晚。其应用自2015年以来却赶上了由直接电子探测器推动的单颗粒冷冻电子显微镜的应用热潮,并取得了令人瞩目的成果。应用高分辨冷冻电子显微镜的代表性工作有剪切体、炎症体、蛋白酶体和藻胆体等等。本课题组在国内率先开展冷冻电子显微镜和人工智能的交叉领域的研究,将统计流形学习、聚类学习、深度学习等技术用于提升冷冻电子显微镜数据处理的算法性能、精度和效率,并开发成ROME软件包,初步应用于蛋白酶体全酶的动力学研究,为冷冻电子显微镜在未来实现生物大分子高分辨动力学分析打下了基础。
Dubochet发展了用于冷冻电子显微镜样品制备的一般方法,奠定了单颗粒冷冻电子显微镜的实验基础;Frank提出了单颗粒重建和高分辨密度图精化的一整套计算方法和技术框架,并通过软件将之实现,奠定了单颗粒冷冻电子显微镜实现精细结构解析的理论算法基础;Henderson通过发展电子晶体学方法和对单颗粒三维重构的理论分析,证明了冷冻电子显微镜技术解析生物大分子精细结构的可行性,为冷冻电子显微镜技术发展指出了一条明路。Dubochet,Frank和Henderson的获奖不仅仅是对他们在冷冻电子显微镜方法学的开创性研究工作的表彰,更是对冷冻电子显微镜技术继续蓬勃发展和在交叉学科中应用的激励。
在冷冻电子显微镜能够将生物大分子的静态结构解析到原子分辨率的基础上,物理学家们对生物大分子系统的动力学复杂性与热力学统计性质表现出极大的兴趣。生命体内的生物大分子并不是稳定不变的,由于生物系统动力学或热力学物理量的变化,生物大分子会表现出亚稳态构象甚至连续构象变化的非平衡态。与此同时,冷冻电子显微镜已经初步具备了对生物大分子系综中的每一个子系统进行非平衡态解析的能力,因而将可能发展成为研究生物大分子能量景观与非平衡统计性质的最有力工具。生物大分子系综的非平衡统计规律与其原位功能信息之间的关系,也将成为冷冻电子显微镜技术的下一阶段的研究重点之一。这类研究最终将帮助我们认识生命的能量本质,揭示生物复杂性背后的基本规律。此外,冷冻电子显微镜还将在药物设计、精准分子医疗和软物质材料等影响人类生活质量的重大应用研究领域中发挥核心驱动作用。♦