基于GROMACS的分子动力学模拟的研究

2016-10-14 19:39江建敏李娟方慧生
医学信息 2016年7期
关键词:力场

江建敏 李娟 方慧生

摘要:分子动力学模拟可以通过多款软件进行,根据需要不同可以选择不同的软件,但GROMACS是应用比较广泛的。生物大分子的结构动力学决定其生物学功能,而分子动力学模拟是研究其结构动力学的有效手段,因此采用GROMACS进行分子动力学计算分析从而指导进一步的实验工作。本文重点介绍了GROMACS的特点、基本流程以及制约因素等,并展望了未来的应用前景。

关键词:分子动力学模拟;GROMACS;力场

Abstract:Molecular dynamics simulation can be carried out through a variety of software, depending on the need to choose a different software, but GROMACS is widely used. biological functions of biological macromolecules is determined by its structural dynamics, and molecular dynamics simulation is an effective means to study its structural dynamics. Therefore,GROMACS is used to carry out molecular dynamics analysis to guide the further experimental work. This review mainly introduces the characteristics, basic process and the control of GROMACS, and the prospect of future prospects.

Key words:Molecular dynamics simulation;GROMACS;Field

蛋白质的空间结构在行使其功能时起着重要的作用,其功能与动力学特征密切相关,不同结构决定了蛋白质的不同功能。蛋白质分子内部运动和构象变化对其正常功能有重要作用,这些过程包括蛋白质的折叠和拉伸,配体和底物的结合等。要了解蛋白质的特性并找到其发挥生物功能的分子基础模型,只有氨基酸顺序和三维结构是不够的,还必须研究蛋白质的结构和功能的关系等。

目前,通过测定蛋白质空间结构的方法可以观察到当蛋白处于不同的构象时,其对应的功能状态也不同,但在这些不同的构象变化的细节仍不清楚。因此利用计算机研究蛋白质的动态结构和动力学信息,在一定程度上弥补了实际实验上的不足。在过去的几十年中,随着计算机软硬件技术的快速提升,在生物大分子等方面的模拟逐渐发展为在原子水平上研究蛋白质、脂类等生物大分子的结构和动力学性质的一个很重要工具,从而辅助实验进行一定的解析。计算机对生物大分子的模拟研究使人们进一步了解生命现象的基本过程,对生物大分子结构和功能的研究更加深入和系统。利用分子动力學模拟计算生物大分子的空间结构,从而得到系统内部的构象随着时间变化的各种信息,有助于我们进一步理解蛋白质、核酸等生物大分子的运动特征。

1957年,Alder和Wainwright[1]最早利用分析动力学及硬球模型实现了第一次模拟。1977年,McCammon[2]等人发表了第一篇蛋白分子模拟研究论文。虽然模拟时间很短,但是使人们看到分子动力学技术对研究蛋白质分子功能的重要作用。1980年,Andersen[3]等人创造了一个恒定的压力分子动力学方法。分子动力学模拟在诞生至今的几十年中不断发展完善,已经成为应用最广泛的分子模拟方法之一。随着分子动力学模拟的快速发展,也逐渐形成了一些比较完善的应用于生物领域的模拟软件,例如NAMD[4]、GROMACS[5]等。GROMACS是一个非常有效并且免费的的软件,遵循GNU许可,可以从网站http://www.gromacs.org/上进行下载得到。本文主要介绍GROMACS的基本过程。

1 GROMACS简介

GROMACS[6],一款开源的分子动力学仿真软件包,最初是由荷兰格罗宁根大学(Groningen University)开发。目前主要由瑞典乌普萨拉大学、斯德哥尔摩大学和德国的马普学会高分子研究所维护和管理。它开创了分子动力学模拟的先河,成为迄今为止应用很广泛的动力学模拟软件之一。

GROMACS设计的初衷主要是应用于生物大分子的分析计算。其模拟程序包除了包含Gromacs力场,还包含了其他动力学软件的力场如CHARMM力场[7]、AMBER力场[8,9],这些力场的加入也让其应用性更加广泛。GROMACS软件主要是用来研究分子体系的动力学,还可用于分子动力学,随机动力学等方法来模拟自然的分子动力学,分子能量优化,构象分析,等等。相比于其他的软件GROMACS提供了极高的性能,而且它允许使用标准的MPI通讯进行并行运算。同时GROMACS支持很多常用的算法,与其他动力学模拟软件相比还具有独特的优势,使其脱颖而出。

2 模拟流程

分子动力学模拟的步骤主要包括四步。

2.1初始结构处理 在分子动力学模拟中,分子结构文件需要转化成分子的拓扑文件以供后续模拟使用。运行pdb2gmx程序后会要求我们选择合适的分子力场。运行pdb2gmx程序这一步会将原始的pdb文件转化成结构文件以及相应的拓扑文件。同时考虑到体系在真实环境中的状态,首先需要采用editconf程序给体系添加一个盒子,然后采用genbox程序选择合适的溶剂化模型。溶剂化模型一般分为显性溶剂化模型和隐形溶剂化模型。同时为了使体系在分子动力学模拟过程保持中性,我们还需要采用genion程序添加抗衡离子。

然而在准备模拟的时候,体系中有很多原子距离太近,或者新加入的粒子位置不一定合理,导致局部能量过高。如果能量过高可能导致运动速度过快,从而使体系不稳定,最终导致模拟失败。因此在开始模拟之前,首先需要进行能量最优化,使系统达到稳定的状态。能量优化的过程是改变系统中局部高能量原子的位置,降低这些部位的能量。

2.2体系优化 进行能量最优化的程序是mdrun,它是GROMACS的核心程序。能量最优化会消除高能量原子之间不合理的结构关系,使能量降低到局部极小值。所有的模拟都是采用 mdrun程序进行的,类似于amber软件中的sander程序,就好像GROMACS的心脏一样。

进行能量最小化后,就可以在控制压强和温度的前提下对体系进行平衡模拟,使体系能量达到全局最小值时,整个体系达到平衡态。首先在NVT系统中,该系统称为等温等容系。然后经过NVT平衡,温定了系统的温度,还需要稳定系统的压强。压强平衡在NPT系统中进行,该系统被称为等温等容系。经过两个阶段的完成,系统已经在需要的温度和压强下平衡良好,可以进行正式模拟了。

2.3正式模拟 经过上一步的平衡相过程后,分子系统已经可以进行生产相过程即完全无限制的分子动力学模拟。然后再次调用grompp程序将输入文件转化成tpr预处理文件,进行真正的分子动力学模拟,从而得到按时间排列的所有原子的运动情况。为了在一定的计算资源和时间下,尽可能增长实际模拟时间。

2.4分析结果 模拟完成后就可以对体系进行分析,从模拟的轨迹中提取有用的信息,并加以分析解释才是最重要的。而作为开源的分子动力学软件的GROMACS,另一个主要优势是提供了一系列分析轨迹文件的小程序。

首先可以使用GROMACS的g_rms程序进行计算蛋白质各个部分的RMSD值随模拟时间的变化,查看结构的稳定性。RMSD值可以反应出模拟过程中体系的稳定情况,当体系的RMSD趋于稳定时,说明动力学模拟达到了平衡。同样可以利用g_gyrate程序计算体系回旋半径的变化,从而度量结构的紧密度。回旋半径是描述蛋白质结构紧密性的一个物理量,半径越小说明致密性越好,即蛋白质结构就越稳定。利用g_energy程序获得体系的势能随时间的变化情况。随着模拟时间的不断增加,体系也会趋于平衡,而势能也是趋于平衡的。

3 模拟软件的比较

目前,用于分子动力学模拟的软件越来越成熟。广泛应用于生物大分子研究的除了Gromacs之外,常用的还有NAMD、CHARMM、AMBER、TINKER、LAMMPS等。

3.1应用范围 分子动力学模拟[11]作为一种理想的计算机模拟方法,可以用来模拟两相之间的相互作用,也是对计算和实验的补充。目前,随着计算机的快速发展,分子动力学模拟在化学工程、生命科学和医学等领域的应用也比较成熟。

GROMACS是通用的分子动力学模拟软件,尤其适用于模拟生物大分子体系。同时由于其速度快,在非生物体系统中也得到了广泛的应用。其中GROMACS软件的一个关键优势是用户界面友好。而且GROMACS模拟中的参数条件和基本功能也已经趋于成熟。此外,我们可以在本地系统上运行GROMACS而不用占用并行系统。

NAMD[15]是一套分子动力学模拟软件,由美国伊利诺伊大学理论与计算生物物理小组开发。它包括Amber、CHARMM、OPLS、GROMACS等多种力场,适用于模拟计算蛋白质、核酸等生物大分子体系,而且并行计算效率非常高。为了配合NAMD进行模拟结果分析,还需要VMD[6]作为分子可视化和辅助分析软件。

AMBER[13]是由美国加利福尼亚大学旧金山分校的Peter A.Kollman小组开发的软件包。现在由罗格斯大学、犹他大学、美国国立环境卫生科学研究所等机构进行维护管理。但是它只支持AMBER力场,其它力场都不适用。另外它的力场是免费的,而其分子模拟软件需要付费使用,能够模拟蛋白质、核酸等生物大分子。

3.2力场 分子力场,有时被称为势函数,对于一个特定的目的,力场可以分为不同的形式,但也有不同的适用范围和局限性。在分子力学和分子动力学的计算中,適当的力场选取是非常重要的,这是决定计算结构的重要条件。

GROMACS[12]是一款功能强大的分子动力学模拟软件,它包括一系列的GROMOS力场、AMBER力场和CHARMM力场等,能普遍应用于处理生物大分子。GROMOS力场[14]诞生后不断被改进,现阶段广泛使用的版本有GROMOS96 43a1、GROMOS96 43a2、GROMOS96 45a3等。GROMACS进行分子动力学模拟时首先采用pdb2gmx程序,然后会出现界面,要求我们选择合适的分子力场,关于力场的选择可以根据不同需要进行不同的选择。

NAMD是并行分子动力学软件,它被设计用于生物大分子的快速仿真,适用性极其广泛。可以使用Amber,CHARMM,GROMACS等多种力场,适合模拟蛋白质、核酸等生物大分子。CHARMM力场适用范围包括化学小分子到生物大分子,同时也是NAMD的默认力场。

AMBER包括一系列用于分子模拟的分子力学力场和分子模拟的软件包[13]。其分子力场在计算生物学领域得到了广泛的应用。它是一种分子动力学模拟和分析程序,可以模拟蛋白质、糖类、核酸等生物大分子。它的势能函数很简单,所需的参数不多,并且参数是从计算结果和实验值的比对中得到。

4 制约因素

4.1兼容性 在进行分子动力学模拟时首先需要处理输入的pdb文件,而GROMACS只能识别pdb初始文件,其他格式的文件均不能被其转化从而进行模拟。而且如果初始文件含有缺失的原子或者杂原子,还需要采用其他软件进行填补或者删除。而且NAMD具有一款很好的分析辅助软件VMD,并能够兼容多种文件格式。

4.2結合自由能计算 在分子动力学模拟领域,准确计算结合自由能虽取得一定进展,但仍然是一个挑战。现在开发了多种计算结合自由能[17]的方法,可分为三类:第一类为自由能微扰,第二类为热力学积分和使用最广泛的第三类MM-PBSA/GBSA。MM-PB/GBSA是 Srinivasan 等人提出的一种自由能计算方法,用来计算复合物体系的绝对和相对结合自由能。此外,Amber软件包中专门提供了MM-PBSA/GBSA程序,可以非常方便的计算出受体与配体间的结合自由能。而GROMACS中并没有像AMBER中那样单独的模块,所以计算比较麻烦。

5 前景展望

随着计算机技术的迅速发展,人们对于生物大分子结构和功能的逐步认识,为分子动力学的进一步发展和完善提供了良好的氛围。本文简要介绍了分子动力学模拟的一款软件GROMACS的基本流程和应用。传统实验需要大量的人力物力而且耗时,所以采用计算机模拟的方法能给予一定的指导,省时省力,提高效率。

目前,分子动力学模拟能在很大程度上进行预测指导实验,因此模拟与实验的对照是将来研究的主要方向之一。对模拟得到的结构进行分析的方法虽然已经提出了多种,然而不能认为它们已经构成了结构分析方法的完整集合。分子动力学模拟不仅广泛应用于生物大分子中,而且在药物设计和开发中具有广阔的应用前景。分子动力学模拟研究药物中配体受体间相互作用的结构信息,为筛选药物和药物设计提供了重要线索。药物的开发需要大量的资金,需要投入大量的人力和物力,而分子动力学模拟可以减少实验的盲目性,从而节省人力物力,提高效率。

参考文献:

[1] Alder B J,Wainwright T E. Phase transition for a hard sphere system[J].The Journal of chemical physics, 1957, 27(5): 1208.

[2] McCammon J A, Karplus M. Internal motions of antibody molecules [J]. Nature, 1977, 268(5622): 765-766.

[3]ANDENSONHC.Molecular dynamics simulations at constant press and/or temperature[J].Journal of Chemical Physics,1980, 72:2384-2393.

[4] Phillips J C, Braun R, Wang W, et al. Scalable molecular dynamics with NAMD[J]. Journal of computational chemistry,2005, 26(16): 1781-1802.

[5]Hess B,Kutzner C, Van Der Spoel D, et al.GROMACS 4: algorithms for highly efficient, load-balanced, and scalable molecular simulation[J]. Journal of chemical theory and computation, 2008,4(3):435-447.

[6] H.J.C. Berendsen, l. van der Spoe, R. van Drunen, Gromacs: A Message-Passing Parallel Molecular-Dynamics Implementation[J].Computer Physics Communications,1995, 91(1-3): 43-56.

[7] Momany F.A., Rone R. Validation of the general purpose QUANTA 3.2/CHARMm force field[J]. Journal of computational chemistry, 1992, 13(7): 888-900.

[8] Weiner S.J., Kollman P.A., Case D.A., et al. A new force field for molecular mechanical simulation of nucleic acids and proteins[J]. Journal of the American Chemical Society, 1984, 106(3): 765-784.

[9] Weiner S.J., Kollman P.A., Nguyen D.T., et al. An all atom force field for simulations of proteins and nucleic acids[J]. Journal of computational chemistry, 1986, 7(2): 230-252.

[10] MACKAY D H J, CROSS A J, HAGLER A T. Prediction of protein structure and the principles of protein conformation [M]. New York: Plenum Press, 1989.

[11] Alder B.J., Wainwright T.Studies in molecular dynamics. I. General method[J]. The Journal of Chemical Physics, 2004, 31(2): 459-466.

[12] E. Lindahl, B. Hess, D. van der Spoel, Gromacs 3.0: A Package for Molecular Simulation and Trajectory Analysis[J].Journal of Molecular Modeling,2001, 7(8): 306-317.

[13] D. A. Case, T. E. C. III, T. Darden, H. Gohlke, et al. Woods, The Amber Biomolecular Simulation Programs.[J].Journal of Computational Chemistry,2005, 26(16): 1668-1688.

[14] Oostenbrink C, Villa A, Mark A E, et al. A biomolecular force field based on the free enthalpy of hydration and solvation: The GROMOS force‐field parameter sets 53A5 and 53A6[J]. Journal of computational chemistry, 2004, 25(13): 1656-1676.

[15] L. Kale, R. Skeel, M. Bhandarkar, R. Brunner, A. Gursoy, N. Krawetz, J. Phillips, A. Shinozaki, K. Varadarajan, K. Schulten, Namd2: Greater Scalability for Parallel Molecular Dynamics[J].J Comput Phys, 1999, 151: 283-312.

[16] W.Humphrey, A. Dalke, K. Schulten, Vmd: Visual Molecular Dynamics[J]. J Mol Graph,1996, 14(1): 33-38.

[17] Chipot C., Pohorille A. Free energy calculations: theory and applications in chemistry and biology[M]. Springer, 2007.

編辑/成森

猜你喜欢
力场
基于不同势函数的正构烷烃物理性质分子动力学模拟
力场防护罩:并非只存在于科幻故事中
调性的结构力场、意义表征与听觉感性先验问题——以贝多芬《合唱幻想曲》为例
工业互联网情景下的企业组织变革
脱氧核糖核酸柔性的分子动力学模拟:Amber bsc1和bsc0力场的对比研究∗
学校教学管理者领导效率的诊断与提升
DMF的力场构建及乙腈-甲醇-DMF三元体系的汽液相平衡模拟
一CO2在LTA型和FAU型沸石分子筛中吸附的力场研究
我的物理学实验和猜想