最近在研究底物结合的时候,用新手教程提供的方案得到的拓扑惩罚值太高(可能我的那个 ligand 结构太奇怪了😇),所以(被迫)搜寻了其他几种优化小分子拓扑的方法。

目前有很多生成小分子拓扑和力场的网站 or 软件,可以满足不同的动力学模拟软件和力场,sob 的 这篇文章 有很好的归纳,然后笔者尝试了其中几种,将所得结果比较完美的方法的流程记录如下:

preparatory work

一般来说,为了构建一个适用于GROMACS的拓扑,我们要把 .pdb 转换成好处理的 .mol2 格式(如果你连小分子三维模型都没有的话,可以去数据库里下载(比如PubChem)或用 GaussView (或者ChemDraw)画一个(不过这就是另外的话题了))。新手教程里处理 .pdb 用的是 Avogadro,但是个人感觉用来转化文件格式、做做小处理有点冗余。这边建议用 Open Babel 来进行操作(它还可以和其他的软件结合使用)。

在这里插入图片描述
然后拿去用就可以了。

For Windows

ORCA+Multiwfn+sobtop

这一套方法适用于GROMACS的所有力场,很方便而且精准度也可以很高。因为其中绝大部分是Sobereva大大发布在他自己的博客里,这里仅说明本人的实践过程然后给出方法相应的链接。

  1. 首先要安装一些可能用到的软件: (1) 下载并安装 ORCA(安装教程 在这 ;因为 ORCA 是完全免费的,所以最好自己去 官网下载 (不过这可能需要魔法上网),实在不行就看万能的网友能不能给你答案吧🧐); (2) 下载并安装 Multiwfn (请一定要按照 Multiwfn 手册进行安装,不要忘记修改 settings.ini 里面的路径); (3) 在环境变量里面新建 Multiwfnpath(Multiwfnpath.exe 所在文件夹)和 ORCA_EXEDIR(orca.exe 所在文件夹),并且在 Path 里面添加他们相应的路径,这么做是为了便于在不同文件夹里运行 Multiwfn(以及调用 ORCA 和运行脚本),请详细阅读Multiwfn 手册 Appendix 1 部分以及 这篇文章 (主要是1.1的第一段)(一定要读而且按照要求的来做,要不然就等着报错吧😈); (4) 为了 Windows 里运行 shell 脚本,安装 Git (如果不理解安装过程中给你的那些选项,只选 recommend 和默认的就可以);

  2. 第一步是利用 ORCA+Multiwfn 生成小分子的 RESP 原子电荷(假设要计算FAD.mol2): (1) 把你的 FAD .mol2 文件放到随便哪个文件夹里,然后在 Multiwfn 文件夹下的 examples\RESP\ 找到对应 ORCA 的 sh 脚本,复制一份到 .mol2 所在的文件夹; (2) 修改脚本内的路径,主要为 ORCA="/home/user/orca503/orca" orca_2mkl="/home/user/orca503/orca_2mkl" ,然后修改并行数和最大核数 nprocs=10 maxcore=1000 (3) 然后在当前文件夹打开 Git Bash,按照教程( 教程1 教程2 ,强烈建议全部阅读)的指令运行就可以了, bash ./RESP2_ORCA.sh FAD.mol2 ,运行结束就可以得到一个 FAD.chg 文件。

  1. 第二步还是是利用 ORCA+Multiwfn,来生成小分子键的优化(这一部分参照了 这个视频 的流程和 这篇文章 ,主要是为了得到 .hess 文件): (1) 将 FAD.mol2 文件转成 ORCA 输入文件 .inp 格式,具体操作为:打开 Multiwfn 并导入第一步中用过的 FAD.mol2 文件,依次输入:
100 #选择其他功能的part 1
2 #文件转换功能
12 #生成 ORCA 输入文件
your path #输入你想保存的路径和名称,如果按回车就会保存在当前文件夹
#如果你使用的是 4.x 版本的 ORCA,请进行下一步操作;如果不是跳过就好
-11 #选择 ORCA 版本
0 #选择 4.x 版本,如果你是高版本记得选别的
0 #更改任务类型,因为我们要进行键的优化嘛
4 #优化
1 #B97-3c

这样就得到了 .inp 文件。(2) 接下来使用 ORCA 得到 .hess 文件;在.inp 文件(假设它叫 lig.inp)所在位置打开 cmd,输入:

orca lig.inp>lig.out

(如果不行就试试ORCAPATH\orca lig.inp>lig.out,其中ORCAPATH是你的orca的绝对路径)等待计算完成就可以啦。

  1. 第三步要利用sobtop来生成拓扑:(1)下载安装 sobtop(2)接下来的操作参考了 sobtop 的例1建议先把第一步的 .chg、第二步的 .hess 以及原本的 .mol2 文件放置到同一个文件夹里(这不是个超链接😆)),双击 sobtop.exe,然后依次输入:
'.mol2 path' #键入原本的 .mol2 文件的绝对路径
7 #添加电荷
10 #添加由 Multiwfn 生成的 .chg 文件
'.chg path' #键入第一步中得到的 .chg 文件的绝对路径
0 #返回
2 #产生 .gro 文件
'your path' #你希望储存的路径和名称,按回车就会生成在默认(应该是sobtop.exe所在的)文件夹里
-1 #设置力场的产生方法
4 #选用 DRIH 方法
1 #产生 GROMACS 拓扑文件
2 #使用 GAFF 原子类型,没法识别的自动用 UFF 原子类型
2 #通过DRIH方法得到力常数
'.hess path' #键入第二步中得到的 .hess 文件的绝对路径
'' #.top的储存路径和名称,按回车就会生成在默认文件夹里(和sobtop.exe在同一个文件夹内)
'' #.itp的储存路径和名称,同上
#输出结束且无报错之后

然后你就得到了相应的.gro、.top和.itp文件了(大功告成 ✌)。

For Linux

ORCA+Multiwfn+sobtop

  1. 首先也是一些软件的安装:(1) 在安装ORCA之前首先要安装对应版本的 openmpi (还是可以参考这里的2.1部分),需要注意的是make all install -j一步需要 root 权限,所以得是sudo make all install -j,否则就会出现无法进入某个文件夹的fault;记得添加路径(如果加完再打开命令行验证还是没有、或者说还是之前的版本的话,有可能换成这个就好了export PATH=/sob/openmpi411/bin:$PATH);(2)按照这个教程继续安装ORCA(很详细的);(3) 安装Multiwfn(跟着手册走就行,很详细);别忘了修改堆栈限制,在~/.bashrc添加export KMP_STACKSIZE=200M ulimit -s unlimited;然后修改settings.ini里的 orca_2mklpath=为你所安装的ORCA相应文件的路径;(4)下载安装 sobtop,直接unzip解压就完了。

  2. 接下来的操作和Win系统类似(所以我在这就写得简略一些了,假设要计算FAD.mol2的),第一步是利用 ORCA+Multiwfn 生成小分子的 RESP 原子电荷:还是把ORCA 的 sh 脚本复制一份到 .mol2 所在的文件夹,修改脚本内的路径和并行设置,然后 bash ./RESP2_ORCA.sh FAD.mol2

  3. 第二步还是是利用 ORCA+Multiwfn,来生成小分子键的优化(具体操作和上一部分一样):(1) 将 .mol2 文件转成 ORCA 输入文件 .inp 格式;(2) 使用上一步的 .inp 通过 ORCA 得到 .hess 文件;

  4. (1) 进入sobtop的文件夹中,在shell里键入sobtop启动(一定要在sobtop这个程序的文件夹,也就是你解压出来的文件夹内运行);(2)接下来的流程和 Win 版本完全一样,不再赘述。
    `

这里我们需要去修改力场的 ,因为小分子的原子类型是不包括在本身的力场中的,我们需要对力场的原子类型进行更改,找到生成protein的力场问题重新复制一份,将小分子itp文件中的 atomtype 下的原子类型复制到 力场文件中 ffnonbonded.itp 中的atomtype下,并删除小分子itp文件中的 atomtype。将protein.gro文件先复制进去,然后在protein.gro的倒数第二行后,将ligand.gro复制进去,并把小分子的top包括protein.top中。 OPLS-分子 这些是用于创建 GROMACS 中使用的分子拓扑的一些 pdb 和 rtp 文件。 建议您在修改任何内容之前先复制 GROMACS forcefield 目录,然后将 GMXLIB 环境变量设置为新位置。 要创建分子拓扑,只需将所有 rtp 文件复制到 GMXLIB 的 oplsaa.ff 文件夹。 然后在您感兴趣的分子上运行 pdb2gmx。 例如,对于甲烷运行: gmx pdb2gmx -f methane.pdb 一定要明显选择OPLS。 我试图确保输出拓扑正确并且没有任何遗漏。 但是,您的工作是确保它们是正确的,并且无法保证它们是正确的。 一些 pdb 文件依赖于多个 rtp 文件,这就是为什么最好将它们全部复制过来的原因。 有些时候,为了方便运用某一个常用分子拓扑或者使 topol.top 文件结构更加简洁,可以把它单独写入一个 .itp 文件中。这个文件仅包含一个特定分子的信息,可以被任意引用,这样就避免了每次都需要使用`pdb2gmx`或者重复地复制粘贴。一般力场中都会提供水分子、离子(有些还提供少许脂质分子)的 .itp 文件;此外有些常用小分子(如ATP)的信息会被储存在立场文件夹的 aminoacids.rtp 中,在`pdb2gmx`过程中与大分子一并生成拓扑。......... .graphml文件,由名字可知主要是用于存储”图(graph)“的。由于我也只是进行数据进行读/存操作,没有对GraphML深入了解,在此给出GraphML细节介绍地址,希望对你有所帮助。GraphML Primer:http://grap 随着计算机技术的发展和计算能力的提升,以模拟和计算的方式去探究实验科学中无法看到的分子机制和细节对目前的科学研究具有极大的促进作用。在分子动力学模拟领域,Gromacs软件表现出独有的优势。本次简要介绍Gromacs的模拟流程和力场构建问题。 1. Gromacs模拟流程 1.1 结构准备 Gromacs的结构输入文件主要为pdb和gro格式。以pdb格式为例,首先要确认结构文件中只包含想要模拟的分析。对于结晶水可用grep –v HOH命令清除,然后通过gmx pdb2gmx命令 本人菜鸟,记录一下自己学习使用Gromacs的过程。 模拟一般过程: 获取蛋白质结构文件 → 准备拓扑 → 选择力场 → 添加盒子、溶剂 → 添加离子 → 最小化能量 → 温度、压力平衡 → 开始模拟 → 分析结果 软件:gromacs2021 1.准备蛋白质结构文件 2.准备拓扑、选择力场 3.添加盒子、溶剂 4.添加离子 5.最小化能量 6.温度、压力平衡 7.开始模拟 8.分析结果 1.准备蛋白质结构文件 蛋白质结构文件(.pdb)可以从PDB..... 蛋白质-配体模拟一般过程: 获取蛋白质结构文件分子对接后的配体结构文件→ 准备蛋白质拓扑 → 选择力场 → 手动小分子拓扑→ 添加盒子、溶剂 → 添加离子 → 能量最小化 → 温度、压力平衡 → 开始模拟 → 分析结果 软件:gromacs2021 1.准备蛋白质结构文件分子对接后的配体结构文件 2.准备拓扑、选择力场 3.手动小分子拓扑 4.添加盒子、溶剂 5.添加离子 6.能量最小化 7.温度、压....... 以我自己的redocking结果为例,进行具体说明。针对出现的问题有一些解释和猜测,如果有不准确请指正,黄色部分是可选方法。本文只对MD的正确运行方法进行陈述,具体研究方法根据实际情况进行选择。 复合蛋白amber坐标和拓扑文件的创建作者:朱宁 来源:大科研小分享前言分子动力学(Molecular Dynamics, MD)是一门结合物理,数学和化学的综合技术。目前主流分子动力学软件有NAMD、GROMACS、AMBER等。AMBER分子动力学程序包是由加州圣弗兰西斯科大学(UCSF)的Peter A Kollman和其同事编写的,程序很全,大约包含60多个程序,相互协调工...