蛋白小分子结合力预测机器学习+openmm蛋白python模拟

蛋白小分子结合力预测机器学习+openmm蛋白python模拟

1.预测蛋白小分子结合能力,机器学习,随机森林。

参考: 1由github/deepchem衍生而来,修改了openmm和pdbfixer的安装方法,修改了conda的安装方法, 原项目如下。

修改后项目

训练集合线性相关R平方>0.9,但预测集合几乎没有任何线性相关。

本次脚本运行的机器学习无法准确预测蛋白和小分子的亲和力,这也从侧面印证了这一课题的高难度,也说明机器学习在该方向的应用仍然不够成熟。

补充:因时间关系,本文作者也没有运行过更大的数据集情况下的准确度,即有可能当我们使用更大的训练集合后,以上脚步将展现出一定的预测能力, 请在新的注释版本内叉掉默认的大数据集(代码位置靠后) ,进行更长时间的训练,以验证是否会提升预测能力。

-----------------------------以上,以下两个项目并无直接关联,请悉知----------------------

2. openmm简约版本蛋白共晶动力学模拟(GPU)

2由openmm 官方tutorial衍生而来,添加了conda安装命令,添加了pdbfixer一段,提供了可供任意使用者自己修改蛋白编码的第五句代码,并修改了输入输出文件的名称。该项目并无对应的原始项目,以下为个人创建。

只需修改第五句代码行的蛋白编码,其他所有均无需修改。

注意,以上默认脚本为只模拟蛋白质,不含小分子。

如希望模拟中包含小分子,建议在该脚本基础上采用charmm gui的输入文件

完成后下载output.pdb,使用任意可视化软件分析,如pymol,vmd等。该动力学流程完全基于python,只用了很少代码即可完成一个模拟,对操作者相对友好。或在线安装 mdtraj.org/1.9.5/instal 进行分析。

编辑于 2021-09-22 12:17