目的:通过此教程,了解Discovery Studio中蛋白序与蛋白质之间相互对接的操作方法及结果分析。
(资料图)
所需功能和模块:Discovery Studio Client,Dock Proteins with ZDOCK,Refinement with RDOCK。
所需数据文件:2ptn.pdb,2sta_I.pdb。
所需时间:1小时30分钟
介绍
蛋白对接技术是一种预测蛋白质相互识别以及相互作用的技术。在DS中,我们可以使用ZDOCK来实现蛋白质的对接计算。ZDOCK是一种基于快速傅里叶转化相关性技术的刚性蛋白对接算法。算法中快速傅里叶转化相关性技术被用于搜索蛋白-蛋白系统的平动和转动空间。RDOCK是一种基于CHARMm的能量优化过程,用于优化ZDOCK所寻找到的蛋白-蛋白复合物的结合构型,并使用能量打分函数给这些结合构型打分。
本教程使用ZDOCK来进行蛋白对接的实验,并分析对接的结果。从中选取的一些结合构型,利用RDOCK进行优化。本教程的蛋白对接实验中,我们选用牛β-胰岛素(PDB号:2ptn)作为受体蛋白,另外胰岛素抑制剂CMTI-I(PDB号:2sta,I链)将作为配体蛋白。该牛β-胰岛素及其抑制剂CMIT-I复合物的晶体结构是已知的(PDB号为1ppe)。
本教程涵盖如下内容:
ZDOCK运算的设定
ZDOCK结果的分析
对接构型的RDOCK优化
蛋白-蛋白结合界面氨基酸的RMSD分析
设定一次ZDOCK计算
1. 在同一个3D窗口中打开受体和配体蛋白
在文件浏览器(Files Explorer)中,展开Samples | Tutorials | Protein Modeling文件夹,双击2ptn.pdb文件。
DS将在一个新的3D窗口中打开该蛋白。
在同一文件夹中,将2sta_I.pdb拖至上述同一分子窗口(2ptn分子窗口)中。(图1)
图1 2ptn分子窗口
2. 蛋白-蛋白对接(ZDOCK)
在工具浏览器(Tools Explorer)中,展开Macromolecules | Dock and Analyze Protein Complexes,点击Dock Proteins(ZDOCK),打开Dock Proteins(ZDOCK)对话框。(图2)
设置Input Receptor Protein为2ptn:2ptn。
设置Input Ligand Protein为2ptn:2sta_I。
点击Angular Step Size右边的栅格,下拉列表中选取15。
注:ZDOCK计算过程中可以采用两种欧拉角度进行结合构型的采样:6°和15°。采样角度为6°时,预测结果更为准确,因为它的最终样本数包括54,000个结合构型。尽管采样角度为15°时的结果准确性有所下降(因为它的采样数只有3600个),但它的计算时间更短。
展开Clustering参数组。
点击RMSD Cutoff参数,将该值设置为6.0。
点击Interface Cutoff参数,将该值设置为9.0。
点击Maximum Number of Clusters参数,将该值设置为60。
本教程中使用的配体抑制剂较小,对于这样小的体系,将RMSD Cutoff设置为 6.0 Å的cluster 半径并同时将Interface Cutoff 设置为9.0 Å,cluster结果会更好。本教程中的ZDCOK运算,将不指定blocked residues也不指定filtering binding site residues。
设置ZRank为False。
ZRank选项用于根据静电势、范德华、去溶剂化效应能来对ZDOCK初始预测的pose进行重新排名。本教程中,我们没有使用该选项。
注:ZDOCK可以在采用blocking和(或)filtering选项时进行计算:
如果有数据表明某些氨基酸残基不可能出现在蛋白-蛋白的作用界面,那么在受体蛋白中选中这些残基,然后设定Receptor Blocked Residues参数为Create New Group from selection。同样的,也可以通过设置Ligand Blocked Residues参数来指定配体蛋白中不可能出现在界面上的残基。
如果有数据表明,某些氨基酸一定会出现在蛋白质-蛋白质作用界面上,那么选中它们。然后展开Filter Poses参数组,设置Receptor Binding Site Residues参数和Ligand Binding Site Residues参数为Create New Group from selection。
Filter Poses功能也可以在ZDOCK运算完后单独运行,采用Process Poses(ZDOCK)protocol即可。
图2 “Dock Proteins(ZDOCK)”参数设置
3. 运行ZDOCK并查看结果
点击Run运行作业,在对话框中观察作业运行状态。点击Background后台运行该作业。
该作业大概需要15分钟的时间(奔4处理器,2Gb的内存,2.8GHz的显示器)。
待作业完成以后,双击任务浏览器(Jobs Explorer)中相应的行,打开Report.htm(图3)。在report文件中分析Summary部分并点击View Results以打开一个包含对接pose的新窗口。(图4)
图3 ZDOCK运算的Report文件
图4 ZDockResults窗口
分析ZDOCK结果
输入的受体蛋白和配体蛋白都显示在视图窗口当中。
如果两个蛋白分子并没有在视图窗口当中显示,则在工具栏中点击Fit To Screen按钮使两个蛋白分子居中显示。每一个聚类的中心pose都以点的形式显示在受体蛋白的周围。
1. 结合构型的聚类(Cluster)结果
在系统视图(Hierarchy View)中,展开Docked Poses和Clusters。
这将打开几组Clusters和poses。Cluster_1是最大的聚类(包含的poses最多),后续的聚类所包含的pose逐渐减少。
在系统视图(Hierarchy View)中,关闭Docked Poses和Clusters组。在表格浏览器(Data Table)中,点击Protein Pose标签。
这将显示如下关于ZDOCK运算结果的信息:
ZDock Score – 包含每个对接构型的ZDOCK分数(PSC 打分函数),Pose 1的 Zdock分数最高(最好)。
Cluster – 指明每个对接构型所属的聚类组
ClusterSize – 报告每个聚类含有的对接构型的个数。
Density – 报告聚类过程中临近的对接构象数目。
关于聚类算法的详述,可以参考Discovery Studio Help中的Clustering and analysis of docked protein poses。
2. 结合构型作图分析
以下的步骤将解释如何使用不同的方法,借助plots和Dock and Analyze Protein Complexes工具来帮助观看对接构型,并选择一部分ZDOCK的对接构型进行进一步的RDOCK优化。
在工具浏览器(Tools Explorer)中,展开Macromolecule | Dock and Analyze Protein Complexes,在Browse Poses一栏下设置Browse为Top Poses in Largest Clusters。
这将显示10个最大的聚类中100个打分最好的pose。
点击First显示第一个pose的配体分子。
这将在分子窗口的视图窗口中产生一个名为Pose1_Cluster2_2sta_I的配体分子。
点击Lock Visibility保留配体分子的该pose并一直处于可见状态。
点击Next观察配体分子的下一个pose,是cluster2中的pose3。
观察到该pose同第一个pose很相似。
点击Next两次显示Pose7_Cluster5_2sta_I。
观察到该pose对接至受体的位置很相似,但是配体的对接界面却有较大的差距。
继续点击Next观察其他pose,如果想要保留某一个pose则点击Lock Visibility。
在Data Table中,点击ProteinPose,使之处于激活状态。
单击鼠标右键,选取List Only Visible Objects。
点击ZDockResult点状图标签,拖拽该窗口,以使能够同时看到ZDockReults窗口。
在View工具栏中,点击Select工具,选中ZDockResults窗口中一些ZDock打分高于12.0的点。
该操作共选取了11个pose,5个pose属于cluster2,4个pose属于cluster1,cluster3和5各包含一个pose。
利用RDOCK优化对接构型
1. RDOCK优化
点击ZDockResults分子窗口,以使该窗口处于激活状态。
在工具浏览器(Tools Explorer)中,展开Macromolecules | Dock and Analyze Protein Complexes,在Refine Poses一栏下,点击Refine Docked Proteins(RDOCK),打开Refine Docked Proteins(RDOCK)对话框。(图7)
点击Input Receptor Protein右边的栅格,下拉列表中选择ZDockResults:2ptn。
点击Input Ligand Protein右边的栅格,下拉列表中选择ZDockResults:2sta_I。
点击Input Poses右边的栅格,下拉列表中选择Create New Group From Selection。
默认的会将该新产生的组命名为Group,共包含之前选取的11个pose。
注:Dielectric Constant参数仍保留设置为4.0。该值即运算RDOCK中计算CHARMm能量时所用的介电常数。
点击Run运行作业,在对话框中观察作业运行状态。
点击Background后台运行该作业。
该作业大概需要5分钟的时间(奔4处理器,2Gb的内存,2.8GHz的显示器)。作业结束时会出现一个提醒任务结束的对话框。
图7 RDOCK参数设置
2. 结果分析
待作业完成以后,双击任务浏览器(Jobs Explorer)中相应的行,打开Report.htm。
在report文件中点击View Results打开一个新的分子窗口。(图8)
经RDOCK优化的对接构型均出现在该窗口中,其中top refined pose在视图窗口中显示。
图8 RDOCK分子窗口
每一个优化好的pose其RDOCK所计算的各能量值都列在表格浏览器(Data Table View)中。
E_elec1 and E_elec2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的静电势能
E_vdw1 and E_vdw 2 – 经过第一、二轮CHARMm能量优化后蛋白质复合物的范德华非键作用能
E_sol – 经ACE方法计算得到的蛋白质复合物的去溶剂化能
E_RDock – RDOCK分数的定义为:E_elec2 + beta×E_sol
表格中同样还包含了运算ZDOCK之后得到的各pose的性质,例如ZDock Score和聚类信息等。这些信息有利于结果的解释。
RDock打分最好的pose属于cluster2。这也证实了cluster2所包含的pose是对接最好的结果,有可能同真实的对接构象比较接近。
在Table中,点击
可以看到第一个pose的3D构象。分别点击
可以查看上一个和下一个pose的结构。
使用RMSD分析结合界面的氨基酸
本小节将把对接的构型同蛋白质复合物PDB 1ppe的晶体结构进行比较。
1 打开PDB 1ppe
点击Poses分子窗口的标签,使该窗口处于激活状态。
从主菜单栏中,选取File | Insert From | URL,打开Insert From URL对话框。
在ID文本框中输入1ppe。确保地址栏设置为Default PDB Structures。
点击Open。
这将在Poses分子窗口的视图窗口中插入1ppe蛋白复合物结构。
在分子窗口中,单击鼠标右键,选取Show All显示所有pose。
在系统视图(Hierarchy View)中,展开Cell,然后展开1PPE。
选中Water,Delete。
这将删除1ppe中的水分子。
2. 将对接构型与1ppe叠合
在进行RMSD计算之前,首先应该将对接的poses和1ppe进行基于受体蛋白的叠合。
在视图窗口(Graphic View)中,单击鼠标右键,选取Show Sequence。
这将打开一个Sequence窗口。(图9)
图9 序列窗口
点击Poses分子窗口标签,激活该窗口。
在系统视图(Hierarchy)中,点击选中1ppe的E链。
在工具浏览器(Tools Explorer)中,展开Macromolecules | Superimpose Proteins,在Reference Protein一栏下,选取1PPE中选中的链作为叠合时的参考分子。
在Sequence Alignment一栏中,设置Sequence Alignment为Poses,并将弹出的窗口关闭。
在分子窗口中,确保1ppe的E链仍被选中。
在Superimpose Proteins一栏中点击Superimpose。
该步将对接poses的受体对接至1ppe的E链。
3. 计算结合界面氨基酸的RMSD值
在系统视图(Hierarchy)中,点击选中1ppe的I链。
在Dock and Analyze Protein Complexes工具面板下,点击Define Ligand。
点击Select Binding Interface。
选中处于蛋白-蛋白分子界面的氨基酸残基。
从菜单栏中,选择Structure | RMSD | By Sequence Alignment….
这将打开RMSD by Sequence Alignment的对话框。
在该对话框中,点击Reference molecule右边的栅格,下拉列表中选择1ppe。点击Selected residues左边的圆形按钮,关闭Report at residue level选项。点击OK。(图10)
图10 “RMSD by Sequence Alignment”参数设置
DS将在一个新的Html窗口中打开一个基于选中氨基酸的RMSD报告。(图11)
比较对接poses的E_RDock打分和RMSD值,发现RMSD值最低的poses其E_RDock打分也最低,都属于cluster2类别。
图11 RMSD报告
End
标签: