Discovery Studio官方教程(Help-Tutorials) 使用ZDOCK進行蛋白-蛋白對接

2023-03-08 17:20:36 來源:軟服之家

目的:通過此教程,了解Discovery Studio中蛋白序與蛋白質之間相互對接的操作方法及結果分析。


(資料圖)

所需功能和模塊:Discovery Studio Client,Dock Proteins with ZDOCK,Refinement with RDOCK。

所需數據文件:2ptn.pdb,2sta_I.pdb。

所需時間:1小時30分鐘

介紹

蛋白對接技術是一種預測蛋白質相互識別以及相互作用的技術。在DS中,我們可以使用ZDOCK來實現蛋白質的對接計算。ZDOCK是一種基于快速傅里葉轉化相關性技術的剛性蛋白對接算法。算法中快速傅里葉轉化相關性技術被用于搜索蛋白-蛋白系統的平動和轉動空間。RDOCK是一種基于CHARMm的能量優化過程,用于優化ZDOCK所尋找到的蛋白-蛋白復合物的結合構型,并使用能量打分函數給這些結合構型打分。

本教程使用ZDOCK來進行蛋白對接的實驗,并分析對接的結果。從中選取的一些結合構型,利用RDOCK進行優化。本教程的蛋白對接實驗中,我們選用牛β-胰島素(PDB號:2ptn)作為受體蛋白,另外胰島素抑制劑CMTI-I(PDB號:2sta,I鏈)將作為配體蛋白。該牛β-胰島素及其抑制劑CMIT-I復合物的晶體結構是已知的(PDB號為1ppe)。

本教程涵蓋如下內容:

ZDOCK運算的設定

ZDOCK結果的分析

對接構型的RDOCK優化

蛋白-蛋白結合界面氨基酸的RMSD分析

設定一次ZDOCK計算

1. 在同一個3D窗口中打開受體和配體蛋白

在文件瀏覽器(Files Explorer)中,展開Samples | Tutorials | Protein Modeling文件夾,雙擊2ptn.pdb文件。

DS將在一個新的3D窗口中打開該蛋白。

在同一文件夾中,將2sta_I.pdb拖至上述同一分子窗口(2ptn分子窗口)中。(圖1)

圖1 2ptn分子窗口

2. 蛋白-蛋白對接(ZDOCK)

在工具瀏覽器(Tools Explorer)中,展開Macromolecules | Dock and Analyze Protein Complexes,點擊Dock Proteins(ZDOCK),打開Dock Proteins(ZDOCK)對話框。(圖2)

設置Input Receptor Protein為2ptn:2ptn。

設置Input Ligand Protein為2ptn:2sta_I。

點擊Angular Step Size右邊的柵格,下拉列表中選取15。

注:ZDOCK計算過程中可以采用兩種歐拉角度進行結合構型的采樣:6°和15°。采樣角度為6°時,預測結果更為準確,因為它的最終樣本數包括54,000個結合構型。盡管采樣角度為15°時的結果準確性有所下降(因為它的采樣數只有3600個),但它的計算時間更短。

展開Clustering參數組。

點擊RMSD Cutoff參數,將該值設置為6.0。

點擊Interface Cutoff參數,將該值設置為9.0。

點擊Maximum Number of Clusters參數,將該值設置為60。

本教程中使用的配體抑制劑較小,對于這樣小的體系,將RMSD Cutoff設置為 6.0 ?的cluster 半徑并同時將Interface Cutoff 設置為9.0 ?,cluster結果會更好。本教程中的ZDCOK運算,將不指定blocked residues也不指定filtering binding site residues。

設置ZRank為False。

ZRank選項用于根據靜電勢、范德華、去溶劑化效應能來對ZDOCK初始預測的pose進行重新排名。本教程中,我們沒有使用該選項。

注:ZDOCK可以在采用blocking和(或)filtering選項時進行計算:

如果有數據表明某些氨基酸殘基不可能出現在蛋白-蛋白的作用界面,那么在受體蛋白中選中這些殘基,然后設定Receptor Blocked Residues參數為Create New Group from selection。同樣的,也可以通過設置Ligand Blocked Residues參數來指定配體蛋白中不可能出現在界面上的殘基。

如果有數據表明,某些氨基酸一定會出現在蛋白質-蛋白質作用界面上,那么選中它們。然后展開Filter Poses參數組,設置Receptor Binding Site Residues參數和Ligand Binding Site Residues參數為Create New Group from selection。

Filter Poses功能也可以在ZDOCK運算完后單獨運行,采用Process Poses(ZDOCK)protocol即可。

圖2 “Dock Proteins(ZDOCK)”參數設置

3. 運行ZDOCK并查看結果

點擊Run運行作業,在對話框中觀察作業運行狀態。點擊Background后臺運行該作業。

該作業大概需要15分鐘的時間(奔4處理器,2Gb的內存,2.8GHz的顯示器)。

待作業完成以后,雙擊任務瀏覽器(Jobs Explorer)中相應的行,打開Report.htm(圖3)。在report文件中分析Summary部分并點擊View Results以打開一個包含對接pose的新窗口。(圖4)

圖3 ZDOCK運算的Report文件

圖4 ZDockResults窗口

分析ZDOCK結果

輸入的受體蛋白和配體蛋白都顯示在視圖窗口當中。

如果兩個蛋白分子并沒有在視圖窗口當中顯示,則在工具欄中點擊Fit To Screen按鈕使兩個蛋白分子居中顯示。每一個聚類的中心pose都以點的形式顯示在受體蛋白的周圍。

1. 結合構型的聚類(Cluster)結果

在系統視圖(Hierarchy View)中,展開Docked Poses和Clusters。

這將打開幾組Clusters和poses。Cluster_1是最大的聚類(包含的poses最多),后續的聚類所包含的pose逐漸減少。

在系統視圖(Hierarchy View)中,關閉Docked Poses和Clusters組。在表格瀏覽器(Data Table)中,點擊Protein Pose標簽。

這將顯示如下關于ZDOCK運算結果的信息:

ZDock Score – 包含每個對接構型的ZDOCK分數(PSC 打分函數),Pose 1的 Zdock分數最高(最好)。

Cluster – 指明每個對接構型所屬的聚類組

ClusterSize – 報告每個聚類含有的對接構型的個數。

Density – 報告聚類過程中臨近的對接構象數目。

關于聚類算法的詳述,可以參考Discovery Studio Help中的Clustering and analysis of docked protein poses。

2. 結合構型作圖分析

以下的步驟將解釋如何使用不同的方法,借助plots和Dock and Analyze Protein Complexes工具來幫助觀看對接構型,并選擇一部分ZDOCK的對接構型進行進一步的RDOCK優化。

在工具瀏覽器(Tools Explorer)中,展開Macromolecule | Dock and Analyze Protein Complexes,在Browse Poses一欄下設置Browse為Top Poses in Largest Clusters。

這將顯示10個最大的聚類中100個打分最好的pose。

點擊First顯示第一個pose的配體分子。

這將在分子窗口的視圖窗口中產生一個名為Pose1_Cluster2_2sta_I的配體分子。

點擊Lock Visibility保留配體分子的該pose并一直處于可見狀態。

點擊Next觀察配體分子的下一個pose,是cluster2中的pose3。

觀察到該pose同第一個pose很相似。

點擊Next兩次顯示Pose7_Cluster5_2sta_I。

觀察到該pose對接至受體的位置很相似,但是配體的對接界面卻有較大的差距。

繼續點擊Next觀察其他pose,如果想要保留某一個pose則點擊Lock Visibility。

在Data Table中,點擊ProteinPose,使之處于激活狀態。

單擊鼠標右鍵,選取List Only Visible Objects。

點擊ZDockResult點狀圖標簽,拖拽該窗口,以使能夠同時看到ZDockReults窗口。

在View工具欄中,點擊Select工具,選中ZDockResults窗口中一些ZDock打分高于12.0的點。

該操作共選取了11個pose,5個pose屬于cluster2,4個pose屬于cluster1,cluster3和5各包含一個pose。

利用RDOCK優化對接構型

1. RDOCK優化

點擊ZDockResults分子窗口,以使該窗口處于激活狀態。

在工具瀏覽器(Tools Explorer)中,展開Macromolecules | Dock and Analyze Protein Complexes,在Refine Poses一欄下,點擊Refine Docked Proteins(RDOCK),打開Refine Docked Proteins(RDOCK)對話框。(圖7)

點擊Input Receptor Protein右邊的柵格,下拉列表中選擇ZDockResults:2ptn。

點擊Input Ligand Protein右邊的柵格,下拉列表中選擇ZDockResults:2sta_I。

點擊Input Poses右邊的柵格,下拉列表中選擇Create New Group From Selection。

默認的會將該新產生的組命名為Group,共包含之前選取的11個pose。

注:Dielectric Constant參數仍保留設置為4.0。該值即運算RDOCK中計算CHARMm能量時所用的介電常數。

點擊Run運行作業,在對話框中觀察作業運行狀態。

點擊Background后臺運行該作業。

該作業大概需要5分鐘的時間(奔4處理器,2Gb的內存,2.8GHz的顯示器)。作業結束時會出現一個提醒任務結束的對話框。

圖7 RDOCK參數設置

2. 結果分析

待作業完成以后,雙擊任務瀏覽器(Jobs Explorer)中相應的行,打開Report.htm。

在report文件中點擊View Results打開一個新的分子窗口。(圖8)

經RDOCK優化的對接構型均出現在該窗口中,其中top refined pose在視圖窗口中顯示。

圖8 RDOCK分子窗口

每一個優化好的pose其RDOCK所計算的各能量值都列在表格瀏覽器(Data Table View)中。

E_elec1 and E_elec2 – 經過第一、二輪CHARMm能量優化后蛋白質復合物的靜電勢能

E_vdw1 and E_vdw 2 – 經過第一、二輪CHARMm能量優化后蛋白質復合物的范德華非鍵作用能

E_sol – 經ACE方法計算得到的蛋白質復合物的去溶劑化能

E_RDock – RDOCK分數的定義為:E_elec2 + beta×E_sol

表格中同樣還包含了運算ZDOCK之后得到的各pose的性質,例如ZDock Score和聚類信息等。這些信息有利于結果的解釋。

RDock打分最好的pose屬于cluster2。這也證實了cluster2所包含的pose是對接最好的結果,有可能同真實的對接構象比較接近。

在Table中,點擊

可以看到第一個pose的3D構象。分別點擊

可以查看上一個和下一個pose的結構。

使用RMSD分析結合界面的氨基酸

本小節將把對接的構型同蛋白質復合物PDB 1ppe的晶體結構進行比較。

1 打開PDB 1ppe

點擊Poses分子窗口的標簽,使該窗口處于激活狀態。

從主菜單欄中,選取File | Insert From | URL,打開Insert From URL對話框。

在ID文本框中輸入1ppe。確保地址欄設置為Default PDB Structures。

點擊Open。

這將在Poses分子窗口的視圖窗口中插入1ppe蛋白復合物結構。

在分子窗口中,單擊鼠標右鍵,選取Show All顯示所有pose。

在系統視圖(Hierarchy View)中,展開Cell,然后展開1PPE。

選中Water,Delete。

這將刪除1ppe中的水分子。

2. 將對接構型與1ppe疊合

在進行RMSD計算之前,首先應該將對接的poses和1ppe進行基于受體蛋白的疊合。

在視圖窗口(Graphic View)中,單擊鼠標右鍵,選取Show Sequence。

這將打開一個Sequence窗口。(圖9)

圖9 序列窗口

點擊Poses分子窗口標簽,激活該窗口。

在系統視圖(Hierarchy)中,點擊選中1ppe的E鏈。

在工具瀏覽器(Tools Explorer)中,展開Macromolecules | Superimpose Proteins,在Reference Protein一欄下,選取1PPE中選中的鏈作為疊合時的參考分子。

在Sequence Alignment一欄中,設置Sequence Alignment為Poses,并將彈出的窗口關閉。

在分子窗口中,確保1ppe的E鏈仍被選中。

在Superimpose Proteins一欄中點擊Superimpose。

該步將對接poses的受體對接至1ppe的E鏈。

3. 計算結合界面氨基酸的RMSD值

在系統視圖(Hierarchy)中,點擊選中1ppe的I鏈。

在Dock and Analyze Protein Complexes工具面板下,點擊Define Ligand。

點擊Select Binding Interface。

選中處于蛋白-蛋白分子界面的氨基酸殘基。

從菜單欄中,選擇Structure | RMSD | By Sequence Alignment….

這將打開RMSD by Sequence Alignment的對話框。

在該對話框中,點擊Reference molecule右邊的柵格,下拉列表中選擇1ppe。點擊Selected residues左邊的圓形按鈕,關閉Report at residue level選項。點擊OK。(圖10)

圖10 “RMSD by Sequence Alignment”參數設置

DS將在一個新的Html窗口中打開一個基于選中氨基酸的RMSD報告。(圖11)

比較對接poses的E_RDock打分和RMSD值,發現RMSD值最低的poses其E_RDock打分也最低,都屬于cluster2類別。

圖11 RMSD報告

End

標簽:

上一篇:
下一篇: