
目的:通過此教程,了解Discovery Studio中蛋白序與蛋白質之間相互對接的操作方法及結果分析。
(資料圖)
所需功能和模塊:Discovery Studio Client,Dock Proteins with ZDOCK,Refinement with RDOCK。
所需數據文件:2ptn.pdb,2sta_I.pdb。
所需時間:1小時30分鐘
介紹
蛋白對接技術是一種預測蛋白質相互識別以及相互作用的技術。在DS中,我們可以使用ZDOCK來實現蛋白質的對接計算。ZDOCK是一種基于快速傅里葉轉化相關性技術的剛性蛋白對接算法。算法中快速傅里葉轉化相關性技術被用于搜索蛋白-蛋白系統的平動和轉動空間。RDOCK是一種基于CHARMm的能量優化過程,用于優化ZDOCK所尋找到的蛋白-蛋白復合物的結合構型,并使用能量打分函數給這些結合構型打分。
本教程使用ZDOCK來進行蛋白對接的實驗,并分析對接的結果。從中選取的一些結合構型,利用RDOCK進行優化。本教程的蛋白對接實驗中,我們選用牛β-胰島素(PDB號:2ptn)作為受體蛋白,另外胰島素抑制劑CMTI-I(PDB號:2sta,I鏈)將作為配體蛋白。該牛β-胰島素及其抑制劑CMIT-I復合物的晶體結構是已知的(PDB號為1ppe)。
本教程涵蓋如下內容:
ZDOCK運算的設定
ZDOCK結果的分析
對接構型的RDOCK優化
蛋白-蛋白結合界面氨基酸的RMSD分析
設定一次ZDOCK計算
1. 在同一個3D窗口中打開受體和配體蛋白
在文件瀏覽器(Files Explorer)中,展開Samples | Tutorials | Protein Modeling文件夾,雙擊2ptn.pdb文件。
DS將在一個新的3D窗口中打開該蛋白。
在同一文件夾中,將2sta_I.pdb拖至上述同一分子窗口(2ptn分子窗口)中。(圖1)
圖1 2ptn分子窗口
2. 蛋白-蛋白對接(ZDOCK)
在工具瀏覽器(Tools Explorer)中,展開Macromolecules | Dock and Analyze Protein Complexes,點擊Dock Proteins(ZDOCK),打開Dock Proteins(ZDOCK)對話框。(圖2)
設置Input Receptor Protein為2ptn:2ptn。
設置Input Ligand Protein為2ptn:2sta_I。
點擊Angular Step Size右邊的柵格,下拉列表中選取15。
注:ZDOCK計算過程中可以采用兩種歐拉角度進行結合構型的采樣:6°和15°。采樣角度為6°時,預測結果更為準確,因為它的最終樣本數包括54,000個結合構型。盡管采樣角度為15°時的結果準確性有所下降(因為它的采樣數只有3600個),但它的計算時間更短。
展開Clustering參數組。
點擊RMSD Cutoff參數,將該值設置為6.0。
點擊Interface Cutoff參數,將該值設置為9.0。
點擊Maximum Number of Clusters參數,將該值設置為60。
本教程中使用的配體抑制劑較小,對于這樣小的體系,將RMSD Cutoff設置為 6.0 ?的cluster 半徑并同時將Interface Cutoff 設置為9.0 ?,cluster結果會更好。本教程中的ZDCOK運算,將不指定blocked residues也不指定filtering binding site residues。
設置ZRank為False。
ZRank選項用于根據靜電勢、范德華、去溶劑化效應能來對ZDOCK初始預測的pose進行重新排名。本教程中,我們沒有使用該選項。
注:ZDOCK可以在采用blocking和(或)filtering選項時進行計算:
如果有數據表明某些氨基酸殘基不可能出現在蛋白-蛋白的作用界面,那么在受體蛋白中選中這些殘基,然后設定Receptor Blocked Residues參數為Create New Group from selection。同樣的,也可以通過設置Ligand Blocked Residues參數來指定配體蛋白中不可能出現在界面上的殘基。
如果有數據表明,某些氨基酸一定會出現在蛋白質-蛋白質作用界面上,那么選中它們。然后展開Filter Poses參數組,設置Receptor Binding Site Residues參數和Ligand Binding Site Residues參數為Create New Group from selection。
Filter Poses功能也可以在ZDOCK運算完后單獨運行,采用Process Poses(ZDOCK)protocol即可。
圖2 “Dock Proteins(ZDOCK)”參數設置
3. 運行ZDOCK并查看結果
點擊Run運行作業,在對話框中觀察作業運行狀態。點擊Background后臺運行該作業。
該作業大概需要15分鐘的時間(奔4處理器,2Gb的內存,2.8GHz的顯示器)。
待作業完成以后,雙擊任務瀏覽器(Jobs Explorer)中相應的行,打開Report.htm(圖3)。在report文件中分析Summary部分并點擊View Results以打開一個包含對接pose的新窗口。(圖4)
圖3 ZDOCK運算的Report文件
圖4 ZDockResults窗口
分析ZDOCK結果
輸入的受體蛋白和配體蛋白都顯示在視圖窗口當中。
如果兩個蛋白分子并沒有在視圖窗口當中顯示,則在工具欄中點擊Fit To Screen按鈕使兩個蛋白分子居中顯示。每一個聚類的中心pose都以點的形式顯示在受體蛋白的周圍。
1. 結合構型的聚類(Cluster)結果
在系統視圖(Hierarchy View)中,展開Docked Poses和Clusters。
這將打開幾組Clusters和poses。Cluster_1是最大的聚類(包含的poses最多),后續的聚類所包含的pose逐漸減少。
在系統視圖(Hierarchy View)中,關閉Docked Poses和Clusters組。在表格瀏覽器(Data Table)中,點擊Protein Pose標簽。
這將顯示如下關于ZDOCK運算結果的信息:
ZDock Score – 包含每個對接構型的ZDOCK分數(PSC 打分函數),Pose 1的 Zdock分數最高(最好)。
Cluster – 指明每個對接構型所屬的聚類組
ClusterSize – 報告每個聚類含有的對接構型的個數。
Density – 報告聚類過程中臨近的對接構象數目。
關于聚類算法的詳述,可以參考Discovery Studio Help中的Clustering and analysis of docked protein poses。
2. 結合構型作圖分析
以下的步驟將解釋如何使用不同的方法,借助plots和Dock and Analyze Protein Complexes工具來幫助觀看對接構型,并選擇一部分ZDOCK的對接構型進行進一步的RDOCK優化。
在工具瀏覽器(Tools Explorer)中,展開Macromolecule | Dock and Analyze Protein Complexes,在Browse Poses一欄下設置Browse為Top Poses in Largest Clusters。
這將顯示10個最大的聚類中100個打分最好的pose。
點擊First顯示第一個pose的配體分子。
這將在分子窗口的視圖窗口中產生一個名為Pose1_Cluster2_2sta_I的配體分子。
點擊Lock Visibility保留配體分子的該pose并一直處于可見狀態。
點擊Next觀察配體分子的下一個pose,是cluster2中的pose3。
觀察到該pose同第一個pose很相似。
點擊Next兩次顯示Pose7_Cluster5_2sta_I。
觀察到該pose對接至受體的位置很相似,但是配體的對接界面卻有較大的差距。
繼續點擊Next觀察其他pose,如果想要保留某一個pose則點擊Lock Visibility。
在Data Table中,點擊ProteinPose,使之處于激活狀態。
單擊鼠標右鍵,選取List Only Visible Objects。
點擊ZDockResult點狀圖標簽,拖拽該窗口,以使能夠同時看到ZDockReults窗口。
在View工具欄中,點擊Select工具,選中ZDockResults窗口中一些ZDock打分高于12.0的點。
該操作共選取了11個pose,5個pose屬于cluster2,4個pose屬于cluster1,cluster3和5各包含一個pose。
利用RDOCK優化對接構型
1. RDOCK優化
點擊ZDockResults分子窗口,以使該窗口處于激活狀態。
在工具瀏覽器(Tools Explorer)中,展開Macromolecules | Dock and Analyze Protein Complexes,在Refine Poses一欄下,點擊Refine Docked Proteins(RDOCK),打開Refine Docked Proteins(RDOCK)對話框。(圖7)
點擊Input Receptor Protein右邊的柵格,下拉列表中選擇ZDockResults:2ptn。
點擊Input Ligand Protein右邊的柵格,下拉列表中選擇ZDockResults:2sta_I。
點擊Input Poses右邊的柵格,下拉列表中選擇Create New Group From Selection。
默認的會將該新產生的組命名為Group,共包含之前選取的11個pose。
注:Dielectric Constant參數仍保留設置為4.0。該值即運算RDOCK中計算CHARMm能量時所用的介電常數。
點擊Run運行作業,在對話框中觀察作業運行狀態。
點擊Background后臺運行該作業。
該作業大概需要5分鐘的時間(奔4處理器,2Gb的內存,2.8GHz的顯示器)。作業結束時會出現一個提醒任務結束的對話框。
圖7 RDOCK參數設置
2. 結果分析
待作業完成以后,雙擊任務瀏覽器(Jobs Explorer)中相應的行,打開Report.htm。
在report文件中點擊View Results打開一個新的分子窗口。(圖8)
經RDOCK優化的對接構型均出現在該窗口中,其中top refined pose在視圖窗口中顯示。
圖8 RDOCK分子窗口
每一個優化好的pose其RDOCK所計算的各能量值都列在表格瀏覽器(Data Table View)中。
E_elec1 and E_elec2 – 經過第一、二輪CHARMm能量優化后蛋白質復合物的靜電勢能
E_vdw1 and E_vdw 2 – 經過第一、二輪CHARMm能量優化后蛋白質復合物的范德華非鍵作用能
E_sol – 經ACE方法計算得到的蛋白質復合物的去溶劑化能
E_RDock – RDOCK分數的定義為:E_elec2 + beta×E_sol
表格中同樣還包含了運算ZDOCK之后得到的各pose的性質,例如ZDock Score和聚類信息等。這些信息有利于結果的解釋。
RDock打分最好的pose屬于cluster2。這也證實了cluster2所包含的pose是對接最好的結果,有可能同真實的對接構象比較接近。
在Table中,點擊
可以看到第一個pose的3D構象。分別點擊
可以查看上一個和下一個pose的結構。
使用RMSD分析結合界面的氨基酸
本小節將把對接的構型同蛋白質復合物PDB 1ppe的晶體結構進行比較。
1 打開PDB 1ppe
點擊Poses分子窗口的標簽,使該窗口處于激活狀態。
從主菜單欄中,選取File | Insert From | URL,打開Insert From URL對話框。
在ID文本框中輸入1ppe。確保地址欄設置為Default PDB Structures。
點擊Open。
這將在Poses分子窗口的視圖窗口中插入1ppe蛋白復合物結構。
在分子窗口中,單擊鼠標右鍵,選取Show All顯示所有pose。
在系統視圖(Hierarchy View)中,展開Cell,然后展開1PPE。
選中Water,Delete。
這將刪除1ppe中的水分子。
2. 將對接構型與1ppe疊合
在進行RMSD計算之前,首先應該將對接的poses和1ppe進行基于受體蛋白的疊合。
在視圖窗口(Graphic View)中,單擊鼠標右鍵,選取Show Sequence。
這將打開一個Sequence窗口。(圖9)
圖9 序列窗口
點擊Poses分子窗口標簽,激活該窗口。
在系統視圖(Hierarchy)中,點擊選中1ppe的E鏈。
在工具瀏覽器(Tools Explorer)中,展開Macromolecules | Superimpose Proteins,在Reference Protein一欄下,選取1PPE中選中的鏈作為疊合時的參考分子。
在Sequence Alignment一欄中,設置Sequence Alignment為Poses,并將彈出的窗口關閉。
在分子窗口中,確保1ppe的E鏈仍被選中。
在Superimpose Proteins一欄中點擊Superimpose。
該步將對接poses的受體對接至1ppe的E鏈。
3. 計算結合界面氨基酸的RMSD值
在系統視圖(Hierarchy)中,點擊選中1ppe的I鏈。
在Dock and Analyze Protein Complexes工具面板下,點擊Define Ligand。
點擊Select Binding Interface。
選中處于蛋白-蛋白分子界面的氨基酸殘基。
從菜單欄中,選擇Structure | RMSD | By Sequence Alignment….
這將打開RMSD by Sequence Alignment的對話框。
在該對話框中,點擊Reference molecule右邊的柵格,下拉列表中選擇1ppe。點擊Selected residues左邊的圓形按鈕,關閉Report at residue level選項。點擊OK。(圖10)
圖10 “RMSD by Sequence Alignment”參數設置
DS將在一個新的Html窗口中打開一個基于選中氨基酸的RMSD報告。(圖11)
比較對接poses的E_RDock打分和RMSD值,發現RMSD值最低的poses其E_RDock打分也最低,都屬于cluster2類別。
圖11 RMSD報告
End
標簽: