
目的:通過此教程,了解Discovery Studio中構建基于受體三維結構藥效團的操作方法及結果分析。
所需功能和模塊:Discovery Studio client,DS CATALYST SBP,DS CATALYST SCORE,DS CATALYST CONFOMATION。
所需數據文件:1k22_potein_ligand.dsv,thrombin_ligands.sd,kinase_ligands.sd。
(相關資料圖)
所需時間:30分鐘
介紹
來自學術界和制藥企業的信息表明,Catalyst是最好的基于小分子結構的藥物設計工具。然而,科學家的愿望不僅僅是這些,大家也非常希望最大限度地利用已知的受體結構和藥物-受體結合信息,有效地克服現有藥物設計工具的缺點,更快地加速新藥研發的過程。
Structure Based Pharmacophore(SBP)利用已知或假設的蛋白活性位點從受體位點的特性直接得到相互作用位點圖,并且將這個信息轉化成適用于快速三維數據庫檢索的藥效團模型。這些相互作用位點圖還可以進行編輯、分類,以確保只有最重要的信息會被保留下來用于虛擬篩選。同時SBP中還可考慮受體活性位點處氨基酸殘基的空間排布,使得通過虛擬篩選得到的分子不僅滿足和受體結合位點化學特征上的互補,還可以在空間上很好地結合在活性位點空腔處。SBP引入了那些使用受體結構信息的最佳方法,這些方法已經在高通量篩選的實驗環境中所使用。
SBP方法首先通過對活性部位的分析產生特征相互作用圖(feature interaction map),特征相互作用圖用于反映可能的配體與蛋白之間的合理的相互作用,接著通過特征相互作用圖產生藥效團模型,進一步利用藥效團模型發現潛在的活性化合物。
本教程中使用а-凝血酶作為例子,展示如何利用SBP方法建立藥效團模型,開展數據庫搜索,以及Discovery Studio如何提供了方便的結果分析工具幫助大家獲得最好的結果。
本教程包括以下步驟:
構建基于蛋白結構的藥效團模型
編輯藥效團模型
配體庫篩選
篩選結果的分析
Structure-Based Pharmacophore的構建
本教程基于а-凝血酶蛋白結構(PDB號:1K22)來構建藥效團模。該蛋白結構從PDB庫中下載得到并經Prepare Protein預先準備。
1. 導入蛋白及配體結構
在文件瀏覽器(Files Explorer)中,展開Samples | Tutorials | Pharmacophore,雙擊打開1k22_protein_ligand.dsv。
а-凝血酶是絲氨酸蛋白酶,是胰凝乳蛋白酶家族中的一員。該蛋白共有三個結合口袋,口袋處殘基分別用紅色、藍色和綠色表示。(圖1)
圖1 受體分子
2. 定義活性位點
在系統視圖(Hierarchy View)中選取1k22_protein。
在工具瀏覽器(Tools Explorer)中,展開Receptor-Ligand Interactions | Define and Edit Binding Site,在工具面板中單擊Define Receptor。
將前面選取的蛋白分子1k22_protein定義為受體分子,供下一步使用。
在系統視圖(Hierarchy View)中選取1k22_ligand。
在Define and Edit Binding Site工具面板中點擊Define Site欄中的From Current Selection。
在視圖窗口(Graphic View)中自動生成了一個紅色的球,該球將1k22配體包裹其中。同時在系統視圖(Hierarchy View)中增加了SBD_Site_Sphere的選項。
如果蛋白結構中沒有配體小分子的信息,則可以選擇已知活性位點處的殘基,或者用binding site工具自動搜索結合位點。
在視圖窗口(Graphic View)中,選取紅色的球體,或者系統視圖(Hierarchy View)中選擇SBD_Site_Sphere,右擊選取Attributes of SBD_Site_Sphere。
打開SphereObjectAttributes對話框,將Radius設為9。(圖2)
球體半徑值可以調大以包含活性位點處的所有殘基,但是這同樣也會增加所要識別的相互作用的數量,其中可能包含一些非相關信息。
圖2 修改Sphere半徑
3. 產生相互作用模型
在受體活性位點球體中產生相互作用模型。
在工具瀏覽器(Tools Explorer)中,展開Pharmacophore | Edit and Cluster Pharmacophore Features,在工具面板中單擊Interaction Generation,打開Interaction Generation對話框。
設置Input Receptor為1k22_protein_ligands:1k22_protein。
設置Input Site Sphere為已定義的半徑為9埃的球體坐標。
其余參數使用默認值。(圖3)
點擊Run運行作業。
等待作業完成。
圖3 “Interaction Generation”對話框
作業完成以后,在視圖窗口(Graphic View)中會自動插入產生的藥效團特征。(圖4)
圖4 產生的藥效團模型
基于結構藥效團模型的編輯
初次構建相互作用模型時,20個藥效團特征元素是一個比較合理的數目。
1. 隱藏所有特征元素
在工具瀏覽器(Tools Explorer)中,展開Pharmacophore | Edit and Cluster Pharmacophore Features,在工具面板中單擊Show/Hide Location Spheres,隱藏feature周圍的球。
注意矢量化的特征元素可以表征同某一個特定的氨基酸殘基間的相互作用。
在系統視圖(Hierarchy View)中,關閉SBD_Site_Sphere。
此時,視圖窗口(Graphic View)中只有不同顏色標記的結合口袋,配體分子,分子間相互作用。
在Edit and Cluster Pharmacophore Features工具面板中,定義Current Feature為All Features。
單擊Show/Hide All Features,隱藏所有特征元素。
2. 對feature進行聚類
首先定義Current Feature為Acceptor,點擊Edit and Cluster Pharmacophore Features工具面板中的Show/Hide Acceptor,顯示所有氫鍵受體特征。
點擊Edit and Cluster Pharmacophore Features工具面板中的Cluster Current Features,對Acceptor特征進行聚類分析。
自動出現一個新的窗口,包含聚類分析的樹形圖。(圖5)
將該Dendrogram窗口標簽拖至視圖窗口使得該窗口同1k22_protein_ligand分子窗口并列顯示。
注:在該窗口中滾動鼠標滾輪,可以縱向調節圖形大小,方便觀察所有樹形分支。移動該窗口中的slider線,顯示不同的聚類中心。相應的該聚類中心會在分子窗口中高亮顯示。該聚類是基于所有特征元素間的幾何距離來定義的。自動聚類分析和手工選取相結合可以方便用戶選取最佳特征元素的組合來表征蛋白活性位點。
移動窗口中的slider線,直到窗口右下角顯示Number of cluster centers為12。
在工具面板中點擊Keep Only Cluster Centers,關閉Dendrogram Window。
這樣所有的Acceptor feature將由12個Acceptor feature代表。
在系統視圖(Hierarchy View)中,展開QueryRoot | Fit Fit_1。
CTRL-選取acceptor feature28,46,56,77,97,單擊工具面板中的Keep Only Current Feature Selections,以保留這些Acceptor特征。
選取這些特定元素特征是因為這幾個Acceptor特征對應了活性位點的特定氨基酸殘基,而其他特征則要么離殘基比較遠要么取向偏離了可能的結合位點。
圖5 Acceptor-Dendrogram示意圖
單擊工具面板中的Show/Hide Acceptor,隱藏Acceptor特征。
設置工具面板中的Current Feature為Donor,點擊Show/Hide Donor,顯示所有氫鍵供體特征。
在系統視圖(Hierarchy View)中,展開QueryRoot | Fit Fit_1。
CTRL-選取donor feature44,63,75,76,94,101,107,141,198,207,單擊工具面板中的Keep Only Current Feature Selections,以保留這些Donor特征。
手動選取這些特定元素特征作為cluster center的代表同活性位點重要殘基相互作用。這些特征的選取僅僅是依據基于蛋白結構信息得到的相互作用模型,用戶也可以依據已知的氫鍵相互作用來手工選取。
單擊工具面板中的Show/Hide Donor,隱藏Donor特征。
設置工具面板中的Current Feature為Hydrophobe,點擊Show/Hide Hydrophobe,顯示所有疏水特征。
在系統視圖(Hierarchy View)中,展開QueryRoot | Fit Fit_1。
CTRL-選取hydrophobe feature9,48,81,單擊工具面板中的Keep Only Current Feature Selections,以保留這些Hydrophobe特征。
設置工具面板中的Current Feature為All Features,點擊Show/Hide All Features,顯示所有保留特征元素。
蛋白活性位點處藥效團模型共由18個特征元素表征,特征元素的選取是基于觀察到的配體和蛋白間相互作用,以及從單一蛋白結構得到的作用。
注:另一個用于編輯藥效團模型的重要工具是Average Pharmacophore Features命令。選取同一類型的特征元素,再用該命令基于這些特征元素得到一個平均特征用以代表整個類別。
在系統視圖(Hierarchy View)中,CTRL-選取acceptor feature28,77,97,donor feature63,75,141,198,從菜單欄中選取Edit | Group。
命名為S-interactions。
該步驟所定義的相互作用都表征的是S-口袋處的殘基。
3. 產生排除體積模型(exclusion model)
在系統視圖(Hierarchy View)中,選擇QueryRoot,然后在主菜單欄中選擇Edit | Select。在Select對話框中,點擊Selection Mode右邊的柵格,下拉列表中選擇Replace,點擊Scope右邊的柵格,下拉列表中選擇AminoAcid。
選取Radius,設為2.00,點擊Apply按鈕。
點擊Selection Mode右邊的柵格,下拉列表中選擇Intersection,點擊Scope右邊的柵格,下拉列表中選擇Atom。
選取Property,在最后一欄下拉菜單中選取CA,點擊Apply。(圖6)
保留的特征元素周圍2埃以內完整殘基中的CA原子被選中。
圖6 “Select”對話框參數設置
從主菜單欄中選取Structure | Query Features,將Feature改設為ExclusionSphere,基于選取的原子產生排除體積。(圖7)
圖7 “Create Feature”對話框參數設置
通過以上步驟,最終得到了一個基于蛋白結構的藥效團模型,含有排除體積。(圖8)
圖8 基于蛋白結構的藥效團模型
配體庫的篩選
在用該藥效團模型篩選化合物庫之前有必要對該模型進行驗證,考察這18個藥效團特征元素中那些特征元素比較關鍵。
本教程通過對一個包含了活性分子和非活性分子的測試集進行虛擬篩選來對該模型進行驗證。
1. 采用藥效團進行數據庫篩選
在文件瀏覽器(File Explorer)中,展開Samples | Tutorials | Pharmacophore,雙擊打開thrombin_ligands.sd。
讀入8個有活性的凝血酶抑制劑,分子名都有_ligand的后綴。
接著展開Samples | Tutorials | Receptor-Ligand Interaction,將kinase_ligands.sd文件拖至thrombin_ligands窗口中。
讀入9個激酶抑制劑,這些分子都視為未知配體(理想情況下,這些分子應確證不能同凝血酶結合才可視為負性對照物)。
在系統視圖(Hierarchy View)中,選中Hydrophobe81特征作為篩選過程中必須出現的特征元素。
在工具瀏覽器(Tool Explorer)中,展開Pharmacophores | Search, Screen an Profile,點擊Screen Library,打開Screen Library對話框。
設置Input Ligands為thrombin_ligands:All。
確保Input Pharmacophore為1k22_protein_ligand: QueryRoot。
接著指定篩選得到的配體分子必需匹配的特征元素個數,以及用于篩選的每個藥效團模型中都必須包含的特征元素。
在Screen Library對話框中,展開Input Pharmacophore參數組。
點擊Required Features右邊的柵格,下拉列表中選擇True,并展開該參數組,設置Required Features為前面選中的Hydrophobe81。
圖9 “Screen Library”參數設置
點擊Features Group右邊的柵格,下拉列表中選擇True,并展開該參數組,設置Feature Group 1為前面定義的S-interactions。
展開Feature Group 1參數組,將Maximum改為7。
該值為該特征元素組中特征元素的上限個數。
將Maximum Features設為8。
該值為輸入藥效團模型中需要考慮的特征元素的上限個數。
展開Input Ligands參數組,點擊Conformation Generation右邊的柵格,下拉列表中選擇FAST。
展開Advanced參數組,查看Number of Possible Pharmacophores。
該值給出了藥效團模型幾種組合的可能性,是基于Total Number of Features,Minimum Features和Maximum Features這三個參數計算得來的,該值當前顯示為105774。
以上參數的設置表明最終篩選得到的配體小分子必須同編輯得到的18個特征元素中的4個特征元素相匹配,并且在這4個特征元素當中必須有一個是Hydrophobe81特征,同時還必須有一個特征來自于特征元素組S-interactions。
要想正確運行該流程還必須設置Maximum Subset of Pharmacophores參數以確保能夠搜索到蛋白活性位點的所有藥效團空間。
將Maximum Subset of Pharmacophores改為250。
其余參數設誒默認設置。(圖9)
點擊Run運行作業。
等待作業完成。
2. 分析查看篩選結果
作業完成后,自動打開Report頁面,點擊View All Results鏈接,打開一個新的分子窗口。
該窗口中包含了一個structure-based pharmacophore和同所有類別的藥效團匹配最好的命中分子。一共篩選得到55個分子,包含了17個凝血酶和激酶抑制劑中的11個配體分子。
在表格瀏覽器(Data Table)中,單擊右鍵,選取Filter …,打開Specify Filter對話框。
將FitValue的Choice選取為Top(#),Value選取為1。
勾選Apply filter to each group of identical value的復選框,選擇Name。(圖10)
針對表格中Name相同的分子只保留FitValue最高的一個。
可以看到8個凝血酶抑制劑中篩出了7個,9個激酶抑制劑中篩出了4個。
圖10 “Specify Filter”參數設置
在表格瀏覽器(Data Table)中,單擊右鍵,選取Remove Filters,還原前步的設置。
雙擊Name一欄使得凝血酶抑制劑排在表格的前面,不選擇表中任何一欄。
從主菜單欄中選取Chart | Heat Map,跳出Choose Plot Axes對話框,設定熱圖的X軸和Y軸屬性。
針對Y軸,選取Name屬性。
針對X軸,選取Acceptor28,接著SHIFT-選取Hydrophobe9。
將ConfNumber和FitValue屬性的選取取消。(圖11)
即縱坐標為Name,橫坐標為所有共18個藥效團特征元素。
圖11 “Choose Plot Axes”參數設置
圖12 篩選結果熱圖
坐標設定完以后,自動生成熱圖。(圖12)
從該圖可以觀察到18個藥效團特征元素分別同每個分子的匹配情況。例如,Hrdrophobe81該特征同所有分子都相互匹配,正如前面所設定的。而Donor94則只同很少的分子相匹配,因此當篩選更大的分子庫時可以考慮刪除該特征。
標簽: