今日快訊:COSMO-RS用于藥物和農藥的水溶解度預測

2023-03-10 11:22:07 來源:軟服之家

關注泰科科技 做模擬不迷路

01


(資料圖片僅供參考)

摘要

COSMO-Rsol方法最初是基于量子化學計算來預測液體-液體和液體-蒸汽平衡常數的,通過添加一個啟發式的吉布斯自由能表達式,已經擴展到固體化合物。通過這一補充,COSMO-Rsol現在能夠先驗地預測各種典型中性藥物和農藥化合物的水溶性。啟發式表達式中只有三個參數被擬合到150個類藥物化合物的數據集上。在這些數據上,均方根偏差為0.66對數單位。后來,該模型在107種農藥上進行了測試,這些農藥是根據兩個實驗數據源并與獨立的HQSAR模型進行交叉檢驗而嚴格選擇的。在沒有對結構極其多樣化的農藥進行任何調整的情況下,該數據集的均方根值為0.61對數單位。這一結果驗證了擴展COSMO-RS預測幾乎任意結構類藥物和農藥的水溶性的能力。新方法是COSMO-Rsol。

02

引言

水溶解度(Saq)是生命科學中被認為是潛在制劑的所有化學化合物的一個關鍵性質,例如藥物或農藥。Saq在很大程度上決定了化合物在體內的可用性,以及釋放到環境中的化合物的環境行為。

由于它的重要性,人們一直在嘗試尋找可靠的方法來預測新化合物的aq15,因為這些方法在尋找有前途的新制劑候選物的過程中具有很大的價值。但是,在用于表征藥劑的吸收、分布、代謝和環境命運(ADME)的不同性質中,aq是最難預測的目標之一。

COSMO-RS類型的成對相互作用的表面段熱力學在計算化學中是不尋常的,但它已經被化學工程師成功地使用了30多年,因為它是UNIFAC和UNIQUAC等模型的基礎。如果我們接受,至少對于電子要求高的分子,好的計算的第一步必須是靜電的量子化學(QC)計算,這可能是在力場環境中經常使用的HF/6-31-G計算,或者是COSMO-RS的DFT/SVP/COSMO計算,那么兩種方法之間的關系就變得更加清晰了。MD/MC的第二步是將真正的量子化學系統還原為成對相互作用的球體的集合,具有從初始QC步驟導出的某些相互作用參數。相反,在COSMO-RS中,我們用表面塊表示系統,相互作用參數來自QC。這兩種方法都需要一個成對的交互功能。在第一種情況下,該泛函通常是力場類型,而在COSMO-Rsol中,它由非常簡單的靜電失配和氫鍵相互作用公式表示。我們應該意識到,在任何一種情況下,這些相互作用函數都只是相互作用的真實物理的近似值。

在這里,對所有化合物執行DFT/COSMO計算(有關這些計算的詳細信息,請參閱計算細節部分),然后使用COSMOtherm程序進行COSMO-Rsol計算。

訓練集和測試集中所有化合物的分子幾何結構已被描繪為二維結構,隨后轉換為三維幾何結構。為了獲得每個化合物的最低能量構象,分子動力學(MD)計算已經用分子建模程序包Alchemy完成。

利用優化后的幾何圖形,利用Turbomole程序包,利用B-P密度泛函理論和SVP質量基集,在從頭算QC水平上計算了分子表面的COSMO極化電荷密度σ。所有COSMO-RS的計算都是使用COSMOtherm程序完成的。

對于每個化合物,在COSMO-RS計算中只使用turbomole-bp /SVP/COSMO QC水平上能量最低的一種構象,訓練數據集中的水楊酸、琥珀酸、2-乙酰氧基苯甲酸和丙氨酸除外,在COSMO- RS中必須考慮兩種相關構象。

03

結論與討論

150種化合物的計算和實驗數據如圖1所示。相應的表匯編了所有實驗和計算數據,連同描述符可作為補充材料。散點圖清楚地顯示了一個相當均勻的誤差分布。

COSMO-Rsol和HQSAR模型在該農藥數據集上的結果見圖2。平均符號誤差僅為0.06,表明模型具有較高的可移植性。HQSAR方法的均方根=0.72,平均無符號誤差為0.59log-unit,這與交叉驗證程序的結果一致。因此,盡管HQSAR方法是專門在同一來源的大型訓練集上進行訓練的,但它在測試集上的預測精度明顯低于純預測的COSMO-Rsol方法,后者以前從未在農藥上進行過訓練。值得注意的是,COSMO-Rsol的三個參數的改裝只產生0.01對數單位的均方根降低,這是絕對微不足道的。這也表明PhysProp數據的質量更好。COSMO-Rsol方法的兩個最大異常值是兩種化學結構極其復雜的非常大的農藥。兩者都非常相似,結構的相對溶解度被正確預測(見圖2)。兩種模型在107種農藥上的誤差分布如圖3所示。COSMO-Rsol清楚地顯示出幾乎高斯誤差分布,而周期為0.6log的奇怪振蕩。單位出現在HQSAR模型的誤差分布中。目前,我們還沒有解釋hqsar模型的奇異誤差分布。

04

總結與展望

本文介紹了COSMO-Rsol方法作為一種預測固體和液體類藥物水溶液溶解度的新方法。雖然不是完全從頭算,但與目前所有可用的水溶解度預測方法相比,COSMO-Rsol具有相當可靠的物理化學基礎。這使得COSMO-Rsol在用于其他方法的開發和參數化的數據集上比其他最先進的方法實現更好的水溶解度預測。即使在結構要求最高和多樣化的農藥數據集上,COSMO-Rsol也取得了非常令人滿意的預測準確性。

COSMO-Rsol在目前所考慮的數據集上的平均精度約為0.65對數單位(rms)。有強烈的跡象表明,這種誤差的重要部分是實驗誤差。因此,似乎有理由假設COSMO-Rsol方法的內在預測誤差為0.5log-單位。考慮到COSMO-RS對液體化合物的平均精度為0.3log-單位,以及對δGfus的估計所涉及的附加近似,COSMO-Rsol的固有誤差不太可能遠小于0.5log-單位。為了明確評估該方法的內在預測誤差,需要大量高質量的實驗數據。

值得注意的是,與所有其他水溶解度預測方法相比,COSMO-Rsol能夠預測幾乎任意溶劑和溶劑混合物中的溶解度,因為COSMO-Rsol能夠預測化合物X在任意液體中的化學勢。一篇即將發表的論文將給出COSMO-Rsol在非水溶解度上的驗證。這種新方法的另一個優點是,基于用于水溶解度的相同COSMO計算,許多其他物理化學性質,如分配系數、蒸汽壓、亨利常數等,都可以很容易地通過COSMO-RS得到。甚至生理分區行為也可以基于COSMO-Rsol進行計算。

與所有其他溶解度預測方法一樣,COSMO-Rsol僅限于純、中性、非離子化合物的溶解度。對于已知pK值的化合物,可以很容易地進行解離或質子化校正。COSMO-RS目前還不能常規地同時預測pK值,盡管已經報道了第一個有希望的結果。由于COSMO-Rsol具有良好的物理基礎,只要能夠收集到實驗溶解度良好的數據集,就可以通過合理的努力將該方法推廣到共晶體甚至鹽。正在計劃朝著這個方向邁出的第一步。

目前,與許多其他溶解度預測方法相比,COSMO-Rsol方法的最大缺點是在1 ghz PC處理器上需要大約2個CPU小時的時間。在合理的周轉時間內,這將方法限制在1000個化合物的數據集上,并禁止在高通量篩選(HTS)中應用,在HTS中,通常必須在幾天內處理數萬或數十萬個化合物。一種略近似的方法(COSMOfrag)正在開發中,該方法通過對片段的相似性分析,從約10,000個預計算的類藥物結構COSMO文件的大型數據庫中導出所需的新化合物的σ-剖面。該方法將COSMO-Rsol的計算時間縮短至秒級,并有望在精度上有較小的損失。

文章詳情:DOI 10.1002/jcc.1168

北京泰科博思科技有限公司是COSMOtherm官方指定代理商,有關軟件詳情或者技術支持請咨詢北京泰科。

05

北京泰科涉及行業

材料研發

基于BIOVIA Materials Studio材料設計平臺,提供涉及電池、航空航天、國防軍工、建筑、涂料涂層等多領域材料研發軟件及綜合解決方案。

藥物研發

針對藥物設計、藥物研發等提供基于Discovery Studio、COSMOLOGIC等軟件的ADME、構象比對、溶劑篩選、結晶、成鹽、共晶篩選、穩定性、溶解度pKa、分配系數等性質的模擬預測軟件及方案。

化工設計

面向精細化工、新能源、石油化工等領域提供精餾萃取催化劑設計、熱力學性質(溶解度、粘度等)、提純表面處理吸附等性質模擬軟件平臺及解決方案。

數據挖掘

基于Pipeline Pilot提供數據搜集、數據清洗、特征工程、機器學習、流程設計等多種數據挖掘綜合解決方案。

一體化實驗室

? 實驗室信息管理

? 電子實驗記錄本/SOP執行

? 試劑耗材管理

? 儀器管理

? 數據管理

06

部分產品

量化材料類

? Crystal:固體化學和物理性質計算軟件

? Diamond:晶體結構數據可視化分析

?Endeavour:強大的求解晶體結構的軟件

? Molpro:高精度量化軟件

? Molcas:多參考態量軟件

? Turbomole:快速穩定量化軟件

?TeraChem:GPU上運行的量化計算軟件

? Spartan:分子計算建模軟件

數據分析類

? GelComparll:凝膠電泳圖譜分析軟件

? SimaPro:生命周期評估軟件

? Unscrambler:完整多變量數據分析和實驗設計軟件

? CSDS:劍橋晶體結構數據庫

? lCDD:國際衍射數據中心數據庫

? ICSD:無機晶體結構數據庫

? Pearson’s CD:晶體數據庫

07

公司簡介

北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是國內領先的分子模擬及虛擬仿真綜合解決方案提供商。

北京泰科博思科技有限公司與國際領先的模擬軟件廠商、開發團隊深入合作,為高校、科研院所和企業在材料、化工、藥物、生命科學、環境、人工智能及數據挖掘、虛擬仿真教學等領域提供專業的整體解決方案。用戶根據需要在我們的平臺上高效的進行各種模擬實驗,指導實際的生產設計。

北京泰科博思科技有限公司擁有一支一流的技術服務團隊和資深的專家咨詢團隊,以客戶真正需求出發,服務客戶,為客戶創造價值。我們秉承“職業、敬業、擔當、拼搏、合作”的企業精神,致力于用國際領先的軟件產品和專業全面的技術支持服務,成為客戶可信賴的合作伙伴。

2023年第8期應用實例賞析-01

標簽:

上一篇:
下一篇: