日韩成人黄色,透逼一级毛片,狠狠躁天天躁中文字幕,久久久久久亚洲精品不卡,在线看国产美女毛片2019,黄片www.www,一级黄色毛a视频直播

基于聯(lián)合分子表征的化合物ADMET性質預測方法及電子設備與流程

文檔序號:42018048發(fā)布日期:2025-05-30 17:02閱讀:3來源:國知局

本技術涉及人工智能藥物研發(fā),具體涉及一種基于聯(lián)合分子表征的化合物admet性質預測方法及電子設備。


背景技術:

1、在藥物發(fā)現與開發(fā)過程中,admet(藥物的吸收、分配、代謝、排泄和毒性)性質對新藥的成功至關重要。藥物的吸收與分配影響其在體內的生物利用度,而代謝與排泄則決定了藥物在體內的持續(xù)時間與安全性,毒性評估則是確保新藥安全性的重要環(huán)節(jié)。因此,有效的admet性質預測可以輔助篩選具有潛力的化合物,節(jié)省時間和資源。通過準確的admet預測,研究人員可以提高候選藥物的成功率,減少失敗的風險。

2、近年來,隨著深度學習技術的迅速發(fā)展,通過使用深度神經網絡能夠構建admet預測模型。這些模型可以利用大規(guī)模的公開數據集進行訓練,從而捕捉化合物的潛在特征。如現有專利文獻cn?118522372?a公開了一種基于融合指紋的分子admet性質預測方法及模型,分別通過三部分架構從提取小分子中的性質信息、提取小分子中的語義信息并進行融合得到分子表征,再融合ecfp(擴展連接指紋)豐富特征,然后通過上述特征訓練得到分子admet性質預測模型。上述文獻中采用分子的smiles(簡化分子線性輸入規(guī)范)字符串、inchi(國際化合物標識)字符串表征,上述字符串表征方式無法完全捕捉分子的三維結構和空間關系,可能導致重要信息的丟失,并且結構相似但字符串表示不同的分子可能被錯誤分類。雖然,上述方案融合了ecfp,但是其僅是通過對分子結構進行特征編碼而生成的二進制向量,能夠在一定程度上捕捉分子的化學特性,無法充分捕捉分子的復雜結構信息,且無法適應新出現的化學特性。因此,現有技術中用于訓練admet預測模型時采用的藥物分子表征可能會丟失分子的重要特征從而影響模型訓練結果,進而影響admet預測的準確性。


技術實現思路

1、本技術要解決的技術問題在于現有技術中藥物admet預測模型訓練時采用的藥物分子表征不夠全面,由此訓練得到的admet預測模型對藥物進行admet預測時得到的結果準確性差,進而提供一種基于聯(lián)合分子表征的化合物admet性質預測方法及電子設備。

2、第一方面,本技術技術方案提供一種基于聯(lián)合分子表征的化合物admet性質預測方法,包括:

3、獲取待預測化合物分子的分子圖和smiles序列;

4、將所述分子圖處理為圖特征向量,將所述smiles序列處理為序列全局特征向量和分子指紋向量;

5、將所述圖特征向量、所述序列全局特征向量和所述分子指紋向量拼接后得到聯(lián)合分子表征;

6、將所述聯(lián)合分子表征輸入至admet性質預測模型,所述admet性質預測模型輸出預測到的所述待預測化合物分子對應的admet性質;其中,所述admet性質預測模型為深度學習算法訓練得到。

7、一些方案中所述的基于聯(lián)合分子表征的化合物admet性質預測方法,所述將所述分子圖處理為圖特征向量,包括:

8、對所述分子圖進行圖特征編碼得到初始特征向量;所述圖特征編碼包括:將所述分子圖中的原子作為點特征,將所述分子圖中的化學鍵作為邊特征;

9、將所述初始特征向量輸入至圖卷積神經網絡模型中,分別對所述點特征和所述邊特征進行傳遞、更新和迭代運算,直到迭代次數達到設定迭代次數;

10、將所述圖卷積神經網絡模型輸出的更新后點特征和更新后邊特征重新組合得到所述圖特征向量。

11、一些方案中所述的基于聯(lián)合分子表征的化合物admet性質預測方法,將所述smiles序列處理為序列全局特征向量,包括:

12、將所述smiles序列輸入至語言學習模型中,對所述smiles序列進行分詞、編碼、向量映射和迭代運算,直到迭代次數達到設定迭代次數;

13、以最后一次迭代過程中所述向量映射得到的輸出向量作為所述序列全局特征向量。

14、一些方案中所述的基于聯(lián)合分子表征的化合物admet性質預測方法,將所述smiles序列處理為分子指紋向量,包括:

15、將所述smiles序列輸入至rdkit工具,提取所述smiles序列對應的分子指紋;其中,rdkit工具是一個用于化學信息學的開源工具包,基于對化合物二維和三維分子操作,可利用機器學習方法進行化合物描述符生成,分子指紋生成,化合物結構相似性計算,二維和三維分子展示等。

16、對所述分子指紋進行歸一化處理得到所述分子指紋向量。

17、一些方案中所述的基于聯(lián)合分子表征的化合物admet性質預測方法,所述將所述圖特征向量、所述序列全局特征向量和所述分子指紋向量拼接后得到聯(lián)合分子表征,包括:

18、對同一待預測化合物分子對應的所述圖特征向量、所述序列全局特征向量和所述分子指紋向量按順序排列相接后得到的向量作為所述同一待預測化合物分子的所述聯(lián)合分子表征。

19、一些方案中所述的基于聯(lián)合分子表征的化合物admet性質預測方法,所述admet性質預測模型的訓練包括:

20、獲取化合物數據集,將所述化合物數據集中的化合物進行標準化處理和信息標注后得到樣本化合物數據集,所述信息標注包括化合物屬性以及所述化合物屬性的屬性值;

21、獲取樣本化合物數據集中各樣本化合物的聯(lián)合分子表征以及對應的admet性質;所述聯(lián)合分子表征包括樣本化合物分子的圖特征向量、樣本化合物分子的序列全局特征向量和樣本化合物分子的分子指紋向量;

22、利用所述化合物樣本的聯(lián)合分子表征及admet性質對深度學習算法進行訓練,得到admet性質預測模型;所述深度學習算法包括前饋神經網絡。

23、一些方案中所述的基于聯(lián)合分子表征的化合物admet性質預測方法,所述利用所述化合物樣本的聯(lián)合分子表征及admet性質對深度學習算法進行訓練,得到admet性質預測模型,包括:

24、根據所述化合物樣本的信息標注確定所述樣本化合物的任務類型;

25、根據所述樣本化合物的任務類型確定所述前饋神經網絡訓練過程中的損失函數和評判指標。

26、第二方面,本技術技術方案提供一種計算機可讀存儲介質,所述存儲介質中存儲有程序信息,計算機讀取所述程序信息后執(zhí)行第一方面任一項技術方案所述的基于聯(lián)合分子表征的化合物admet性質預測方法的步驟。

27、第三方面,本技術技術方案提供一種計算機程序產品,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現第一方面任一項技術方案所述的基于聯(lián)合分子表征的化合物admet性質預測方法的步驟。

28、第四方面,本技術技術方案提供一種電子設備,包括存儲器、處理器及存儲在所述存儲器上的計算機程序,所述處理器執(zhí)行所述計算機程序以實現第一方面任一項技術方案所述的基于聯(lián)合分子表征的化合物admet性質預測方法的步驟。

29、本技術提供的上述技術方案,相比于現有技術,具有如下技術效果:

30、本技術提供的基于聯(lián)合分子表征的化合物admet性質預測方法及電子設備,通過獲取待預測化合物分子的分子圖和smiles序列,將分子圖、smiles序列擴展為圖特征向量、序列全局特征向量和分子指紋向量,然后將三個向量進行拼接得到聯(lián)合分子表征。預先利用聯(lián)合分子表征對深度學習算法得到admet性質預測模型,因此,將待預測化合物分子的聯(lián)合分子表征輸入到admet性質預測模型即可得到待預測化合物分子對應的admet性質。通過本技術的上述方案,利用分子圖對應的圖特征向量、smiles序列得到的序列全局特征向量和分子指紋向量實現admet性質的預測。通過圖特征向量能夠充分捕獲分子圖中節(jié)點之間的關系和特征,通過序列全局特征向量關注smiles序列中不同部分之間的多種關系,避免在處理長序列時丟失重要信息,進而捕捉到smiles序列豐富的上下文信息,通過分子指紋向量能夠涵蓋分子從簡單的物理化學性質到復雜的分子描述符的特征,彌補前兩種向量特征中難以學習到的結構信息,即,本方案通過待預測化合物分子的三種不同類型的分子特征進行融合,有效減少特征缺失,提高admet性質預測結果的準確性和穩(wěn)定性。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1