藉由整合不同機轉的電腦預測模型提升化合物毒性預測能力

實驗方法為化合物毒性評估的標準方法,然而在藥物開發與化合物管理上,當大量的化合物需要評估時,執行毒性評估就須花費大量的時間、經費與人力。近來有許多研究紛紛以統計學習或人工智慧(AI)方法分析過去實驗產生的化合物與毒性反應資料,找出蘊藏在資料中的樣式並建立電腦預測模型協助毒性預測。預先將化合物進行毒性排序再以實驗驗證,能加速篩選低毒性化合物進行後續藥物開發或是協助毒性化合物管理。然而,由於化合物毒性資料不如目前人工智慧領域中最普遍應用的影像與文字資料來的充沛,因此在僅有少量化合物毒性資料之下建立的電腦模型多半僅能預測部分機轉或僅適用於少數化合物。對於複雜機轉的毒性終點的評估如化學致癌性與發育及生殖毒性等,以化學致癌性為例,目前已有11個致癌關鍵特徵被提出,且每個關鍵特徵個別具有複雜的路徑與基因參與其中,採用上述單一機轉的電腦模型明顯的並無法達到全面性的毒性預測。

為了解決目前複雜機轉毒性預測的難題,本院生技與藥物研究所童俊維研究員團隊與本院國家環境醫學研究所林嬪嬪研究員合作,以證據權衡(weight-of-evidence)為概念整合了三大類不同機轉的電腦模型,包括以毒性相關化合物結構特徵建立的結構警示(structural alerts)、以統計學習或人工智慧方法建立的定量構效關係預測模型(quantitative structure-activity relationship),以及與基於基因交互作用及相關毒性推論的計算毒理基因體學模型(in silico toxicogenomics)開發了證據權衡電腦預測模式。研究團隊分別以基因演算法(genetic algorithm)與隨機森林演算法(random forest)整合上述三大類電腦模型,針對化學致癌性與發育及生殖毒性建立預測模型結果發現,相較於單一電腦預測模型,整合不同機轉的電腦預測模型除了能大幅提升複雜毒性的預測準確度外,亦能大幅提升適用的化合物數量。此外,該演算法亦能分析各種不同類型預測模型對於預測特定毒性終點的相對重要性,提供可解讀的預測。大幅提升後的化學致癌性與發育及生殖毒性電腦預測模型已被應用於分析食品接觸物質的相關毒性,未來將能應用於各種不同的化合物,協助藥物設計與化合物毒性管理。相關成果已發表於Archives of Toxicology (2020 Feb;94(2):485-494) 及Food and Chemical Toxicology  (2022 Jan 1;160:112802) 期刊中。

圖:(a)相較於個別模型,基因演算法的證據權衡模型對於預測發育及生殖毒性最多能提升20%左右的AUC (Area Under a Receiver Operating Characteristic Curve) 準確度。(b)相較於個別模型,隨機森林演算法的證據權衡模型對於預測化學致癌性最多能提升30%左右的AUC準確度;(c)而適用化合物比例更是從20%左右大幅提升至100%。

文/圖:生技與藥物研究所童俊維研究員

Comments are closed.