鑑往知來—運用機器學習建立登革熱重症預測模型

隨著人工智慧技術發展及電腦效能的提升,促進及活化大數據資料的分析及運用已在眾多專業領域及生活層面上,促成革命性的影響。機器學習(machine learning)是人工智慧的分支,機器在演算法、分析及反覆測試大量資料的過程中,學習資料的關聯性、規律或模式,針對鎖定目標建構有效的分析或預測模型;未來,便可應用建構出的模型協助判斷。在醫藥衛生領域上,機器學習結合醫學影像、醫療檢查項目、實驗室檢驗結果、基因體序列等大數據資料已廣泛地應用於癌症、神經系統、免疫系統、消化系統及傳染性疾病等,協助找出病徵、診斷疾病、評估住院風險及預後。

世界衛生組織將登革熱列為2019年全球十大健康威脅之一,確診病例在近二十年間大量增加,超過一百個國家為登革熱地方性流行區域,其中約百分之七十發生在亞洲。研究顯示,將近百分之二十的登革熱重症會導致患者死亡,因此早期診斷及評估將有助於降低重症及死亡率。台灣環境適合會傳播登革病毒的病媒蚊孳生,2015年南台灣即爆發了第二型登革病毒大流行,當年度統計有43,423位本土確診病例(造成228例死亡),是自1981年以來,年度確診病例數最多的。也因當時的嚴峻疫情,醫療及衛生單位收集了在檢驗、診斷、病媒蚊、流行區域等各方面大量的資料,以期未來應用於協助臨床診斷,達到降低重症和死亡率的目標。

本院國家蚊媒傳染病防治研究中心黃聖文專案助研究員與國立成功大學醫學院及成大醫院病理部臨床病毒實驗室合作,運用機器學習分析患者資料、病毒抗原及抗體快篩的結果,並評估和驗證多種機器學習方法,建構登革熱重症的預測模型。其中,以人工神經網路方法所建立之模型預測效果最佳,此模型的優勢是「臨床檢驗的數據來源是能夠短時間內判斷結果的快篩方法」,因此有望在感染初期即時協助評估患者演變成重症的可能性。相關成果已發表於PLOS Neglected Tropical Diseases 期刊。

圖:將大量來自患者的醫學檢查數據,運用機器學習建構模型協助臨床診斷或疾病分類

為了進一步發掘是否有其他因子也可以應用於建立登革熱重症的預測,黃博士研究團隊利用次世代定序技術獲得登革病毒株之基因體序列分析後發現,病毒基因體存在大量的序列變異。接著利用機器學習分析這些大數據,找出與登革熱重症具有相關性的變異,而高度相關性的變異所建構出之模型亦可有效的判別登革熱重症患者,證明了病毒基因變異用於預測登革熱重症的可能性。儘管由於目前大量基因體定序仍較耗時,此技術暫時難以廣泛應用於登革熱的早期評估,待未來開發出更快速的定序技術時,這樣的機器學習模型亦將可能成為幫助感染控制的工具。相關成果已發表於Frontiers in Cellular and Infection Microbiology期刊。

黃博士表示,我們正處在突破領域疆界、技術整合運用的第四次工業革命時代,學術研究、臨床醫學、公共衛生及生技醫藥產業不斷快速且大量地積累資料,活用這些寶貴的大數據並應用人工智慧技術,以科技結合防疫,相信可以開發更多創新工具,攜手走向全人類更健康的未來。

論文發表

  1. Huang S-W*, Tsai H-P, Hung S-J, Ko W-C, and Wang J-R. (2020) Assessing the risk of dengue severity using demographic information and laboratory test results with machine learning. PLoS Negl Trop Dis 14(12): e0008960. doi: 1371/journal.pntd.0008960.
  2. Hung S-J, Tsai H-P, Wang Y-F, Ko W-C, Wang J-R and Huang S-W*. (2022) Assessment of the Risk of Severe Dengue Using Intrahost Viral Population in Dengue Virus Serotype 2 Patients via Machine Learning. Cell. Infect. Microbiol. 12:831281. doi: 10.3389/fcimb.2022.831281.

文/圖:國家蚊媒傳染病防治研究中心洪素珍研究助理、黃聖文專案助研究員

Comments are closed.