商傳媒|葉安庭/綜合外電報導
美國奧勒岡大學(University of Oregon)的研究團隊開發出一款新型人工智慧(AI)模型,能夠解讀DNA序列,以重建物種的祖源,此項技術有望大幅加速生物演化研究。
這項研究的成果在於,該AI模型透過分析基因編碼中的突變,追溯基因的共同祖先。領導這項研究的Kevin Korfmann表示,他們無法重複演化過程,因此建立模擬是關鍵工作流程之一。這些模擬會模仿演化過程,產生的結果則用來訓練他們的深度學習模型。
該模型採用了GPT-2這類較早期的機器學習架構,並透過細菌、齧齒動物、蚊子及靈長類等多種物種的基因演化模擬進行訓練。在測試中,這款AI模型的表現與傳統統計方法旗鼓相當,但在處理速度上展現顯著優勢。傳統的數學方法可能需要數小時甚至數天才能解碼單一蚊子染色體,而新型AI工具僅需數分鐘即可完成。
奧勒岡大學生物學教授安德魯·柯恩(Andrew Kern)指出,生成式AI及其底層架構的進步,在聊天機器人以外的許多領域都具有潛在應用價值。Kevin Korfmann解釋,與經典的推論方法相比,AI工具不需逐一推論每個突變,而是直接讀取模式,因為所有耗時的統計工作已在訓練階段預先完成,從而規避了瓶頸。
此AI工具的應用潛力廣泛,例如能協助科學家判斷物種何時發展出特定性狀,或疾病抗性基因何時出現。以蚊子對殺蟲劑的抗性為例,這是防治瘧疾傳播的一大挑戰。安德魯·柯恩提到,現在可以利用AI模型,探究這些抗性基因在族群中何時產生,進而了解這種瘧疾關鍵載體的演化史。
該模型還能處理不完整的DNA資料集,這對於研究人員來說是常見的難題。Kevin Korfmann表示,機器學習領域有許多尚未應用於生物學的技術,還有大量轉化工作要做,才能讓這些新穎演算法在生物學中發揮作用。研究團隊計畫未來利用機器學習,建構跨多個譜系的完整系譜樹。








