Evo: AI 模型精確解讀與生成基因序列
November 20, 2024
位於 Arc 研究所的科學家們推出了 Evo,這是一個突破性的人工智能(AI)模型,訓練於 270 萬微生物基因組。Evo 代表了 AI 與遺傳學交匯處的一個重大進展,結合了解讀與生成基因序列的無與倫比的精確性。
Evo 的運作原理
與傳統的文本訓練 AI 語言模型不同,Evo 利用 DNA、RNA 和蛋白質序列來同時學習和預測基因模式。這種創新的方法模仿了大型語言模型如 ChatGPT 的結構,但其訓練內容涵蓋了基因代碼的複雜性,而非人類語言。
Evo 的主要特點包括:
- 生物大分子的整合理解: Evo 能夠跨多種生物數據類型學習模式,使其能够預測 DNA 變化的影響並設計新的基因序列。
- 新基因設計: Evo 已經設計出功能性的基因編輯工具,為合成生物學的突破鋪平道路。
- 基因組長度創作: Evo 生成超過 100 萬個鹼基對的新型基因組長度序列。雖然這些序列尚無法形成可行的生物體,但它們展示了該 AI 處理大量基因數據的能力。
安全優先
出於倫理和安全考量,研究人員故意將人類影響的病毒基因組排除在 Evo 的訓練數據之外。這一預防措施旨在減少潛在的濫用風險,並強調在遺傳工程等敏感領域開發強大 AI 工具的責任。
Evo 的重要性
Evo 能力的影響深遠:
- 加速研究: Evo 可以大幅縮短分析基因數據所需的時間,增進對疾病和生物系統的理解。
- 藥物開發: 通過設計新蛋白質,Evo 可能徹底改變治療開發,包括罕見疾病的治療。
- 疾病突變預測: 預測基因突變如何影響疾病有助於開發預防策略。
- 合成生物學: Evo 創造基因藍圖的能力可能為生物修復、農業等合成生物體的應用開啟大門。
倫理考量
雖然潛在的好處非同凡響,但 Evo 的能力也引發了有關倫理使用和社會影響的嚴重問題。「寫遺傳代碼如同寫電子郵件一般容易」的能力如果未得到妥善監管,可能會導致濫用或意想不到的後果。與所有變革性技術一樣,挑戰在於最大化利益的同時最小化風險。
未來展望
Evo 仍處於早期階段,研究人員預計隨著該模型的演變將進行重大改進。除了微生物基因組外,Evo 可能擴展到遺傳學的其他領域,進一步模糊了人工智能與生物智能之間的界線。
隨著社會應對「AI 為 DNA」的影響,Evo 彰顯了開創性創新所帶來的承諾與責任。
欲了解更多詳情,請訪問發表於 Science 的原始研究: https://www.science.org/doi/10.1126/science.ado9336