
Google DeepMind 宣佈釋出 AlphaGenome,這是一款全新的 AI 模型,用於預測遺傳變異如何影響整個基因組的基因調控。它在單一的通用架構中,成功結合了長程式列上下文與鹼基對級別的高解析度,是計算基因組學領域的一大重要進步。
AlphaGenome 能夠一次性處理多達 100 萬個 DNA 鹼基對。它還能針對數千種分子模態輸出高解析度預測,涵蓋了基因表達、染色質可及性、轉錄起始位點、RNA 剪接以及蛋白質結合等多個方面。藉助該模型,研究人員可以評估常見及罕見變異所造成的影響,其評估範圍不僅包括蛋白質編碼區,也涵蓋了更為複雜、占人類基因組 98% 的非編碼調控區。
在技術方面,AlphaGenome 結合了兩種關鍵技術。它利用卷積神經網路來檢測區域性序列基序,並藉助 Transformer 來建模長程相互作用。模型的訓練資料來源自 ENCODE、GTEx、4D Nucleome 和 FANTOM5 的豐富多組學資料集。該架構的效能已達到業界頂尖水準,在 26 項變異效應預測基準中,有 24 項的表現都超越了任務專屬模型。
一個顯著的創新是 AlphaGenome 能夠直接建模 RNA 剪接點,這一特性對於理解許多由剪接錯誤引起的遺傳性疾病至關重要。該模型透過對比突變與參考序列,能夠量化變異在各類組織與細胞中的調控影響,為研究疾病相關位點和解讀全基因組關聯研究(GWAS)提供了關鍵手段。
訓練效率也得到了提升:得益於最佳化的架構和資料流程,完整的 AlphaGenome 模型僅用 4 小時就在 TPU 上完成了訓練,所用的計算預算僅為 DeepMind 早期模型 Enformer 的一半。
該模型已透過 AlphaGenome API 面向非商業性研究開放,科研人員無需整合不同的工具或模型,即可大規模地生成功能性假設。此外,DeepMind 也已表示,計劃將該模型進一步擴充套件,以應用於新的物種、任務及精細化的臨床場景。
此次釋出也引發了關於 AI 在醫療領域應用的更廣泛討論。AI 對齊研究員 Graevka Suvorov 評論稱,醫療 AI 的發展前沿不應僅侷限於診斷的準確性,更關鍵的在於其如何影響患者接收資訊後的心理狀態。他指出:
AI 若想在醫療領域實現質的飛躍,就必須從一個“影像分析工具”進化為一個懂得如何與“人”溝通的“夥伴”,能夠以富有同理心和清晰上下文的方式傳遞診斷資訊,避免技術給患者帶來不必要的心理負擔。
AlphaGenome 將該領域向這一願景又推進了一步,它讓對基因組的解讀更深入、更準確,併為在序列層面理解生物學提供了一個統一的模型。
原文連結:
https://www.infoq.com/news/2025/07/deepmind-alpha-genome/
宣告:本文由 InfoQ 翻譯,未經許可禁止轉載。
點選底部閱讀原文訪問 InfoQ 官網,獲取更多精彩內容!
