AI蛋白質設計前沿教程,AAAI’25三大機構攜手4小時全面剖析

加拿大魁北克省人工智慧研究所Mila 投稿

量子位 | 公眾號 QbitAI
精準預測和設計蛋白質的序列、結構及模擬其動態變化,一直是科學界的重大挑戰。
在即將舉行的AAAI 2025會議上,加拿大魁北克省人工智慧研究所Mila、美國東北大學和MIT的學者將組織一場主題為“人工智慧在蛋白質設計中的應用”的教程
(文末附教程直通車)
綜觀當下,AI與生命科學深度融合背景下,蛋白質研究正經歷前所未有的AI驅動變革。
作為生命活動的核心,蛋白質在細胞結構構建、物質運輸和催化化學反應中扮演著關鍵角色。如今,AI技術的介入,以前所未有的速度和力度,重塑了蛋白質研究的格局,帶來了無限可能。
這不僅加速了新藥研發和生物技術創新,也為解決環境和工業領域的挑戰提供了新的工具。
本次教程將全面回顧AI在蛋白質預測與設計領域的最新進展,探討當前的研究成果和未來的發展方向
同時,教程將展望AI在蛋白質設計中的未來趨勢,討論可能面臨的挑戰和機遇
無論是蛋白質序列表示學習,還是結構研究,AI都展現出巨大潛力。
本次教程中,主辦方將詳細介紹AI在蛋白質序列、結構和功能預測與設計中的應用方法。透過生成模型進行蛋白質設計,甚至可以創造具有特定功能的新型蛋白質。
教程希望參與者具備機器學習的基礎知識,但即使缺乏計算生物學或生物資訊學經驗也無妨,課程將提供入門介紹,幫助大家瞭解這一交叉學科領域。
教程定於美東時間2月26日上午8:30至中午12:30在賓夕法尼亞州費城會議中心117號房間舉行

教程大綱:多維度解鎖蛋白質設計奧秘

本次教程將從多個維度深入解析 AI 蛋白質設計領域的關鍵問題、前沿方法和研究趨勢,具體內容如下:

(一)序章:前沿洞察與基礎知識

本部分將重點介紹AI在蛋白質研究領域取得的重大突破
從早期探索到最新成果,AI 在蛋白質研究中的每一步進展都意義深遠。
同時,將對蛋白質的基本結構、功能及其在生命活動中的重要角色進行科普講解。
最後,討論如何對蛋白質資料進行學習,為後續深入研究奠定堅實基礎。

(二)蛋白質表示學習:挖掘資料的潛在價值

本部分是教程的核心之一,將詳細介紹多種蛋白質表示學習的方法。
在序列表示學習中,將深入探討自迴歸語言模型、掩碼語言模型和擴散語言模型,這些模型以不同方式對蛋白質序列進行編碼,提取關鍵資訊。
結構表示學習方面,幾何深度學習為研究蛋白質的幾何結構提供了新視角;GVP、GearNet等蛋白質結構編碼器,以及多種結構預訓練演算法,從不同角度對蛋白質結構進行學習和最佳化。
多模態表示學習結合了序列、結構、功能和文字等多種資訊,模型如ESM-GearNet、SaProt、DPLM-2、ESM3、ProtST等,展示了多模態融合在蛋白質研究中的強大能力。
最後,將介紹這些方法在蛋白質理解任務、蛋白質適應性預測和抗體親和力最佳化等方面的應用。

(三)蛋白質結構和動力學預測,探索分子動態奧秘

蛋白質結構和動態預測是研究中的核心問題之一。
本部分將介紹單鏈摺疊(如 AlphaFold2、ESMFold)、側鏈預測(如 AttnPacker、DiffPack)和複合物預測(如 AlphaFold-Multimer、AlphaFold3)等前沿方法。
在蛋白質構象取樣方面,與會人員將探討玻爾茲曼生成器、基於粗粒度的方法、基於剛性框架的方法以及蛋白質結構語言模型。
在分子動力學(MD)軌跡模擬中,將介紹神經模擬器、條件轉移運算元和軌跡生成器等前沿方法。

(四) 蛋白質設計:開啟新型蛋白質創造之門

在序列設計方面,主辦方將介紹無條件序列生成(如ProGen)和逆折疊(如ESM-IF、ProteinMPNN)的方法。
結構設計中,FrameDiff、FrameFlow、Genie2、Chroma、RFDiffusion、FoldFlow、FoldFlow-2等模型將是討論的重點。
序列-結構協同設計部分,ProtSeed、ProteinGenerator、MultiFlow、Protpardelle、DPLM-2 等模型將展示如何同時最佳化蛋白質的序列和結構。
抗體設計將聚焦於RefineGNN、AbX等方法。

(五)總結與展望:共繪蛋白質設計的未來藍圖

這一部分將系統回顧整個教程的核心內容,梳理人工智慧在蛋白質設計領域的最新進展與取得的成果。
此外,主辦方還將對該領域未來可能的發展趨勢進行展望,深入探討前沿研究中可能遇到的挑戰及潛在的機遇。
最後,教程特別設定了互動問答環節,以進一步增進交流、啟發思考,共同探索蛋白質設計研究的新方向。

教程背後組織團隊

本次教程由加拿大Mila教授唐建,和美國東北大學教授金汶功團隊聯合組織。
唐建博士是加拿大魁北克省人工智慧研究中心Mila副教授,該中心由圖靈獎獲得者、“AI之父” Yoshua Bengio 創立。
他還是加拿大CIFAR AI講席教授、北京百奧幾何公司創始人兼執行長。
此外,唐建是圖表示學習領域的知名學者,在深度生成模型、圖機器學習及其藥物發現應用方面成果顯著。
他曾發表圖表示學習領域的經典論文LINE(單篇引用次數超過6000次),並將這些技術開創性地應用於藥物發現領域,發表了一系列極具影響力的代表作,包括最早用於分子圖的預訓練演算法InfoGraph、第一個用於分子三維結構生成的擴散生成模型ConfGF和GeoDiff,以及最早基於蛋白質三維結構的預訓練模型之一GearNet。
他還與英偉達、Intel、IBM 等機構共同開發了業內首個專門針對藥物與蛋白質的開源機器學習平臺TorchDrug和TorchProtein。相關研究發表於Nature、PNAS、Nature Communications、Nature Machine Intelligence、NeurIPS、ICML、ICLR等頂級會議與期刊。
同時,唐建還擔任 NeurIPS 和 ICML 的領域主席,以及機器學習領域著名期刊 Journal of Machine Learning Research (JMLR) 的執行編輯。
金汶功博士是美國東北大學Khoury計算機科學學院助理教授,同時擔任Broad Institute Eric and Wendy Schmidt 中心的訪問研究科學家。
他於MIT CSAIL獲得博士學位,導師為Regina Barzilay和Tommi Jaakkola。
在AI藥物發現領域的演算法創新方面,金汶功團隊等變神經網路、擴散模型等多個方向有所建樹,開發出RefineGNN、Mol2Image等模型與演算法,成果發表於NeurIPS、ICLR等頂會。
在藥物發現方面,團隊成功發現了新型抗生素,成果發表在Cell和 Nature等。
在化學工程領域,團隊還助力實現自動化化學合成實驗室,其開發的化學反應結果預測演算法精度達到化學家級別,相關成果發表於NeurIPS和Chemical Science等期刊。

教程連結:

https://deepgraphlearning.github.io/ProteinTutorial_AAAI2025/

—  —
學術投稿請於工作日發郵件到:
標題註明【投稿】,告訴我們:
你是誰,從哪來,投稿內容
附上論文/專案主頁連結,以及聯絡方式哦
我們會(儘量)及時回覆你
一鍵關注 👇 點亮星標
科技前沿進展每日見
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!

相關文章