對談Chai-2核心科學家喬卓然:抗體生成成功率提升百倍,分子生成平臺是藥物研發的GPU|BestMinds

嘉賓:喬卓然
訪談:penny、cage
AlphaFold 3 是生命科學領域中“foundation model 時刻”的代表,但蛋白質結構預測只是科研閉環的起點,只有當模型的能力從“預測結構”邁向“直接生成分子”,新藥開發效率才能實現真正的指數級提升。
今年 6 月 30 日,OpenAI 投資的 Chai Discovery 新發布的 Chai-2 是目前最接近這個目標的 AI-native 模型之一。在無任何訓練樣本的前提下,它能設計出具備 binding 活性的抗體,成功率高達 16%,不僅趕上了傳統噬菌體篩選的效率,還具備更強的拓展性——幾小時內就能針對任意靶點生成可實驗驗證的候選分子。
我們認為,Chai 不是在“輔助製藥”,而是在構建“AI-native 製藥”平臺,把科學問題轉化成工程問題。
為了更好地瞭解 AI 是如何推動藥物發現的,我們訪談了 Chai Discovery 的創始科學家喬卓然,探討 Chai-2 背後的設計理念與行業意義:
• Diffusion Model 給藥物預測領域帶來了建模範式的根本改變,AlphaFold 2 在模型架構上掃平了很多障礙;
• Chai-2 相較於 Chai-1 最大的進步是從預測過渡到了生成,能夠在零樣本條件下直接生成具有生物活性的抗體,抗體設計將從樣本依賴轉向結構引導的泛化正規化;
• 結構預測是模型最基礎的能力,很大程度上決定了模型的能力上限;
• 長遠來看,分子生成平臺對藥物研發的作用就像 GPU 對 AI 的作用一樣,AI-native 平臺將成為製藥行業的新生產力基礎設施;
• 未來,合成數據會是連線實驗資料和生物學理論的“第三模態”,AI for Science 公司在商業模式上會出現“平臺即 IP”。
……
 本期內容音訊版即將上線,歡迎關注「海外獨角獸」小宇宙第一時間收聽。
💡 目錄 💡
  01 Diffusion Model 帶來了建模範式的根本改變
   02結構設計是結構預測的逆問題
   03 Chai-2 將藥物開發週期從數月縮短到兩週
   04 結構預測能力決定模型上限
   05 分子生成平臺是藥物研發的 GPU
   06 Zero-shot 更接近藥物設計的本質
   07 未來的商業模式是平臺即 IP
01.
Diffusion Model 帶來了建模範式的根本改變
 海外獨角獸先請卓然做個自我介紹,你是怎麼進入 AI4S 這個研究領域的?
喬卓然:大家好我是喬卓然,擁有物理和計算化學的複合學術背景。計算化學透過對物理基本定律的理解,藉助計算來研究現實世界中的化學構成。我在 Caltech 獲得了化學博士學位。
博士期間我的主要研究興趣集中在如何運用資料驅動的方法改進分子模擬,以顯著提升計算效率。傳統的分子模擬研究依託於兩個關鍵支柱:
1. 量子化學:透過電子結構計算,我們能夠獲得一個分子的能量,也就是獲得了分子構型與物理能量之間的對映關係。
2.在已知能量的 landscape 進行好的取樣:研究化學反應,以及不同分子的物質形態(氣態、液態等)之間的相變都依賴於這個取樣方法和一些統計力學。
博士期間我首先做的是用資料驅動的方法加速量子化學,當時將求解一個分子能量的過程提高了 1000 倍。
後來,我的研究興趣逐漸聚焦到生物分子的結構預測,一方面,生物分子的結構與人類健康密切相關,另一方面,sampling 的問題是我從本科階段起就持續關注的問題。
例如,當我們研究一個蛋白質從非摺疊態過渡到摺疊態的過程時,該過程可能發生在毫秒級,甚至秒級。透過傳統分子動力學(molecular dynamics, MD)研究蛋白質目前最領先的研究團隊之一是 D. E. Shaw Research,但即便如此,計算成本仍然是天文數字。
為了解決這個問題,D. E. Shaw 團隊用 ASIC (專用積體電路)打造了一些專有的超級計算機,他們能夠實現的模擬尺度是每天生成一微秒的模擬軌跡。這可能已經達到了人類透過物理計算手段進行取樣的極限。
但是人類基因組中含有超過 2 萬個以上的蛋白質,如果我們希望研究這些蛋白的成藥機制及作用機制,這已經遠遠超出了分子動力學在傳統立場下所能求解的能力上限。
 海外獨角獸:當想要研究的分子數量從幾十個、幾百個,到上萬個時,你逐漸發現分子動力學或物理模擬的方法開始變得越來越不適用了?喬卓然:是的,但也不能說是完全失效,這些方法在早期確實取得了很多成功。但從實際的角度來看,如果想要把這些技術應用到藥物研發,比如研究蛋白質的功能、研究蛋白與藥物分子之間的相互作用機制等,這些方法仍然過於昂貴。
大概在 2021 年,有兩件事對我產生了深刻影響。
第一件事是 score-based generative modeling 的發展。當時 Yang Song 團隊發現可以透過一個隨機微分方程(stochastic differential equation),從一個隨機的初始狀態出發去取樣新資料,把一個簡單的資料分佈逐步轉化成一個複雜的資料分佈。
Score-based generative modeling 是一種生成模型方法,核心思想是學習資料分佈的“score function”,即對數密度函式的梯度。與傳統的生成對抗網路或變分自編碼器不同,這種方法不直接生成樣本,而是透過一個隨機微分方程從噪聲出發,逐步將樣本轉化為資料分佈中的真實樣本。
Song Yang 團隊成果
他們當時主要研究的問題是影像生成,這一過程與統計力學和隨機熱力學中所採用的模擬方法是嚴格對應的,比如在一個隨機微分方程中,它包含一個漂移項和一個布朗運動的噪聲項,和分子模擬中的勢能函式以及熱浴是直接對應的。這種新的生成式建模方式是天然地適合處理複雜、高維的分子運動系統。
我們當時就意識到它可以直接從噪聲中生成新的樣本,天然地避免了需要長軌跡去模擬生成新樣本的過程,從而可以做到從一個隨機的初始猜測直接跳躍到一個結果。
以導航類比,傳統的導航方式是透過隨機遊走,在街區附近不斷地去探索,再到最終感興趣的目的地,而現在是能夠直接跳躍到目的地,這很大程度地改變了我們研究蛋白質和生物大分子的基本邏輯。
 海外獨角獸:大部分人沒有意識到影像領域中的 diffusion 和分子、蛋白質領域中的藥物發現之間還存在著聯絡。在藥物發現裡面,最終生成的分子結構對精確度要求應該更高,什麼機制可以確保生成的藥確實具有高精確性呢?
喬卓然:藥物研發還涉及很多後續驗證環節,比如在人體或動物模型中是否具有療效等。但我們當時所具體考慮的科學問題是生物分子的結構預測。
結構預測已經有很多的 ground truth 資料,就是 PDB(蛋白質結構資料庫),這個資料庫基於過去五十年結構生物學的實驗積累,包括 X 射線晶體學、冷凍電鏡等技術。它收錄了很多生物的蛋白質單體以及蛋白質與其他分子(如核酸、小分子)結合形成的複合物結構,因此每一個結構都包括所有原子的三維座標資訊。這些 ground truth 可以幫我們把科學問題轉化成機器學習問題,設計一個 loss function 去確認模型的預測是否完全正確。
PDB 蛋白質結構資料庫
但是當時最激動人心的還是 Diffusion Model 帶來了建模範式的根本改變。
我最開始接觸理論化學科研時的主要興趣是,透過統計方法去加速傳統分子動力學取樣,比如增強抽樣是基於取樣區域的重要性對能量面進行重加權,在充分探索後,再透過 reweighting 去建模原始的勢能和自由能面,但是有一個最大壁壘就是,它仍然預先假設人類對於一個分子體系所有能穩定存在的結構有基本瞭解。
這其實是傳統計算的一個困境,也就是說我們需要預先知道整個分子體系全域性所有能取樣的狀態,但實際上我們又需要從一個狀態出發,不帶偏見地充分去探索其他的狀態。現在有了生成模型,我們希望能夠一次性地生成具有代表性的結構樣本。
第二件事就是 AlphaFold 2 的出現,在模型架構上掃平了很多障礙
我們意識到可以透過一個非常高效的神經網路,以一個非常強大的 capacity 去表示這些分子的三維結構,然後把它從一維的序列表示對映到三維座標上。
AlphaFold 2 根據氨基酸序列預測蛋白質結構
雖然 AlphaFold 2 在很大程度上解決了“蛋白質如何摺疊”的問題,但計算化學研究者最更關注的還是蛋白質如何運動、如何與其他分子結合,以及這種結合如何進一步調控蛋白質的功能。
我們需要生成式模型,而生成式模型也在這個時候開始逐步成熟起來。雖然我可能比 AlphaFold 團隊更晚進入到這個領域,但也許在那個時間點,我比所有人都更加相信,diffusion structure prediction 和這些生成式模型探索分子生成的方式,會很大程度上改變未來進行計算化學研究乃至設計新藥的邏輯。
 海外獨角獸:Diffusion 讓你們看到了生成式建模這種全新正規化的出現,而 AlphaFold2 則帶來了結構預測領域的巨大變革。恰好這兩項幾乎同時發生,所以你很清晰地感受到一個新的機會正在出現。
喬卓然:2021 年,我逐漸把自己的研究方向轉到大分子的結構預測上,當時我和 Nvidia 的幾個合作者一起做了可能是最早的 co-folding structure prediction(共摺疊結構預測),叫 NeuralPLexer。
我們當時的想法就是:
1. 做全原子的結構預測;
2. 做通用模態,不管是蛋白還是小分子,都可以放在一個框架裡面去建模;
3. 能夠對整個構象分佈進行取樣,而不僅僅是單個結構。當小分子與蛋白結合時,會引發蛋白自身的構象變化,這些變化又可能進一步影響蛋白與其他訊號分子的結合及其功能,我們希望透過一個統一的結構預測框架來生成這些假設。
 海外獨角獸:全模態能力的出現主要是因為 AlphaFold 的出現嗎?還是說源於其他技術的出現?
喬卓然:主要還是因為通用的生成式建模手段,讓我們可以直接在每個原子的層面上建模座標。
比如 AlphaFold 2 仍然有一些對於分子內部組成規則的基本假設。以蛋白質為例,它被分成主鏈和側鏈,常見的天然氨基酸其實只有 20 種,這 20 種可以基於一些簡單規則來無失真壓縮成 tokens,比如對於每個主鏈骨架中的兩個碳原子和一個氮原子,可以簡化成一個三角形的框架,也可以把側鏈抽象成兩個二面角。
但是這樣的一種抽象手段並不適用於其他大部分的 building block,比如核酸有另外一套組成規則,而小分子是可以基於任何的一個化學分子圖去表示的。這就使得 AlphaFold 2 這種利用基於規則的抽象去訓練一個 deterministic regression model 的思路並不能直接擴充套件到更通用的分子模態上。
如果我們基於擴散模型和 geometric deep learning 做建模,可以實現從頭建模每一個原子在三維空間座標上的演化,然後透過一個基於隨機微分方程不斷地迭代更新座標,這是更直接通用的一套模擬手段。
 海外獨角獸:你從看到這個機會開始,就調整了自己的研究方向,後來你是怎麼加入 Chai 的?
喬卓然:我的第一個研究就是 AI 量子化學,很大程度上激發了我的 PhD 導師 Tom Miller 的創業熱情,他意識到這件事情不僅能夠在學術上提高計算的效率,也可以幫助工業界的不同團隊去研究化學反應,研究藥物靶標的作用機制。
Entos AI(現稱 Iambic Therapeutics)是一家 AI 驅動小分子藥物發現初創公司,依託自身專有的 OrbNet 平臺,將量子力學融入機器學習,加速預篩選化合物、提高準確性。Tom Miller 是創始人兼 CEO。
Tom Miller
我當時與 Iambic 的許多研究員合作,把我們開發的 AI 量子化學工具 OrbNet 從一個擁有一百萬引數的模型,提高到一個擁有一億引數的模型,從而提升效果,幫助幾個主要化工企業改良了一些催化劑。
後來,當我開始進入結構預測領域時,我意識到學術界面臨很多算力和工程能力上的壁壘,而結構預測用於複合物建模的基礎框架一旦建立,急需解決的關鍵問題就不僅僅是演算法層面的創新,而是模型和資料的 scaling。
比如怎麼能夠把 PDB 中每一個原子的資訊都利用起來,如何用更大的模型、更好的訓練和資料來進一步提高預測精度,從而在更多真實體系中達到接近實驗的精度水平。
相比在學術界繼續做演算法層面的早期探索,我更希望看到模型能力在真實場景中增長,所以我加入了 Iambic,我搭建的演算法團隊在不斷地做模型 scaling 和工程能力建設。
之後我們釋出了 NeuralPLexer2 和 NeuralPLexer3。在 NeuralPLexer2 中,我們第一次看到隨著算力地指數級提升,能夠精確求解的體系數目實現了線性提升,NeuralPLexer3 在此基礎上重寫了架構並且基於 flow matching 做了所有分子模態上的的 scaling,目前仍然是 state-of-the-art 的預測成功率,同時生成的小分子立體化學的錯誤率也顯著領先於其他方法。
NeuralPLexer2 和 NeuralPLexer3 是由 Caltech 的 Thomas F. Miller III 等人在內的研究團隊開發的一系列用於大規模分子結構預測和生成的深度學習模型,主要面向量子化學和計算分子科學等領域。這些模型在保留物理精度的同時,大幅提升了計算效率。
NeuralPLexer3
AlphaFold3 的釋出進一步驗證了我們思路的有效性。不只是 Iambic 團隊在進行 co-folding 方向的研究,Google DeepMind 等團隊也認識到 co-folding 作為一個新的正規化,會成為更通用且能產生新的 structural hypothesis 基本的邏輯。
AlphaFold 從 2 到 3 就是從確定性的 regression model 轉向了 diffusion-based,包括 embedding 模組大幅的簡化,以及不同分子型別 embedding 的通用化。
2024 年年底,我結識了 Chai 團隊。當時團隊中很多成員,包括我自己,都相信,無論是結構預測、親和力預測,還是分子性質預測,AI 正在改變傳統藥物設計閉環中的很多環節。在很多分子設計的過程中,有了 AI 模型的引導之後,它確實可以大大地加速。
但這些模型新湧現出來的能力是不是上限不止於此,是不是能夠帶來全新的分子設計機會,而不只是在我們人類專家設計的一個環節裡起到輔助作用?
於是我和很多 Chai 成員們產生了一個共同的想法:這些模型能不能本身成為一個有效的平臺,成為一個產生有臨床價值分子的一種新的工具和正規化?
因此,我決定加入 Chai,開始去思考能不能 AI native 地去做 Discovery,我願意把 Chai 定義成一個 AI native 的生物技術公司,而不只是說一家整合了 AI 功能的生物技術,或者說一家純 AI 公司。
 海外獨角獸:你加入 Chai 多久了?在這段時間裡,在這個團隊工作你有什麼感受?喬卓然:加入到現在有 7 個月了。Chai 是一個非常小而精簡的團隊,現在也只有 10 個成員,包括我在內有一半的成員之前都在 biotech 公司帶領過 AI 團隊,搭建過 foundation model。初始團隊成員一共貢獻了領域中 5 個較為重要的基礎模型,參與了大約 10 條已經進入或即將進入臨床階段的藥物管線研發。
如果要用一句話簡單概括 Chai 的團隊,我認為是具備第一性原理,即會從模型所具備的新能力出發,重新思考做藥以及搭建研發平臺的方式。
在此基礎上,團隊還具備非常強的產品意識,這是很難能可貴的,團隊會關注模型能力如何向生物醫藥研發的後續環節滲透,不僅僅是提升計算指標,而是去真正解決這個行業中的需求。
這些真正的需求並不侷限於醫藥研發管線中已明確的各個最佳化環節,我們更關注本質的問題,比如對一些更難成藥的生物學機制去針對性地設計分子,如何快速地將一款新藥真正交付到患者手中或醫療系統中。
最後,我們能夠做到快速地執行並且迭代,並在這個過程中不斷調整想法。這也保證我們在做出新的模型能力後可以擴大它的影響力,這也會讓整個行業去評估新技術的可能性。
02.
結構設計
是結構預測的逆問題
 海外獨角獸:Chai discovery 最近發了 Chai-2,是系列模型的第二代,做這一系列模型的出發點和目標是什麼?和 AlphaFold 系列模型會有什麼不同呢?
Chai-2 釋出
喬卓然:Chai Discovery 的模型是想要預測並且重程式設計所有生物學相關分子之間的相互作用。
預測就是從分子的序列和化學式出發,生成三維結構和統計分佈。重程式設計就是在一個活細胞之內,不同生物分子的蛋白質和 RNA 之間、蛋白和小分子之間的相互作用構造成了一個大尺度的互作網路,這個互作網路維護著細胞穩態。
絕大多數新藥研發都可以歸結於如何把一個病理性的互作網路透過化學的手段把它調控成一個正常的細胞狀態,如果我們想透過 AI foundation model 去做這件事情,就需要我們對互作網路有非常精細的理解,而且我們還需要在高質量互作網路預測的基礎上,具備生成新分子的能力。
AlphaFold 的成功之所以能產生巨大影響,獲得諾貝爾獎,在很大程度上是因為之前的傳統模擬手段很難以 brute-force(蠻力窮舉)的方式解決這一問題,即難以遍歷所有蛋白質可能的構象來獲得它們的三維結構。
但是結構預測模型,尤其是 AlphaFold,解決的問題就是透過分子進化的資訊,從另外一個角度去提取出蛋白結構中的有效約束,然後把這些約束轉化成一個三維結構。 
近年來,隨著 AI biology 基本模型能力在提升,AI 能夠解決問題的範圍不斷擴大。但這裡有一條暗線是我們對爆炸性增長的基因測序資料、蛋白質序列資料的理解需要不斷加深,對廣義的分子進化資料也要有更加充分的利用。
AlphaFold 的 foundation model 就是利用了共進化原理,以蛋白質為例,如果某一蛋白質的兩個殘基在大量相關的序列中總是同時發生變化,這大機率意味著這兩個殘基在三維結構上是足夠接近的。
AlphaFold 所實現的就是在蛋白質單體層面上,能夠利用一個合適的注意力神經網路,從海量的蛋白質序列資料庫中抽取出潛在的結構約束,並將這些約束轉化為人類可以觀察的三維結構模型。但是在此之上還有更一般性的分子進化機制,比如新抗體的產生,它涉及到的是可變區域的重組,透過免疫機制持續篩選積累一些 affinity 更高的一些抗體。
我們如何才能更好地利用這些資料,以及我們如何透過更一般的進化原則,來不僅僅解決蛋白單體的結構問題,而可以進一步去預測多個分子之間的結合模式,以及它們是如何在原子層面上互相交流的。這其實是為實現相互作用的重程式設計提供了基石。
我們目前已經接近實現的一個重要里程碑就是 Zero-shot Molecular Design,即零樣本的分子設計。
Zero-shot 意味著我們可以對於從未有任何已知實驗資料的靶點,可以直接透過計算生成有結合活性的新蛋白。這些設計可以精準、選擇性地作用於我們感興趣的表位上。
我們更長期的目標是基於 zero-shot design 重新定義當前藥物研發,尤其是抗體類藥物的設計方式,甚至可以把模型能力擴充套件到蛋白質組層面去重程式設計整個細胞狀態。
 海外獨角獸:蛋白質對於分子結構的預測和蛋白質抗體這類分子的設計之間是什麼關係?做好了結構預測就能做好設計嗎?
喬卓然:我們認為可能要先解決結構預測,然後再慢慢過渡到設計。結構預測就是預測已知序列的蛋白在三維空間中的 fold。
從頭設計蛋白質在某種意義上是這個問題的逆問題:如果我們已知人類在一個蛋白上關心的功能,如何去預測生成的新結構,包括基於這個功能和結構去預測去生成新的蛋白序列。比如酶的設計,以及治療性蛋白的設計,如抗體、小型蛋白等。
還有一個應用場景是藥物遞送,藥物在人體內輸運的過程中有時需要一個合適的載體,而這些載體的設計,同樣是從功能出發,這對模型的效能在蛋白結構預測之上提出了一些新的需求。
首先就是 multimer(多聚體)結構預測,要預測多個蛋白,不論是多個蛋白的 copy,還是不同型別的蛋白之間的相互作用,然後預測多聚體的結構。
此外,如果我們想預測一個蛋白功能,就不只是需要對它的整個 folding 的骨架進行定性的預測,而是要在整個原子層面上對關鍵的活性位點的排布都有比較好的建模能力。比如要設計一個酶,需要它的過渡態做一個好的建模,因為酶會催化從底物到最終產物的反應。那從底部到產物這中間的高能態,就需要我們從每一個原子的層面都對它的位置做精細的建模。 
 如果用現有結構預測的手段重新設計新的酶的骨架,那需要做 motif scaffolding(基序支架設計),需要基於它已經在原子細節上排列好的 catalytic triad(催化三聯體)核心模組為基礎,構建一個能夠容納該模組的整體骨架結構。這實際上對模型在兩方面提出了更高的要求,一是活性位點原子結構理解的精細度,二是生成新蛋白序列的能力。
簡單來說,要從結構預測走向結構設計,我們既需要在 AI 層面上進行建模範式的轉變,這不僅僅是從序列到結構,而是要從頭生成結構和序列資訊。與此同時,在模型能力方面,也對在分子相互作用建模上的精細程度以及預測精度提出了更高的要求。
 海外獨角獸:這比語言模型要難得多,語言模型可能會涉及不同 token 之間的相互關係,但並不涉及到全模態,甚至是 3D 結構的相互關係。
喬卓然:是的,從評估一個模型能力的角度和底層架構上的建模方式上都可以反映出來。
在評估結構預測模型時通常有一些指標,比如 TM-score、LDDT(local Distance Difference Test),都是計算所有 token 之間的距離矩陣,然後和 PDB 裡的正確答案去比對,有時一個蛋白會有多個正確答案,但我們會對每一個正確答案進行驗證,這不像語言模型那樣會有更多人類主觀評價的成分。
例如做一個新的蛋白,我們會在實驗裡去評估它的結合親和力是否達標,以及結合特異性是不是足夠好。某種意義上確實是一個難度更高的問題,但是從另一個角度想,這也是一個更量化、更直接的反饋。
另外一方面,結構分子的模態更貼近於物理,所以我們可以在架構上做一些更好的設計來提高模型的泛化性。
比如 AlphaFold 的架構中非常創新的就是引入了 Transformer,但並不侷限於建模 token 間的兩兩關係,而是直接去建模一個蛋白的相互作用矩陣,然後透過一個 triangular attention 去建模三個 token 之間的關係,也就是用兩個 token 和第三個 token 之間的關係,不斷地透過 attention 去 refine 這兩個 token 之間的距離分佈。
比如計算一個蛋白裡 token 之間的距離值,那它需要滿足一個三角不等式,即原子 A 與原子 B 之間的距離,加上 B 與 C 的距離,不超過 A 與 C 之間的距離。有很多這樣的原理可以幫助我們 inspire 新架構上的設計,然後讓它更貼近於物理原理,然後我們將這些好的 inductive biases 注入到模型中,這能夠提升模型在需要高度精度預測的問題上的表現。
 海外獨角獸:語言模型領域經常會提到“Scaling Law”,即減少對模型的先驗設定,讓模型儘可能自主學習。但結構預測模型的設計過程中,仍然需要人類科學家在物理、化學、生物等方面的啟發式理解。未來的結構預測模型會逐漸去掉這些設計,還是說這些設計可能會始終是重要的部分?
喬卓然:未來這兩個方向都會有一些並行的探索,現在基於 Transformer scaling 並具備良好 inductive bias 的架構探索就是由 EvolutionaryScale 團隊做的。ESM 是把結構、序列和功能都 tokenize,直接在一維的 token 流上建模所有模態以及模態之間的相互作用。
在結構預測上,目前表現最好的仍然是以 AlphaFold 3 為代表的架構。這類模型是建立在 inductive bias 基礎上,並結合了 Diffusion 方法。從引數量上看,ESM-3 採用了約 100B 的引數,而 AlphaFold 3 的引數量低於 1B,但在蛋白質三維結構建模上的效果是不相上下的。
如果我們希望將結構預測模型擴充套件到像 RFDiffusion 這類的模型,也就是從結構預測模型重定向到分子設計模型,沿用 diffusion 相對會更直接。但是從更長期角度來看,那些更通用模態、inductive bias 較少的架構,可能更適合用作與自然語言互動的介面。
但如何在保留和自然語言互動的能力的情況下,又不丟失建模 special domain、蛋白結構以及序列地能力?
在這種情況下,我們需要的可能是透過更 specialized 結構預測和生成模型合成一些良好的資料,以此構建一個好的資料生態並支援這些更通用的模型。
另外的一種可能性是通用的語言模型作為一個 orchestrator(協調者),現在的良好結構預測工具和設計工具會成為底層的互動環境,當環境本身成為對生物分子結構和相互作用的保真的建模層後,那麼通用 agent 或語言模型就更容易與環境互動,並獲得有效反饋,也許就不再需要進行專門的模型 scaling。
目前,多個研究團隊正圍繞這一方向展開探索,但對於哪種方法將主導未來的發展,尚未形成共識。Chai-2 已經跑通的路線是基於結構建模的能力,也就是在一個的 folding model 作為基座的前提下,發展出的分子生成能力。
03.
Chai-2 將藥物開發週期從數月縮短到兩週
 海外獨角獸 :怎麼用一句話來形容 Chai-2?相較於 Chai-1 以及整個行業中其他 foundation model 的最重要突破又體現在哪些方面?
喬卓然:Chai-2 相較於 Chai-1 最大的進步是從預測過渡到了生成,能夠在零樣本條件下直接生成具有生物活性的抗體。
如果定量比較,之前的設計探索的成功率大多在 0.1% 左右,而 Chai-2 將設計成功率提高了 100 倍以上,達到了 16%,在 mini protein 的設計上,成功率已經達到了 60%。我們的溼實驗驗證規模其實也超過了這個方向之前所有學術文獻的總和,我們能夠確信這些實驗成功率結果的統計顯著性。
Chai-2 的突破性成果
相對於已有的計算方法,真正的 baseline 是傳統的溼實驗篩選方法。Chai-2 相較於如酵母展示或噬菌體展示等抗體研發管線最常用的篩選手段,也展現出明顯優勢。尤其是噬菌體展示,通常需要耗時幾個月,並投入大量人力物力,但它在下一輪驗證中的成功率也僅有約 50%–60%,而 Chai-2 在一天之內從零樣本生成的成功率已經非常接近這些傳統溼實驗方法所能達到的水平。
酵母展示和噬菌體展示是兩種常見的體外蛋白篩選技術,用於發現與特定靶標具有高親和力的抗體或蛋白分子。它們透過將蛋白質或抗體片段表達在微生物(如酵母或噬菌體病毒)表面,然後利用篩選和富集過程找到目標結合物。
與“零樣本生成”相對的是一種叫做 lab-in-the-loop optimization 的正規化,在蛋白設計領域已經存在很多探索,比如我們使用蛋白語言模型生成很多新的序列,然後將這些序列作為下一輪實驗篩選的起點。
Lab-in-the-loop optimization 是一種將實驗反饋與機器學習模型相結合的最佳化方法,常用於蛋白質或藥物分子設計流程中。該方法透過迭代過程進行最佳化:模型首先生成候選序列,隨後透過實驗驗證效能,再將實驗資料反饋給模型,來指導下一輪設計。透過這種方式,能夠持續提升設計的效率和準確性。這種方法代表了一種“模型+實驗”協同進化的設計理念,與完全依賴模型的“零樣本生成”策略不同。
以抗體設計為例,我們可以先隨機生成很多序列,再透過溼實驗測試它們的結合親和力,測試結果可以用來微調蛋白模型,然後在下一輪的實驗生成裡,能夠成功產生 binder 的機率就會更高。Cradle Bio、Prescient Design 等團隊已經驗證了這種 lab-in-the-loop 的可行性。
但是這樣的方法實現的是需要實驗樣本的設計手段,因為初始的設計成功率仍然是由一開始的篩選文庫定義的,且每一步的模型精調的過程也需要長週期的溼實驗資料支援。
另一種思路是 inverse folding,也就是說在已知抗體結合模式的前提下,透過 AI 技術改造抗體序列。這種方法依賴於結構預測的進展。假設我們有一個抗體的三維結構,結構預測問題解決的是從序列對映到結構,但 inverse folding 則是從結構骨架到蛋白序列的逆向問題。
 比如 David Baker 的實驗室以及 Absci、Generate Biomedicines 公司,都做到了基於 PDB 中已知抗體骨架,去生成更具多樣性的序列,並在實驗中測試這些序列的生物活性,也獲得了不錯的成功率。 
但是這兩種正規化的特點是都需要一些已知的實驗結果,要麼是實驗室自己收集的新活性資料,要麼是透過之前的歷史積累篩選出來的抗體的結構資料,這些都是基於一定量樣本的 AI 設計。
相比之下,零樣本設計只基於我們關心的藥物靶點結構和特定表位或結合位點,不依賴於任何已有的資料,可以直接生成新的抗體或蛋白質 binder。
這實際上是比前述方法更具挑戰性的問題,但一旦解決,也將帶來更大的想象空間。因為一旦我們可以在沒有實驗資料支撐的情況下,僅透過計算機就完成假設生成的第一步 ,那麼後續的性質最佳化等步驟也都可以在統一的平臺內整合。相較於傳統流程必須先溼實驗收集初始資料,在面對一個新靶點時,零樣本生成在生成一批能有效結合並中和該靶點的 binder 上有更好的可拓展性。
 海外獨角獸:在引入零樣本生成之前,整個過程是由計算與溼實驗交替進行的,溼實驗還需要不斷地微調。現在雖然最終仍需透過溼實驗驗證生成的結構或分子是否達到預期,但在最終驗證之外,前面所有步驟都已經變成純計算了。在這種情況下,大約能節省多少時間和成本?
喬卓然:舉幾個例子來說明。當前的一些篩選方式,比如酵母展示和噬菌體展示通常需要三到六個月的時間,首先需要建立一個文庫,無論是透過動物免疫建立文庫,還是使用已有的抗體庫,然後我們需要透過基因工程手段將序列插入到噬菌體的基因組中,然後在噬菌體上表達大約 1 億到 10 億個抗體,接著再設計一個合適的篩選壓力(selection pressure)來進行富集(enrichment)。
這個過程通常需要多輪迭代,因此整個週期往往需要幾個月的時間。而透過零樣本生成的方法,我們可以將這一過程壓縮至兩週以內。
與此同時,它也大幅縮短了後續抗體最佳化的時間線。這主要得益於我們直接基於三維結構資訊進行設計,從而生成出更加精確的抗體,我們也能更有信心地預測它會結合在目標位點上。
相比之下,酵母展示和噬菌體展示等方法的侷限在於,所讀出的結合訊號無法提供結合位點的資訊,可能存在一些結合在非功能性位點上的 false positives,我們還需額外手段將這些錯誤篩除。此外,透過這些傳統手段首次篩選獲得的結合親和力通常不夠高,還需要進一步進行親和力成熟(affinity maturation)過程。
而我們現在基於三維結構的零樣本生成方法,在結構層面對分子間相互作用的控制更為精細。藉助這種控制能力,所生成的抗體更容易滿足在實際藥物設計中,傳統篩選方法較難實現的目標。
有些抗體的設計其實是一個多目標最佳化問題,並不只是針對單一表位,可能要求同時識別多個表位,甚至跨物種識別。比如在 Pre-clinical study(臨床前研究)中,要做猴子裡的活性研究,就需要保證抗體並不只是能夠中和人類的蛋白,也需要能夠做到中和猴子裡的同源蛋白。
我們處理過的一個合作案例是,該公司在我們接手之前,已經投入了大約 300–400 萬美元,並耗時兩到三年,仍未得到一個能夠同時滿足多個設計指標的 lead 抗體。而我們使用 Chai-2,只花了一天時間,就生成了 20 個設計,在隨後兩週的實驗測試中,有數個設計滿足了預期目標。
所以,對於普通的單克隆抗體篩選流程而言,Chai-2 能將時間從 6 個月壓縮到 2 周,而對於更具挑戰性的任務,Chai-2 甚至能夠實現從無到有的全新能力。
 海外獨角獸 :Chai-2 的成功率是 16%,這個數字在行業裡是什麼水平?
喬卓然:我們一開始看見 16% 的成功率也有點難以置信,所以又做了幾輪實驗來進一步驗證這個結果。16% 的這個數字也可以幫助我們理解為什麼要做零樣本生成。
傳統的抗體設計流程包括幾個步驟,首先是建文庫(library),然後做噬菌體展示,從早期的高通量篩選實驗(screening assay)中挑出一些較好的候選抗體(candidate),再用 binding assay 對這些候選體進行表徵。
這個早期的高質量篩選通常需要做很多輪,耗時大概三到六個月。後續的 characterization 相對較快,比如在一個 96 孔板上做一輪 binding assay 大概需要兩個星期。如果能基於一個表位直接從頭生成一個有 binding 能力的抗體,就能跳過這六個月的篩選環節,直接進入後續兩週的實驗環節。整個抗體生成和設計流程因此可以加快數十倍。
之前也有很多學術界關於 de novo nanobody(從頭設計的奈米抗體)的探索,比如 David Baker 團隊是這個方向的先驅,他們測了四個靶點,設計成功率在千分之一到百分之一。Nabla Bio 做了第一個在 GPCR 上的 VHH nanobody,做出來的抗體活性很好。但他們的設計過程中仍然結合了噬菌體展示來獲得更多的資料,所以並沒有實現一個真正從零開始的設計。
如果我們用一個 96 孔板去測試這些設計,大機率是測不出有成功 binding 的抗體,可能要測十次甚至幾十到上百次,才能找到一個 binder。這種方法反而比傳統方式,即先大規模文庫篩選、再進行表徵,還要更貴。
因此,之前這些工作的思路更像是透過計算方式去建一個篩選庫,然後再用噬菌體展示或酵母展示去驗證。結果不僅沒有節省掉那六個月的篩選時間成本,反而額外多加了一步計算建庫的流程。
 海外獨角獸:建庫是足夠泛化的,還是每次針對一個特定的靶點都得重新建一次?
喬卓然:如果是命中率為 1/1000 的設計模型,那確實是每一個 target、每一個表位都需要重新建一個庫。我們認為,一個真正成熟的 de novo design 方法應該做的是,針對每一個 target 一次性直接生成 24 個設計,就不再是建庫了,然後做一次 binding assay 來驗證這 24 個設計裡是否有一個是成功的。但是如果需要為每一個表位都建一次庫,那確實每次都要走一遍耗時六個月的流程。
 海外獨角獸:建庫到底意味著什麼?它為什麼可以省掉 1000 次實驗?
喬卓然:這裡涉及到的實驗機制是不一樣的。最傳統的建庫方式,是透過動物免疫,動物的內源性免疫系統中有很多 T 細胞、B 細胞,它們表達抗體,並透過基因重組和突變,每一個 B 細胞都能生成很多相同序列的抗體,去結合不同的抗原。
在基因重組上,以 VDJ 重組為例,它指的是 B 細胞和 T 細胞在發育過程中,透過對 V(可變)、D(多樣)、J(連線)基因片段的隨機重排來產生多種抗體或 T 細胞受體的過程。
在基因突變上,以 Somatic hypermutation(體細胞高頻突變)為例,它指的是 B 細胞在活化後,抗體可變區基因發生快速而高頻的點突變,從而增加抗體對抗原的親和力。
動物免疫實驗就是把一個抗原注射進動物體內,然後提取它的血清或脾臟,從中找到能夠結合該抗原的抗體,再進一步純化。這樣一次免疫過程可以得到大量的候選抗體,然後透過展示技術和流式細胞分選等方法去富集它們。此時讀到的 binding 訊號是相對粗糙的,不像後期分析實驗那樣能夠得到定量的結合常數,但確實可以獲得更高通量的資料。
現在還有很多團隊在做動物免疫實驗,一些公司甚至運營著羊駝農場,將抗原注入羊駝體內,過兩個星期到一個月後收集血清,然後進行克隆,以獲得更多產量。這個過程中可以得到一個純度很低的抗體混合物,再從中分離出最有效的變體。這個流程之所以通量更高,是因為它利用了動物的內源免疫系統進行自然篩選,而不是完全依賴人工實驗。
 海外獨角獸:你們報告中說用 52 個靶點設計抗體,得出了 16% 的成功率,具體是用了什麼方法去驗證這個結果?
Chai-2 靶向了 52 種新抗原。藍色方框表示在測試的設計數量不超過 20 種的情況下,至少有一種成功結合的靶點,佔已測試靶點的 50%。
喬卓然:我們用的主要實驗手段是 BLI(Bio-layer Interferometry,生物層干涉技術)。
如果大家學過基礎物理,可能對雙縫干涉實驗比較熟悉,兩個縫隙之間的路徑差會導致干涉條紋的變化,波長不同。BLI 的原理類似,當我們把一個蛋白固定在感測器表面,然後用雷射照射,會有一束光反射感測器底面,另一束光反射結合層的表面,這兩束光的干涉產生特定的波長。當我們加入抗體,如果抗體成功結合在 target 上,就會影響這兩個反射面之間的距離,從而引起干涉訊號的波長變化。
BLI 是我們用於快速分析驗證的主要實驗手段之一,可以在 24 孔板上高效完成。透過觀察波長是否發生位移,以及波長位移隨著抗體濃度變化的趨勢,我們可以擬合出結合的強弱。
為了證明我們的方法確實可靠,我們將所有合作方能夠實際完成實驗的 target 基本都做了一遍,一共測試了 52 個靶點,基本上涵蓋了我們能找到的、PDB 中沒有結構、但又相對容易實驗驗證的所有 druggable target 的上限。在 BLI 測試中,我們確實觀察到了百分之十幾的結合成功率。
為了進一步確認這些不是假訊號,我們又做了 binding specificity 測試。也就是說,我們驗證每一個抗體是否只結合設計的 target,而不會和其他非相關蛋白或常見、無活性的蛋白髮生非特異性結合。這能排除所謂的 polyspecific binding,也就是抗體假訊號的情況,從而確保只結合了我們關心的表位。 
此外還有一些細節問題,如果 target 本身是多聚體,那麼讀出的 binding signal 可能會高於預期,我們對這些問題做了細緻分析,並在報告中明確標註是否存在這類風險。未來我們還會做一些後續驗證,比如模型預測和實際 binding 模式是否一致,也會做一些結構生物學實驗。
04.
結構預測能力
決定模型上限
 海外獨角獸:Chai-2 具備 Zero-shot 的能力,命中率也大幅提升,同時它還具有足夠的泛化能力。背後的技術突破主要體現在哪些方面?
喬卓然:在模型能力提升的過程中,folding 成功率的提高極大地推動了整個設計的成功率。就像語言模型對文字的理解能力增強為 coding 或多模態能力提供了基礎一樣,模型對抗原抗體相互作用三維結構的預測精度,也在很大程度上提高了設計成功率。
這個邏輯也可以從直觀上理解:結構預測越精準,我們就能在原子層級施加越細緻的控制。
從技術角度來說,讓蛋白設計成為可能的一個核心思路是自洽(self-consistency)。這個概念大約由 MIT 的 Sergey Ovchinnikov 團隊在 2021 年推廣到蛋白設計領域。具體做法是,在設計蛋白骨架時,通常是先基於目標生成一個不含序列資訊的 backbone,然後再透過 inverse folding 生成相應的新序列。
在整個過程中,一個能有效進行質量控制的方法就是,把最終生成的序列重新輸入到蛋白質摺疊模型中,驗證摺疊後的三維結構是否與最初設計的骨架一致,比如生成蛋白骨架的 RMSD(Root Mean Square deviation)是否與初始的 binder backbone 完全吻合。如果結構預測足夠精確,它就能為整個生成鏈條提供更準確的反饋和質量控制,從而使更多設計透過 self-consistency 檢驗,並在溼實驗中具有真實活性。
結構預測模型實際上定義了一個蛋白可設計空間。越優秀的 folding 工具,定義的可設計空間就越接近實驗室中真正具有活性的蛋白空間。
 海外獨角獸:本質上是更好的結構預測帶來了更強的設計能力。有點類似於語言模型中,更好的生成能力帶來了更好的理解能力。
喬卓然:結構預測依然是模型最基礎的能力,很大程度上決定了模型的能力上限。只有當提高 DockQ > 0.23 這類預測結果基本正確的 folding problem 的比例,才有可能提高這些體系上體系設計新蛋白的成功率。
DockQ 是用於評估蛋白質複合物對接質量的綜合評分指標,介於 0 和 1 之間,數值越高表示預測結構越接近真實結構。通常,DockQ > 0.23 被視為是正確對接的閾值,用以判定一個複合結構是否可信。
 海外獨角獸:為什麼 diffusion 會特別適合做生物領域的分子和原子生成呢?
喬卓然:回看之前的一些建模手段,比如說像 VAE 或者 auto-regressive(自迴歸模型),它們在生物分子結構領域上的表現並不是特別好,原因在於生物分子的結構本身不像自然語言那樣具有自左至右的時序結構。Auto-regressive 模型在語言任務中表現非常好,是因為語言這個模態的空間複雜度很低,而時間複雜度很高,可以一個 token 接一個 token 從左到右地生成。
但在三維結構中,往往涉及幾千甚至幾萬個原子,很難像生成文字那樣一個原子一個原子地生成三維座標。我們要思考的是能不能有一種更好的建模範式,能從一個初始猜測出發,直接生成所有原子的整套三維座標?在這個過程中,原子之間的依賴關係則可以透過 diffusion 的過程不斷地被 refine 出來。
 海外獨角獸:在做這個研究的過程中,使用了什麼方法來防止模型在訓練資料中已經見過這些目標抗體?
喬卓然:我們做了兩層保護,目的是確保這個驗證過程確實屬於“零樣本生成”,而不是模型在訓練階段已經接觸過類似樣本。
1. 排除所有已知抗體結構的抗原,凡是 PDB 資料庫中已經存在抗體與其結合結構的蛋白質,我們都不作為測試集使用;
2. 對於我們最終測試使用的這 52 個抗原,又進一步將與這些抗原序列相似度超過 70% 的 PDB 條目全部從模型訓練集中移除。
這樣可以保證它不僅是零樣本,而且是在低同源的體系上測試的。模型在大部分大家關心的一些 target 成功率上可能還會更高,但是現在的報告是在最具挑戰性、與訓練資料重合最少的設定下取得的。
 海外獨角獸:在 Chai-2 的技術報告中提到,團隊專門測試了 TNF-α(腫瘤壞死因子α)這一靶點。為什麼 TNF-α 被認為是一個高難度靶點?Chai-2 在這一問題上的進展具體體現在哪些方面?
喬卓然:TNF-α 之所以是一個難度較大的靶點,主要原因在於它不是單體蛋白,而是一個三聚體結構。三聚體是指,具有生物活性的基本功能單元是由三個相同的亞基透過締合組成的。在 TNF-α 中,這三個亞基共同形成一個完整的蛋白複合體,並與天然結合配體 TNFR 相互作用。
TNFR 與 TNF-α 的結合位點並不位於某個單體蛋白的表面,而是在兩個亞基之間的縫隙。這個區域結構非常扁平,且極性較強,因此很難透過簡單規則找到好的結合模式。之前在這個體系上嘗試的計算蛋白設計是全部失敗的。DeepMind 在之前的蛋白生成模型研究(AlphaProteo)中也曾透過計算方法評估 TNF-α 的設計難度,認為這是整個 PDB 資料庫中 top 1% 難度的目標。
如果在這個體系中能夠成功實現零樣本的 binder 的設計,這某種意義上意味著 AI 已經非常接近解決全部人類基因組的結合蛋白設計的問題,Chai-2 在這個體系上的成功率達到了 20%,並且最優的 binder 親和力已達到納摩爾(nM)量級。
 海外獨角獸:在特別難的問題上,Chai-2 和人類的頂尖科學家會有什麼明顯的差異嗎?針對一些高難度目標,模型是否已經能做到超人類水平?
喬卓然:在所有的 de novo 抗體設計或 binder 設計中,模型早已超越了人類的能力。人類科學家擅長的是生成新的生物學假設、理解蛋白質的功能,並基於對生物醫藥問題的深刻洞察來提出工程設計目標,此外,還能夠在有限的資料下做出戰略決策。
但人類在快速列舉計算或驗證假設方面並不擅長。人類也無法高效執行這些設計任務。圍棋和蛋白質摺疊就是兩個典型例子,這本質上要求我們在一個自由度極高的問題空間中,能夠快速地找到一個合適的取樣區域,並在其中驗證我們的假設是否成立。
比如在蛋白質摺疊上,60 年代的諾貝爾獎得主 Linus Pauling 的研究方式就是建立一個蛋白氨基酸的球棍模型,然後嘗試不同位置的調整,也能弄清楚一些現在看來非常正確的蛋白二級結構,但是這可能已經是人類智力在蛋白質摺疊這個問題上純手工操作的體現。
如果沒有 AI 的話,這其實遠遠超出人類能列舉的上限,蛋白質設計也是一樣,人類是讀不懂蛋白語言的。但現在,透過 AI 模型,我們可以快速學習蛋白質的特徵分佈,並根據蛋白質的語言規則生成新的設計。
05.
分子生成平臺
是藥物研發的 GPU
 海外獨角獸:抗體設計是一個什麼樣的工作流?歷史上有什麼樣的技術關鍵進展?現在 AI 出現之後,哪些環境會發生什麼樣的變化?
喬卓然:先講一下人體內抗體篩選的過程。
我們內源的免疫系統在面對外源病原體時,具有自體免疫應答。比如,T 細胞負責殺死被感染的宿主細胞,而 B 細胞則會表達抗體,這些抗體會中和病原體的蛋白質。人體內部的抗體實際上在不斷進行重組和突變,生成新的序列,而這些新的序列會透過免疫系統的篩選,最終留下能夠有效中和病原體蛋白的抗體。 
之前的幾波抗體設計技術進展都是將內源分子的進化和篩選過程轉移到人工實驗環境中。比如七十年代的雜交瘤技術可以透過動物免疫來大規模獲得早期抗體種子,用來表達單克隆抗體;八十年代,隨著噬菌體展示技術和酵母展示技術的出現,生物技術領域迎來了第一個平臺型技術革命,當時一個初創公司 Cambridge Antibody Technology 公司與  Abbvie 合作,開發出了首個噬菌體文庫篩選出的單克隆抗體 Humira,到現在為止,每年銷售額都在 200 億美元。
Humira 是全球首個由噬菌體展示技術篩選獲得併成功商業化的全人源單克隆抗體藥物,最初由 Cambridge Antibody Technology(後併入阿斯利康)開發,並由 Abbott(現為 AbbVie)推廣上市。
與此同時 Adimab 這樣幾十億市值的平臺型公司也嶄露頭角,他們的商業模式就是透過構建足夠好的展示庫,篩選出性質優良的抗體,再交付給生物製藥公司,從中獲得可觀的收入和銷售版稅。這就是抗體早期發現過程中的一個典型環節。
但在內源免疫找到能夠識別抗原的初步抗體之後,抗體還需要經歷親和力成熟化(Affinity Maturation),這個過程就是提高抗體的結合強度。比如從一個微摩爾或納摩爾級別,提高到皮摩爾級別,這一過程可能需要幾周甚至幾個月時間。
現在藉助 AI,抗體設計的速度得到了百倍提升,可以實現更精準的表位控制與生成多樣性。
人體內的 B 細胞在探索序列空間時,受到物理和生物條件的限制,只能取樣一部分。而 AI 在取樣的時候其實是沒有這個限制的,這也很像我們在動物免疫中經常遇到的一些問題。
比如說像 self-antigen 這類本身存在於人體內的訊號蛋白,如果它們成為了致病來源,就很容易出現免疫逃逸的問題,因為人體會把它們識別為自身的、無害的蛋白質,而且在訓練免疫系統或者模型探索訓練空間的過程中,往往也會主動迴避這類 target,但我們現在透過 Chai-2 可以很快解決這些問題。
最後就是我們可以針對一些更難以進行高通量篩選的 target,用 Chai-2 做新的設計,比如一些在膜上的蛋白,由於一些實驗上的困難很難做噬菌體展示,那現在也可以設計一些新 target。
 海外獨角獸:有了 Chai-2 開發抗體藥物之後,新的 pipeline 是會變成什麼樣呢?跟傳統的製藥會有什麼區別?
喬卓然:傳統抗體發現的過程可以定義成一個篩選、測試、最佳化、投產的過程。在這個過程中,每當發現新的問題或需求時,往往需要回到之前的階段,重新走一遍實驗流程。
但是 AI native 的 pipeline 可以將這個過程可以簡化成一個三階段的生成。首先定義設計問題,然後直接在虛擬環境裡進行零樣本生成,最後在一個小規模的實驗室裡進行驗證。這裡所有的 feedback 都在中間生成這一步,都在一個計算環境下完成,我們只通過實驗硬體去進行最後一步的 characterization。
 海外獨角獸:從 foundation model 釋出到真正落地之間,會存在怎樣的差距?我們能期待這種高效率很快成為行業常態嗎?
喬卓然:從長期來說非常樂觀,Chai-2 這樣的技術不僅會改變科研層面上設計新抗體的流程,也會很大程度上改變現在藥物研發公司、生物技術公司佈局 R&D 專案的方式。因為之前不同的研發流程很多大程度上是由之前的分子設計技術的邊界來確定下來一個 operation 上的最優解。
但現在,如果我們能夠在生成的初步階段就直接預測後續的分子性質,那麼這會在很大程度上改變藥廠的執行模式,進而改變前期和後期投入的比例。現在在 maturation 和 optimization,以及如何消除這些序列的免疫源性上,更耗時且投入較大。但如果這些能夠成為第一步的設計目標,那麼設計邏輯可能會快速轉向如何直接生成大量有效抗體,探索更多新的生物學假設,並將這些生物學假設的生成能力透過 AI 的支援轉化為行業核心競爭力。
未來會出現一個平臺與生物學家之間的融合。現在,計算化學家和計算生物學家對平臺有很高的熱情,他們在嘗試理解這些計算功能帶來的變化。但下一步,真正理解疾病生物學並擁有管線研發經驗的人,才會感受到平臺本身所帶來的能力。
從長遠來看,分子生成平臺對藥物研發的作用,將會像 GPU 對 AI 的作用一樣,誰能夠訪問更好的基礎平臺,誰就能加速研發程序,更好地佈局新的疾病領域研發管線。這將成為新一代行業研發的生產力核心來源。
當前的業務研發大多仍然基於還原論,即我們假設每個疾病都有幾個關鍵的靶點需要解決。在這些靶點上,如何最佳化 on-target 的結合親和力,並將其在細胞中的活性轉化為臨床治療效果,這仍然是一個待解決的問題。但擁有更好的設計工具後,我們將能更快速地解決這些生物學上的難題。
所有新技術整合進現有生態系統仍然需要時間。不同的方法論將在一定時期內並存,就像現在仍有公司在使用動物免疫文庫一樣。但某些疾病領域可能會更快被零樣本生成技術解決。例如血漿中的靶點,由於抗體通常透過靜脈注射,而這些血漿中的靶點本身就在血細胞膜上,因此抗體在這些細胞表面的結合,很大可能能直接轉化為治療效果。 
這一旦產生,在一至兩年內,可能可以為所有定位在血細胞表面的蛋白設計出高親和力且高選擇性的抗體。在這個階段,自身免疫性疾病例如風溼性關節炎等疾病,可能是最先切實感受到這些新技術帶來變革的方向。而其他一些疾病領域由於涉及到在器官內的吸收或者背後的生物學機制更加複雜,我們則需要與生物學專家展開更深入的合作。
06.
Zero-shot 
更接近藥物設計的本質
 海外獨角獸:相比傳統生物學家,Chai 的思維方式更像新一代的工程師,或者說有工程思維的科學家。Chai 有一個願景是成為蛋白設計領域的 Photoshop,去把一個科學問題轉化為工程問題,怎麼理解這個願景?
喬卓然:科學在某種意義上是依賴靈感和理性,以偶發的方式產生成果;而工程則代表了可重複交付的成功。
從這個角度來看,生物醫藥領域過去的大多數進展屬於科學範疇,因為它們來源於實驗室中的原始發現,這些科學成果在真實世界中轉化後,每一個科學成果往往能解決的是不同的問題。但從工程的視角來看,我們能否找到一個通用方法,去重複實現新藥開發以及找到具有臨床價值分子?如果我們已經有一套方法能夠針對某個疾病領域的一個靶點設計出有效療法,能否將這一方法透過 digital biology 或計算手段推廣至 10 個甚至 100 個靶點?
傳統的正規化依賴生物學家提出假設,並透過技術手段加以驗證。然而,驗證過程往往高度依賴專家經驗與實驗流程,比如前面提到的 6 個月的篩選週期,以及昂貴、人工取捨明顯的實驗程式,這些都帶來了冗長的生產週期。
現在有了 AI,我們可以高保真地建模蛋白結構,建模蛋白與蛋白、小分子之間的相互作用,從而設計出新的抗體。這實際上為生物學家提供了一個分子設計的作業系統,也就是一個互動環境,使得他們能夠快速驗證生物學假設,並將科學設想迅速轉化為新的分子實體。這正是我們將 Zero-shot antibody discovery 作為階段性目標的原因。
與傳統的“提出假設—設計抗體—實驗驗證” (hypothesis testing)流程相比,Zero-shot 的設計是一個更為困難但定義更清晰的問題,它更接近藥物設計的本質,即如何根據分子層面上的假設直接驗證這些假設,而不是被動地去求一個近似解。
因此,我們認為結構預測和零樣本設計將在未來成為藥物設計 R&D 流程中的基本模組,而不僅僅是對已有流程的輔助工具。實驗室硬體仍然是必要的,但角色將更多轉變為驗證設計的環節,而非產生新分子的核心流程。未來,新分子的產生將在很大程度上轉移至計算流程之內,而實驗將成為最終的質量控制手段。
 海外獨角獸:在生物領域,現實世界的資料可能還比較有限,已經在用一些合成數據了。現在這個領域的模型是不是已經漸漸開始有更多的合成數據?
喬卓然:生物領域一直在探索合成資料。比如在 AlphaFold 的文章中,他們就使用了 self-distillation training(自蒸餾訓練)的方法,對 UniProt 資料庫中的所有蛋白序列進行結構預測,然後將預測分數足夠高的蛋白重新送入訓練集中。透過這種方式,模型在 CASP(Critical Assessment of protein Structure Prediction)上的 GDT-TS 分數(Global Distance Test Total Score)提高了接近 0.1。因此,合成數據一直是大家持續關注的方向。
對資料的理解深度也決定了能從中挖掘出的價值上限。目前還有很多尚未被模型飽和的資料,例如序列資料和組學資料等,可以進一步利用。
同時,合成數據相比於原始的序列資料和實驗資料,有獨特優勢,比如能夠提供某些實驗中難以直接獲取的蛋白質間相互作用資訊。在未來,合成數據很可能會成為連線實驗資料和生物學理論的“第三模態”,也就是說,決策將由實驗資料、理論假設與 AI 生成資料三者共同推動。
物理規則早已被建立得較為完整,比如百年前對於生物體系和化學體系的量子力學、分子力學等理論公式已經成型,後續幾十年中相關的數值計算方法也被逐步完善。最核心的瓶頸仍然是計算資源的限制。許多體系由於維度過高,即使我們知道其底層的物理規則,仍難以進行有效計算。
當前結構預測模型的優點在於可以快速求解三維結構,完全繞過傳統取樣方法成本高昂的問題。但這些模型確實也存在幻覺。之前的研究也花了大量精力去降低結構預測模型的幻覺率。
這個問題其實非常類似於影片生成領域的幻覺問題。例如早期 Sora 在生成滑雪運動員滑雪的影片時,會出現人物飛到空中的不合理現象。如果影片生成時間夠長,還會出現崩壞(degrade)。分子結構生成中也存在類似現象,比如 diffusion 常見的幻覺模式是會生成一些天然環境中不存在的二級結構,尤其是在天然無序蛋白中的難以解析的無序區域。這些問題往往難以透過單純修改模型架構加以解決。
未來幾年,我認為生成模型與實驗驗證、物理模擬的結合將是一個非常有前景的方向。物理方法難以從頭生成結構,但是非常適合驗證三維結構的合理性。我們需要透過模擬手段去驗證模型輸出是否符合基本的物理規律,也可以透過分子模擬的手段給模型一些好的反饋,來檢驗是否符合物理、化學規則。同時,實驗資料也能為模型提供定性或半定量的約束。目前,物理資料與生成模型的結合仍處於學術探索階段,但我期待它在未來能帶來重大突破。
 海外獨角獸:在 Chai-2 之後,生成的框架未來需要怎麼進一步的閉環並最佳化其他的性質?比如說功能活性、developability,而不僅僅是現在重點解決的親和力的問題。
喬卓然:在 Chai-2 的報告中,我們其實已經驗證了兩個關鍵性質:Humaness 和 Chemical Developability。
Humaness 是指生成抗體的序列與人源抗體在骨架結構和 CDR(互補決定區)區域上的相似性。而 Chemical Developability 則是指這些序列是否包含某些特徵,比如潛在的不良翻譯後修飾。 由於我們在做 de novo design 的時候,是直接使用人源骨架進行設計,因此不再需要額外進行 humanization(人源化處理),因此,開發性風險的機率大幅度降低了。
以後我們還需要進一步整合更精細的設計目標和抗體工程知識,並納入模型的虛擬生成環境中。這樣我們就能夠在這些新的 developability 指標上進行快速迭代和閉環最佳化。
 海外獨角獸:那接下來 Chai 的未來願景和想要達到的目標是什麼樣的呢?
喬卓然:在通用性上,目前 technical report 中報告的抗體格式主要是 VHH,即僅包含重鏈的單域抗體,還有 scFv,即兩個抗體的可變區透過一個 linker 連線起來的結構。如果我們希望將其轉換為可以做成製劑的單克隆抗體(mAbs),比如改成 IgG 或者 Fab,這確實涉及到格式的轉換,但這一步其實不需要重新進行設計,僅需做 reformatting,然後測試其活性即可。
我們對這一步發展非常樂觀,因為抗體活性的核心決定因素仍然是它的可變區域是否能夠有效地與抗原結合。雖然 framework 可能對親和力的定性和定量有一定影響,但整體來看,風險很低。因此我們傾向於透過實驗方式進行驗證。
在新模態的設計方向上,這也是我們目前重點關注的方向之一。以雙特異性抗體為例,可以設計一個抗體可以同時結合一個抗原上的兩個表位或者結合兩個抗原,來增強它的活性,它的常用場景是增強 T 細胞免疫,比如將 T 細胞上表達的蛋白和一個癌症細胞上過表達的蛋白連線起來,從而更高效地清除癌細胞。這些設計目標完全在 Chai-2 的設計範圍之內,當然我們仍需透過實驗直接驗證效果。
另一個我們正在關注的方向是 ADC(抗體偶聯藥物,Antibody–Drug Conjugate),是把一個化療藥物和抗體透過一個 link 連線起來,實現化療藥的精準遞送,療效更好,也更安全,它也可以約化成一個抗體的設計問題,我們需要在後續工程流程中完成藥物偶聯,並在模式系統中進行測試。
07.
未來
商業模式是平臺即 IP
 海外獨角獸:透過 Chai-2 的模型,我們能感覺到新一代的 AI 生物公司和上一代 biotech 有很多不一樣,你作為從業者,從技術、平臺化發展的戰略來講,對今年或者未來三年新一代的這個 AI Biotech 公司有什麼樣的一些期待和看法?
喬卓然:現在湧現出來的 AI for Science 公司在商業模式上出現了一種新的可能性,我稱之為“平臺即 IP”。
以前的平臺更多是作為研發過程中的工具,我們仍然需要構建完整的全鏈條 R&D 管線,然後將平臺作為一個加速研發的模組,或者專注於某類靶點的技術工具。這種方式仍然需要我們整合大量的生物學知識和能力,最終才能產出具有商業價值的分子。
但現在,基於 AI 的方法已經可以快速滲透到抗體設計、蛋白質設計的後續環節。這樣的滲透能力實際上讓平臺可以擴充套件到更多藥物發現環節,覆蓋更多的疾病領域,提供快速增長的機會。
目前業內一個常被討論的問題是,以往抗體的專利保護很大程度上依賴於 CDR(互補決定區)序列的相似性判斷。但即使尚未進入 de novo design 這一步,僅憑 inverse folding 等方法,AI 也已經能設計出在結構上高度相似、結合模式高度相似、但在序列上與原始抗體完全不同的新候選抗體。
這意味著我們現在已經具備了非常高效的 AI 工具,在幾天到幾周就能輕鬆突破甚至繞開現有抗體藥物的專利壁壘。之前的 AI 已經實質性地改變了抗體設計中快速排序(fast order)邏輯。接下來,專利審查是否需要將結構資訊、靶點資訊等也納入考量?我認為,隨著 de novo design 抗體設計技術的成熟,它將為監管體系帶來更多挑戰。我們需要從整個生態系統的角度出發,思考如何在確保患者獲得更多醫療價值的同時,最大程度推動技術的快速進步。
 海外獨角獸:“平臺即 IP”意味著未來做 model 和做軟體的這個技術平臺的公司,可能不只是收一個平臺服務費,藥最有價值的就是最終的 IP,如果平臺即 IP,也就說新一代的 Biotech 公司可能也能從後續藥的銷售中獲得收益。
今年還觀察到一個趨勢就是這個領域的 foundation model 湧現出特別多, Chai-2 是典型模型,代表分子結構預測領域,還有一個領域是 Virtual cell foundation model,為什麼 foundation model 最近湧現得特別快 ?怎麼看 Virtual cell 那個方向和你們未來的關係?
喬卓然:Foundation model 進展快很大程度上是受了 AI 進展的推動,像訓練和推斷時的 scaling law,很多經驗都複用了。在 Virtual cell 上,相較於分子層面的大模型,那些面向細胞層面 phenotype 的模型是另一個新興方向,可能和分子設計形成互補。
我個人非常興奮的是,相比於目前主要依賴基因敲除等非持續性模型的方法,更高效的分子設計有機會實現更精確的細胞干預。傳統的基因敲除方法,並不能很好地反映藥物透過結合或抑制蛋白活性之後,在細胞內產生的真實功能影響。像 Recursion 和 Xaira 這樣的公司也釋出了基於 CRISPR perturbation 的虛擬細胞資料集(Virtual Cell Dataset),在 RNA-seq 層面(蛋白表達量)上進行擾動實驗,並觀察細胞在基因層面上的響應。 
 但相較於這種方式,更理想的擾動方式可能是,我們直接為感興趣的靶點設計出一個具活性的 binder,讓它直接作為調節蛋白功能的工具。這種方式有望訓練出更高質量的虛擬細胞資料,從而獲得更真實、更有效的表型響應資料,進而支撐更好的模型訓練。
未來要預測細胞對藥物的響應,可能同時需要白盒系統和黑盒系統。白盒系統來源於分子生物學中積累的通路知識,這些生物學通路本身已經解釋了近 50% 的疾病機制,比如像激酶或細胞因子識別機制,這些機制高度保守,對細胞的穩態和生存至關重要。如果你的治療靶點正好處於這些關鍵通路上,那會很重要。
但與此同時,還有許多我們尚未完全理解的作用機制,這類機制很難從一個具體結構或靶點出發去建模和解釋,因此我們可能更需要透過 top-down 的方式去獲得表型層面的響應資料。
我認為,如果從藥物設計的角度出發,既需要強預測能力,又需要良好解釋性,那麼在未來幾年內,結合白盒系統與黑盒系統,可能會成為帶來最大變革的突破點。
 海外獨角獸:分子結構預測和 Virtual cell 虛擬細胞這兩個方向是比較平行,但最後可能殊途同歸。你認為三年內最有可能商業化落地的一個 AI for science 的里程碑會是怎麼樣?
喬卓然:我很希望看到 AI 設計的抗體進入一個臨床獲批階段,至少它會進入到臨床的二三期。
 海外獨角獸:為什麼會是抗體?其他的小分子或者其他的分子模態會比抗體來得更慢嗎?
喬卓然:在小分子這種模態上,現在還沒有真正從 de novo design 到實驗上被大規模驗證的工作湧現出來,但我相信之後會有團隊實現。
相對於抗體,小分子的生物學工程化相對沒有那麼成熟,沒有現成的蛋白表達合成模組可以去快速地去驗證設計。小分子需要面對合成化學的壁壘,化學相對於生物學,現在工程化的程度也低一些,可能有更多硬體層面上的問題需要解決。但這也意味著更多的新機會和想象空間。
 排版:夏悅涵
延伸閱讀

Listen Labs:把使用者研究“黑燈流水線”化,AI Agent 系統實現小時級洞察

Isomorphic Labs:DeepMind 創始人再創業,打造製藥界的 TSMC

“10x Cursor”開發體驗, Claude Code 如何帶來 AI Coding 的 L4 時刻?|Best Ideas

Jack Clark: 美國 AI 政策的隱形推手,時代的良心還是囚徒?

Cluely:最具爭議的 00 後 AI 創業者,用一款 “作弊神器”2 個月實現 600 萬美金 ARR

相關文章