


遊戲是我整個生涯的關鍵
我的 AI 之旅其實是從遊戲開始的,特別是國際象棋。
我從四歲開始學習象棋,並積極參加比賽,甚至擔任英國少年象棋隊的隊長。右側這張照片是我九歲時代表英國 11 歲以下少年隊出戰的場景。
在如此年幼的年紀認真下棋,對我的思維方式產生了深遠影響。它讓我開始思考“思維”本身——我們的大腦如何構思策略?如何制定計劃?這種思維方式如何得到提升?

在訓練營裡,我們可以使用早期的棋類計算機,例如 Fidelity Chess Challenger。這些機器的操作非常原始,需要手動按壓棋盤上的 LED 燈來移動棋子。
原本,我們應該用這些機器來提高棋藝,但我更感興趣的是——竟然有人能夠程式設計,讓這塊塑膠能下棋,並且下得不錯。這引發了我的思考,我開始閱讀相關書籍,並在 11 歲時,在我的 Amiga 500 計算機上編寫了第一個 AI 程式,用來玩黑白棋(Othello)。

這個 AI 終於打敗了我的弟弟——儘管他當時才五歲。但這仍然讓我震驚:一個程式竟然能夠獨立做某些事情!
從此,我對計算機和 AI 產生了終生的興趣。
遊戲AI的突破
AlphaGo與自我學習的革命
二十多年後,遊戲仍然是我開發人工智慧方法的核心,並構成了 DeepMind 初期研究的重要基礎。我們在2010年創立 DeepMind 時,定位為工業研究實驗室,目標是建立“通用人工智慧”,類似現代版的貝爾實驗室。起初我們選擇遊戲作為AI的理想測試平臺,因為在遊戲中,資料非常容易產生:系統可以自己和自己對局,也能輕鬆定義明確的目標或評估指標,比如贏得比賽或獲得更高分數。因此你可以清晰地判斷演算法是否取得了進展。

遊戲AI的發展歷史悠久,從人工智慧誕生之初就開始了。艾倫·圖靈和克勞德·夏農等先驅都曾嘗試開發國際象棋程式。而遊戲AI的巔峰之作,便是圍棋,這項古老遊戲可能是人類設計過的最複雜的遊戲之一。圍棋的複雜程度令人難以置信,它的可能狀態多達10的170次方,比宇宙中的原子數還多,因此無法用窮舉搜尋來解決。
2016年,我們取得了重大突破,我們的 AlphaGo 系統在首爾與韓國圍棋大師李世石進行著名的圍棋對決,以4比1的成績取勝。但AlphaGo不僅贏了比賽,還創造出了一些此前人類從未見過的、極具創造性的戰略思想,其中最著名的是“第37手”,即右下圖中以紅色圈出的那枚黑子。這一步在職業圍棋中前所未見,卻在一百步之後決定了整場比賽的勝負,彷彿AlphaGo事先預見到了未來。
AlphaGo及其後繼版本AlphaZero,透過我們所謂的“自我學習”(self-learning)過程掌握了圍棋乃至其他所有雙人對弈類遊戲。這意味著,這些AI系統不是被直接程式設計出特定的解決方案,而是透過數十萬、數百萬次的自我對弈,逐步從錯誤中學習,並持續改進策略。透過這種自我學習,我們建立了有效的圍棋神經網路模型。
AlphaGo 在2016年的成功是現代AI的一個重要轉折點,它第一次清晰地表明,這類學習系統有能力解決人們曾認為無法解決的問題。藉助神經網路,我們能高效地引導搜尋過程,無需窮盡圍棋或其他複雜問題的所有可能路徑。如圖中的示意,我們只分析可能性中的一小部分路徑(藍色所示),然後在有限的思考時間內(比如一到兩分鐘),選擇最佳的、最有可能成功的路徑(紫色所示)。



當我們攻克了遊戲AI的巔峰時,我們便知道自己已經掌握了足夠先進的技術,可以將這些方法應用於現實世界的重大科學挑戰。
那麼,什麼樣的問題適合用這種 AI 方法去解決呢?

我們通常會從三個標準去判斷一個問題是否適合應用人工智慧。
第一,它是否能夠被歸納為一種在極其龐大、複雜的組合搜尋空間中尋找最優路徑的問題?
第二,我們能否清晰地定義一個目標函式或者最佳化指標,用於判斷模型是否正在取得進展? 比如,在遊戲中這一點就很容易實現,我們的目標是贏得比賽或者取得更高的分數。
第三,我們是否有大量的資料可供訓練神經網路模型?或者我們是否擁有一個精確高效的模擬器,可以持續生成更多合成數據?
事實上,當我們用這樣的角度來看問題時,就會發現有許多現實問題都符合或者可以被調整到這種模式,尤其是科學領域中的許多難題。
攻克科學難題
AlphaFold與蛋白質摺疊
而在這些問題中,我一直最想用人工智慧去解決的,正是“蛋白質摺疊問題”。
自從我在劍橋大學讀本科時第一次瞭解到蛋白質摺疊這個迷人難題,它便一直高居我的心願單榜首。

正如之前提到的,蛋白質是生命的基石。每個生物體內幾乎所有的生命過程都依賴於蛋白質發揮作用:從肌肉纖維的抽動到神經元的放電。因此,蛋白質本質上就是一種精妙的奈米級生物機器,擁有極致的美感。

我們知道,蛋白質是由氨基酸序列定義的,就像左側所展示的這樣;而這些氨基酸序列會摺疊成右側展示的複雜三維結構。你可以把這種過程想象成一串珠子捲曲成一個球的過程。理解蛋白質的三維結構能讓我們深入瞭解它的功能,這對理解疾病以及加速藥物開發至關重要。
那麼問題來了:我們是否能僅憑藉蛋白質的氨基酸序列(一維序列),直接預測出它的三維結構?
1972年,克里斯蒂安·安芬森(Christian Anfinsen)在他的諾貝爾獎演講中就提出,這在理論上應該是可能的。他提出了著名的“熱力學假說”,即一個蛋白質會自動地選擇一個能量最低的狀態。這一假設開啟了科學界長達半個世紀的探索歷程,人們致力於用計算方法來破解這一挑戰。

那麼,這個問題到底難在哪裡呢?
過去,人們通常需要用實驗手段確定蛋白質的結構,這是非常複雜、困難且耗費時間的過程。單單解析一個蛋白質的結構,可能需要幾個月甚至數年時間。
列文塔爾(Leventhal)曾用著名的“列文塔爾悖論”清晰地描述了這一困難。他估計,對於一個典型大小的蛋白質來說,它可能有多達 10^300 種不同的構象——一個天文數字。因此,如果用窮舉法列舉所有可能性,那所需的時間將遠遠超過宇宙的年齡。但令人驚奇的是,在自然界中,蛋白質能在短短幾毫秒內自動摺疊完成。這讓我們相信,這背後一定有某種高效的能量地形(energy landscape),引導著蛋白質快速完成摺疊過程。也許我們能用人工智慧找出這個自然界早已擁有的摺疊規律。

我們選擇蛋白質摺疊問題的另一個原因,是它有充足的資料可以用來訓練模型,並且具備非常清晰的、可用於測量研究進展的基準測試(benchmark)。
經過幾十年實驗工作,人類已經用實驗方法確定了大約17萬個蛋白質的結構,並將其整理進了蛋白質資料庫(PDB)中,這成為訓練 AlphaFold 模型的重要基礎資料。此外,還有一個名為 CASP 的國際比賽(自1994年以來,每兩年由約翰·莫爾特教授及其團隊組織一次),被公認為蛋白質結構預測領域的黃金標準基準測試。
這個比賽最精妙之處在於,它是一個盲測式評估比賽。科學家剛剛透過實驗確定了某些蛋白質的結構,但尚未公開發表。所有參與預測的團隊都不知道這些結構的實際樣子,因此能真正檢驗計算方法的預測能力。
我們一直被告知,要讓計算預測結果真正實用、能夠幫助實驗科學家,預測誤差必須縮小到一個原子的寬度內,也就是平均小於一埃(angstrom)的誤差。這是非常高的精準度要求。

最終,我們透過 AlphaFold2 系統成功實現了原子級的預測精度。
我們在2016年推出了 AlphaFold1,並於2018年首次參加了第13屆 CASP 競賽(CASP13)。當時 AlphaFold1 已經在這一領域取得了重大突破,顯著提高了預測精度,首次將機器學習作為蛋白質摺疊預測方法的核心。但 AlphaFold1 並未達到“原子級精度”(即圖表中代表90分的 GDT 精度線)。
隨後,我們基於 AlphaFold1 的經驗,重新設計開發出 AlphaFold2 並參加了 CASP14 競賽。這次,AlphaFold2 一舉突破了原子級精度門檻,競賽組織方甚至宣佈,蛋白質摺疊問題已被實質性解決。

AlphaFold2 的架構非常創新,我這裡就不贅述技術細節,因為 John 隨後的演講中會具體講到。但我想強調的是,解決這一問題並沒有單一的靈丹妙藥,AlphaFold2 整合了十多項不同的創新,組成了一個複雜的混合系統(hybrid system)。其中關鍵的一步是將進化約束(evolutionary constraints)和物理約束(physical constraints)與機器學習元素緊密結合。AlphaFold 團隊的跨學科性質也起到了重要作用,這個團隊中既有生物學、化學專家,也有機器學習和工程專家。

AlphaFold迭代預測蛋白質結構的過程
AlphaFold2 是一個端到端的系統,從氨基酸序列輸入開始,直接輸出蛋白質的三維結構預測。它還透過一種迭代精煉機制(recycling stage),逐步提高預測精度。比如,在 CASP14 中的一個複雜蛋白質案例中,你能看到預測(藍色)與真實結構(綠色)非常吻合,AlphaFold2 經過192步迭代,不斷改善,最終精準地給出了蛋白質的結構。


當 AlphaFold2 系統完成之後,我們自然希望能讓它發揮最大的影響力。
AlphaFold 不僅精準,而且速度極快,我們很快意識到,它實際上有能力預測所有已知蛋白質的結構——大約兩億多個我們已知序列卻不清楚結構的蛋白質。因此,在接下來的一年時間裡,我們的計算機完成了這兩億多個蛋白質結構預測,並與歐洲生物資訊研究所(EMBL-EBI)的同事們合作,建立了 AlphaFold 資料庫,免費、開放地供全世界所有研究者使用。
當然,我們在釋出 AlphaFold 資料庫時也非常謹慎地考慮了安全和倫理問題。我們特意諮詢了超過30位生物安全和生物倫理領域的專家,以確保釋出該資料庫帶來的好處遠遠超過任何潛在風險。
AlphaFold 產生的影響力遠遠超出了我們的預期:全球超過兩百萬研究人員使用了 AlphaFold 的預測結果,相關論文引用量超過三萬次,AlphaFold 已經成為生物學研究領域的標準工具之一。

僅舉幾個 AlphaFold 所推動進步的例子:
-
設計新型酶來解決塑膠汙染問題;
-
幫助攻克那些影響世界貧困地區但長期資金不足的被忽視疾病;
-
協助基礎結構生物學研究,比如確定核孔複合物的結構;
-
甚至就在幾周前,科學家利用 AlphaFold 發現了新的繁殖機制。
我相信,這一切還只是 AlphaFold 這類程式所產生影響的開端。
我們一直在持續開發 AlphaFold,就在今年早些時候,我們釋出了最新的 AlphaFold 3 系統。這也是一次重大進步,因為此前的 AlphaFold 2 主要解決的是蛋白質結構的靜態圖景,即蛋白質本身的結構是什麼樣的。但我們都知道,生物學本質上是極其動態的,許多有趣的生物現象都是在生物系統的不同成分之間相互作用時才會發生的。

AlphaFold3:
模擬生命中的所有分子
AlphaProteo:
設計可與目標分子或蛋白結合的新型蛋白質
AlphaFold 3 是我們在建模這種動態互動方面邁出的第一步,它能夠模擬蛋白質與蛋白質之間的兩兩相互作用,此外還包括蛋白質與 RNA、蛋白質與 DNA,以及蛋白質與配體之間的相互作用。這向利用 AlphaFold 進行藥物研發的目標邁進了一大步。

數字生物學
生物學作為一種資訊處理系統
最後,我想稍微放大一下視野,談談這項工作的廣泛意義,以及我們和同事們對 AI 在科學研究領域更宏觀的看法。

如果我們退一步來觀察我們所建立的這些系統(包括 AlphaGo、AlphaFold 以及其他一些系統)的本質,它們實際上都是在極其龐大的組合搜尋空間中尋找最佳解答的方法。我們透過學習資料或模擬環境中的模型,然後利用這些模型引導搜尋過程,朝著某個我們希望最佳化的目標函式前進。
事實證明,這是一個非常通用的解決方案,許多問題都適合這樣的思路。


比如,之前我展示的圍棋遊戲中的樹狀圖,我們很容易將樹狀圖中每個節點的圍棋佈局換成化合物或藥物設計。這時,搜尋樹所代表的就是在化學空間中尋找最佳分子或最佳藥物化合物的過程。而我們完全可以用類似的技術方法去解決這些問題。

這意味著,我們或許正在進入一個我稱之為“數字生物學”(digital biology)的新時代。我一直認為,生物學在最基本的層面上可以被視作一種資訊處理系統,儘管它是極端複雜且具有湧現特性的系統。正因如此,生物學很難用簡單的數學方程歸納出來。
數學一直是描述物理現象的絕佳工具和語言,而我認為,人工智慧可能正是描述生物學的理想語言。我們希望,未來回顧時,AlphaFold 能被視為開啟這一“數字生物學”新時代的重要證明。
為了推動這一願景,我們在幾年前成立了新公司 Isomorphic Labs,這家公司致力於在 AlphaFold 基礎上,用 AI 從根本上重新構想藥物研發過程。或許有一天,我們能將藥物研發——這個漫長、昂貴且困難的過程——從數年縮短到數月、數週甚至更短的時間。
有時我們會把這種由 AlphaFold 引發的科學加速程序稱作“以數字速度做科學”(science at digital speed)。而我長期以來的夢想之一,是有一天能用 AI 模擬出一個完整的虛擬細胞——不只是模擬單個蛋白質或幾個蛋白質之間的互動,而是整個細胞。這些預測結果將對實驗科學家產生巨大的幫助。
未來展望
經典計算的潛力與倫理責任
考慮到這是諾貝爾獎演講,我想以一些稍帶挑釁意味的新觀點作為結束,就像1972年克里斯蒂安·安芬森演講中的風格一樣。

自從完成 AlphaGo 專案以來,我一直在思考經典計算系統的極限究竟在哪裡。目前計算機領域有一個很熱門的討論,就是量子計算機與經典計算機之間的對比。
我認為,經典圖靈機,也就是我們今天計算機的基礎,實際上可能比我們過去想象的更加強大。
它們是如何做到的呢?經典系統或許能夠提前做大量的預計算(precompute),建立起高質量的環境模型或問題模型,然後利用這個模型在所謂的多項式時間內(複雜度理論中的術語,意味著高效的時間)高效地探索解答空間。
因此,我提出了一個粗略的猜想:自然界中能產生或發現的任何模式或結構,都可能被經典學習演算法高效地發現和建模。當然,這並不意味著經典系統能模擬所有量子系統,因為有些量子系統並不表現出自然界的模式或結構,比如大數分解這類抽象問題。但我相信,自然界中的一些系統,比如蛋白質甚至材料,或許具有某種結構,可以被我們今天描述的這種學習過程高效地學習。
如果經典系統最終真的能模擬某些量子系統,這可能會對複雜性理論領域,比如 P 與 NP 問題,甚至是基礎物理中的資訊理論產生深遠影響。

最後一點,今天我著重談的是人工智慧在生物學和生命科學中的應用,但實際上我們在 DeepMind 已經將 AI 廣泛應用到醫學、氣候研究、數學等多個科學領域。過去幾年,我們做出了許多應用 AI 的研究成果,包括醫學影像分析與診斷、基因序列中錯義變異的識別、核聚變反應堆中等離子體的控制、更高效的矩陣乘法演算法、最先進的天氣預測系統,以及發現數以千計我們從未見過的新材料。AI 正在成為科學研究的一種基礎性工具。
我們可能正在進入一個新的發現黃金時代,新的強大 AI 工具將加速這一程序。

當然,我一生從事人工智慧研究,是因為我相信它能幫助我們應對人類面臨的重大挑戰。但同時,AI 也是一種“雙刃劍”技術,它必須負責任地、安全地開發和使用,以造福全人類。為此,我認為科學家和技術專家必須積極與政府、學術界和民間社會等各類利益相關者合作,廣泛聽取意見,共同決定這些系統的最佳應用方式。
我認為,通用人工智慧(AGI)這項技術的變革力量類似火和電的發明,我們需要極大的謹慎和遠見,才能安全地引導我們走過接下來的技術發展階段。但如果我們能安全地引導這一技術的發展,AGI 或許最終會成為幫助我們理解宇宙和我們自身存在意義的終極工具。

最後,我要特別感謝 AlphaFold 團隊、AlphaGo 和 AlphaZero 團隊,DeepMind 和 Google 所有同事、歐洲生物資訊研究所(EMBL-EBI)的合作者們,CASP 社群以及 PDB 和實驗生物學界。當然,最重要的是,我要感謝我的家人、朋友和同事們,沒有他們的愛與支援,我不可能取得今天的成就。
謝謝大家!


影片連結:
https://www.youtube.com/watch?v=YtPaZsasmNA&t=4s
