

作為 GoogleDeepMind 的聯合創始人兼 CEO,以及因在蛋白質結構預測領域的貢獻而獲得諾貝爾獎的科學家,德米斯·哈薩比斯(Demis Hassabis)毫無疑問是當今人工智慧領域最具影響力的人之一。近期,透過一系列播客訪談及在英國劍橋大學的公開講座,哈薩比斯闡述了他對 AI 發展的看法、DeepMind 的研究路徑,以及 AI 在未來,尤其是在科學研究和現實世界應用中的潛力。
“AI 將影響整個世界,每個行業,每個國家。在我看來,它將是有史以來最具變革性的技術,”哈薩比斯在與 LinkedIn 聯合創始人 Reid Hoffman 主持的 Possible 播客節目中開宗明義地指出。他將 AI 的潛在影響力比作“電力或火”,並強調全球參與其設計的重要性,認為這不應僅僅侷限於矽谷的“百平方英里加州地塊”。他認為,吸納來自不同地域、不同學科(如哲學、社會科學、經濟學)乃至更廣泛社會群體的觀點,“不僅僅是科技公司和科學家”,共同決定 AI 的構建方式和應用方向,至關重要。
這份思考,源於一段始於棋盤而非機房的獨特旅程。

圖丨相關播客欄目(來源:Spotify)

棋盤上的頓悟:“思考‘思考’本身”
哈薩比斯的早年生活幾乎被國際象棋佔據。自四歲學棋起,他便展現出驚人天賦,曾擔任英國青少年隊隊長,一度立志成為國際象棋特級大師,甚至世界冠軍。“那幾乎是我整個童年。”他回憶道,“所有課餘時間,我都在世界各地參加比賽,與成年棋手對弈。”
然而,大約 11 歲時,一次深刻的自我反思改變了他的人生軌跡。“(下棋)真的是一個人應該傾注一生的事業嗎?這是對我才智的最佳運用嗎?”這種內省恰逢他在英國國家隊訓練營中接觸到早期象棋計算機。本意是提升棋藝,哈薩比斯卻被一個更根本的問題所吸引:一個“沒有生命的塑膠塊”如何能下得如此出色?
“我更著迷的是,有人編寫程式讓它做到了這一點……我非常想理解其中的原理,並最終嘗試編寫自己的象棋程式。”這標誌著他轉向了元認知(metacognition)——如 Hoffman 所說的,“思考‘思考’本身”。他的焦點從精通遊戲轉向了理解智慧過程的本質,以及如何利用計算來加速這一過程。
儘管如此,早期 AI 的侷限性也讓他感到些許“失望”。他提到了著名的“深藍”(Deep Blue)對戰卡斯帕羅夫(Garry Kasparov)的比賽。當時已在劍橋大學學習神經科學的哈薩比斯表示,自己“對卡斯帕羅夫的大腦印象更深……而非那臺機器”。作為“專家系統”(expert system)方法的巔峰之作,“深藍”依賴於人類程式設計師精心編寫的啟發式規則(heuristics)和強大的蠻力搜尋(brute force search)。它能達到世界頂尖的象棋水平,但除此之外,若不重新程式設計,連井字棋(tic-tac-toe)都不會下。
‘深藍’看起來……並不智慧,“哈薩比斯表示,它缺少的是學習新事物的能力……而且它不像人腦那樣具有通用性。我認為這些(學習能力和通用性)才是智慧的標誌……是我們破解 AI 難題所必需的。”
這些認識為 2010 年 DeepMind 的創立奠定了基礎。在專家系統仍佔主導、AI 研究某種程度上處於“寒冬”之時,哈薩比斯和他的同事們做出了一個逆向押注:專注於學習系統。公司名稱中的“Deep”部分,正是指向了“深度學習”(deep learning)這種受大腦結構啟發的層級化神經網路技術。
更關鍵的是,DeepMind 將深度學習與強化學習(RL, Reinforcement Learning)相結合,後者同樣源於對動物行為和神經科學的研究。強化學習的核心是透過試錯來學習,在環境中採取行動,根據結果獲得獎勵或懲罰,最終目標是最大化累積獎勵。“這基本上是人腦工作的兩大核心組成部分。”哈薩比斯解釋說,“大腦是一個神經網路,一個模式匹配和結構發現系統。但它同時也有強化學習機制……(大腦中的)多巴胺系統就實現了這一點。”
這種生物學上的合理性,在 AI 研究的寒冬時期給予了他們極大的信心。“當你身處沙漠……你需要任何水源或證據來指引方向……而當時的 AI 正處於這種困境,因為之前的嘗試(專家系統)多次失敗,基本走到了天花板。”DeepMind 開創性地將這兩種方法融合為“深度強化學習”(deep reinforcement learning),創造出能夠從零開始學習複雜任務的智慧體(agent)。

AlphaGo、“上帝之手”與創造力的本質
遊戲成為了檢驗和完善這些理念的完美“坩堝”。它們提供了可控的環境、明確的目標(獲勝、最大化得分)、可量化的進展(Elo 等級分),以及與人類頂尖專家進行校準的機會。而終極挑戰,便是古老的圍棋。
圍棋的複雜度遠超象棋——哈薩比斯指出,其可能的狀態數估計高達 10 的 170 次方,“比宇宙中的原子還多”。蠻力計算毫無可能。此外,圍棋高度依賴直覺;頂尖棋手常常難以清晰描述其落子背後的邏輯,只是說感覺“對”。這種基於模式識別和美感的特性,讓傳統專家系統束手無策。
DeepMind 的 AlphaGo 採用了不同的策略。它透過觀察數百萬局人類棋譜進行學習,隨後又與自身進行了數百萬局的對弈。它發展出了自己對“好”的模式、棋形和致勝局面的理解。2016 年,AlphaGo 在首爾與世界冠軍李世石進行了一場載入史冊的人機大戰。決定性的時刻出現在第二局:第 37 手。
“那是一步真正充滿創造力的棋。”哈薩比斯回憶道。圍棋已有數千年曆史,其策略已被深入探索。然而,第 37 手前所未見,甚至最初被頂尖解說認為是失誤。“他們以為操作員 Aja 點錯了滑鼠……因為那一步太不可思議了。”哈薩比斯說。但在一百多手之後,這步棋被證明是制勝的關鍵。

圖丨 AlphaGo 和李世石對戰第二局的前 99 步(來源:WikiPedia)
第 37 手(常被稱為“神之一手”)完美詮釋了哈薩比斯所定義的第二層次創造力:外推(extrapolation)。“你從已知資訊出發進行推演,得出一個前所未見的新策略,就像第 37 手。這本身就非常有價值。”這與第一層次的內插(interpolation,例如從數百萬張貓的圖片中生成一張平均的貓臉)以及尚難企及的第三層次——發明(invention)或“跳出框架思考”(out-of-the-box thinking)——形成對比。AI 能否發明圍棋本身?或者基於 1900 年代的資訊推匯出廣義相對論?“顯然,今天的答案是否定的,”哈薩比斯坦誠,“仍然缺少一些東西……但我認為它(真正的創造力)終將到來。”
DeepMind 隨後透過 AlphaStar 繼續拓展邊界,挑戰了複雜的即時戰略(RTS, Real-Time Strategy)電子遊戲《星際爭霸 II》(StarCraft II)。與圍棋不同,《星際爭霸》包含不完美資訊(玩家無法看到全部地圖)、即時決策和資源管理等要素。為了攻克這一難關,DeepMind 設計了一個“智慧體聯盟”(league of agents),讓不同的 AI 策略在內部聯賽中相互競爭。獲勝的策略得以進化,併產生新的變種,形成一種類似演化的動態過程,最終培養出能夠擊敗頂尖職業玩家的智慧體。這成功解決了部分資訊環境下的決策問題,向模擬真實世界挑戰邁進了一大步。
哈薩比斯將這種利用遊戲的方式與“遊戲的人”(Homo Ludens)概念聯絡起來,認為玩耍是人類經驗的基礎,它不僅孕育創造力,也提供了一個安全的“練習場”,讓人們可以在壓力下模擬和訓練關鍵決策能力。因此,遊戲不僅是基準測試,更是開發通用 AI 能力的理想訓練場。

從畫素到蛋白質:AlphaFold 與“數字生物學”的黎明
在證明了學習系統在複雜遊戲領域的強大能力後,哈薩比斯和 DeepMind 轉向了他們的終極目標:利用 AI 加速科學發現。“我畢生致力於 AI 工作的全部意義,就是用它來加速科學發現。”他強調。他將目光投向了他所謂的“根節點問題”(root node problems)——那些一旦解決,就能解鎖整個全新知識分支的基礎性科學難題。
蛋白質摺疊問題(protein folding problem)正是他任務清單中的重中之重。蛋白質是生命的基石,其複雜的三維結構決定了其功能。理解這些結構對於揭示疾病機理和設計藥物至關重要。然而,僅根據蛋白質的氨基酸線性序列預測其三維形狀,是一個困擾了科學家 50 年的巨大挑戰(因可能構象數量龐大,也被稱為“Levinthal 悖論”)。
運用在遊戲 AI 中磨練出的技術,DeepMind 開發了 AlphaFold。2020 年,它在國際蛋白質結構預測關鍵評估競賽(CASP,Critical Assessment of protein Structure Prediction)中展現出驚人的準確性,被廣泛認為有效解決了該問題。隨後,DeepMind 使用 AlphaFold 預測了幾乎所有已知蛋白質(超過 2 億種)的結構,並將這個龐大的資料庫免費開放給全球科學界。

圖丨 AlphaFold(來源:Google)
其影響是革命性的。“這就像在一年內完成了十億年的博士研究時間,”哈薩比斯在劍橋講座中提到。“全球有兩百萬研究人員正在使用它……已被引用超過三萬次,並已成為生物學研究的標準工具。”這項成就為哈薩比斯和 DeepMind 的同事 John Jumper 贏得了 2024 年諾貝爾化學獎。
AlphaFold 不僅是一項生物學突破,更預示著哈薩比斯所稱的“數字生物學”(digital biology)新紀元的到來。“目前開發一種新藥平均需要 10 年時間……耗資數十億美元,”他說,“我們為什麼不能利用這些(AI)技術,將這個時間從數年縮短到數月?甚至,未來某一天,縮短到數週?就像我們將蛋白質結構發現的時間從過去的數年縮短到了分鐘乃至秒級一樣。“他認為,AI 有潛力成為描述生物學的“完美語言”。

邁向現實世界:多模態、機器人與通用智慧助理
隨著 AlphaFold 的成功,DeepMind 的研究重心愈發轉向現實世界的應用。哈薩比斯強調了多模態的重要性,即讓 AI 能夠像人類一樣,同時處理和理解多種型別的資訊輸入,如文字、影像、音訊和影片。
“我們生活在一個多模態的世界,”他解釋道,“如果我們希望 AI 系統成為出色的工具或助手,它們最終需要理解我們所處的空間和時間世界,而不僅僅是語言或抽象思維世界。”
這直接關係到機器人技術的未來。過去,人們普遍認為機器人需要透過物理互動(即所謂的“具身智慧”,embodied intelligence)才能真正理解物理世界。然而,哈薩比斯指出,DeepMind 最新的影片模型(如 Veo 2)僅透過觀看海量 YouTube 影片,似乎就能掌握相當程度的物理常識,這讓他也感到震驚。這表明,強大的多模態基礎模型經過微調後,可能無需大量額外的機器人資料就能應用於機器人控制,這或許會大大加速機器人技術的發展。
DeepMind 正在推進一個名為“Project Astra”的研究原型,旨在打造“通用智慧助理”(universal assistant)。“它可以在你的手機或其他裝置上執行,也許是眼鏡。它能伴隨你在現實世界中活動,幫助你處理日常生活中的事務。”哈薩比斯描述道。例如在烹飪時提供即時指導,或識別周圍環境中的物體。這種助理的核心是能夠理解 3D 世界並進行規劃的多模態模型,如 DeepMind 的 Gemini 系列。

圖丨 Astra 旨在成為一個即時的多模態人工智慧助手(來源:Google)
同時,AI 也在改變軟體開發本身。哈薩比斯認為最近爆火的“vibe coding”代表了程式設計的未來,開發者主要透過自然語言與 AI 協作程式設計,將低層實現細節交給 AI 處理。這將極大地降低程式設計門檻,賦能設計師、藝術家等創意人士將想法變為現實,並使專業程式設計師的效率提升“10 倍”,實現人機協同創作的新模式。
此外,未來 10 到 15 年,哈薩比斯最希望看到的是 AI 在醫學領域帶來突破性進展,實現“數字速度的科學”(science at digital speed),大幅加速新藥研發,甚至“真正有機會解決所有疾病”。
他甚至提出了一個猜想:基於經典計算(圖靈機)的 AI 系統,其潛力可能遠超我們目前的認知,或許有一天能夠幫助人類探索量子力學乃至宇宙的基本規律。“我一直認為,以這種方式構建的通用人工智慧,可能成為理解我們周圍宇宙以及我們在其中位置的終極通用工具。”哈薩比斯說道。
參考資料:
1.https://www.possible.fm/podcasts/demis/
2.https://www.cst.cam.ac.uk/nobel-laureate-and-cambridge-university-alumnus-sir-demis-hassabis-heralds-new-era-ai-drug-discovery
運營/排版:何晨龍



