Borg排程進化了!谷歌超強AIAgent登場:能設計算法、提效系統,陶哲軒親自助攻,網友封神理科扛把子!

編譯|核子可樂、冬梅
昨晚,科技圈又炸鍋了!
谷歌 DeepMind 又放出了大招——歷時一年半鑽研的 AlphaEvolve 終於亮相了。這個由 Gemini 驅動的 AI 智慧體,簡直就是個會自我進化的“解題機器”。
專案地址:https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
簡單來說,它就像個超級學霸:將谷歌 Gemini 解決創造性問題的能力和能驗證答案的自動評估器相結合,然後用進化框架來最佳化最有潛力的想法。
這項成就已經被《Nature》刊登,它的厲害之處在於剛出道就破了數學界 53 年紀錄:用 48 步計算搞定 4×4 複數矩陣乘法(相當於把祖傳的“珠算口訣”給優化了)。
它不只會算矩陣——幾何題、數獨謎、質數猜想…50 多個數學領域的未解難題也都不在話下。
但 DeepMind 團隊的說法很實在:“這 AI 不是來替代數學家的,是來當助手的。” 也就是說,DeepMind 將它定位為一款“Agent”,畢竟它最擅長的就是把人類要花幾個月驗證的想法,壓縮到幾小時裡試錯迭代。
值得注意的是,華裔數學家、菲爾茲獎得主陶哲軒也參與了該專案,他在社交平臺發文稱,
“我(與 Javier Gomez-Serrano 一起)正與谷歌 DeepMind 的一個團隊合作,探索其工具 “AlphaEvolve”(其早期工具 “Funsearch” 的後續產品,該工具於今日公開宣佈)在數學領域的潛在應用。大致來說,這是一種能夠嘗試對函式 F (x) 進行極值化的工具,其中 x 取值於高維引數空間 Ω。當引數空間維度極高且函式 F(及其極值點)具有非明顯結構特徵時,該工具的表現可能優於更傳統的最佳化演算法。
我們已嘗試將該工具應用於一些初步問題,包括涉及調和分析不等式、加性組合學和堆積問題的相關內容,這些在公告中已有提及;我們現在正逐步轉向更具挑戰性的問題,這類問題的引數空間中優質解的集合更為稀疏。這項工作仍在進行中,但我希望在接近完成時(可能在幾個月後)能夠彙報更多進展。”
業內怎麼看?
目前,AlphaEvolve 已被部署在谷歌資料中心、晶片設計以及 AI 訓練系統當中,在提升效率的同時,也解決了不少困擾研究人員幾十年的數學難題。
谷歌 DeepMind 研究員 Matej Balog 在接受採訪時解釋道,“AlphaEvolve 是一款由 Gemini 驅動的 AI 編碼智慧體,能夠在計算和數學領域取得新發現。它可以提出極其複雜的演算法——往往超過數百行程式碼,且複雜的邏輯結構遠非平常函式可以比肩。”
該系統透過演進整體程式碼庫、而非特定函式,極大擴充套件了谷歌此前在 FunSearch 專案上的成果。它代表著 AI 在開發複雜演算法以應對科學挑戰和日常計算問題方面,再次實現了重大飛躍。
AlphaEvolve 的釋出迅速引發熱議。
在 X 平臺上,AI 初創創始人 Justin Halford 驚歎 AlphaEvolve 超人編碼能力,並稱程式設計將在 10 年內迎來它的 AlphaGo 時刻。
也有人認為,這就是未來學習思考的方式,人工智慧不僅僅是解決問題,它正在解鎖智力的維度。
AI 創企 Rediminds 公司也發文對 AlphaEvolve 表示祝賀,並認為 AlphaEvolve 的出現標誌著一種正規化轉變:
“人工智慧不僅應用演算法,更能創造演算法。透過將 LLM 驅動的提案生成與自動化、嚴格的評估迴圈相融合,它已經提供了新的矩陣乘法例程,並在數十個開放數學問題上超越了人工設計的解決方案。”
計算效率提升 0.7%:
AI 創造演算法接管執行公司資料中心
AlphaEvolve 在谷歌內部默默運轉了一年有餘,且成果已經十分顯著。
它發現的一種演算法正在驅動谷歌的大規模叢集管理系統 Borg。這種啟發式排程演算法平均可釋放谷歌全球基礎設施中 0.7% 的計算資源——以搜尋巨頭的規模而言,這樣的效率提升可謂相當驚人。
這項成果針對的是所謂“擱淺資源”——即那些某種資源已被耗盡(如記憶體)、但其餘資源型別仍有剩餘(如 CPU)的可用裝置。AlphaEvolve 提出的解決方案之所以極其價值,是因為它能夠生成簡單易讀的程式碼,以供工程師們輕鬆解釋、除錯和部署。
這款 AI 智慧體的應用範圍遠不止於資料中心。它還重寫了谷歌部分硬體設計,找到新方法來消除張量處理單元(TPU)關鍵運算電路中不必要的位元位。TPU 設計人員驗證了這一改進並確認可行,其將被應用於後續推出的晶片設計當中。
更令人印象深刻的是,AlphaEvolve 還改進了驅動其自身的系統。它優化了用於訓練 Gemini 模型的矩陣乘法核心,將該運算的速度提升了 23%、藉此將整體訓練時間縮短了 1%。對於在少量計算網格上訓練的 AI 系統來說,這樣的效率提升足以實現可觀的電力與資源節約效果。
另一位 DeepMind 研究員 Alexander Novikov 在採訪時表示,“我們努力尋找能夠加速並儘可能發揮重要作用的關鍵部件。我們得以將一個重要核心的實際執行速度優化了 23%,意味著將整個 Gemini 訓練卡的端到端效能節約下 1%。”
打破 Strassen 保持 56 年的
矩陣簡潔記錄
AlphaEvolve 解決了困擾人類專家幾十年的數學難題,同時推動了現有系統的進步。
該系統設計了一種基於梯度的新穎最佳化程式,進而發現了多種新的矩陣乘法演算法。其中一項發現,直接打破了一項保持了 56 年的數學記錄。
Balog 在談到 DeepMind 之前的專用矩陣乘法系統時表示,“說實話,最讓人驚訝的是雖然 AlphaEvolve 其實是一項更強調通用性的技術,但它的結果甚至比 AlphaTensor 還要好。對於這些 4 x 4 矩陣,AlphaEvolve 首次找到一種超越 Strassen 1969 年演算法的新解法。”
這項突破使得兩個 4 x 4 復值矩陣相乘只需要 48 次標量乘法,優於此前的 49 次——自 Volker Strassen 當初發表的里程碑成果以來,數學家們一直未能突破這個難題。根據研究論文,AlphaEvolve 共“改進了 14 種矩陣乘法演算法的最優解”。
該系統的數學應用範圍遠遠超出了矩陣簡潔。在針對數學分析、幾何學、組合學及數論領域 50 多個未解決問題進行測試時,AlphaEvolve 在約 75% 的案例中給出了與最先進解法相媲美的結果。而在約 20% 的案例中,它的答案甚至比已知最佳解法還要先進。
“接吻數問題”也取得了重大突破——這是一個有著數百年曆史的幾何學挑戰,旨在確定有多少個不重疊的單位球體能夠同時接觸一箇中心球體。在 11 維空間上,AlphaEvolve 發現了包含 593 個球體的配置方式,打破了之前 592 個球體的記錄。
怎麼做到的?
AlphaEvolve 與其他 AI 編碼系統的最大區別,在於其採用的進化方法。
該系統同時部署有 Gemini Flash(以提升速度)和 Gemini Pro(以提升深度),藉此對現有程式碼提出修改建議。這些修改會由自動評估器進行測試,並針對每個變化進行評分。最成功的演算法將引導下一輪進化。
AlphaEvolve 不僅僅是根據訓練資料生成程式碼。它還會主動探索解法空間,發現新穎方法,並透過自動評估流程對其進行改進,最終創造出人類可能從未想到過的解法。
Novikov 解釋道,“我們方法中的一個關鍵理念,在於專注具有明確評估方式的問題。對於任何提出的解法或程式碼片段,我們都可以自動驗證其有效性並衡量方法質量。如此一來,我們就能建立起快速可靠的反饋迴圈來改進整個系統。”
這種方法之所以極具價值,是因為該系統可以處理一切具有明確評估指標的問題——既包括資料中心的能源效率,也涉及優雅的數學證明。
DeepMind 表示,在實驗中,AlphaEvolve 系統可以幫助最佳化谷歌用於訓練其 AI 模型的部分基礎設施。他們正在構建一個用於與 AlphaEvolve 互動的使用者介面,並計劃在可能進行更廣泛推廣之前,先為選定的學者推出一個早期訪問計劃。
大多數人工智慧模型都會產生幻覺。由於其機率架構,它們有時會自信地編造一些事情。事實上,像 OpenAI 的 o3 這樣的較新的人工智慧模型比它們的前幾代產品更容易產生幻覺,這說明了這個問題的挑戰性。
AlphaEvolve 引入了一種巧妙的機制來減少幻覺:自動評估系統。該系統使用模型生成、評估並得出一個問題的可能答案池,並自動評估和評分答案的準確性。
DeepMind 實驗室表示,其 AlphaEvolve 系統旨在供領域專家使用
谷歌演算法驅動型 AI 的下一步發展方向
AlphaEvolve 目前被部署在谷歌的基礎設施與數學研究當中,但其潛力遠不止於此。谷歌 DeepMind 設想將其應用於材料科學、藥物研發以及其他需要複雜運算解法的領域。
Novikov 強調該系統的協作潛力時指出,“最佳人機協作有助於解決開放的科學挑戰,並將成果應用在谷歌規模的龐大業務體系當中。”
谷歌 DeepMind 目前正與其“人機協同”研究團隊合作開發使用者介面,並計劃面向部分學術研究人員推出早期訪問計劃。該公司還在探索更廣泛的專案應用空間。
該系統擁有顯著的靈活性優勢。Balog 指出,“至少在我從事機器學習研究工作之前,我還很少見到哪種科學工具能夠快速起效併產生如此規模的實際影響。這真的非常罕見。”
隨著大語言模型的進步,AlphaEvolve 的功能也將隨之增強。該系統展示了 AI 自身的一種有趣演變——從谷歌伺服器的數字化疆域開始,最佳化賦予自身生命的硬體和軟體。如今,這份成果已經大大延伸,開始解決困擾人類幾十年甚至幾個世紀的巔峰難題。
今日好文推薦
直播預告
從 0 到 1,AI 創業者的實戰經驗分享。多位一線 AI 創業者現身說法,親述從想法到落地的真實經歷。當 AI 不只是工具,而是時代機會,你準備好抓住了嗎?掃碼預約,不見不散!

相關文章