突破300年數學難題!陶哲軒出題,DeepMind通用科學AI智慧體一夜屠龍


新智元報道  

編輯:桃子 好睏
【新智元導讀】谷歌DeepMind重磅推出AlphaEvolve,最強通用AI智慧體橫掃數學難題!它不僅推動了300年「接吻數難題」,一舉顛覆了56年前Strassen演算法神話。而且,還在AI訓推、TPU設計、資料中心領域,展現出了極強的實力。
就在剛剛,谷歌DeepMind祭出終極AI智慧體——AlphaEvolve,一個由Gemini驅動的進化編碼神器。
歷時一年半,它的出世,直接炸翻了演算法界。
AlphaEvolve核心機制,是將谷歌Gemini解決創造性問題的能力和能驗證答案的自動評估器相結合,然後用進化框架來最佳化最有潛力的想法。
它用48次標量乘法,搞定4×4複數矩陣乘法,改進了1969年Strassen最優演算法。
AlphaEvolve不僅僅是矩陣乘法屠龍刀,還是個跨界狂魔。
DeepMind團隊讓其解決數學分析、幾何、組合學、數論等領域的50+開放問題。

菲爾茲獎得主陶哲軒等大佬親自出題,谷歌論文致謝
在約75%題目中,它重新發現了最前沿解法;在20%題目中,它直接碾壓了已知最佳解。
AlphaEvolve最炸裂的戰績,便是改進了困擾數學家300多年的「接吻數問題」!
Wikipedia已更新至谷歌DeepMind的最新資料
甚至,AlphaEvolve讓谷歌資料中心效率飆升,平均回收了0.7%的計算資源。
此外,它還能提升晶片設計和AI訓練過程的效率,包括訓練它自己所使用的LLM。
AI初創創始人Justin Halford驚歎AlphaEvolve超人編碼能力,並稱程式設計將其十年內迎來AlphaGo時刻。

利用LLM設計更好的演算法
2023年,谷歌首次展示了LLM的驚人能力:生成用計算機程式碼編寫的函式,不僅能幫助發現開放科學問題的新知識,還能證明其正確性。
這一突破,為演算法設計開啟了全新篇章。
論文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf
如今,谷歌AlphaEvolve更進一步,超越了單個函式的生成,進化出能夠最佳化整個程式碼庫,並開發更復雜演算法的能力。
AlphaEvolve透過利用谷歌一系列SOTA模型,協同生成計算機程式,以程式碼形式實現高效的演算法解決方案。
其中,最快、最高效的Gemini Flash最大程度地拓展了探索性思路的範圍,而效能最強的Gemini Pro則透過富有洞察力提供關鍵最佳化建議。
AlphaEvolve的核心在於,其智慧的演算法生成與進化機制,如下圖所示。
提示詞采樣器為語言模型構建提示詞,隨後語言模型會生成新的程式。生成的程式會經過評估模組的評估並存儲於程式資料庫中,該資料庫採用進化演算法來決定哪些程式會被用於後續的提示詞構建
AlphaEvolve還引入了自動評估指標,來驗證、執行和評估候選程式。
它對提供的每個解決方案的準確性和質量,進行客觀、可量化的評估。
這種系統化方法確保了演算法最佳化透明度,尤其在數學、計算機科學等需要精確衡量進展的領域,展現出巨大的潛力。

發現矩陣乘法演算法
顛覆56年最優解神話
AlphaEvolve的威力究竟有多炸裂?
它能為複雜的數學問題提出新方法。
在提供最小程式碼框架後,它便能設計出全新的基於梯度最佳化程式的元件發現了多種用於矩陣乘法的新演算法。
AlphaEvolve開發的多種演算法,在14個不同矩陣乘法任務上實現了技術突破。
其中,最耀眼的成果,是用48次標量乘法來完成4×4複數矩陣乘法,徹底顛覆了Strassen演算法的「最優解」神話。
過去56年間,在特徵為0的任意數域中,設計少於49次乘法的演算法,始終是懸而未決的難題。
在求解過程中,AlphaEvolve對初始程式進行了重大改進,透過多項原創性設計逐步最佳化演算法。
Strassen演算法
不僅如此,相較於前輩AlphaTensor,AlphaEvolve簡直開了掛。
前者還在二進位制算術下,對4×4矩陣做小修小補,後者直接殺入複數矩陣,效率飆升。

300年親吻數難題再獲突破
為了測試AlphaEvolve的極限,谷歌DeepMind還將其投入了數學分析、幾何、組合學和數論中的50多個開放問題。
在短短幾小時內,AlphaEvolve完成了大多數問題的設定,展現出驚豔的靈活性。
更令人震撼的是,它在大約75%情況下,重新發現了最先進的解決方案;在20%情況下,改進了已知的最佳解決方案,並在相應的開放問題上取得了進展。
以困擾數學家300多年「親吻數」難題為例,AlphaEvolve在11維空間中,發現了593個外球的配置,重新整理了該問題的下限。
這一突破不僅讓幾何界為之沸騰,更呈現了AlphaEvolve在高維數學空間無敵探索力。
幾何學中,數學空間的親吻數被定義為一種空間排佈下非重疊單位球體的最大數量。其中,所有的單位球體都與一箇中心單位球體相切
此外,在這三個不同領域,AlphaEvolve取得的其他成果:
分析學領域
· 自相關不等式:AlphaEvolve在多個自相關不等式問題上,改進了已知最優界值。
有網友表示,陶哲軒還曾嘗試開發一個AI,來驗證分析中的估計,而且自己幾年前曾夢想過的事情,正在變為現實。
· 不確定性原理:AlphaEvolve透過最佳化傅立葉分析中不確定性原理構造,生成了一種改進的配置,略微提高了上界。
組合數學與數論
· Erdős最小重疊問題:AlphaEvolve為最小重疊問題建立了新的上界,小幅超越了此前記錄
幾何與堆積
· 親吻數問題
· 堆積問題AlphaEvolve在多個問題上取得突破:在給定形狀內佈置N個點,最佳化最大與最小距離比;實現多邊形最優巢狀填充;改進Heilbronn問題變體(構造避免形成小面積三角形的點集)

重構計算生態系統
效率成倍飆升
當然,AlphaEvolve的突破不侷限於數學,其實際應用已深刻改變了谷歌的計算生態系統。
在過去一年中,谷歌將AlphaEvolve發現的演算法,部署到資料中心、硬體、軟體等多個領域。
這些演算法最佳化措施,顯著提升了計算效率,尤其在AI和計算基礎設施中成倍放大。
AlphaEvolve助力谷歌實現了更高效的數字生態系統,涵蓋從資料中心排程、硬體設計到AI模型訓練的各個環節
這些改進不僅降低了能耗和運營成本,還為所有使用者構建一個更強大、更可持續的數字生態系統。

資料中心排程 :節省0.7%計算資源
在最佳化谷歌龐大的資料中心排程系統Borg時,AlphaEvolve發現了一種簡單但非常有效的啟發式方法,顯著提升計算資源效率。
這個解決方案已投入生產一年多,平均持續回收谷歌全球0.7%的計算資源。
這意味著,在相同的計算資源消耗下,任何時刻資料中心都能完成更多的任務。
更令人歎服的是,AlphaEvolve的解決方案不僅效能強大,其程式碼還具備顯著的運營優勢:可解釋性、易除錯性、可預測性和易部署性。

設計谷歌下一代TPU
AlphaEvolve的觸角還延伸到了硬體設計領域。
在最佳化谷歌下一代TPU時,它提出了一種Verilog重寫方案,精準刪除了用於矩陣乘法的關鍵、高度最佳化的算術電路中冗餘位。
至關重要的是,這個方案必須通過了嚴格的驗證流程,確保了修改後的電路保持功能正確性。
網友表示,這一改進代表了Gemini對TPU算術電路的首次直接貢獻
目前,它已經被整合到了谷歌即將推出的TPU中。
透過在晶片設計師的標準語言中提出修改建議,AlphaEvolve架起了AI和硬體工程師之間橋樑,加速未來專用晶片的設計。

核心加速23%,最佳化時間縮短至數天
AlphaEvolve在AI訓練和推理方面的突破,更是令人瞠目結舌。
透過找到更優的方法,將大型矩陣乘法分解為更易於處理的子問題,AlphaEvolve將Gemini架構中關鍵核心加速了23%,讓訓練時間縮短了1%。
在AI模型動輒消耗海量計算的今天,這一效率提升將節省巨大成本和能源消耗。
不僅如此,AlphaEvolve還將核心最佳化的工程時間,從專家數週砍到了自動實驗的幾天時間,大幅加速研究人員創新步伐。
AlphaEvolve還可以最佳化底層GPU指令。
這個極其複雜的領域通常已經透過編譯器進行了大量最佳化,因此,人工最佳化往往難以奏效。
AlphaEvolve在基於Transformer的AI模型中,對FlashAttention核心實現高達32.5%的加速。
這種最佳化有助於專家查明效能瓶頸,並輕鬆地將改進納入其程式碼庫中,從而提高他們的生產力,併為未來節省計算資源和能源提供可能。
參考資料:

https://www.nature.com/articles/d41586-025-01523-z

https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/


相關文章