Grok3衝擊諾獎級突破，成證明「黎曼猜想」關鍵！AI與數學家打出終極組合拳

2025-08-20 16:46 矽星人Pro

文章轉載於新智元

困擾人類一個多世紀的「黎曼猜想」，如今可能正站在被破解的邊緣。

這周釋出的Grok 3異軍突起，不僅橫掃各大排行榜，更將目光投向了這個「猜想界的皇冠」。

風投機構IBC Group創始人Mario Nawfal發文稱，破解黎曼猜想的競賽正在升溫，而Grok 3可能正是關鍵所在！

究竟是什麼原因，讓他敢於做出這樣一個判斷？

暴力計算：憑藉足夠的計算能力和驗證器，AI可以窮舉所有解法。
人工智慧+人類合作 ：AI輔助頂尖科學家，可能會帶來圖靈獎、菲爾茲獎，甚至諾獎級別的突破。

有了這雙重buff的加持，Grok估計什麼時候可以解決這一世紀難題？根據馬斯克的預測，「基於AI的進展，可能將在兩年內實現」。

在Mario看來，雖然目前還沒有解決方案——但Grok 3正在逐步接近破解這個數學界最大的未解之謎之一！

網友對此激動地表示，「暴力計算和人類洞察力的結合，簡直是終極組合拳」。

甚至，還有人大膽預言，下一個諾獎得主就是AI。

1

Grok 3對決黎曼猜想：突破即將到來？

在Grok 3還未橫空出世之前，曾被xAI工程師硬廣了一波。

去年11月，工程師Hieu Pham「爆料」稱，Grok 3證明了黎曼猜想。

為此，xAI不得不終止模型訓練，以驗證它的證明。他表示，如果結果是正確的，將會完全終止模型的訓練。

之後，Hieu Pham發帖稱這只是自己的惡搞

要知道，黎曼猜想可是千禧年七大數學難題之一。

這一次，基於20萬塊GPU訓出的Grok 3，在數學基準測試中AIME 2024上重新整理SOTA，創下了52高分。mini版本效能幾乎與Claude 3.5 持平。

與此同時，xAI團隊專門針對最新AIME 2025基準，對Grok 3模型推理版本進行了測試，更是創下了93分紀錄。

AI大神Karpathhy在Grok 3還未釋出之前，曾拿到了灰度測試資格，讓其去證明黎曼猜想猜想。

他表示，相較於其他模型（如o1-pro、Claude、Gemini 2.0 Flash Thinking），只會簡單表示——這是一個偉大的未解之謎，Grok 3非常有勇氣，會嘗試去解決問題。

雖然沒有攻克，但是邁出了「嘗試」的重要一步。

正如Karpathhy所言，誰知呢，總會有那麼一天…

甚至，就連菲爾茲獎得主陶哲軒大膽預測，2026年，AI將與搜尋和符號數學工具相結合，成為數學研究中值得信賴的合著者。

對此，有網友對於人工智慧輔助破解數學謎題的前景感到興奮。

更有網友期待Grok 3將量子力學與相對論一起聯絡起來。

「可能性是無限的」該網友評論道。

1

Grok 3全面領先！

Grok 3目前在聊天機器人競技場（Chatbot Arena）上大幅領先，並且是長期以來第一個在所有類別中都排名第一的模型。

這些排名是基於人類的盲測評估得出的。

對此，馬斯克表示，Grok位居第一，並持續改進。

「這個結果是基於兩週前的Grok版本。自那時以來Grok有顯著改進。」他表示。

網友Gavin Baker評論說，從2022年夏季到2024年春季，OpenAI曾大幅領先，隨後谷歌和Anthropic趕上了GPT-4的水平。

OpenAI能夠主導大約7個季度，這歸功於他們率先積極押注於預訓練的傳統「Scaling Law」。然而，率先實現o1級別的推理僅僅使得OpenAI領先幾個月。

目前，Deepseek、谷歌和xAI與OpenAI大致處於同等水平。xAI甚至可以說處於領先地位。

谷歌和xAI的基礎模型更優秀，因此它們很可能很快就會徹底超越o3。因此，OpenAI迫切需要GPT-5，作為假定的o5推理模型的基礎。

奧特曼指出，OpenAI未來的領先優勢將會縮小。微軟CEO納德拉也基本表示認同，OpenAI在模型能力方面擁有巨大領先優勢的時期即將結束。

網友Gavin表示，在他看來，這就是為什麼Nadell根據Theinformation的訊息，選擇不為OpenAI 1600億美元的預訓練提供資金的原因。相反，他希望透過為OpenAI提供推理服務來賺錢。

Google和xAI都擁有獨特且有價值的資料來源，這將使它們與Deepseek、OpenAI和Anthropic之間的差異越來越大。如果Meta在模型能力方面趕上來，情況也是如此。

Gavin同時指出，無法獲得獨特、有價值資料的前沿模型是歷史上貶值最快的資產。模型蒸餾只會加劇這種情況。

Nadella在最近一次播客中說，資料中心建設過剩即將到來，租用比購買更好。甚至在某個時候，微軟可能會使用開源模型來驅動CoPilot。

未來的前沿模型，如果無法獲得像YouTube、X、TeslaVision、Instagram和Facebook這樣獨特、有價值的資料，可能無法獲得任何投資回報 (ROI)。從這個角度來看，扎克伯格的策略似乎也更加合理。獨特的資料最終可能成為區分多萬億或千萬億引數模型預訓練的唯一基礎，也是獲得投資回報的唯一基礎。

如果這是正確的，那麼只有2-3家公司會進行前沿模型的預訓練，我們只需要少數幾個巨型資料中心來構建預訓練所需的相干叢集。

其餘的人工智慧計算將由較小的資料中心完成，這些資料中心在地理位置上進行了最佳化，以實現低延遲和/或具有成本效益的推理。具有成本效益的推理等於更便宜、質量較低的電力（對核電的需求減少），在短期內對液冷的需求減少等。

這與目前6-10家公司都在進行前沿模型預訓練的世界截然不同。

推理模型需要極高的計算量。測試時計算意味著計算能力本身就是智慧。因此，在這種情況下，所需的計算量甚至可能比2023-2024年整個市場所預期的以「預訓練」為中心的計算場景還要多。

但這將是一種截然不同的計算型別，如上所述。預訓練和推理之間的比例將不再是50/50，而是5/95。基礎設施的卓越性將至關重要。

對於網友Gavin Baker的這番分析，馬斯克也表示認同。

「良好的分析」他評論道。

1

使用者離開ChatGPT轉向Grok

有網友在x發文稱，現在大量使用者正在在從ChatGPT轉向Grok，並配上了一段形象的影片。

有網友調侃說，他妻子嫉妒Grok 3，因為他跟Grok 3說的話比跟他妻子還多。

對於大家紛紛轉向Grok這事兒，網友紛紛表示贊同。

1

什麼是黎曼猜想？

黎曼猜想是一個數學領域裡非常重要但至今沒有解決的問題，它主要研究質數的分佈規律，以及一個叫黎曼zeta函式的數學工具跟質數的關係。

質數是那些大於1、只能被1和自己整除的數字，比如2、3、5、7、11、13等等。它們像是自然數的「積木」，因為任何一個自然數都可以拆成質數的乘積，比如15 = 3 × 5。

質數的出現看起來很隨機，沒有簡單的規律可循。

比如在1到10裡有4個質數（2、3、5、7），11到20裡也有4個（11、13、17、19），但21到30裡只有2個（23、29），數量分佈不太好預測。

這讓研究質數分佈成了數學中一個大難題。

質數的研究不只是數學家的興趣，它在現實生活中也很重要。比如，網際網路上的安全通訊（像網上銀行、購物）靠一種叫RSA的密碼系統保護，而RSA的基礎就是利用大質數的不可預測性。

什麼是黎曼zeta函式

1859年，德國數學家伯恩哈德·黎曼（Bernhard Riemann）想出了一個研究質數的新辦法，引入了一個叫黎曼zeta函式的東西，記作ζ(s)。

簡單來說，zeta函式是一個無限加法公式：

這裡的「s」是一個複數，複數是一種特別的數字，比如s = a + bi（a是實部，b是虛部，i是虛數單位）。

這個函式的神奇之處在於，它跟質數的分佈有很深的聯絡。

zeta函式的零點

零點就是讓ζ(s)等於0的s值。研究發現，這些零點分成兩類：

平凡零點：這些零點出現在s = -2, -4, -6等負的偶數位置。它們比較容易找到，性質也很明確。

非平凡零點：這些零點的實部（a值）在0到1之間，而且虛部（b值）不是0。它們的位置很神秘，很難算出來。目前透過計算機檢查發現，所有已知的非平凡零點的實部都是1/2，但這只是觀察結果，還沒有數學證明能確認所有零點都這樣。

黎曼猜想到底在猜什麼？

黎曼猜想的核心是：所有的非平凡零點的實部都等於1/2。

想象一下，把複數s = a + bi畫在平面上，橫軸是實部a，縱軸是虛部b。

黎曼猜想說，所有非平凡零點都會整整齊齊地排在實部a = 1/2這條豎線上。

如果這個猜想是真的，它能讓我們更清楚地知道質數是怎麼分佈的。

比如，它能更精確地預測某個範圍內有多少個質數。這跟一個叫素數定理的東西有關，素數定理告訴我們質數的「大趨勢」，而黎曼猜想則能解釋趨勢裡的「小起伏」。

打個比方，把質數分佈想象成一條河的流量，素數定理像是告訴你河水平均每天流多少水；黎曼猜想則是幫你搞清楚為什麼有些天水流多些，有些天少些。

這種對質數的深入瞭解不只對數學家重要，還會影響像密碼學這樣的領域，因為密碼系統需要質數儘量「隨機」。

為什麼這麼受關注？

黎曼猜想從1859年提出到現在，已經160多年了，但還是沒人能證明它是對是錯。

它被認為是數學裡最重要的問題之一，出現在1900年希爾伯特提出的23個數學難題裡（第8個問題），也被2000年Clay數學研究所列為「千禧年七大難題」之一。

Clay研究所還懸賞100萬美元，鼓勵全世界數學家來挑戰這個問題。現在，計算機已經檢查了無數個非平凡零點，發現它們的實部都是1/2，但這只是證據，不是嚴格的數學證明。

一些數學家，比如Larry Guth和James Maynard，最近在這個問題上有了一些新進展，但離徹底解決還很遠。

黎曼猜想不只是數學裡的「腦洞」，它的研究還推動了很多數學分支的發展，比如複分析和數論的結合。

參考資料：

https://twitter.com/MarioNawfal/status/1893181929823895668

https://twitter.com/cb_doge/status/1893430235821154702

https://twitter.com/GavinSBaker/status/1893356200026116290

點個“愛心”，再走吧

相關文章

馬斯克釋出“地球最聰明AI”？！秒殺DeepSeek？

馬斯克釋出“地球最聰明AI”？！秒殺DeepSeek？

什麼！黎曼猜想被AI破解？人類安全危在旦夕

什麼！黎曼猜想被AI破解？人類安全危在旦夕

地表最強Grok3突襲免費體驗，網友實測對比DeepSeek，發現中文彩蛋

地表最強Grok3突襲免費體驗，網友實測對比DeepSeek，發現中文彩蛋

被掃地出門18個月後，馬斯克終復仇OpenAI

被掃地出門18個月後，馬斯克終復仇OpenAI

還沒釋出，xAI工程師公開承認Grok3不如OpenAI，遭馬斯克怒火解僱！馬斯克：Grok3打遍天下無敵手

還沒釋出，xAI工程師公開承認Grok3不如OpenAI，遭馬斯克怒火解僱！馬斯克：Grok3打遍天下無敵手

特斯拉的AI「遊戲」，「理想們」不能照搬｜焦點分析

特斯拉的AI「遊戲」，「理想們」不能照搬｜焦點分析

反超DeepSeek？馬斯克「鈔能力」砸出來的Grok3終於上線了

反超DeepSeek？馬斯克「鈔能力」砸出來的Grok3終於上線了

Gork-3語音功能上線！馬斯克揭秘百天搭建超算中心

Gork-3語音功能上線！馬斯克揭秘百天搭建超算中心

馬斯克20萬塊GPU煉出Grok-3，暴擊DeepSeekR1數學屠榜！瘋狂復仇OpenAI

馬斯克20萬塊GPU煉出Grok-3，暴擊DeepSeekR1數學屠榜！瘋狂復仇OpenAI

馬斯克，放大招！Grok-3來了

馬斯克，放大招！Grok-3來了

Copyright © 2025 | WordPress Theme by MH Themes