18個月前,馬斯克被OpenAI掃地出門;18個月後,他帶著Grok 3強勢迴歸,直接將OpenAI拉下神壇。
昨天,馬斯克釋出的Grok 3大模型不僅在效能上超越了OpenAI的GPT-4o,還在推理、程式設計和多模態能力上展現出驚人的實力。
從被踢出OpenAI到建立xAI實驗室,再到如今的復仇成功,馬斯克用“暴力開源”策略撕裂了OpenAI的閉源壁壘。而OpenAI的山姆·奧特曼也毫不示弱,聲稱GPT-4.5將帶來AGI的初體驗。
這場AI領域的權力天平正在傾斜,而開源與閉源的路線之爭,或許才是這場戰爭的真正焦點。
———— / BEGIN / ————
2月18日,馬斯克釋出完Grok 3大模型後,轉發了一條推特:
劃重點,Grok3目前世界第一強模型(競技場得分1400),比OpenAI的推理模型還厲害,18個月就超越了山姆·奧特曼領導下的OpenAI。
要知道馬斯克曾是OpenAI的天使投資人,甚至Open這個關鍵詞就是馬斯克幫取名的。
變化發生在2018年,奧特曼與馬斯克在“開源還是閉源”的問題上徹底決裂。馬斯克堅信,人工智慧必須透明開放以規避風險;而奧特曼則在資本壓力下選擇與微軟結盟,將技術封閉於商業護城河內。
此前大家都相安無事,因為當時ChatGPT還沒那麼厲害。就在2022年末,ChatGPT4橫空出世後,馬斯克對於被踢出了這麼一個跨時代專案,就開始碎碎唸了。
應了那句話:『不怕分手,就怕前任過得好。』
這段往事在2024年再度被點燃。
馬斯克以“違背公益初衷”為由,對OpenAI發起訴訟,指控其將技術壟斷權拱手讓給微軟。
這場官司雖未勝訴,卻為馬斯克埋下了一顆復仇的種子——2023年7月,馬斯克成立xAI實驗室,開始釋出Grok系列模型,對標OpenAI的GPT系列模型。
大力出奇跡,
18個月追上OpenAI
在Grok3釋出會上,開場xAI介紹了他們的決心:
『122天,建成了10萬顯示卡叢集,再過了92天后,建成了20萬張 H100 顯示卡叢集。』這是世界上最大的H100算力叢集。

很多朋友不懂這個資料的意義,這意味著Grok3訓練算力超過了DeepSeek V3的263倍,卻只帶來超過DeepSeek 33%的Benchmark能力。
Scaling Law是否失效暫且不提,就說這大手筆投入算力基礎設施,也算是體現了馬斯克追趕的決心。
短短2年內,xAI接連推出Grok系列模型:從引數量為3140億的Grok-1,到支援多模態的Grok-1.5 Vision,追趕ChatGPT 4o的Grok 2,以及今天登頂的Grok 3,Grok每一步都試圖用“暴力開源”策略撕裂OpenAI的閉源壁壘。
重要時間節點是在2024年底。xAI在田納西州孟菲斯建成了一座堪比“算力核電站”的資料中心,10萬塊英偉達H100 GPU組成的叢集,讓Grok 3的訓練速度比前代提升十倍。馬斯克在推特上寫道:“算力即權力,而我們將擁有最暴力的武器。”
此後馬斯克宣佈融資60億美元,繼續投資Grok大模型的訓練。這筆錢比國內大模型六小虎的融資總額還多。
在xAI成立的18個月(不到2年時間)後,Grok 3正式釋出,成功登頂最強大模型。
Grok 3的“量子躍升”,
有何殺手鐧?
2025年2月18日,全球百萬觀眾湧入直播平臺,見證馬斯克的最新大模型,此前他在中東的AI大會上,宣佈將釋出全球最聰明的大模型Grok 3。
現在看來Grok 3名副其實,具有諸多強悍能力。
技術核爆點一:最聰明的模型
基準測試資料顯示,Grok 3達到了1400的Elo得分,這是其他任何模型都未曾達到的。
Grok 3在AIME 2025科學推理測試中得分超過Gemini 2 Pro和GPT-4o,其迷你版模型甚至在程式設計任務中擊敗了DeepSeek-R1。
可能大家已經被大模型刷榜測試的傳聞,搞得不太相信這些資料的真實性。國外有拿到Grok 3測試的大神,測試了超過人類和一些大模型理解的《卡坦島》問題:
“建立一個顯示六邊形網格的棋盤遊戲網頁,就像遊戲中的 Settlers of Catan 一樣。每個六邊形網格的編號從 1 到 N,其中 N 是六邊形瓷磚的總數。使其通用,以便可以使用滑塊更改“環”的數量。例如,在 Catan 中半徑為 3 個六邊形。請使用單個 html 頁面。”
他評價很少有模型能夠可靠地做到這一點。
頂級的 OpenAI 思維模型(例如 o1-pro,每月 200 美元)也能做到這一點,但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都沒有做到這一點。
甚至數學歷史上著名的未接知名『黎曼猜想』,Grok 3也會嘗試去算,不像O1-Pro、Claude等模型直接回答做不了,放棄了。
技術核爆點二:動態反思機制
Grok 3引入“思維鏈”推理技術,能像人類一樣拆解複雜任務並即時修正邏輯斷層。
現場演示中,Grok 3僅用30秒便生成了一份從地球到火星的航天器軌跡圖,並標註出引力彈弓效應的最佳利用節點。

『你能看到Grok真的在做一些模糊思考,這樣模型就不會被立即完全複製。』
圖中可以看到,在數學測試中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。
同樣在科學和程式設計兩項中,Grok3兩款模型也存在一定程度上的領先。
技術核爆點三:更多呈現模式
Grok 3不僅能解鎖測試時間計算,還能啟用強大的代理。這些能力促成了一款名為DeepSearch的新產品。“下一代搜尋代理,用於理解宇宙”。DeepSearch還會展示它進行搜尋時所採取的步驟。

不僅如此,Elon強調了Grok 3的創意湧現能力。在這個和DeepSeek十分相似的頁面上,Grok新增了第三個標籤按鈕『Big Brain』。使用“大腦模式”,透過更多計算資源和推理來使用Grok 3,也許會呈現意想不到的效果。

未來Grok 3應該不太限制大模型的創作風格,以及思考創意的邊界。相比之下,OpenAI則是解除了ChatGPT的成人內容限制,這就。。。。。
口水戰打不完,
奧特曼的反擊
面對Grok 3的突襲,OpenAI並非毫無動作。
釋出會前天,山姆·奧特曼在X平臺宣稱:“GPT-4.5將帶來AGI的初體驗。”預計GPT-4.5也會在一兩週內釋出,屆時拿出滿血的O3,應該能奪回全球最佳模型的寶座。
此前,一個由馬斯克牽頭的財團擬出價 974 億美元收購 OpenAI,後者的執行長薩姆・阿爾特曼對此回應稱," 不用了,謝謝,但如果你願意,我們可以以 97.4 億美元的價格收購推特(即如今的 X)" 後。
商業競爭互相都不手軟,口水戰也打個不停。
未來兩家公司還存在路線競爭。與OpenAI的閉源策略針鋒相對,Grok 3承諾未來“開源”,Grok 2將在一個月內開源,並計劃接入特斯拉車載系統和Optimus人形機器人。
同時,xAI同步推出了“Super Grok”訂閱服務,以每月49美元的價格向開發者開放深度搜索(DeepSearch)功能——這種能交叉驗證資訊來源、公開推理路徑的引擎,直指ChatGPT的“黑箱”痛點。
更深層的衝擊來自生態層面。Grok 3的開源策略吸引了大量開發者湧入,而特斯拉的硬體佈局(如Model Q車載系統)則為AI落地提供了現實場景。
2025年,AI領域的權力天平正在傾斜。
Grok 3的顛覆性不僅在於技術,更在於它重新點燃了“開源理想主義”的火種。
正如一位矽谷投資人所言:“馬斯克用Grok 3完成了一場遲到的復仇,但這場戰爭的真正贏家,或許是那些終於看見技術透明曙光的人們。”
山姆·奧特曼會拿出怎樣的競爭手段回擊呢?
———— / E N D / ————
本文來自微信公眾號:鯨選AI,作者:鯨哥
