馬斯克“地球上最聰明AI”Grok3釋出:20萬張GPU,號稱強過DeepSeekV3

來源:網易科技
作者:有態度的

劃重點:
01Grok 3 包括Grok 3 Reasoning 和 Grok 3 mini Reasoning。
02Grok3 的推理模式加入了DeepSearch,可以檢索網際網路和 X 上的資訊進行響應。
03X 的 Premium+ 訂閱者將首先獲得 Grok 3。
04SuperGrok 的價格為每月 30 美元或每年 300 美元。
05最快一週後——Grok 將獲得“語音模式”。
06實行代際開源,即當下一個版本完全釋出時,將開源Grok的上一個版本。

昨日,馬斯克的人工智慧初創公司 xAI 透過直播的形式,即時演示展示了他口中的“地球上最聰明的人工智慧”—— Grok-3。
依舊是大力出奇跡
首先,根據直播演示,Grok 3並非單一模型,而更像是一個模型家族。其中,輕量級版本Grok 3 mini主打即時響應,雖會犧牲部分精度,但推理速度較標準版提升5倍;Grok 3 Reasoning則採用類人腦“慢思考”機制,透過多層事實核查規避AI幻覺。
高管團隊詳細闡述了Grok的構建歷程。他們表示:“要打造頂尖AI,自建資料中心是唯一途徑。由於我們想盡快推出Grok 3,時間異常緊迫。最終我們決定在短短四個月內建成資料中心。”
據xAI透露,團隊僅用122天就完成了首批10萬塊GPU的部署並投入執行,“這堪稱壯舉”。
此外,他們還披露了將H100計算叢集規模翻倍。“為此我們啟動了二期工程,僅用92天就實現了容量倍增。所有這些算力資源都被持續用於產品迭代最佳化,”xAI高管說道。
號稱超越GPT-4o、
DeepSeekV3
據xAI披露,Grok 3在多項基準測試中超越GPT-4o以及DeepSeekV3。

在評估數學問題解決能力的AIME測試中表現優異,在採用博士級物理、生物、化學試題的GPQA評估體系裡同樣領先。
早期版本在Chatbot Arena(一個透過使用者投票對比AI模型響應質量的眾包測試平臺)中也展現出強勁競爭力。
現場演示環節,工程師僅用“開發結合俄羅斯方塊和星際爭霸玩法的2D遊戲”這一自然語言指令,Grok3完成核心程式碼生成與除錯。
此前,馬斯克就曾表示,Grok3在數學邏輯測試中表現遠超當前所有公開模型,包括OpenAI的GPT-4o和DeepSeek R1。例如,Grok3已能獨立完成高等數學難題的推導,並計劃在2025年應用於SpaceX的發射視窗最佳化,以提升火箭軌道計算的精度與效率。
可以透過 Grok 應用程式訪問
“X 的 Premium+ 訂閱的訂閱者將首先獲得 Grok 3的訪問許可權,我們還推出了一個名為 Super Grok 的單獨訂閱。”馬斯克在演示中表示。目前尚不清楚 Grok 3最初是免費提供給所有使用者,還是僅提供給 Premium 和 Premium+ 使用者。
使用者可以要求 Grok 3進行“Think”,或者利用“Big Brain” 模式進行,對於更困難的推理。xAI表示推理模型最適合數學、科學和程式設計相關問題。
SuperGrok 的價格為每月30美元或每年300美元,可解鎖額外的推理和 DeepSearch 查詢,並提供無限的影像生成功能。
馬斯克表示,未來,最快一週後Grok 將獲得“語音模式”。幾周後,Grok 3模型將與 DeepSearch 功能一起出現在xAI企業API中。
“我們的一般方法是,當下一個版本完全釋出時,我們將開源Grok的上一個版本,”馬斯克表示。
此刻距離馬斯克“用AI理解宇宙本質”的終極目標還有多遠?
讓我們等Grok 3再飛一會。

相關文章