就在昨天,按照“慣例”延遲20分鐘後,馬斯克才正式登場並推出了預熱許久的xAI最新旗艦大模型Grok-3!
直播主題為“我們的使命是理解整個宇宙”,馬斯克還表示Grok-3為“地球最聰明的AI”,並直言其效能比前代Grok-2提升10倍。
Grok-3訓練動用了位於孟菲斯的超級資料中心,共計20萬塊GPU叢集,僅用時122天建成!
圖片來源:嗶哩嗶哩 @產品君(下同)
工程師團隊還透露,Grok-3是一個系列模型家族,包含輕量版Grok-3 mini(犧牲部分精度以提升速度)。
Grok-3在多項測試中重新整理紀錄,直接開啟不服跑個分模式:
數學(AIME’24):96分,超DeepSeek-R1(87分)、GPT-4o;
科學(GPQA):研究生級知識問答斷層領先;
程式設計(LCB):生成複雜程式碼效率碾壓Claude 3.5、Gemini 2.0268。

同時以1402分登頂Chatbot Arena歷史榜單,成為首個突破1400分的模型,超越OpenAI、谷歌、Anthropic等巨頭。

圖片來源:嗶哩嗶哩 @環球新知
在AIME2025測試中,Grok-3 Reasoning Beta和Grok-3 mini Reasonin同樣以90+的成績擊敗了其他競品。

還現場生成《俄羅斯方塊×寶石迷陣》混合遊戲的完整程式碼,並渲染3D動效;挑戰黎曼猜想等未解難題,展示完整思考鏈。

還有DeepSearch模式:聯網深度分析資料,提供研究、頭腦風暴、程式碼除錯一體化方案。
獨創“思維鏈”機制,支援測試時計算(Test-Time Compute),開啟“Big Brain”模式後,問題解決深度提升263%!
不過,“地表最聰明的AI”自然是不能讓你隨便用的。
X Premium+使用者:即日可優先解鎖Grok-3完整功能,SuperGrok訂閱:30美元/月,無限影像生成+深度搜索配額。

圖片來源:X @Elon Musk
外網有網友提問“賺一百萬美元最快的方法”,然後Grok-3告訴他去買一張彩票。


你就說這個方案,是不是有可能性吧!
最後馬斯克承諾Grok-3穩定版釋出後,將開源Grok-2模型25。並在結尾放話:“xAI的創新速度將徹底改寫AI競爭格局!”。
反正外面的格局是——DeepSeek開源,ChatGPT“下海”。Grok-3能掀起多大的水花,咱們拭目以待!



