Grok3來了!馬斯克宣稱“地球上最聰明的AI”,20萬張GPU能否顛覆AI格局?

Grok 3,馬斯克口中的“最聰明AI”終於來了!
當地時間2月17號,埃隆•馬斯克(Elon Musk)的AI公司xAI正式推出最新的Grok 3模型,並稱其是目前“地球上最聰明的AI”。
圖 | Grok 3釋出會(來源:xAI)
“我們非常高興能夠推出 Grok3,我們認為,在很短的時間內,它的功能比 Grok2 強大一個數量級。這要歸功於一支不可思議的團隊的辛勤工作,我很榮幸能與這樣一支優秀的團隊合作。”馬斯克在釋出會上說道。   
有意思的是,他還解釋了Grok這一名字的來歷:Grok這個詞來自羅伯特·海因萊因的小說《異鄉異客》(Stranger in a Strange Land)。這是一個火星詞,意思是充分而深刻地理解某事。
隨後,xAI在釋出會上簡單粗暴地擺起了數字。
圖 | Chatbot Arena成績(來源:xAI)
Grok 3和Grok 3 mini在數學、科學和程式設計基準測試上超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。   
圖 | Grok 3的數學、科學和程式設計基準測試成績(來源:xAI)
同時,具備推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning則是超越了類似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。
圖 | Grok 3推理模型的數學、科學和程式設計基準測試成績(來源:xAI)    
xAI還現場演示了Grok 3的推理+程式設計能力,其中一個問題是“生成3D動畫程式碼,演示從地球發射、著陸火星,然後在下一個發射視窗返回地球的過程”。
經過近兩分鐘的思考,Grok 3生成了可以直接跑起來的python程式碼,3D動畫可以執行,但是否正確還有待驗證。
圖 | Grok 3生成的程式碼可以直接執行(來源:xAI)
Grok 3的最後一個新功能是代理/智慧體(Agent)。釋出會演示的是新產品DeepSearch,基於Grok 3的搜尋引擎。
它不僅可以搜尋網頁,查詢現有資料,還可以“推測使用者的真正意圖”並加以思考,在經過交叉對比不同信源後,確保“能夠返回正確的資訊”。
在演示中,它還能基於搜尋資料給出一些推測性的結論。
圖 | DeepSearch功能演示(來源:xAI)
最後xAI表示,“我們今天將推出 Grok 3,首先從 X 上的 Premium+訂閱者開始,他們將是第一批獲得訪問許可權的人。”尚不清楚普通使用者何時能用上。
馬斯克補充稱:“如果你想要一個更完善的版本,可能要等待一週,但每天都會有所改進。我們還在開發語音互動功能,我認為這將是 Grok 3 最好的體驗之一。”    
圖 | 額外的DeepSearch功能演示(來源:xAI)
更強大的計算能力與訓練方式
Grok 3的推出正值全球AI競爭日益激烈之際,尤其是在中國初創公司DeepSeek釋出了一款能以低成本媲美OpenAI的GPT和o1/o3系列模型後,許多AI公司都開始重新評估用堆算力和引數來推進所謂的“擴充套件法則”是否仍然適用。
值得一提的是,馬斯克曾稱“Grok 3將在2024年底之前上線”,但卻推遲到了今天。
至於原因,有人認為是xAI的技術團隊規模較小,人才儲備相對不足,難以完成馬斯克“雄心勃勃的計劃”。儘管如此,距離Grok 2系列模型釋出才過去了六個月而已。
Grok 3由Colossus超級計算機訓練完成,這臺計算機是在短短八個月內建成的,搭載了10萬顆英偉達H100 GPU,提供了超過2億GPU小時的計算資源——是Grok 2的10倍。   
圖 | Colossus設施(來源:xAI)
據介紹,xAI最開始搭建這個10萬GPU叢集用了122天,後續拓展到20萬叢集僅用了92天。
馬斯克表示,這一顯著的算力提升讓Grok 3能夠更高效地處理龐大資料集,縮短訓練時間,並提升AI模型的準確性。
據介紹,在訓練方法上,xAI採取了一些新的策略來最佳化Grok 3的能力,包括合成數據集、自我糾錯機制和強化學習。
Grok 3相比前代在法律領域的理解能力也有所提升。馬斯克曾表示,該模型的訓練資料中包含了大量法律檔案,使其在解讀法律相關問題時更加精準。
儘管Grok 3被馬斯克譽為“地球上最聰明的AI”,但它在早期測試中仍然暴露出一些侷限性。
在正式釋出之前,幾名X平臺使用者表示自己可以提前體驗Grok 3,他們發現,儘管該模型能夠正確回答一些困難的謎題,並生成HTML和JavaScript程式碼,但是它在編寫程式碼時仍然存在一些細節上的疏漏,出現了bug。
馬斯克的AI野心與行業競爭    
Grok 3的釋出不僅僅是一款AI產品的更新,它也是馬斯克與OpenAI等競爭對手較量的一部分。
2月13號,在迪拜召開的2025年世界政府峰會上,馬斯克曾視訊通話中表示:“Grok 3 具有非常強大的推理能力,因此在迄今為止我們進行的測試中,它的表現已經超越目前市場上的所有產品,這是一個好兆頭。”
圖 | xAI對比自己的發展速度(來源:xAI)
此外,馬斯克繼續對OpenAI表達不滿。他批評OpenAI已經從最初的開源非營利組織變成了“封閉的、以利潤為導向的公司”。
此前,馬斯克試圖以974億美元的價格收購OpenAI,但遭到了該公司CEO山姆•奧特曼(Sam Altman)的拒絕。奧特曼認為,馬斯克的提議不過是拖慢OpenAI發展的策略。
隨著Grok 3的釋出,xAI也在加速資本佈局。
據報道,xAI正在與紅杉資本(Sequoia Capital)、Andreessen Horowitz和Valor Equity Partners等現有投資者進行談判,計劃融資100億美元,使公司估值達到750億美元。   
要知道,xAI的C輪60億美元融資才剛剛在去年12月23號完成。如果新一輪融資成功,xAI的總融資金額將達到224億美元。
這筆資金的一部分可能用於購買伺服器,以支援Grok模型的進一步開發。據悉,xAI正在考慮從戴爾採購價值超過50億美元的伺服器,以提升其AI計算能力。
Grok 3的推出標誌著xAI在AI競賽中的又一次重大嘗試。憑藉強大的計算能力、最佳化的訓練方法以及對邏輯推理的改進,馬斯克寄希望於它能在AI市場上佔據一席之地。
圖 | Grok 3 在Arena排行榜中拿到了1402的高分(來源:lmarena.ai)
不過,這並不是一個容易實現的目標,即使背靠“流量之王”馬斯克和X社交平臺(所有X使用者都可以免費使用Grok),Grok 3仍然面臨著激烈的競爭。   
在DeepSeek的衝擊之下,OpenAI 已經接連放出o3-mini系列模型,以及GPT-4.5和GPT-5的路線圖;Anthropic也宣佈將在近期推出Claude 4系列。
隨著OpenAI、Anthropic、Meta 和 Google等公司不斷推出更先進的AI模型,未來的AI之戰仍將持續升溫。而Grok 3能否真正超越競爭對手,成為AI領域的佼佼者,還有待市場的進一步檢驗。
參考資料:
https://techcrunch.com/2025/01/27/grok-3-seemingly-went-live-for-some-users/
https://techcrunch.com/2025/02/14/elon-musks-ai-company-xai-said-to-be-in-talks-to-raise-10b/
https://www.servethehome.com/inside-100000-nvidia-gpu-xai-colossus-cluster-supermicro-helped-build-for-elon-musk/
https://lmarena.ai/ 


相關文章