馬斯克新發布的“全球最強模型”含金量如何?

2025.07.10

本文字數:2397,閱讀時長大約4分鐘
作者 | 第一財經 劉曉潔
7月10日中午12點,經歷了前一代模型的延期和此次直播推遲,埃隆·馬斯克終於現身Grok 4釋出會進行開場,畫面中的他略顯憔悴,一週前提及“和xAI團隊通宵打磨模型”,看起來為這次釋出準備已久。
在帖子中,官方稱此次釋出的Grok 4是 “全球最強大的AI模型”,馬斯克則在直播中表示,“Grok 4幾乎在所有學科上都比人類研究生更聰明” 。其後,馬斯克在其社交媒體表示,Grok很快將應用於特斯拉車輛,最遲將在下週實現。
Grok 4具體含金量如何?資料顯示,Grok 4的多項基準測試很能“打”,實現了對現有頂尖模型的超越。在AIME25數學競賽上,Grok 4拿下了滿分,在“人類最後的考試”(HLE)測試中,不用工具的情況下拿下了26.9%的高分,該測試包含 2500 個專家級問題,涵蓋上百個學科。
測評機構Artificial Analysis獲得早期訪問許可權並在釋出會後公佈了 Grok 4 基準測試,官方提到,Grok 4的人工智慧分析指數達到73,“是我們的智慧指數首次將 xAI 列為第一名”。從資料來看,Grok 4領先於 OpenAI o3(70)、谷歌Gemini 2.5 Pro(70)、Anthropic的 Claude 4 Opus(64)和國內DeepSeek R1 0528(68)。
根據Artificial Analysis 的測試,在“人類最後的考試”中Grok 4則取得了24%的歷史最高分,超過了谷歌Gemini 2.5 Pro 之前21%的歷史最高分。不過,測試分數只是一方面,Grok 4模型的能力還需要看後續開發者們實際使用的效果,目前模型剛推出不久,實測案例並不多。
xAI團隊在直播中透露,Grok 4的訓練量是Grok 2的100倍,在強化學習(RL)階段投入的算力,是市面上其他任何模型的10倍以上。釋出會介紹,Grok 4 的訂閱費為 30 美元/月,更強大的Grok 4 Heavy 版本的費用為300 美元/月,Grok 3 維持免費開放。
值得一提的是,此次直播比原定的時間推遲了約一小時。xAI準點釋出帖子稱“Grok 4 直播即將開始”,但1小時過去直播仍未推出,評論中網友們一邊催更,一邊質疑是否“又是炒作”。
在這之前,馬斯克在X上頻頻為Grok模型預熱,但Grok 3.5模型最終跳票,一度引發對模型能力的懷疑。4 月底,馬斯克就在 X上預告,Grok 3.5Beta版下週將上線,主打專業問答能力,特別是工程、程式設計類問題。但直到5月中旬,馬斯克才出來回應稱,“還有點粗糙,再打磨一週。”
馬斯克在6月27日再次提到Grok,表示在和xAI團隊通宵打磨模型,進展不錯,即將釋出的模型被命名為Grok 4。也就是說馬斯克和團隊選擇跳過Grok 3.5,“端”出更高的迭代版本,針對模型跳票後外界的質疑,看起來是一個很好的挽救方案。
從這次遲到看,釋出顯得有些倉促,不過從效能測試看沒有讓行業失望。xAI整個團隊為這次Grok 4的釋出熬了不少夜,此前有博主訪問了xAI的辦公室,畫面顯示辦公區走廊兩側全是帳篷,這意味著不少核心員工近段時間可能都睡在辦公室。
馬斯克在2023年7月才成立xAI,兩年時間就追上了行業最頂尖的水平,充足的資金和算力是他的籌碼。
為了支援Grok的開發和訓練,馬斯克在美國田納西州孟菲斯建立了超級計算中心“Colossus”,在2024年7月啟動時配備了10萬塊英偉達H100 GPU,到 2025 年 2 月,GPU 數量已翻倍至 20 萬塊。馬斯克計劃將孟菲斯超級叢集的規模擴充套件到 100 萬塊 GPU,並且正在為此籌集資金。
就在上週6月30日,華爾街大行摩根士丹利在X上釋出宣告稱,xAI已完成總計100億美元的新一輪融資,其中包括50億美元債務融資和50億美元股權融資。這是xAI繼去年兩輪各60億美元的融資後、又一輪大額融資,2024年以來xAI公開的總融資額已達220億美元(約為人民幣1579億元)。
目前尚不清楚本輪融資後xAI的具體估值,此前3月xAI與X合併後估值高達1130億美元。其中xAI估值為800億美元,X的估值為330億美元。
但如此龐大的融資,也很難支撐大模型公司的鉅額花銷。據媒體援引訊息人士報道,xAI目前每月消耗高達10億美元,截至2025年3月底,公司賬面現金僅剩40億美元。此次融資後,xAI或許能支撐一段時間,但明年還需繼續籌資,目前其收入遠遠小於其成本。
馬斯克曾公開表示,像xAI這類鉅額虧損在整個AI行業並不罕見,主要源自高昂的伺服器建設和晶片採購成本。
xAI在商業化進展方面的表現還落後於一些競爭對手,xAI的主要營收來源是X Premium的訂閱服務,預計2025年營收僅為5億美元,明年預計可達到20億美元。對比來看,OpenAI預計2025年營收將達127億美元,且業務更加多元化。
雖然此次Grok 4短暫領先了,但今年夏天OpenAI也將釋出其最新旗艦模型GPT-5,這一領先優勢能保持多久並不確定。海外大廠對於AI模型也是勢在必得,微軟、亞馬遜、谷歌和Meta四大巨頭去年的總資本支出為2300億美元,2025年這些公司的投資計劃則高達3200億美元,在財報中管理層紛紛表示,計劃增加對AI技術和資料中心建設的投資。
xAI對未來較為樂觀。在與X合併後,xAI團隊希望,能夠利用X上龐大且不斷更新的資料檔案來訓練其模型,從而避免像其他公司那樣支付昂貴的資料費用。xAI樂觀地預計將在2027年實現盈利,相比之下,OpenAI據悉預計要到2029年才能實現現金流轉正。
程式設計和更強大的多模態智慧體是xAI接下來的看點。在此次直播中,團隊定下目標,在8月釋出程式設計模型,9月釋出多智慧體,10月釋出影片生成模型。不過,結合此前多次的延期,這個時間點是否靠譜還需要打個問號。
微信編輯 | 蘇小
推薦閱讀

“黃金平替”,單日大跌6%!


相關文章