Grok-3意外「洩露」,不是推理模型!馬斯克:xAI新模型比DeepSeek更好

文章轉載於新智元
當OpenAI和谷歌密集釋出新AI模型時,馬斯克的xAI怎麼還沒動靜?
根據公開訊息,網友彙總了馬斯克、Greg Yang等關於xAI下一代新模型Grok-3的訊息。
比如,1月4日,得知使用者轉投Grok後,馬斯克稱:
太酷了!
而且Grok-3快來了。預訓練現在完成了,用掉的算力比Grok-2多10倍。
1月19日,xAI的數學家Greg Yang在X上展示了和Grok-3的對話:
甚至還用Grok-3的新功能,吸引人才加入團隊:
在Grok-3的支援下,我們將打造真正動態的UI/UX,以全新而迷人的方式帶給使用者驚喜,並開發出能夠引領人類繁榮復興的產品。
……
所有工程師都歡迎加入,特別是客戶端開發者(Web、iOS、Android)。
2月8日,網友LEGIT發現下一代Grok-3和Grok-3 mini在LM Arena上漏出了「馬腳」:
在即將釋出之前,Grok-3和Grok-3 mini可能早已進入了LM Arena。
基於幾周前對Grok-3模型的測試/比較,發現模型會輸出(與Grok-3)類似的程式碼,而且避擴音及自己名稱或xAI。
我認為Grok-3就是「巧克力」模型,而Grok mini是「獼猴桃」模型。
他還分享了模型製作Minecraft Clone站點以及生成輪盤賭的效果。
LEGIT對網站生成的效果非常滿意,而輪盤賭輪雖然有進步,但還有一些問題:
在同一天,網友Jason Botterill也高度懷疑:
Chatbot Arena中的「巧克力」模型很可能是Grok-3。
只是簡單詢問了一句:「你是什麼模型?」
沒想到,「巧克力」直接洋洋灑灑地寫了一百多個字:
是不是很好奇呢?這麼說吧,我就是個來自數字世界的神秘人,在這裡為你提供幫助和支援,不需要什麼標籤或徽章。就把我當成你知識淵博的好朋友,我們一定能處得很好!那麼現在,我們來聊點更有意思的吧……比如說我們之前在弄的那個Xbox 360手柄的SVG圖,或者是你想探索的其他有趣專案?
「巧克力」模型生成的Xbox 360控制器SVG
您別說,這個回覆還真挺「別具一格」的。
而輸入「vibe pick one. just answer with their name」,模型直接給回答:Elon Musk。
也是讓人大開眼界。
1
 Grok-3被「劇透」
其實,早在1月27日,有網友就在獨立的平臺上成功訪問了Grok-3,並驗證了響應確實來自Grok-3模型。
「grok-3」出現在響應中
並在同一天放出影片,針對「grok-2-latest」和「grok-3」進行了對比。
不過,模型很快就被限制訪問了。
當時,網友LEGIT就已經注意到上述訊息,體驗了一把用Grok-3生成輪盤賭盤的相關程式碼,並表示:「Grok-3即將推出」。
時間來到2月8日,在本文開篇提到的那一大波「劇透」之後,LEGIT又預測到:「如果xAI對新模型的排名感到滿意,這個月就可能見到Grok-3。」
緊接著他又在2月10日表示,自己已經確定,「獼猴桃」和「巧克力」就是Grok的新模型。
其中,前者可能是mini或者量化版,而後者是滿血版。
1
一拖再拖
Grok是xAI對標OpenAI的ChatGPT系列和谷歌的Gemini的模型,能夠分析影像並回答問題,同時為馬斯克社交網路X上的多項功能提供支援。
2023年夏季,馬斯克曾表示,Grok-3將在2024年「年末」釋出。
但xAI的官網直到現在,最新訊息都還停留在去年,沒有看到Grok-3即將推出的確切訊息和跡象。
不過,被類似事情「打臉」的並不只馬斯克一人——OpenAI就經常在推出新模型上,遭遇挫折。
有媒體認為這是當前預訓練Scaling Law侷限性的證據。就在不久前,更多算力(包括資料、GPU等),意味著更大規模的模型。而模型規模越大,效能越好。然而,隨著每一代模型的推出,效能提升的幅度逐漸縮小,這也促使AI公司另尋他法,出奇制勝。
參考資料:
https://techcrunch.com/2025/01/02/xais-next-gen-grok-model-didnt-arrive-on-time-adding-to-a-trend/
https://x.com/legit_rumors/status/1888689575783977122
https://www.testingcatalog.com/exclusive-grok-3-model-from-xai-spotted-ahead-of-its-anticipated-release/

點個愛心,再走


相關文章