突發，Grok-3免費上線！答對9.11和9.9誰大，1分攻克MIT積分難題

2025-08-24 12:21 新智元

新智元報道

編輯：編輯部 HNYZ

【新智元導讀】剛剛Grok-3免費開放了！DeepSearch和Think兩大模式加持，剛上了熱搜的「9.11和9.9哪個大」終於能做對了（但沒全對），甚至1分鐘秒解MIT積分賽題。然而，它剛一亮相就遭OpenAI研究員「打假」，被對方質疑作弊。

世界首個20萬塊GPU（另有說法是10萬）訓出的Grok-3，官宣人人可用了！

DeepSearch、Think兩大模式，同時上線。唯獨遺憾的是，Big Brain還在雪藏。

Grok 3全部免費開放，直到伺服器崩潰為止

一邊，AI科技圈開發者激動地奔走相告，另一邊，OpenAI和xAI直接打起來了。

先是本科輟學的OpenAI研究員Aidan McLaughlin，譴責Grok-3在評測中用基於64個樣本進行多數投票刷分。

灰色陰影區域表示在64個樣本下的多數投票一致性表現

隨後，OpenAI應用研究主管Boris Power更是絲毫不留情面，「看到Grok團隊在評估中作弊和欺騙的動機，真令人失望。簡而言之，o3-mini在每個評估中都優於Grok-3。Grok-3確實是一個不錯的模型，但沒有必要過度宣傳」。

對此，xAI高階工程師Igor Babuschkin，「完全不對。我們只是用了和你們一樣的方法」。

從下圖中不難看出，o1-preview和o1確實有同款「陰影」。

不過，根據McLaughlin的解釋道，OpenAI o3-mini並沒有使用這種方法。

OpenAI與xAI針鋒相對，也不是一天兩天了，好在他們的競爭，利好所有人。

話不多說，直接上實測吧。

一波實測來了

就在昨天，「Grok-3答錯9.11和9.9哪個大」這個話題，還一度衝到熱搜話題前幾。

我們實測發現，果然，如果用同樣的方式問，Grok-3還是會答錯。

而在開啟Think模式後，它只思考了4秒就輕鬆做對了！

上下滑動檢視

有趣的是，如果把prompt換成「9.11和9.9誰大」，Grok-3在普通模式下也能給出正確答案了。

然而，在開啟Think模式之後，Grok-3卻為了這個prompt想了足足34秒……

上下滑動檢視

有網友實測Grok-3 二十四小時後，發現它的幾大優點——

對程式碼真的很好；
上下文視窗非常非常長；
能充分利用上下文；
擅長遵循指令；
而且有一個非常令人愉快的性格。

在程式碼工作流中，Grok-3表現得十分絲滑。

有人用Grok-3做了個帶聲音的影片遊戲，主題是馬斯克使用雷射、火箭和嬰兒來摧毀美國政府。

耗時一個小時後，Grok-3成功做出了這個遊戲。

網友只用5分鐘，就寫出了一款大戰小行星的遊戲。

另一種形式的遊戲如下。

甚至有人只在幾分鐘內，就用Grok-3和Imagen 3、tripoai等工具，建立了下面這些逼真的3D模型。

有人總結了一份Grok-3全部潛能的完整速查表，因為它「強大到瘋狂」，但大多數人還不知道該如何有效使用。

照片級真實的影像

Grok-3是不是世界上最聰明的AI還有待考察，但它現在確實可以生成照片級真實的影像。

X網友Min Choi分享了10個案例。

在海灘上的隨意自拍
瘋狂的細節，你可以看到每根羽毛
SpaceX的火箭
影像細節程度簡直令人驚異的眼睛特寫
月球網路探測車
在紐約地鐵上的自拍
走秀的貓咪
微型小熊貓的微距鏡頭
一位年輕白化男子手持綠色小狗的文藝復興風格肖像
水池邊的自拍

左右滑動檢視

對此，有網友說，我們現在已經很難分清圖片上的是不是現實了。

「我們已經跨越了那個門檻！」，Min說。

不過也有網友發現了它的一些缺點，比如生成正在倒立的人物時，依然會出現匪夷所思的問題。

網友實測，Grok-3在2024麻省理工積分大賽中，直接幹掉o1 Pro和人類選手，並在1分02秒內解決了這個問題！

就連馬斯克稱讚道，簡直太酷了。

高階語音模式，期待住了

下一步，Grok-3或許還會推出高階語音模式，一些拿到灰度測試的網友曬出了自己的實測。

它不僅支援聯網模式，還支援自定義語音模式、語音轉錄、音訊分享等功能。

目前，預設的是Sal男性聲音。此外，還有一個Ara女性聲音可選。

使用者介面底部有三個鍵：關閉退出語音模式；靜音；分享

如下是轉錄功能的展示。

下面影片中，Grok-3不僅會唱生日快樂歌，還會笑。

參考資料：

https://x.com/xai/status/1892400129719611567

相關文章

馬斯克正式釋出Grok3，這回真的把OpenAI幹碎了…

馬斯克正式釋出Grok3，這回真的把OpenAI幹碎了…

OpenAI又一次輕輕地“碎掉了”，馬斯克正式釋出Grok3

OpenAI又一次輕輕地“碎掉了”，馬斯克正式釋出Grok3

馬斯克20萬塊GPU煉出Grok-3，暴擊DeepSeekR1數學屠榜！瘋狂復仇OpenAI

馬斯克20萬塊GPU煉出Grok-3，暴擊DeepSeekR1數學屠榜！瘋狂復仇OpenAI

馬斯克釋出地表最聰明AI！號稱超越DeepSeekR1，20萬張卡砸出的「奇蹟」

馬斯克釋出地表最聰明AI！號稱超越DeepSeekR1，20萬張卡砸出的「奇蹟」

特斯拉的AI「遊戲」，「理想們」不能照搬｜焦點分析

特斯拉的AI「遊戲」，「理想們」不能照搬｜焦點分析

馬斯克的Grok3還不是“地球最聰明”的，但確實是最有錢的｜亮馬橋小紀嚴選

馬斯克的Grok3還不是“地球最聰明”的，但確實是最有錢的｜亮馬橋小紀嚴選

馬斯克“地球上最聰明AI”Grok3釋出：20萬張GPU，號稱強過DeepSeekV3

馬斯克“地球上最聰明AI”Grok3釋出：20萬張GPU，號稱強過DeepSeekV3

Gork-3語音功能上線！馬斯克揭秘百天搭建超算中心

Gork-3語音功能上線！馬斯克揭秘百天搭建超算中心

20萬卡吞金獸Grok3炸裂登場，卡帕西大神親測：效能超過DeepSeekR1！馬斯克：短期不開源

20萬卡吞金獸Grok3炸裂登場，卡帕西大神親測：效能超過DeepSeekR1！馬斯克：短期不開源

馬斯克宣佈：免費！直至崩潰

馬斯克宣佈：免費！直至崩潰

Copyright © 2025 | WordPress Theme by MH Themes