

除了 o1 / o3,OpenAI 另一個尚未公開的內部推理模型曝光了。爆料者正是 CEO 阿爾特曼本人。
據他透露,與全球頂尖程式設計師相比,當前這一內部模型的程式設計能力已達 Top50,甚至今年年底將排名第一。

而且針對大家近來尤為關注的算力問題,他更是直言:
在內部,我們已經達到了 GPT 4.5,而達到 GPT 5.5 並不需要 100 倍以上的計算能力。

除此之外,也是在東京大學的這場對話活動中,阿爾特曼由 AI 對教育的影響引出了更多話題,包括 AI 時代需要何種人才,以及一系列對內部模型進展的爆料。
這場對話由東京大學的校長(Teruo Fujii)和執行副校長(Kaori Hayashi,女)主持,OpenAI 首席產品官 Kevin Weil 陪同阿爾特曼參加。
期間,他們暢談了 AI 的應用和未來,並和學生進行了面對面問答。
以下為重點內容整理 & 摘錄。
內部模型已達 GPT 4.5,升級成 5.5 不再需要 100 倍算力升級
主持人簡短開場後,活動由學生提問開啟。
談及 AI 對教育的影響以及未來這一領域的發展,阿爾特曼直言教育是 OpenAI 最關注的幾個領域之一。
目前已經能看到 ChatGPT 如何為學生提供各種輔助,未來類似 AI 工具只是改變了環境和部分人類習慣,對於人類來說可能是一種解放,不用過於擔心 AI 會改變一切。
另外,由於科學發現可能呈現 10~100 倍增速,由 AI 推動的生產力進步可能極大促進社會發展。

接下來副校長也提了一個問題,AI 時代需要怎樣的人才和技能?
對此阿爾特曼回應稱,顯然人類現在已經很難在數學、程式設計等具體任務中優於 AI,因此圍繞弄清楚人們需要什麼,去培養個人的開創性視野、快速適應能力等也就更加重要。
Kevin 總結了一個更簡單的辦法,從現在開始將 AI 用起來,將之融入工作生活。一旦遇到新問題,嘗試用 AI 解決,以此逐漸跟上 AI 發展的步伐。

隨後,有學生提到了算力進化問題,如果擁有 100 倍計算能力,可以期望 GPT 具有哪些新特性?
阿爾特曼稱,GPT 系列代表了曾經的一個正規化,專注預訓練部分,GPT 1、2、3、4 的每一次升級都大致意味著 100 倍算力升級,隨之也產生了更強的能力。
目前內部模型已經達到 GPT 4.5 水平,照舊正規化推測,達到 GPT 5.5 也需要 100 倍算力升級。然而,隨著 o1 系列推理模型取得新突破,一種令人難以置信的新計算效率誕生了。
這也意味著類似升級不再需要 100 倍算力,透過強化學習等技術我們也能得到更強的模型能力。

之後阿爾特曼梳理了 OpenAI 在推理模型上取得的一系列進展,按網友總結下來就是:
程式設計能力上,o1 排名為 9800;僅過去幾個月,o3 將排名拉到第 175 位;如今一個內部模型在基準測試中排名約為 TOP50,而且年底就能直接登頂。

“我們希望朝著開源前進”
接下來,阿爾特曼談到了更多未來計劃。
o3 的釋出已經為未來 6~12 個月的研究點明瞭方向,OpenAI 將盡可能推動小型、功能強大且速度極快的推理模型,同時也會繼續推進 GPT 6/7 等。
過程中,他著重 cue 到了 OpenAI 最近向 Pro 使用者推出的“深度研究”(Deep Research)功能,這是一個使用推理來綜合大量線上資訊併為使用者完成多步驟研究任務的智慧體,能幫助使用者進行深入、複雜的資訊查詢與分析。
在他看來,OpenAI 一大重點也是釋出更多此類智慧體,而且夢想之一是搞一個程式設計智慧體。
總之,今年的主線任務是,到年底能夠有一個模型,即便使用者問出非常難的問題,它也能在執行並思考幾小時後準確作答。

然後看點來了,基於中國 DeepSeek 選擇開源後廣受好評這一事實,有學生當面提問:
是否有計劃重新考慮開源?
阿爾特曼這次倒是很乾脆,直接承認“我們將這樣做”,“我們希望朝著開源前進”。

但是(沒錯有一個但是),目前不知道開源什麼,也不知道應該選擇什麼時候開源。

在這之後,阿爾特曼又回答了對腦機介面、太空工程和 AI 機器人等前沿科技的看法。
雖然眾所周知他和馬斯克不對付,但他這次竟然直言:
“(像 Neuralink 這樣的)腦機介面公司是自己過去 6 個月見過的最有趣的!”
本文來自微信公眾號:量子位(ID:QbitAI),作者:一水,原標題《OpenAI 內部模型曝光!程式設計能力躋身全球 Top50 程式設計師,年底不再有人類對手》
編輯:萬能的大雄
相關閱讀: