千呼萬喚始出來的GPT4.5，主打的只是一個“大”

2025-08-24 08:48 矽星人Pro

作者

｜王兆洋

郵箱

｜[email protected]

“GPT系列不是我們前沿的模型。”

一個月前你還很難想象OpenAI釋出GPT的下一個大版本更新時，會這樣說自己。

但當2月27日OpenAI突然用一個直播發布了GPT4.5的時候，一切都已經發生變化。

GPT的定位不再是OpenAI用來震撼外界的模型，而是一個逐漸退到舞臺後方的“底座”；

它的釋出也不再是OpenAI引導行業敘事的大動作，而更多帶上了防禦的感覺；

這是GPT目前“最大”的一款，也是它在舞臺中心的最後一舞。

OpenAI最初文件裡的表述，後已刪除。圖源：推特

GPT4.5的亮點簡單總結，在於“更大，更暖”——OpenAI迄今最大、知識最豐富的模型。

根據OpenAI的介紹，GPT-4.5在多個方面超過了GPT-4o及其他許多AI模型。例如，在OpenAI的SimpleQA基準測試（該測試考察 AI 在處理簡單、事實性問題時的準確度）中，GPT-4.5的表現優於GPT-4o和OpenAI的推理模型o1、o3-mini。

在測試程式設計能力的SWE-Bench Verified基準測試上，它與GPT-4o和o3-mini表現相當，但不如OpenAI的deep research和Anthropic的Claude 3.7 Sonnet。在AI生成完整軟體功能的能力上，它在SWE-Lancer上的表現超過了GPT-4o和o3-mini。

但與以往只會重新整理榜單不同，這次OpenAI甚至在釋出時就展示了自己在榜單中的差距——在一些學術基準測試比如AIME和 GPQA上，GPT 4.5 在數學和科學相關問題上處於領先水平，但在其他多個維度的評測上，不及DeepSeek和Anthropic的模型。當然，這麼做還是因為，它自身開發的新一代推理模型依然在榜單裡領先。

很明顯，OpenAI給GPT4.5的定位不再是最強模型。基準測試也就不再是GPT4.5想要對外呈現的重點。

根據OpenAI的直播發布，它的亮點在其他地方，總結起來如下：

更暖，更少幻覺

GPT-4.5最引人注目的特性是“情商”的顯著提升。

透過深度學習海量人類對話資料，它不僅能識別文字中的情緒（如憤怒、焦慮），還能解析情感背後的潛在需求，生成更具同理心的回應。

例如，當用戶抱怨“朋友總是爽約”時，GPT-4.5不再機械地輸出建議，而是優先提供情感支援，再引導理性解決方案，甚至透過鼓勵性語言幫助使用者調整心態。這種能力源於對語境和情感細微差別的深度解構，而非簡單的關鍵詞匹配。

知識廣度與準確性的提升

透過無監督學習的規模化擴充套件（據OpenAI研究員稱，它的預訓練算力較GPT-4提升10倍，但這一點後來被官方從文件中去掉了），GPT-4.5的世界知識覆蓋深度顯著增強。

例如，在回答“海水為何是鹹的”這類問題時，它能提供結構清晰、通俗易懂的解釋，並主動補充科學不確定性，將“幻覺率”降至37.1%，遠低於前代模型。

這種進步不僅體現在知識量上，更在於對使用者意圖的精準捕捉——例如，從“我需要減肥”中識別出隱含的健康管理需求，而非單純推薦食譜。

多場景實用性的最佳化

GPT-4.5在寫作、程式設計和日常問題解決中展現出更強的上下文連貫性。它可輔助生成創意文案、修復程式碼漏洞，甚至透過聯網檢索即時資訊。

儘管在數學和程式設計等深度推理任務中提升有限（程式碼能力僅提升7%-10%），但其在依賴世界知識和創造力的領域（如設計、教育諮詢）表現卓越。此外，多語言支援擴充套件至14種，低資源語言（如斯瓦希里語）的表現顯著提升，進一步打破語言壁壘。

而在訓練方面，OpenAI也強調了它訓練方法的高效率和更大規模。他們使用了低精度訓練，以及提升了跨資料中心的訓練資源使用效率。

以上這些種種特點都難免讓人想到DeepSeek。

作為一個強調邏輯推理能力的模型，DeepSeek R1卻在文字表達上讓人驚喜。而作為一個“知識型”模型，GPT4.5開始強調它的情感能力；

在訓練上，GPT4.5“激進地”使用了低精度訓練，而這幾乎就是deepseek最初公佈V3時引發外界震動的絕活之一；

OpenAI為了讓GPT4.5“變大”，在預訓練階段使用了跨多個數據中心的計算設施來實現擴充套件，這也讓人想到DeepSeek“起家”的技術，關於它自建的螢火叢集的一系列跨資料中心的研究論文。

OpenAI稱GPT-4.5會成為未來推理模型的基礎模型，這也是V3與R1的關係。

在DeepSeek開源之前，OpenAI的口徑還是GPT系列和o系列是兩個不同系列的模型，而DeepSeek的詳細論文解釋了基座模型與推理模型的關係，並自然把競爭引向了OpenAI和Anthropic最近兩個模型所體現出的模型融合的路線上。

API非常貴

當我們停下來看看，這一切的變化還是很神奇的：

一個月之前這一切都不會這樣發生，現在每一個AI領域的重要動作，都多少籠罩在DeepSeek“陰影”之下。

甚至所有跡象都在顯示這是一個OpenAI計劃外發布的模型，它不能太強，超過它主打的o3，但它又必須釋出，因為DeepSeek帶來的這一波開源衝擊，人人都知道了GPT系列和o系列的緊密關係，它需要證明它在基礎模型上的進展，而不能只是用o系列來震撼大家了。

OpenAI這次釋出繼續“做實”了很多事情，比如曾經依賴資料和計算能力的擴充套件所帶來的GPT系列的能力增強，正式結束了；它帶來的o系列的計算時間擴充套件定律，正式成為接下來的行業主題；而GPT系列的意義從最前端的直接參與競爭的角色，變成比拼推理模型時的重要支撐。

GPT正式淡出了舞臺中央，只屬於它的時代結束了，接下來正式進入群雄競爭的推理時代。

點個“愛心”，再走吧

相關文章

GPT-4.1深夜偷襲！OpenAI掏出史上最小、最快、最便宜三大模型，百萬token上下文

GPT-4.1深夜偷襲！OpenAI掏出史上最小、最快、最便宜三大模型，百萬token上下文

GPT-4.5釋出！OpenAI史上最大最貴也可能是最慢那個，全網都在罵大街啦

GPT-4.5釋出！OpenAI史上最大最貴也可能是最慢那個，全網都在罵大街啦

十多個模型打不過DeepSeek一個？奧特曼受不了了：怒將GPT和o系列合併，非思維鏈模型到頭！

十多個模型打不過DeepSeek一個？奧特曼受不了了：怒將GPT和o系列合併，非思維鏈模型到頭！

ChatGPT-4o，人類「AI助理」的一大步｜ZTalk

ChatGPT-4o，人類「AI助理」的一大步｜ZTalk

OpenAI又推“全能模”GPT-4.1，B端市場福音

OpenAI又推“全能模”GPT-4.1，B端市場福音

GPT-4.1淘汰了4.5！全系列百萬上下文，主打一個性價比

GPT-4.1淘汰了4.5！全系列百萬上下文，主打一個性價比

剛剛，OpenAI釋出GPT-4.1！吊打GPT-4.5，14萬/月的博士級AI曝光

剛剛，OpenAI釋出GPT-4.1！吊打GPT-4.5，14萬/月的博士級AI曝光

GPT-4.1深夜亮相|在閉源堡壘崩塌前夜？GPT-4o終於迎來了它的接班人

GPT-4.1深夜亮相|在閉源堡壘崩塌前夜？GPT-4o終於迎來了它的接班人

ChatGPT終於活成了iPhone最想要的樣子

ChatGPT終於活成了iPhone最想要的樣子

Altman「喜當爹」，OpenAI連夜發的GPT-4.5都「更有人味」了

Altman「喜當爹」，OpenAI連夜發的GPT-4.5都「更有人味」了

Copyright © 2025 | WordPress Theme by MH Themes