OpenAI剛出官方部落格,誇讚GPT-4.5是比 4 聰明10倍的模型,轉眼就又推出了GPT-4.1,還是非推理模型,還更便宜。
有網友評價:“GPT-4.5甚至還沒來及說再見!”而且這次沒說明,為何數字命名又倒退了?難道Altman也分不清 9.9 和 9.11 的大小?
言歸正傳,OpenAI最新發布的三個新模型是:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。
-
GPT-4.1 是 OpenAI 最新旗艦大模型,具有更好的程式設計與寫作能力,支援最長 100 萬 token 上下文,適用於複雜任務。 -
GPT-4.1 Mini 是中端任務模型,效能接近GPT-4o,但成本降低 83%。 -
GPT-4.1 Nano 是OpenAI最快+最便宜模型的本地執行小模型,持 AI 智慧硬體助手等邊緣應用。
官方提到,4.1在編碼和指令跟蹤方面均有顯著提升,多模態能力提升巨大,實際上差不多提升了三分之一左右。
具體來說,GPT-4.1 被視為 GPT-4o 的全面升級版,具備更強的多模態處理能力、更大的上下文視窗(全部可處理 100 萬個 token),並且成本降低了 26%。

OpenAI又端出了一盤菜,琳琅滿目的模型選擇,本質上也沒有很大的差別,能力上也沒有拉開絕對差距。

實際上,Altman也意識到這一問題,宣稱GPT-5 將整合語音、畫布、搜尋、Deep Research 等功能。“我們的一個核心目標是透過建立能夠使用所有工具、知道何時需要長時間思考、並且適用於廣泛任務的系統,來統一 o 系列模型和 GPT 系列模型。”
GPT-4.1有點GPT-5的影子了,意味著OpenAI也在嘗試初步解決模型雜亂這一問題。
這次推出 GPT-4.1,核心目標就是逐步淘汰一些舊模型。
此前官宣GPT-4 將於 2025 年 4 月 30 日從 ChatGPT 中退役,由更強的 GPT-4o 完全替代。GPT-4.1未來也許會正在逐步取代 GPT-4o,目前除了文生圖能力還沒有,4.1已經全面超越了4o。
而GPT-4.5 的預覽版將於 7月14 日從 API 中下線,4.1成為主流To B服務模型,適用於大多數使用者和開發者,具有更強的效能和更低的成本。
鯨哥個人認為,GPT-5不會順利在第三季度推出,年底能出現就算不錯了。
GPT-4.1可能是今年OPenAI扛大樑的模型,因此這款模型的能力邊界就值得關注。
在重要的 SWE-bench Verified 程式設計能力基準測試中的得分比較,GPT-4.1 的任務完成率為54.60%,位列第四名。

看似成績不如Claude 3.7 sonnet、Gemini 2.5 Pro Exp這些老對手,但要注意第一名是不會發布的o3模型(未來直接融入GPT5一起釋出)。
接下來研究4.1的多模態識別能力和程式碼生成能力,鯨哥用第一時間免費上線 4.1 API的 Windsurf,輸入圖片讓其生成動態視覺化網頁,這樣識圖能力和程式碼生成能力都可以體現。

審美距Claude3.7還有距離
另一方面,GPT-4.1 nano API定價和 Gemini Flash 幾乎相同,這是針對Google的又一次狙擊。
夠用且便宜,這是OpenAI在模型進展不明顯的情況下,還要推出4.1的緣由,他需要4.1和競爭對手搶佔市場,尤其是B端市場,接替3.5和4o mini。
不像DeepSeek一樣追逐技術高峰,至今官網沒解決經常崩潰的使用者體驗問題。OpenAI在GPT-5來臨前,還需要兼顧商業化。
而且,據悉OpenAI 計劃在新一代推理模型(o3、o4),整合跨學科知識整合能力,並對該模型收取高達 2 萬美元/月的費用,大約是普通 ChatGPT Plus 訂閱價格的 1000 倍。
顯然不是給普通使用者準備的,這次GPT-4.1也沒第一時間上ChatGPT,讓C端使用者第一時間體驗。
期待GPT-4.1早日更新到ChatGPT,能力更強,月費也能更便宜。



