


文|《中國企業家》記者 閆俊文
編輯|張曉迪
這兩天,中美大模型公司各有大事發生。
4月15日凌晨,OpenAI釋出了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano,它們的核心特徵是成本更低,速度更快;同一天,另一家中國明星AI公司,智譜AI正式啟動上市輔導備案,由中金公司擔任輔導機構。備案報告顯示,智譜AI將在今年8月至10月完成IPO輔導計劃。
此前的3月底,智譜AI CEO張鵬曾告訴《中國企業家》,他判斷實現AGI,路程還長,“不管我們融了多少錢,其實都是AGI道路上的盤纏,未來,還需要更多盤纏,我們會持續地做相關的事情”。
如今看來,這個“更多的盤纏”就是指IPO。
2025年開年,DeepSeek“燃爆”AI圈,目前,截至R1模型正式釋出已經過去86天。
DeepSeek和梁文鋒的團隊什麼時候推出新的大模型產品,尤其是R1的更新版?
《中國企業家》統計了國外Anthropic、Meta等公司更新大模型的週期,如果是模型的重大升級,週期在5至10個月左右;而同一版本的功能升級則在3至4個月之間。
根據DeepSeek官網資料,梁文鋒的AI團隊更新產品與國外主流公司同頻,2024年9月釋出V2.5,12月釋出V3,2025年3月將V3更新為V3-0324版本,也幾乎每隔3個月就會迎來一次升級。
有一些預測認為,DeepSeek下一次更新R1模型可能是在5月初,屆時或提前釋出,但DeepSeek方面目前還尚未對這種預測進行回應。

公開資料顯示,GPT-3的引數規模為1750億,GPT-4的引數規模為1.76萬億,到了GPT-4o引數約2000億規模,此次OpenAI推出的GPT-4.1 Mini,被稱作OpenAI的高效小型模型,在多個基準測試中表現超越GPT-4o,大幅減少延遲並降低83%成本。
GPT-4.1 Nano被稱之為首個超小型模型,它能支援100萬token的上下文視窗,適用於低延遲任務,如分類和自動補全。
值得注意的是,上述三個模型將上下文視窗處理的規模從GPT-4o的128K直接提升至100萬token(1M)。這意味著模型在更長的文字中保持專注和理解的能力得到了強化。
具體到成本、價格方面,GPT‑4.1比GPT‑4o便宜26%,輸入、輸出分別是每百萬token2美元和8美元;GPT‑4.1 Nano輸入、輸出分別為0.1美元和0.4美元。
對比DeepSeek,標準時間段內,V3模型輸入、輸出百萬token的費用為0.5元、8元,R1推理的費用分別為1元和16元。
可以說,OpenAI也打上了token的價格戰,價格直接對標DeepSeek。
與此同時,OpenAI已暫停了其此前2月釋出的GPT-4.5,原因在於成本太高,其API定價為輸入、輸出每百萬token75美元、150美元。官方回應說此次調整旨在將更多資源投入未來模型的研發。
關於開源,OpenAI的CEO山姆·阿爾特曼不得不走向與DeepSeek同樣的路徑,他曾表示,DeepSeek的出現並未影響GPT的增長,OpenAI將推出更好的開源模型。
不過,在DeepSeek衝擊之下,阿爾特曼曾經一度非常惱火,甚至恐慌,他曾在社交平臺上指責R1模型使用了GPT的資料蒸餾,又寫公開信給美國政府,聲稱限制AI技術流向中國等國家,並停用DeepSeek。

但這並不影響DeepSeek的影響力。在英偉達的2025GTC開幕主題演講會上,黃仁勳數次提到R1模型,並用R1模型驗證了黃仁勳所謂的“推理越多,所需算力越多”的說法。
除了OpenAI,谷歌在4月9日也舉辦了釋出會,宣佈推出Agent2Agent智慧體互動協議,該協議允許生態系統中的AI智慧體進行底層技術無關的相互操作。多個智慧體的協作將帶來更高的自主性,同時成倍提高生產力、降低長期成本。

在R1模型“爆火”之後,DeepSeek除了模型升級,人事佈局上動作頗多,DeepSeek官網在3月份釋出了招聘CFO、COO、財務負責人崗位的資訊。這也被一些媒體解讀為DeepSeek在為融資做準備;模型方面,DeepSeek最大的動作是3月25日釋出了V2模型的更新版。
目前,DeepSeek並未釋出有關融資方面的資訊。4月3日,梁文鋒和團隊發表了一篇論文,題目是《通用獎勵建模的推理時間縮放》,文章論述瞭如何讓注意力機制更高效地處理更長的上下文等。
DeepSeek“燃爆”AI圈後,外界對其充滿好奇和新的期待。潞晨科技CEO尤洋近期在接受《中國企業家》採訪時說,如果有機會跟梁文鋒面對面,他最想問梁文鋒的是他最終的目標是什麼,“梁文鋒是想做一個成功的商業化公司,還是想透過一些其他手段做一些非盈利的事情?這兩者肯定差距是非常大的,OpenAI可能還是想做一個Google那樣的非常高價值的商業化公司。”
記者瞭解到,目前,無論是杭州本地的大公司,還是深圳的頂級創投,都難見梁文鋒一面。
近期英偉達公開表示,美國政府正在限制其H20晶片向中國的出口,並且H20晶片對華出口需要獲得許可證,這一要求是“無限期”。
而H20晶片正是梁文鋒最在意的“基礎設施”,早先,梁文鋒在接受媒體採訪時說,“我們真正的挑戰從來不是資金,而是高階晶片的出口禁令。”
不過,面對禁令,梁文鋒也並非坐以待斃,他曾在接受媒體採訪時說,“英偉達的GPU沒有什麼神秘之處,但要趕上他們,就必須重建團隊、付出時間和成本,追趕下一代技術——這才是真正的護城河。”
新聞熱線&投稿郵箱:[email protected]


關注“中國企業家”影片號
看更多大佬觀點和幕後故事