Claude4被曝釋出在即！DeepSeek把大招都給逼出來了

2025-09-12 12:20 量子位

衡宇發自凹非寺

量子位 | 公眾號 QbitAI

終於！終於！Claude 4被曝將在未來幾周內釋出！

高亮重點，最新的它採取了一個與之前模型路線不同的辦法：

是個混合型大模型。

簡單來說，就是既帶有推理能力，會使用更多的算力來思考和解決難題；在面對簡單問題的時候，又能像傳統大模型一樣短平快地輕巧處理，無需多費不必要的功夫。

怎麼樣，聽起來是不是和昨天奧特曼透露的GPT-5非常類似（doge）。

都是不再把傳統通用模型和推理模型分開推出，直接融合在一起。

據透露，Anthropic計劃在未來幾周內釋出該模型。

而翻遍網際網路發現，4天前就有人按捺不住，在推特上劇透過：

Anthropic內部員工告訴我，他們將在本週內釋出Claude 4，以及一個推理模型。

至於效能嘛，超過滿血o3！

俗話說得好：傳言有出入，期待需謹慎。

但還是禁不住狠狠期待一下！

下面一起來看更詳細的劇透——

Claude 4不走老路，可控制使用時的推理成本

如前所述，Claude 4與此前的通用大模型不同。

它把通用模型和推理模型融合到一起去了，會根據具體任務，調整所需算力和所需功能：

遇到複雜的問題，就啟用推理能力；遇到簡單的問題，就用通用模型處理。

而且使用者可以自行控制，每個問題需要耗費多少token——表現出來就是我可以規定它在每個具體的問題上思考推理多長時間。

具體操作，是使用者可以透過一個遊標刻度尺來調整，刻度上標註的是“完成任務所需的token數”。

如果將遊標滑動到“0”，那麼Claude 4就是一個傳統的、不帶推理能力的AI大模型。

滑動到的數值越大，所呼叫的算力就越多，思考推理過程就越長。

其實呢，OpenAI現在的模型也有類似功能。

不過OpenAI只分了“低-中-高”三檔，供使用者選擇推理強度。

但講道理，很難預測模型在每一檔位實際上會用掉多少tokens，所以很多使用者反饋“三個檔位並不能很好地控制使用成本”。

不過，這可能和OpenAI和Anthropic的市場定位有關係。

OpenAI更多針對的是普通使用者和個人開發者，三檔式更簡單易懂，方便操作。

而Anthropic更注重企業級市場，相對來說toB一些，所以採用了遊標刻度尺來調整，讓使用者控制成本、速度等。

推理通用二合一，下一個大趨勢？

可以看到，國外大模型的兩個最強玩家，Anthropic和OpenAI，都明確了下一步道路：

讓通用模型和推理模型合二為一。

幾周內將釋出的Claude 4如此，數月內將釋出的GPT-5也是如此。

這或許是所有基座大模型玩家的下一步共同選擇也未可知——

當傳統Scaling Law撞牆成為一個強共識，而後訓練、推理、CoT的重要性與日俱增時，推理變成通用模型的必需技能，似乎是大勢所趨。

不過在這中間，Anthropic有屬於自己的牢固生態位，那就是它旗下的Claude系列，程式設計能力一直站在第一梯隊的頂尖。

而且它擅長的是大廠工程師所需級別的程式設計任務。

舉個例子，Claude系列更擅長理解由數千個檔案組成的複雜程式碼庫，並生成就能正常執行的完整程式碼，且一次成功。

這就非常有意思了～

因為在面對複雜程式設計問題時，AI大模型往往會偷懶，僅提供註釋，而不是吐出實際程式碼。

不過，現在還不清楚Claude 4將如何定價。

會比o3-mini便宜嗎？會比DeepSeek-R1便宜嗎？會比Google 2.0 Flash-Lite便宜嗎？

暫時還沒人知道。

不過有網友說出了大多數人的心聲：

如果花1000美元還解決不了我想解決的問題，那不是純純浪費錢嗎。

說白了，如果不是在某項實用能力上有「傲視群雄的拔尖實力」，或許所有模型玩家在定價這一part上能做的，就是像DeepSeek和Google 2.0 Flash-Lite一樣。

（忍痛）對著價格先狠狠砍一刀，然後再砍一刀，再砍一刀……

參考資料：

[1]

https://x.com/iruletheworldmo/status/1888978299159756878
[2]https://x.com/kimmonismus/status/1890056488774676697

— 完 —

評選報名｜2025年值得關注的AIGC企業&產品

下一個AI“國產之光”將會是誰？

本次評選結果將於4月中國AIGC產業峰會上公佈，歡迎參與！

一鍵關注 👇 點亮星標

科技前沿進展每日見

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法！

相關文章

寫給小白的大模型入門科普

寫給小白的大模型入門科普

AI的三岔路口：專業模型和個人模型

AI的三岔路口：專業模型和個人模型

LLM時代小模型的應用潛力與挑戰

LLM時代小模型的應用潛力與挑戰

全面解析DeepSeek的蒸餾技術

全面解析DeepSeek的蒸餾技術

跨越模態邊界，探索原生多模態大語言模型

跨越模態邊界，探索原生多模態大語言模型

深度解析DeepSeek的蒸餾技術

深度解析DeepSeek的蒸餾技術

開源模型未必更先進，但會更長久

開源模型未必更先進，但會更長久

DeepSeek推出後，移動端AI風向要變

DeepSeek推出後，移動端AI風向要變

AI大模型，這個就叫專業！

AI大模型，這個就叫專業！

從o1-mini到DeepSeek-R1，萬字長文帶你讀懂推理模型的歷史與技術

從o1-mini到DeepSeek-R1，萬字長文帶你讀懂推理模型的歷史與技術

Copyright © 2025 | WordPress Theme by MH Themes