Anthropic秘密「混合模型」Claude4首曝細節,硬剛GPT-5!深度推理模型來了


新智元報道  

編輯:犀牛 好睏
【新智元導讀】AI競賽白熱化!Anthropic秘密研發一種與眾不同的AI——語言模型與可控推理能力相結合的混合模型。模型包括一個獨特的「滑動條」功能,它賦予開發者對計算資源和成本前所未有的控制權。
Anthropic終於要開始搞點事情啦!
近期的「推理模型」熱潮中,Anthropic除了其CEO打了幾個嘴炮外,還沒有掏出一個拿得出手的產品。
在這樣下去,可能要退出AI一線模型玩家行列了。Anthropic自己顯然不想看到這種情況發生。
就在剛剛,有訊息稱,Anthropic會在未來幾周內釋出其全新的「混合AI」模型。
Anthropic版「推理模型」,測試時計算完全掌控
在OpenAI去年秋季釋出其「推理模型」後,谷歌以及國內眾多AI公司紛紛推出了自己的模型。作為一個主要的競爭對手,Anthropic在這場推理競賽中卻明顯缺席。
現在,我們知道了原因——Anthropic開發的是一款融合了推理能力的混合AI模型。

具體來說,這種「混合模型」可以使用更多的計算資源來計算複雜問題,但也能像傳統LLM一樣快速處理更簡單的任務,無需額外計算。
此外,模型還可以讓客戶控制它在查詢時使用的算力——換句話說就是,它在解決問題時「推理」的時長。
開發者可以透過一個滑動條來調整模型在嘗試找出答案或完成任務時將處理或生成的token數量。
透過將滑動條設定為「0」,開發者可以將Anthropic模型作為一個普通的、非推理AI使用,類似於OpenAI的GPT-4o。
OpenAI也有類似的功能,允許開發者控制其推理模型「思考」的時間。
但開發者僅限於「低」、「中」和「高」三種設定,很難預測模型在這些級別上實際會處理多少token——因此,也很難預測單次查詢的成本。
現在,OpenAI可能轉而成為追隨者。
在外界看來,這和Anthropic尚未公開的技術路線可謂是如出一轍。(去年11月The Information曾做過相關預測)
從Anthropic和OpenAI設計模型和產品的方式,我們可以清晰地看出它們在競爭激烈的AI市場中的戰略定位。
OpenAI顯然更希望ChatGPT成為面向消費者或個人專業人士的突破性應用,這可能就是它在推理模型中使用低-中-高命名法的原因,因為這更容易讓普通使用者理解。
Anthropic則更專注於企業市場,這就是為什麼它致力於開發能讓開發者透過滑動條方式更好地控制成本、速度和定價的功能。
據知情人士透露,Anthropic即將推出的模型在程式設計方面也取得了特別顯著的進展,這已經成為生成式AI在企業中最強大的應用之一。
當允許Anthropic模型使用最長時間「思考」時,在某些程式設計基準測試中,它的表現已經超過了客戶目前能訪問到的最先進的OpenAI推理模型(即o3-mini high)。
這位人士表示,雖然OpenAI的推理模型在更學術性的問題上表現更好,比如競爭性程式設計問題,但Anthropic的模型更擅長處理企業工程師可能遇到的實際程式設計任務。
例如,Anthropic的模型更善於理解由數千個檔案組成的複雜程式碼庫,並能一次性生成可用的完整程式碼行。
不過,仍然懸而未決的重要問題是,Anthropic的新模型將收取多少費用,以及它是否會比OpenAI最近釋出的o3-mini推理模型更便宜。後者因比OpenAI最受歡迎的非推理模型GPT-4o更便宜而給開發者留下了深刻印象。
目前還不清楚像DeepSeek和谷歌最新的Gemini模型這樣的超低價AI是否會推動所有模型的價格趨近於零。
就目前來看,市場上似乎在進行著兩場不同的競爭:
  • 在AI開發的前沿,那些在推理或程式設計方面能夠逐步改進的模型將繼續保持定價優勢;
  • 在另一個更大的市場中,那些「夠用就好」(good-enough)的模型則可能會繼續展開價格戰。
對於這個全新的「混合模型」,有網友認為,Anthropic新模型的成敗將取決於它的成本,畢竟效能也很強的o3-mini是一個小模型,成本很低。
當然,也有網友質疑說,「滑動條」並不是一個好的設計,這位叫eric的網友評論稱,「我只希望回覆是正確的,不想在每次後續中都需要調整。」
「我們確實處於模型互動體驗尷尬階段。」他評價說。
2027年收入飆至345億美元
根據The Information的報道,Anthropic在2023年燒了56億美元現金後,計劃在2025年將支出減少近半,並在2027年實現高達345億美元的收入。
要實現這樣的增長,Anthropic需要大幅縮小與市場領導者OpenAI之間的差距。目前OpenAI的收入可能是Anthropic的5倍以上——在2027年實現4,400億美元的收入。
Anthropic和OpenAI一直是企業在生成式AI投資方面的風向標,因此科技投資者正密切關注兩家公司的表現。
在最可能的基本情況下,Anthropic表示其收入將從2025年的22億美元增長至2027年的120億美元。
目前外界並不知道Anthropic在2024年的具體收入,不過其月收入從年初的約800萬美元上升到年底的約8,000萬美元,這表明其全年收入在4億至6億美元之間。
Anthropic即將推出的新一代旗艦模型Claude有望支援其宏偉的增長目標。據知情人士透露,新模型預計在未來幾周內釋出。
然而,最近像DeepSeek這樣的超低成本模型的釋出,引發了人們對AI公司是否需要降價以保持競爭力的質疑。
在DeepSeek釋出後,Anthropic也是少數幾個沒有大幅降低模型價格的AI實驗室之一。
從Anthropic的融資材料來看,公司認為透過API向企業提供技術服務的機會,要大於與ChatGPT等聊天機器人競爭。
OpenAI的ChatGPT在普通使用者以及程式設計師、營銷人員和律師等專業人士群體中取得了突破性成功,截至去年底,其訂閱收入每月超過3.33億美元。

超越OpenAI?

在Anthropic傳送給投資者的融資材料中,公司管理層預計到2027年API收入將達到200億美元,是OpenAI同期預測API收入的3倍。
即使在基準預測情況下,Anthropic的API收入也將超過OpenAI。(Anthropic的其餘預期收入來自向企業和專業使用者銷售Claude)
Anthropic表示,其技術可以改變辦公場景,如生成或審查法律檔案、實現軟體工程自動化等。
諸如程式碼託管平臺GitLab,法律搜尋公司LexisNexis,以及開發Cursor程式設計助手的Anysphere,都是Claude的主要客戶。
目前,Anthropic正尋求以580億美元的投前估值融資20億美元,而OpenAI則試圖以2,600億美元的投前估值進行融資。
除收入差距外,影響兩家公司估值差異的另一個因素是Anthropic與轉售其AI的雲服務商(主要是亞馬遜)之間的協議。
OpenAI透過與微軟的業務合作獲得20%的收入分成,而Anthropic此前向部分投資者透露,當客戶透過亞馬遜購買其模型時,需要向亞馬遜支付更高比例的分成。
在Anthropic管理層預計的2027年345億美元收入中,近2/3將來自其API業務,其中大部分銷售將透過亞馬遜等合作伙伴實現。亞馬遜已承諾向該公司投資數十億美元,並正在為其開發專用資料中心伺服器叢集。

資金消耗

估值差距的另一個因素是:OpenAI的運營效率可能高於Anthropic。
  • Anthropic去年燒掉的現金比計劃高出近30億美元。其中,超過50%是來自一次性支付的資料中心使用費。
  • OpenAI在2024年上半年僅消耗了3.4億美元現金(未來幾年會有所增加),並在在同期產生了數倍於Anthropic的收入。
  • AI模型開發成本佔據了Anthropic支出的大部分。其中,單在伺服器上就投入了15億美元。
  • OpenAI去年在訓練成本上的支出約為30億美元(包括資料購買等額外支出)。
  • Anthropic的研發人員成本達到了1.6億美元,但不包括股權激勵支出(一項重要的非現金支出)。
  • OpenAI在2024年上半年報告的股權激勵支出為15億美元。
  • 截至2024年底,Anthropic擁有915名員工,其中521人從事研發工作;預計到2025年底,這一數字將翻倍至1,900人。
  • 截至2024年9月,OpenAI的員工人數已超過1,600人。
對此,Anthropic向投資者表示,今年的現金支出預計是30億美元,較去年的56億美元大幅減少。此外,公司將會在2027年實現現金流轉正。
參考資料:
https://www.theinformation.com/articles/anthropic-strikes-back?rc=epv9gi
https://www.theinformation.com/articles/anthropic-projects-soaring-growth-to-34-5-billion-in-2027-revenue?rc=epv9gi

相關文章