DeepSeek三個月,改變全球四大雲廠走了三年的路

DeepSeek、Manus過去三個月帶來的狂潮,正改變全球AI產業過去三年既定路線。變局當前,亞馬遜、微軟、谷歌、阿里姿勢各不相同
文|吳俊宇 
編輯|謝麗容
這三個月,中國大模型創業公司DeepSeek、中國AI應用創業公司Manus引爆了市場情緒。
DeepSeek論文稱,“用2048張英偉達H800晶片和558萬美元訓練成本”訓練出了DeepSeek-V3。這款模型和美國明星AI創業公司OpenAI旗下主力模型GPT-4o效能接近。
Manus利用Muti-Agent(多代理)策略,製造出了一款AI原生應用。演示資料中,Manus可以獨立思考、計劃並執行復雜任務。Muti-Agent被認為是2025年AI應用發展方向。
DeepSeek、Manus這兩家公司不乏爭議。市場對DeepSeek披露的算力規模、訓練成本有所質疑。Manus則被認為是“套殼”產品,缺乏真正的核心競爭壁壘。
無論如何,DeepSeek、Manus都是大模型浪潮三年的里程碑。它們這三個月帶來的狂潮意味著,擁有云業務大型的科技公司(如亞馬遜、微軟、谷歌、阿里等)未來三年的既定路徑將被改變。
其一,過去三年大模型競爭重點是訓練,這三個月正在轉向推理。
過去三年,大模型競爭焦點是用萬卡、十萬卡訓練高效能模型。但近一年,“Scaling law”(規模定律,模型效能由算力、模型、資料規模決定)放緩。成倍的算力只能讓模型效能提升10%-20%。但得益於晶片、模型、演算法最佳化,推理算力成本正以每年十倍的速度下降。
其二,過去三年AI應用處於萌芽期,但這三個月AI應用快速成長。
AI應用消耗的是推理算力,受益者仍然是雲廠商。過去三年,AI應用落地主要障礙是推理算力成本偏高。隨著推理算力下降,釘釘、飛書、WPS、美圖秀秀這些老應用近三個月在加快疊加新的AI能力,Manus這類AI Agnet(代理)為代表的原生AI應用也迅速爆發。
AI應用爆發,算力消耗增長,變局正在來臨。那麼,全球四大雲廠商——亞馬遜、微軟、谷歌、阿里,是如何面對這場狂潮的?
先吃下紅利
雲是大模型的基礎設施,也是大模型最終受益者。隨浪而躍,幾大雲廠過去三個月正在爭相吃下DeepSeek帶來的早期市場紅利。
亞馬遜雲科技、阿里雲、微軟Azure、谷歌雲等雲廠商先後迅速接入DeepSeek。雲廠商上架DeepSeek不難。DeepSeek-V3/R1是開源的,任何人都能下載、部署、使用。客戶使用時會消耗算力、資料,帶動其他基礎雲產品(計算、儲存、網路、資料庫等)銷售。
今年2月,多家國際、中國雲廠商的一線銷售透露,DeepSeek走紅後,大量客戶在詢問,DeepSeek何時能上架。DeepSeek近一個月快速帶來了算力消耗和收入增長。
DeepSeek帶來了市場紅利,但一些雲廠商面對DeepSeek情緒複雜——猶豫、被動、搖擺的心態始終存在。根源是,它們始終面臨一個問題——要如何面對第三方模型?
接入第三方大模型,會和自研模型直接競爭。一位中國雲廠商銷售坦言,大部分雲廠商,原本最希望銷售自家旗艦模型。過去,DeepSeek等第三方產品無法得到官方推薦。銷售人員通常會對客戶說,自家模型表現最好。然而,自家模型公開測評得分與DeepSeek-R1差距很大。如今面對客戶質疑,一線銷售很難回答這個問題。
“丟了面子,得了裡子”,另一位中國雲廠商銷售的判斷是,接入DeepSeek,既是被動防守,也是為了爭取更多訂單。他認為,“先吃下DeepSeek帶來的市場紅利,總比自家模型丟掉市場份額要好”。
亞馬遜沒有太多糾結,它的動作迅速且堅決。它是全球率先接入DeepSeek的雲廠商。亞馬遜還在後續兩個月不斷為客戶提供使用DeepSeek的完整工具鏈。
1月30日,亞馬遜雲科技Marketplace模型市場和SageMaker開發平臺接入DeepSeek。
2月24日,亞馬遜雲科技Marketplace中國區上線矽基流動(一家部署了DeepSeek V3/R1的平臺服務商),中國使用者可藉此使用DeepSeek。
3月11日,亞馬遜在Amazon Bedrock平臺上架DeepSeek-R1。這是中國市場首款上架Bedrock的大模型。目前,亞馬遜雲科技是首個提供全託管版本並正式商用的海外雲廠商。
入選Bedrock門檻並不低。亞馬遜會評估全球範圍內的大模型,嚴格篩選並最終上架。目前Bedrock只有十家模型廠商的產品,其中包括明星AI創業公司Anthropic旗下的Claude 3.7系列、Meta旗下的Llama 3系列。
我們瞭解到,亞馬遜雲科技2024年曾試圖尋找適合上架Bedrock的中國大模型,但無疾而終。DeepSeek-R1技術領先,效能出眾。亞馬遜的客戶,如豐田、思科等對它很感興趣,這是它最終上架Bedrock的重要原因。
亞馬遜CEO安迪·賈西(Andy Jassy)在2024年報電話會介紹,DeepSeek訓練技術令人印象深刻。它使用了強化學習技術,這比監督微調更有意思。
“上架”Bedrock,比“接入”更近一步。客戶可以透過全託管、無伺服器方式使用。這種體驗如同一方產品,可以得到官方推薦和更多客戶資源傾斜。1月30日至今,亞馬遜雲科技已有數千名客戶使用Amazon Bedrock的自定義模型匯入功能部署了DeepSeek-R1。
為什麼要向第三方模型開放自己的資源?因為,在真實業務場景中,企業往往會用多模型。
每款模型都有擅長的領域,如文字、程式碼、影像。一位出海智慧營銷公司技術人士直言,他們公司業務中部署了十餘款模型,包括阿里千問系列、Anthropic的Claude系列、谷歌Gemini系列、DeepSeek系列等。Claude承擔英語和小語種營銷文案任務,千問負責中文營銷文案任務,Gemini被用於營銷圖片、影片生成。DeepSeek目前還在測試階段。
選定了模型的專業領域,還要面對“不可能三角”——在成本、速度、效能三者之間權衡,最終找到適合自身業務的模型。
面對這些真實需求,亞馬遜雲科技的做法是,“Choice Matters”(選擇大於一切)安迪·賈西曾對此解釋,要給開發者自主選擇的權利。使用模型時,擁有多種選擇至關重要,因為“永遠不會出現一種工具在某個領域一統天下的情況”。
創新往往來自邊緣。一位亞馬遜雲科技人士的觀點是,DeepSeek脫穎而出,說明頂尖AI模型不一定來自大家都期待的大公司,它可能來自任何人。亞馬遜不會押注單一贏家,而是提供開放平臺。只要模型足夠好,就立刻上架Bedrock,為客戶提供多種選擇。
為此,Bedrock集成了包括亞馬遜、Anthropic、Meta、DeepSeek等十家大模型廠商的幾十款精選模型。Bedrock上的Bedrock Marketplace像是一個“超市”,上架了180多款專業模型或行業模型。
雲廠商簡單接入DeepSeek是不夠的。不同雲平臺的DeepSeek,體驗差距很大。因為,模型要經過適配、開發,最終才能使用。工具鏈是否完善,決定了DeepSeek是否好用。
以DeepSeek-R1為例,它並非完美。上述出海智慧營銷公司技術人士提到,DeepSeek-R1引數規模到了史無前例的6710億。這導致在測試中表現不穩定,還帶來了高併發等問題,這些都需要反覆除錯。
DeepSeek-R1創造力、想象力出眾。隨之而來的是,模型幻覺(大模型生成不符合事實的內容)率偏高。AI創業公司Vectara用幻覺評估模型計算稱,DeepSeek-R1幻覺率為14.3%。這是大部分頭部模型廠商兩年前的水平。
也就是說,大多數企業生產環境內,DeepSeek-R1無法開箱即用。
如何讓DeepSeek更好用?Bedrock提供了完整的工具集,如Agent、知識庫、提示詞管理、Guardrails(安全防護)等功能。這可以讓模型效能更強、更簡單易用。
怎樣控制DeepSeek-R1的幻覺?Bedrock的Guardrails功能可以提供防護欄,阻止85%的有害內容,並藉助自動推理檢查防止模型幻覺帶來的事實錯誤。
拿出更好的模型
DeepSeek給科技公司帶來了一輪紅利,同時也帶來了壓力。反思的聲音在一些企業內部誕生——為何DeepSeek沒有最先出現在算力、資金、人才看似都更豐富的大廠?
一種解釋是,大廠很難像DeepSeek集中精力做純粹的技術研究。大廠需要商業化,面對未經驗證的技術路線,不敢輕易投入資源。技術負責人也不敢拿公司資源、團隊前途去賭更激進的技術路線。
過去三年,一些科技雲廠商人士原本認為,大模型只是幾個大廠的遊戲,創業公司很難出頭。DeepSeek橫空出世後,大廠技術團隊面對它的心態很矛盾——一方面認為要學習借鑑它的技術特性;另一方面也不服輸,認為它還不夠好,自己家能夠拿出更好的模型。
面對DeepSeek的技術創新,不同大廠應對策略不同。
落後者迅速追趕,阿里在春節期間釋出了對標DeepSeek-V3的Qwen2.5-Max。領先者觀望後立刻反制,微軟和OpenAI拿出了效能更強的o3-mini和GPT-4.5。亞馬遜則考慮,如何用好現有的模型,讓它們在客戶業務場景中發揮最大潛力。
DeepSeek-R1誕生後,直接逼迫大廠要迅速拿出更好的模型。大廠並非沒有技術儲備。隨後不到一個月,阿里、谷歌等廠商均跟進推出了對標DeepSeek的產品。
“幾個大廠不緊不慢地賽跑。現在,賽道上突然橫插進一匹黑馬”,一位中國科技公司大模型領頭人形容,這三個月DeepSeek-R1正在倒逼他們重拾緊迫感。他的團隊對DeepSeek-R1迅速參考借鑑後,在2月末上線了自研的推理模型。他承認,這款模型是“趕鴨子上架”,整個訓練週期不到兩週,甚至沒有經過反覆測試就上線了。
微軟和AI創業公司OpenAI相對從容。微軟和它投資的OpenAI依舊手握優勢。OpenAI的GPT系列仍保持3個至6個月效能領先。因此,面對DeepSeek,OpenAI動作並不多。
今年1月釋出的DeepSeek-R1,效能接近OpenAI去年9月釋出的GPT-o1。今年2月,OpenAI釋出了迭代後的GPT-o3-mini,這款模型的效能領先優勢很大。
不過,OpenAI被詬病的並不是模型效能,而是態度和價格——它的模型閉源,不提供推理思維鏈,定價也過高。奧爾特曼今年1月末曾稱,DeepSeek能以低價算力提供這樣的服務令人驚訝。他表示推遲了部分產品的釋出。然而,今年3月GPT-4.5釋出後,外界再次質疑它價格太貴且缺乏誠意。
一些技術人士認為,DeepSeek為行業帶來了貢獻,但要客觀看待——V3/R1效能並非斷崖式領先,它們仍然存在短板,它距離落地還有一段距離。
一位中國大模型創業公司人士評價,位元組豆包、阿里通義的大語言模型和DeepSeek-R1相差只有1個-3個月。DeepSeek擁有一定的成本/效能優勢,但隨時可能會被複制、追趕或超越。對客戶來說,DeepSeek是偏科生,目前只有語言模型(只能輸入/輸出文字),沒有影像、音訊、影片等多模態模型。比如,工業製造中影像、視覺模型是剛需。
“DeepSeek-R1想進入客戶業務場景,必須擠掉已經部署的模型,但這非常難”,上述出海智慧營銷公司技術人士直言,他們現在無法做這個決定。因為DeepSeek-R1吞吐效率偏低、幻覺率偏高。這會影響客戶口碑。
和很多模型廠商追求更強的模型效能、更高的評測跑分不同,亞馬遜更關注模型實際業務表現:如響應速度、吞吐效率、安全可靠。
一位科技公司演算法負責人的觀點是,基準測試、評測跑分、語言表達華麗不能完全代表模型實際能力。“高分低能”是常見現象,因為模型廠商可以透過刷基準測試題庫的方式取得高分。一些模型紙面效能很強,但企業實際使用時,受制於響應速度、吞吐效率等問題,難以扛住業務洪流。越是深入業務,“好模型”的標準就變得越多維。
這是亞馬遜和它投資的AI創業公司Anthropic所擅長的。
一位亞馬遜雲科技中國區管理層2024年12月曾表示,安迪·賈西一直堅持“Practical AI”(實用/可用的人工智慧)這個觀念。這也是亞馬遜做大模型的邏輯。亞馬遜沒有一個研究院性質的組織,而是把AI能力分散在各個業務線。目的是讓自家模型經過業務檢驗,實現“eat your own dog food”(使用自家生產的產品)
Anthropic 2月末推出Claude 3.7 Sonnet系列推理模型。Claude系列不能只看評測跑分,它的工程、程式碼能力一直遠超其他模型。一位測試過多款模型的一線工程師認為,DeepSeek擅長風格化表達,對大眾使用者來說,這很驚豔。但對工程師來說,程式碼準確率更重要,Claude表現更穩定、靠譜。
亞馬遜雲科技去年12月推出旗下自研家族模型Amazon Nova。Nova包括四個基礎版本(Micro、Lite、Pro、Premier),以及影像模型Nova Canvas、影片模型Nova Reel。Nova是亞馬遜自研模型,卻仍要和Anthropic、DeepSeek等模型同臺競爭,接受客戶考驗。
目前,Nova系列主打賣點是,便宜、好用、安全,以及多模態。上述亞馬遜雲科技中國區一線銷售人員表示,Nova已有大量客戶。它和Claude系列錯位佈局,Claude定位高階,Nova價格更低。
亞馬遜釋出過一份《Amazon Nova系列模型:技術報告與模型卡片》的論文。這份論文和OpenAI、DeepSeek的技術論文強調技術優勢不同,它更強調實際業務場景的測試。
上述論文內容顯示,Nova的啟動速度、吞吐效率、響應時間表現均位居前列。Nova在軟體工程、財務分析等職業專業測試中,同樣表現出眾。為保障資訊安全,亞馬遜聘請了包括德勤等多家外部機構,組成專家團隊定期進行“紅隊演習”。他們會針對300多類違禁、攻擊內容進行對抗測試,以此提升Nova的安全能力。
投入更多算力
隨著模型加速落地,AI應用爆發,加大算力投入已是大勢所趨。
這三個月,算力需求的未來走勢一度引發爭論。根據DeepSeek披露的資訊,似乎不需要萬枚、十萬枚高階AI晶片,也能做出效果不錯、成本低廉的模型。
這在三個月前引發了市場擔憂。投資者一度以為,這會戳破泡沫,減少算力需求。受此影響,1月27日英偉達股價下跌約17%,市值蒸發近6000億美元,創下美國股市歷史上最大單日市值跌幅紀錄。
樂觀預期很快又佔據主流。主流判斷是,單位算力成本下降反而會激發更多需求。AI應用將因此爆發,進而加大算力消耗量。
2月後,中美四家大型科技公司(亞馬遜、微軟、谷歌、阿里)均公佈了2025年資本支出計劃——它們並未減少算力投資,反而在加碼算力投入。
科技公司算力投資,會在資本支出中體現。科技公司每年至少60%以上的資本支出被用於投資算力,如採購晶片、伺服器、儲存和網路裝置、租賃土地、建設資料中心。
2024年,四家科技公司資本支出均達到歷史頂點(詳見《DeepSeek將拉低算力總需求?美國科技四巨頭今年算力投資不減》。2025年,四家科技公司資本支出仍將高速增長。
目前,資本支出計劃規模最大的是亞馬遜。安迪·賈西甚至在2024年報電話會中向投資者保證這筆支出值得,稱這是“千載難逢的商業機會。”
最新財報電話會顯示,亞馬遜計劃2025年投入1000億美元資本支出,增速接近30%,主要用於雲業務。微軟計劃2025財年(2024年7月初-2025年6月末)資本支出800億美元,2025年資本支出將環比增加。谷歌計劃在2025年投入750億美元資本支出,增速將超過40%。阿里宣佈,未來三年將投入超過3800億元(約合535億美元,以美元和人民幣匯率1:7.1計算),用於雲和AI硬體基礎設施,總額超過去十年總和。
對不同公司來說,鉅額資本支出帶來的壓力不盡相同。資本支出率可以側面反映問題。
科技公司鉅額資本支出採購晶片、伺服器等算力裝置後,會轉化為固定資產。這些固定資產折舊攤銷時長一般為五年,計入每年的折舊攤銷成本,影響未來五年的淨利潤。
資本支出率越低,理論上帶來的財務壓力越小。亞馬遜、微軟、谷歌、阿里2024年資本支出率分別是12.2%、28.9%、15.0%、7.4%。目前,亞馬遜資本支出率偏低,它的資本支出對未來幾年的利潤影響有限,算力投資是可持續的。微軟明顯偏高,這對利潤影響相對更大,它不可能長期維持高強度的算力投資。
為什麼即使面臨種種不確定因素,亞馬遜、微軟、谷歌、阿里仍要加大算力投入?
其一,它們“錢袋子”仍是富餘的,淨利潤、現金流能支撐短期高強度算力投資。
其二,短期砸錢買算力對利潤影響不大,還能透過延長部分伺服器、網路裝置使用時長調節利潤。
其三,過去兩年的鉅額投資產生了實際回報,“雲+AI”收入、利潤在增長。這進一步刺激了算力投資。
事實上,“寧可多投不可錯過”是大型科技公司高強度投資算力的重要心態。
多位中國科技公司戰略規劃人士今年2月告訴我們,加大投資才能在競爭中擁有更高勝率。科技公司不能讓淨利潤、現金流躺在賬面,必須投資未來。多買算力,有浪費的可能。但如果不投,一定會錯失未來。
上述中國科技公司演算法負責人透露,他所在公司綜合考慮算力資源儲備、市場未來用量、模型成本下降等因素判斷,2027年每天推理算力的消耗量將增長100倍以上。因此,拉到十年長週期看,算力需求不會減少,只會螺旋上升。
既然未來1年-2年必須加大算力投資。那麼,要如何更經濟、高效地投資算力?亞馬遜的做法是,自研晶片,且自研晶片採購比例比其他公司更高。
目前亞馬遜全球新增算力的一半以上都是基於Arm架構Graviton系列晶片,數量已超過x86系列晶片(主要生產企業包括英特爾、AMD)。未來AI訓練/推理自研晶片的採購比例也將提升。
一位晶片技術人士的觀點是,自研晶片採購量足夠大,成本足夠低時,可以攤薄研發成本,進而得到更有價效比的算力。這也是亞馬遜的優勢所在。
責編 | 王 寧

相關文章