DeepSeek三個月，改變全球四大雲廠走了三年的路

DeepSeek、Manus過去三個月帶來的狂潮，正改變全球AI產業過去三年既定路線。變局當前，亞馬遜、微軟、谷歌、阿里姿勢各不相同

文｜吳俊宇

編輯｜謝麗容

這三個月，中國大模型創業公司DeepSeek、中國AI應用創業公司Manus引爆了市場情緒。

DeepSeek論文稱，“用2048張英偉達H800晶片和558萬美元訓練成本”訓練出了DeepSeek-V3。這款模型和美國明星AI創業公司OpenAI旗下主力模型GPT-4o效能接近。

Manus利用Muti-Agent（多代理）策略，製造出了一款AI原生應用。演示資料中，Manus可以獨立思考、計劃並執行復雜任務。Muti-Agent被認為是2025年AI應用發展方向。

DeepSeek、Manus這兩家公司不乏爭議。市場對DeepSeek披露的算力規模、訓練成本有所質疑。Manus則被認為是“套殼”產品，缺乏真正的核心競爭壁壘。

無論如何，DeepSeek、Manus都是大模型浪潮三年的里程碑。它們這三個月帶來的狂潮意味著，擁有云業務大型的科技公司（如亞馬遜、微軟、谷歌、阿里等）未來三年的既定路徑將被改變。

其一，過去三年大模型競爭重點是訓練，這三個月正在轉向推理。

過去三年，大模型競爭焦點是用萬卡、十萬卡訓練高效能模型。但近一年，“Scaling law”（規模定律，模型效能由算力、模型、資料規模決定）放緩。成倍的算力只能讓模型效能提升10%-20%。但得益於晶片、模型、演算法最佳化，推理算力成本正以每年十倍的速度下降。

其二，過去三年AI應用處於萌芽期，但這三個月AI應用快速成長。

AI應用消耗的是推理算力，受益者仍然是雲廠商。過去三年，AI應用落地主要障礙是推理算力成本偏高。隨著推理算力下降，釘釘、飛書、WPS、美圖秀秀這些老應用近三個月在加快疊加新的AI能力，Manus這類AI Agnet（代理）為代表的原生AI應用也迅速爆發。

AI應用爆發，算力消耗增長，變局正在來臨。那麼，全球四大雲廠商——亞馬遜、微軟、谷歌、阿里，是如何面對這場狂潮的？

先吃下紅利

雲是大模型的基礎設施，也是大模型最終受益者。隨浪而躍，幾大雲廠過去三個月正在爭相吃下DeepSeek帶來的早期市場紅利。

亞馬遜雲科技、阿里雲、微軟Azure、谷歌雲等雲廠商先後迅速接入DeepSeek。雲廠商上架DeepSeek不難。DeepSeek-V3/R1是開源的，任何人都能下載、部署、使用。客戶使用時會消耗算力、資料，帶動其他基礎雲產品（計算、儲存、網路、資料庫等）銷售。

今年2月，多家國際、中國雲廠商的一線銷售透露，DeepSeek走紅後，大量客戶在詢問，DeepSeek何時能上架。DeepSeek近一個月快速帶來了算力消耗和收入增長。

DeepSeek帶來了市場紅利，但一些雲廠商面對DeepSeek情緒複雜——猶豫、被動、搖擺的心態始終存在。根源是，它們始終面臨一個問題——要如何面對第三方模型？

接入第三方大模型，會和自研模型直接競爭。一位中國雲廠商銷售坦言，大部分雲廠商，原本最希望銷售自家旗艦模型。過去，DeepSeek等第三方產品無法得到官方推薦。銷售人員通常會對客戶說，自家模型表現最好。然而，自家模型公開測評得分與DeepSeek-R1差距很大。如今面對客戶質疑，一線銷售很難回答這個問題。

“丟了面子，得了裡子”，另一位中國雲廠商銷售的判斷是，接入DeepSeek，既是被動防守，也是為了爭取更多訂單。他認為，“先吃下DeepSeek帶來的市場紅利，總比自家模型丟掉市場份額要好”。

亞馬遜沒有太多糾結，它的動作迅速且堅決。它是全球率先接入DeepSeek的雲廠商。亞馬遜還在後續兩個月不斷為客戶提供使用DeepSeek的完整工具鏈。

1月30日，亞馬遜雲科技Marketplace模型市場和SageMaker開發平臺接入DeepSeek。

2月24日，亞馬遜雲科技Marketplace中國區上線矽基流動（一家部署了DeepSeek V3/R1的平臺服務商），中國使用者可藉此使用DeepSeek。

3月11日，亞馬遜在Amazon Bedrock平臺上架DeepSeek-R1。這是中國市場首款上架Bedrock的大模型。目前，亞馬遜雲科技是首個提供全託管版本並正式商用的海外雲廠商。

入選Bedrock門檻並不低。亞馬遜會評估全球範圍內的大模型，嚴格篩選並最終上架。目前Bedrock只有十家模型廠商的產品，其中包括明星AI創業公司Anthropic旗下的Claude 3.7系列、Meta旗下的Llama 3系列。

我們瞭解到，亞馬遜雲科技2024年曾試圖尋找適合上架Bedrock的中國大模型，但無疾而終。DeepSeek-R1技術領先，效能出眾。亞馬遜的客戶，如豐田、思科等對它很感興趣，這是它最終上架Bedrock的重要原因。

亞馬遜CEO安迪·賈西（Andy Jassy）在2024年報電話會介紹，DeepSeek訓練技術令人印象深刻。它使用了強化學習技術，這比監督微調更有意思。

“上架”Bedrock，比“接入”更近一步。客戶可以透過全託管、無伺服器方式使用。這種體驗如同一方產品，可以得到官方推薦和更多客戶資源傾斜。1月30日至今，亞馬遜雲科技已有數千名客戶使用Amazon Bedrock的自定義模型匯入功能部署了DeepSeek-R1。

為什麼要向第三方模型開放自己的資源？因為，在真實業務場景中，企業往往會用多模型。

每款模型都有擅長的領域，如文字、程式碼、影像。一位出海智慧營銷公司技術人士直言，他們公司業務中部署了十餘款模型，包括阿里千問系列、Anthropic的Claude系列、谷歌Gemini系列、DeepSeek系列等。Claude承擔英語和小語種營銷文案任務，千問負責中文營銷文案任務，Gemini被用於營銷圖片、影片生成。DeepSeek目前還在測試階段。

選定了模型的專業領域，還要面對“不可能三角”——在成本、速度、效能三者之間權衡，最終找到適合自身業務的模型。

面對這些真實需求，亞馬遜雲科技的做法是，“Choice Matters”（選擇大於一切）。安迪·賈西曾對此解釋，要給開發者自主選擇的權利。使用模型時，擁有多種選擇至關重要，因為“永遠不會出現一種工具在某個領域一統天下的情況”。

創新往往來自邊緣。一位亞馬遜雲科技人士的觀點是，DeepSeek脫穎而出，說明頂尖AI模型不一定來自大家都期待的大公司，它可能來自任何人。亞馬遜不會押注單一贏家，而是提供開放平臺。只要模型足夠好，就立刻上架Bedrock，為客戶提供多種選擇。

為此，Bedrock集成了包括亞馬遜、Anthropic、Meta、DeepSeek等十家大模型廠商的幾十款精選模型。Bedrock上的Bedrock Marketplace像是一個“超市”，上架了180多款專業模型或行業模型。

雲廠商簡單接入DeepSeek是不夠的。不同雲平臺的DeepSeek，體驗差距很大。因為，模型要經過適配、開發，最終才能使用。工具鏈是否完善，決定了DeepSeek是否好用。

以DeepSeek-R1為例，它並非完美。上述出海智慧營銷公司技術人士提到，DeepSeek-R1引數規模到了史無前例的6710億。這導致在測試中表現不穩定，還帶來了高併發等問題，這些都需要反覆除錯。

DeepSeek-R1創造力、想象力出眾。隨之而來的是，模型幻覺（大模型生成不符合事實的內容）率偏高。AI創業公司Vectara用幻覺評估模型計算稱，DeepSeek-R1幻覺率為14.3%。這是大部分頭部模型廠商兩年前的水平。

也就是說，大多數企業生產環境內，DeepSeek-R1無法開箱即用。

如何讓DeepSeek更好用？Bedrock提供了完整的工具集，如Agent、知識庫、提示詞管理、Guardrails（安全防護）等功能。這可以讓模型效能更強、更簡單易用。

怎樣控制DeepSeek-R1的幻覺？Bedrock的Guardrails功能可以提供防護欄，阻止85%的有害內容，並藉助自動推理檢查防止模型幻覺帶來的事實錯誤。

拿出更好的模型

DeepSeek給科技公司帶來了一輪紅利，同時也帶來了壓力。反思的聲音在一些企業內部誕生——為何DeepSeek沒有最先出現在算力、資金、人才看似都更豐富的大廠？

一種解釋是，大廠很難像DeepSeek集中精力做純粹的技術研究。大廠需要商業化，面對未經驗證的技術路線，不敢輕易投入資源。技術負責人也不敢拿公司資源、團隊前途去賭更激進的技術路線。

過去三年，一些科技雲廠商人士原本認為，大模型只是幾個大廠的遊戲，創業公司很難出頭。DeepSeek橫空出世後，大廠技術團隊面對它的心態很矛盾——一方面認為要學習借鑑它的技術特性；另一方面也不服輸，認為它還不夠好，自己家能夠拿出更好的模型。

面對DeepSeek的技術創新，不同大廠應對策略不同。

落後者迅速追趕，阿里在春節期間釋出了對標DeepSeek-V3的Qwen2.5-Max。領先者觀望後立刻反制，微軟和OpenAI拿出了效能更強的o3-mini和GPT-4.5。亞馬遜則考慮，如何用好現有的模型，讓它們在客戶業務場景中發揮最大潛力。

DeepSeek-R1誕生後，直接逼迫大廠要迅速拿出更好的模型。大廠並非沒有技術儲備。隨後不到一個月，阿里、谷歌等廠商均跟進推出了對標DeepSeek的產品。

“幾個大廠不緊不慢地賽跑。現在，賽道上突然橫插進一匹黑馬”，一位中國科技公司大模型領頭人形容，這三個月DeepSeek-R1正在倒逼他們重拾緊迫感。他的團隊對DeepSeek-R1迅速參考借鑑後，在2月末上線了自研的推理模型。他承認，這款模型是“趕鴨子上架”，整個訓練週期不到兩週，甚至沒有經過反覆測試就上線了。

微軟和AI創業公司OpenAI相對從容。微軟和它投資的OpenAI依舊手握優勢。OpenAI的GPT系列仍保持3個至6個月效能領先。因此，面對DeepSeek，OpenAI動作並不多。

今年1月釋出的DeepSeek-R1，效能接近OpenAI去年9月釋出的GPT-o1。今年2月，OpenAI釋出了迭代後的GPT-o3-mini，這款模型的效能領先優勢很大。

不過，OpenAI被詬病的並不是模型效能，而是態度和價格——它的模型閉源，不提供推理思維鏈，定價也過高。奧爾特曼今年1月末曾稱，DeepSeek能以低價算力提供這樣的服務令人驚訝。他表示推遲了部分產品的釋出。然而，今年3月GPT-4.5釋出後，外界再次質疑它價格太貴且缺乏誠意。

一些技術人士認為，DeepSeek為行業帶來了貢獻，但要客觀看待——V3/R1效能並非斷崖式領先，它們仍然存在短板，它距離落地還有一段距離。

一位中國大模型創業公司人士評價，位元組豆包、阿里通義的大語言模型和DeepSeek-R1相差只有1個-3個月。DeepSeek擁有一定的成本/效能優勢，但隨時可能會被複制、追趕或超越。對客戶來說，DeepSeek是偏科生，目前只有語言模型（只能輸入/輸出文字），沒有影像、音訊、影片等多模態模型。比如，工業製造中影像、視覺模型是剛需。

“DeepSeek-R1想進入客戶業務場景，必須擠掉已經部署的模型，但這非常難”，上述出海智慧營銷公司技術人士直言，他們現在無法做這個決定。因為DeepSeek-R1吞吐效率偏低、幻覺率偏高。這會影響客戶口碑。

和很多模型廠商追求更強的模型效能、更高的評測跑分不同，亞馬遜更關注模型實際業務表現：如響應速度、吞吐效率、安全可靠。

一位科技公司演算法負責人的觀點是，基準測試、評測跑分、語言表達華麗不能完全代表模型實際能力。“高分低能”是常見現象，因為模型廠商可以透過刷基準測試題庫的方式取得高分。一些模型紙面效能很強，但企業實際使用時，受制於響應速度、吞吐效率等問題，難以扛住業務洪流。越是深入業務，“好模型”的標準就變得越多維。

這是亞馬遜和它投資的AI創業公司Anthropic所擅長的。

一位亞馬遜雲科技中國區管理層2024年12月曾表示，安迪·賈西一直堅持“Practical AI”（實用/可用的人工智慧）這個觀念。這也是亞馬遜做大模型的邏輯。亞馬遜沒有一個研究院性質的組織，而是把AI能力分散在各個業務線。目的是讓自家模型經過業務檢驗，實現“eat your own dog food”（使用自家生產的產品）。

Anthropic 2月末推出Claude 3.7 Sonnet系列推理模型。Claude系列不能只看評測跑分，它的工程、程式碼能力一直遠超其他模型。一位測試過多款模型的一線工程師認為，DeepSeek擅長風格化表達，對大眾使用者來說，這很驚豔。但對工程師來說，程式碼準確率更重要，Claude表現更穩定、靠譜。

亞馬遜雲科技去年12月推出旗下自研家族模型Amazon Nova。Nova包括四個基礎版本（Micro、Lite、Pro、Premier），以及影像模型Nova Canvas、影片模型Nova Reel。Nova是亞馬遜自研模型，卻仍要和Anthropic、DeepSeek等模型同臺競爭，接受客戶考驗。

目前，Nova系列主打賣點是，便宜、好用、安全，以及多模態。上述亞馬遜雲科技中國區一線銷售人員表示，Nova已有大量客戶。它和Claude系列錯位佈局，Claude定位高階，Nova價格更低。

亞馬遜釋出過一份《Amazon Nova系列模型：技術報告與模型卡片》的論文。這份論文和OpenAI、DeepSeek的技術論文強調技術優勢不同，它更強調實際業務場景的測試。

上述論文內容顯示，Nova的啟動速度、吞吐效率、響應時間表現均位居前列。Nova在軟體工程、財務分析等職業專業測試中，同樣表現出眾。為保障資訊安全，亞馬遜聘請了包括德勤等多家外部機構，組成專家團隊定期進行“紅隊演習”。他們會針對300多類違禁、攻擊內容進行對抗測試，以此提升Nova的安全能力。

投入更多算力

隨著模型加速落地，AI應用爆發，加大算力投入已是大勢所趨。

這三個月，算力需求的未來走勢一度引發爭論。根據DeepSeek披露的資訊，似乎不需要萬枚、十萬枚高階AI晶片，也能做出效果不錯、成本低廉的模型。

這在三個月前引發了市場擔憂。投資者一度以為，這會戳破泡沫，減少算力需求。受此影響，1月27日英偉達股價下跌約17%，市值蒸發近6000億美元，創下美國股市歷史上最大單日市值跌幅紀錄。

樂觀預期很快又佔據主流。主流判斷是，單位算力成本下降反而會激發更多需求。AI應用將因此爆發，進而加大算力消耗量。

2月後，中美四家大型科技公司（亞馬遜、微軟、谷歌、阿里）均公佈了2025年資本支出計劃——它們並未減少算力投資，反而在加碼算力投入。

科技公司算力投資，會在資本支出中體現。科技公司每年至少60%以上的資本支出被用於投資算力，如採購晶片、伺服器、儲存和網路裝置、租賃土地、建設資料中心。

2024年，四家科技公司資本支出均達到歷史頂點（詳見《DeepSeek將拉低算力總需求？美國科技四巨頭今年算力投資不減》）。2025年，四家科技公司資本支出仍將高速增長。

目前，資本支出計劃規模最大的是亞馬遜。安迪·賈西甚至在2024年報電話會中向投資者保證這筆支出值得，稱這是“千載難逢的商業機會。”

最新財報電話會顯示，亞馬遜計劃2025年投入1000億美元資本支出，增速接近30%，主要用於雲業務。微軟計劃2025財年（2024年7月初-2025年6月末）資本支出800億美元，2025年資本支出將環比增加。谷歌計劃在2025年投入750億美元資本支出，增速將超過40%。阿里宣佈，未來三年將投入超過3800億元（約合535億美元，以美元和人民幣匯率1:7.1計算），用於雲和AI硬體基礎設施，總額超過去十年總和。