


文|《財經》記者 劉以秦 研究員 吳俊宇 顧翎羽 周源
編輯|謝麗容
2025年春節的前一週,節日氣氛正濃,來自中國杭州的一家初創公司開始讓華爾街投資人寢食難安。
杭州量化私募機構幻方旗下的大模型公司DeepSeek(深度求索)釋出的一款開源AI模型,在多項測試中表現優於OpenAI的產品,且研發成本不到600萬美元。更讓華爾街投資人震驚的是,DeepSeek1月20日釋出R1模型,上線六天後同時登頂蘋果App Store和谷歌Play Store全球下載榜首,上線18天內,累計下載量已突破1600萬次。隨後在2月1日突破3000萬大關,成為史上最快達成這一里程碑的應用。
華爾街的擔憂在於,目前投入數十億美元用於構建大型AI模型的做法可能會打水漂,更廉價的替代方案將讓華爾街人工智慧的泡沫破裂。泡沫破裂帶來的資本市場危機短期內是否會再次上演?
到了春節前一天,這種擔憂氣氛開始達到頂峰。1月27日晚間,美股科技巨頭股價集體下跌:英偉達股價下跌約17%,市值蒸發近6000億美元,創下美國股市歷史上最大單日市值跌幅紀錄。博通公司股價下跌17%,AMD下跌6%,微軟下跌2%。美股指數當日下跌:納斯達克綜合指數跌3.07%,標普500指數跌1.46%。人工智慧領域的衍生品,如電力供應商也受到重創。美國聯合能源公司股價下跌21%,Vistra的股價下跌29%。

1月27日之後英偉達股價在震盪中回升。老虎國際資料顯示,2月13日英偉達股價為135.29美元,較前一交易日上漲3.16%。但這可能不是一次簡單的技術性調整,目前沒有明確的整體持續回撥趨勢。
相對於美股投資者,全球AI產業界的視角心態更加複雜微妙。短暫慌亂和研判之後,中美主流廠商先後拿出了表態和新的動作。
最開始,慌亂情緒蔓延。有大模型公司陷入恐慌情緒,有人反思為何這樣的創新沒有發生在自己的公司裡,有人為新方向出現而興奮,準備“大幹一場”。

很快,新的佈局開始了。曾經佔據開源模型主導地位的Meta,在過去幾個月要求技術團隊加班加點,復刻DeepSeek路徑。全球大模型領域最知名的公司OpenAI也調整了模型釋出策略,不再“擠牙膏”。
各大科技廠商(包括亞馬遜AWS、微軟Azure、谷歌雲、阿里雲、華為雲、騰訊雲、百度智慧雲等)在模型商店中迅速上線了開源版的DeepSeek-V3/R1這兩款模型。因為企業客戶對DeepSeek-V3/R1的需求旺盛,此舉可以為科技雲廠商帶來算力收入。
1月29日,阿里雲釋出了開源的通義千問Qwen 2.5-Max MoE(混合專家模型),它使用了和DeepSeek-R1類似的技術路線。谷歌2月5日上線自研大模型Gemini 2.0,推出和DeepSeek-R1功能類似的思維鏈功能。OpenAI CEO(執行長)薩姆·奧爾特曼2月13日宣佈,GPT-4.5/5將很快釋出,ChatGPT將搭載GPT-5,並可無限制免費對話。百度一度是“閉源模型+模型收費”的擁躉,堅持不做開源模型,但2月14日百度宣佈了一系列動作——文心一言4月1日起免費,未來數月推出文心大模型4.5系列,6月30日開源文心大模型。
整體來說,它們選擇兩條腿走路——一方面是擁抱DeepSeek,另一方面是跟進技術方案類似的自研產品。
DeepSeek的開源如同鯰魚,改變了科技大廠們的既定動作。過去,科技廠商對大模型是否要開源存在大量爭論.如今,國內科技大廠如阿里、騰訊、百度已經全部選擇加入開源陣營。這意味著曾經試圖靠模型收費的商業模式不再成立。
一級投資市場的反應更快,春節假期還沒結束,不少投資人已經開始四處尋找門路,但“連DeepSeek核心團隊的面都見不到”。更多投資人意識到這家公司可能不開放融資後,快速調整策略,大量機構組團去杭州約見其他的科技公司,一些在2024年認為AI創業公司估值太高、風險太高的投資人重新燃起熱情,“害怕錯過”的情緒再次蔓延。
不同行為、不同態度的背後是複雜的資本、技術、人才和市場等因素交織作用。《財經》綜合採訪調研結果顯示,DeepSeek帶給中美產業界的巨大轉變有兩點。
其一,人們此前普遍認為,資訊科技的關鍵突破都在美國,其他國家都是在反向工程。DeepSeek打破了這一刻板共識,成為近20年來第一個拿出革命性方案的中國創業公司。人工智慧時代目前仍處於發展初期,DeepSeek激發全行業找到一張階段性新地圖,發展AI技術的另一個解法——並非一味地追求算力膨脹。這意味著在美國對中國實施算力封鎖的當下,中美AI企業重新站到了一個新的競爭維度上,一個樂觀的判斷是,雙方差距將快速拉近。
其二,此前全球的AI競爭的焦點在於訓練,產業界普遍認為推理很重要,但這個過程會很漫長,不是現在。DeepSeek把時間節點提前了。當產業界將競爭焦點集中到推理,除了算力成本革命性下降,對整個AI行業還有更加深刻的影響——硬軟體協同會進一步加強,基於大模型技術的千行百業應用將大發展,而不是僅僅對話模型了。馬上,人們不僅能看到整個行業從晶片、伺服器、算力中心到終端、能源的產業劇烈變化,還能看到基於大模型技術的各種應用出現百花齊放的局面。

DeepSeek沒有根本改變大模型的經濟規律,只是持續成本降低曲線上一個可預期的成功。這次的不同之處在於,這是一箇中國創業公司
最早注意到DeepSeek並將這家公司推到臺前的是矽谷科技圈。
2024年6月,據當地媒體報道,多位美國AI領域專家都表示對中國的AI大模型印象深刻,其中包括DeepSeek-V2模型,報道稱,這款模型在一系列標準的行業評估中擊敗了OpenAI的GPT-4 Turbo、谷歌的Gemini 1.5 Pro和Anthropic的Claude 3 Opus。當時就已經有不少美國行業人士認為,中國的生成式AI起步雖然較晚,但差距比很多人想象的要小。


2024年12月底,剛剛過完聖誕節的矽谷科技圈就開始了對DeepSeek的全面研究。
2024年12月28日,DeepSeek V3模型釋出後的第三天,OpenAI創始人薩姆·奧爾特曼在社交媒體評論稱,DeepSeek能夠以低價算力提供這樣的服務令人驚訝。OpenAI將暫停一些新的釋出,擁有一個新競爭對手令他感到興奮。
1月31日,他在Reddit論壇回覆網友問題時提到,DeepSeek的出現改變了過去幾年OpenAI遙遙領先的情況。
2月7日,OpenAI宣佈公開最新模型o3-mini系列模型的思維鏈(並非完整版),即讓使用者看到模型是如何推理思考的,而此前,出於競爭考慮,OpenAI沒有完全公開o3-mini及其前身(o1和o1-mini)的推理步驟,僅向用戶提供推理摘要。
DeepSeek對美國資本市場帶來了衝擊,甚至引發了美國政策制定者、矽谷科技巨頭及創業公司的關注。
美國總統特朗普1月27日在邁阿密發表講話時稱,DeepSeek模型高效且經濟,其出現是一種積極的發展,也給美國相關產業敲響了警鐘。美國需要集中精力贏得競爭。
微軟執行長薩提亞·納德拉1月27日在瑞士達沃斯世界經濟論壇表示,應當非常、非常認真地對待來自中國的這些技術進展。
Anthropic是亞馬遜投資的一家AI創業公司,它是OpenAI的直接競爭對手。Anthropic CEO達里奧·阿莫代伊(Dario Amodei)1月撰文稱,一個公正的說法是,DeepSeek生產出了一款效能接近美國七個至十個月前模型的模型。它的成本大幅降低,但遠未達到人們所說的比例。DeepSeek-V3並非一項獨特的突破,也沒有根本改變大模型的經濟規律。它只是持續成本降低曲線上一個可預期的成功。但這次不同之處在於,第一個降低預期成本的是中國公司。這在以前從未發生過,並且具有地緣政治意義。
一位曾在矽谷和歐洲從事多年科技投資的人士向《財經》評價,DeepSeek之所以能在美國科技圈引發地震,主要有三方面因素:一是DeepSeek本身的技術進步,用低成本實現高效能,且不斷有新的最佳化版本出現;二是開源,過去中國在世界科技領域的信任度是被美國所限制的,但開源是透明的,透明就意味著信任,且開源意味著大家都能用,越多人用,就越多人相信這個模型的實力;第三,DeepSeek的出現,顛覆了美國科技公司對AI領域的預設,他們開始反思並調整動作。“我們曾一度認為AI是一座大山,大家努力往上頂爬,現在或許應該思考,AI可能是大海,有很多方向可以探索。”
DeepSeek帶來的影響不止在美國科技圈,前述投資人提到,近期所有的相關會議裡,DeepSeek都變成了最重要的議題。歐洲和印度的一些創業者和投資人,過去認為大模型是隻有中國和美國能做的事,他們不太敢投入,現在大家都好像有了底氣,也都在嘗試進入這一領域。

在中國,此前大模型行業主要有兩類玩家,一是科技大廠們,包括字節跳動、百度、阿里巴巴、騰訊、華為等,它們大多擁有相對完整的AI生態,戰略上重視大模型,人才儲備和資金實力強大。二是AI創業公司,最具代表性的是“六小虎”——智譜AI、百川智慧、月之暗面、Minimax、階躍星塵、零一萬物,它們都拿到了鉅額融資,各有發展側重。
這個春節,DeepSeek狂潮的出現,兩類玩家陷入壓力之中。
所有大廠中,位元組旗下的豆包感受到的衝擊感相對強烈。在DeepSeek出現之前,豆包App是中國活躍使用者量最高的生成式AI應用。多位位元組人士曾告訴《財經》,位元組對大模型的投入“不設限”,幾乎是位元組內部的“一號工程”。整個豆包團隊,包括研發、解決方案和商務,人員數量約2000人-3000人,且不少人員都是加了50%甚至1倍的薪資,從其他大廠裡挖來的。位元組對於大模型業務的要求是要做到“全面領先”。
豆包用高成本堆積的C端領先優勢,被DeepSeek用一個月的時間超過了。2月5日,DeepSeek移動端上線26天,日活使用者數突破4000萬。前述位元組人士表示,在B端使用者那裡,DeepSeek起到了很好的推廣效應,近期有不少企業主動來要求推動豆包AI合作。但提到對C端應用的影響,他說,“內部打擊不小。”
多位行業人士提到,大廠很難做出突破性創新,更常見的路徑是,小團隊做出成果,大廠再透過投資、收購,或是複製、最佳化的方式來跟進,並擴大創新的商業價值。
另一大型科技公司的一位中層人員向《財經》提到,以目前AI技術的程序來看,AI領域裡還有很多未知的可能性,但他所在公司的管理層早早就下了判斷,包括“不卷模型,要卷應用”“閉源才是未來,開源價值不大”等。且公司定期會有員工考試,考試的題目就包含了這些判斷,員工必須“答對”。公司認為這樣能夠實現“戰略對齊”。
但從現在的局面來看,他覺得有點“被打臉了”。
大廠雖然人才儲備豐富,但涉及多項業務和層級,層級彙報、不同業務部門的溝通協作都會消耗時間精力。DeepSeek的母公司幻方做的是量化投資,是天然的AI大模型應用場景,業內認為,技術研發和應用場景的聯動,是有效提升技術實力的方式之一。前述大廠人士提到,他所在的核心業務部門曾多次向大模型團隊提出合作,但都沒有收到積極反饋。
DeepSeek出圈後,大量客戶在詢問雲廠商的一線銷售人員,DeepSeek何時可以上架。過去,銷售人員為了業績通常會對客戶說,自家模型表現最好。如今,客戶質疑隨之而來,一線銷售人員很難回答這個問題。
銷售人員把這些質疑也拋給了技術團隊——為什麼你們無法開發出客戶真正需要的技術?某國際雲廠商的一位中國區銷售人士向《財經》評價,自家模型在公開測評中得分與DeepSeek差距很大。這款去年底釋出的自研大模型曾被寄予厚望,但如今已悄無聲息。這家雲廠商的銷售人員私下已經開始了小範圍的討論和反思,這些覆盤並未上升到公司層面。
類似情況在一家中國頭部雲廠商內部也存在。一位中國頭部雲廠商架構師最近壓力很大,現有的模型不如DeepSeek-R1,但客戶又對R1非常感興趣。前線的壓力逐漸傳遞到了後方產研團隊。產研團隊可以承認DeepSeek的技術創新,卻不願承認自己技不如人。
對比大廠,創業公司相對更靈活也更扁平,但有其他阻力。
一家成立超過七年的AI公司創始人很佩服DeepSeek敢於投入的勇氣。他的感受是,雖然業內很多公司都拿到高融資,宣稱大舉投入,但實際很少有創業公司真正花了大價錢去做大模型的基礎研發。“大家花的不是自己的錢,燒這種量級的錢還是謹慎的。”
此前,一位英偉達的長期合作伙伴告訴《財經》,過去兩年密集購買英偉達GPU的中國公司主要是自身有業務需求的大廠,包括阿里巴巴、騰訊、字節跳動、百度等,創業公司很少。有一些知名大模型創業公司會主動要求和他建立戰略合作關係,以此來對外證明自己在投入算力,“不給錢的那種”。
大模型太燒錢,即使是以低成本著稱的DeepSeek在前期的投入也很難估量。第三方機構SemiAnalysis推算,DeepSeek實際擁有龐大的算力儲備:共堆砌了6萬張英偉達GPU卡,其中包括1萬張A100、1萬張H100、1萬張“特供版”H800以及3萬張“特供版”H20。
按照行業傳統,中國AI創業公司還有一個大掣肘因素——創業公司拿到融資後,就不得不去考慮股東回報,這需要逐步抬高公司估值,而估值越高,IPO(首次公開募股)的時間表就越緊急。這意味著,一個AI創業公司拿不到融資甚至沒理由活下去,但一旦拿到第一筆融資,就被上了發條,為了上市而草草商業化。
大模型領域對算力和資料的高投入,一度被認為是影響創業公司估值的障礙。一方面,創業公司很難在這些投入上和大廠抗衡,投入看不到上限。另一方面,這會讓創業公司變成一家重資產公司。
大多數中國科技公司一開始就會將重心放在閉源模型上,因為行業的普遍預判是AI商業化應用主要集中在B端,而核心的企業客戶需要閉源模型,甚至需要本地化部署。
物理AI模擬系統開發商松應科技CEO聶凱旋告訴《財經》,DeepSeek的開源模式一定程度上規避了這個矛盾。開源比閉源的模式成本低且進步速度快,“DeepSeek沒有做特別多架構性的創新,應該說它是在借鑑開源的基礎上,對模型能力做了比較陡峭的升級”。

無論大公司小公司,之前要贏,是高成本的贏;現在,所有人都有可能低成本贏,這是生態的本質
DeepSeek兩款模型V3/R3是開源的,任何人都可以下載、部署、使用,這也是它能夠快速獲得討論度的核心原因之一。
大年初一,正在丈母孃家吃團圓飯的華為工程師張飛飛(化名)被拉進一個電話會,新的動作在這次會上被部署:“準備安排加班,我們現在就要開始接入DeepSeek V3。”四天後,所有團隊成員就位。他們的目標是一季度就要完成所有的適配工作。
阿里雲資深工程師徐陵(化名)所在團隊在年前就已經多次開會討論了。他透露,2025年開年以來自己“所有工作都是在圍著DeepSeek轉。”他評價,DeepSeek的技術路線並不是獨一無二的,各家大廠都有類似的產品,但DeepSeek目前展示出的工程能力確實很強。所謂工程能力,包括但不僅限於訓練成本效率、模型效能和技術創新能力。
工作量陡然加大,徐陵覺得很累,但重拾久違的信心。阿里雲現有大模型的雲業務也有自研AI晶片。他向《財經》表示,在美國數次加碼國產GPU的算力封鎖之後,自家晶片為了合規已經不得不主動降低了算力和製程,這讓他一度沮喪,認為中美之間AI差距在加大,但是DeepSeek的技術路線證明了較低算力晶片也有可能做出同樣先進的模型效果。
短短十餘天,百餘家中國公司已經宣佈“接入DeepSeek”,覆蓋從晶片、算力服務商到AI使用者到終端使用者各級生態圈。
另一個新變化是,一些科技公司裡閒置的伺服器重新跑了起來。“我們公司一批放在庫房吃灰的CPU伺服器,以前從沒想過還能和AI扯上什麼關係,現在也能帶得動大模型了。”位於上海松江區的某雲服務公司的一位技術人士告訴《財經》,此前大模型應用開發的成本太高了,他認為DeepSeek帶來的大幅降低開發門檻的趨勢將會推動產業向前一大步。
一家中國晶片設計公司已經準備將原定於2026年推出的新產品釋出提前到今年,希望接住DeepSeek帶來的國產算力的機會。
開源也讓DeepSeek迅速形成產業生態——晶片廠商、雲廠商、軟體廠商都在主動接入或適配DeepSeek。
晶片公司第一時間擁抱了DeepSeek。包括英偉達、AMD這些國際晶片廠商,華為•N騰、百度崑崙芯、海光這幾家國產晶片廠商也迅速適配DeepSeek,為其專門最佳化Al推理。晶片是AI行業發展中最重要的基礎設施,一個樸素的經濟學理論是:技術進步和效率提升雖然能夠降低某資源在單個領域的使用強度,但最終的結果是該資源的總消費量反而會增加。
雲廠商一直是大模型推廣應用的直接受益者,它們願意上架所有熱門模型。客戶使用DeepSeek等模型時會消耗算力、資料,進而帶動其他基礎雲產品(計算、儲存、網路、資料庫、軟體)的銷售。因此,包括美國三大雲廠商(亞馬遜AWS、微軟Azure、谷歌雲)、中國科技雲廠商(阿里雲、華為雲、騰訊雲、火山引擎、百度智慧雲、中國電子雲)、電信運營商(天翼雲、移動雲、聯通雲)都迅速上架了DeepSeek。
軟體公司同樣願意接入市面上不同的大模型,因為這可以讓軟體更好用。包括釘釘、飛書、金蝶等一批軟體公司已接入DeepSeek。線上辦公系統公司釘釘的一位技術人士告訴《財經》,2024年6月開始,釘釘接入了六家模型。此次釘釘使用的DeepSeek部署在阿里雲上,專供釘釘使用。另一個線上辦公系統公司飛書的一位技術人士告訴《財經》,飛書用的開源版DeepSeek部署在火山方舟和矽基流動兩款模型平臺上,它已和飛書的多維表格、智慧夥伴建立平臺等功能深度結合。
當產業鏈中的所有人都不約而同往DeepSeek上跑的時候,DeepSeek初步完成了第一輪生態佈局。目前,DeepSeek生態呈現出快速擴張且規模龐大的態勢。
在使用者端,DeepSeek在1月累計獲得1.25億使用者(含網站、App累加不去重),2025年1月網站月訪問量達2.56億,全球榜上以22.3倍的速度增長。近期DeepSeek訪問使用量急速上升,已成為目前最快突破3000萬日活躍使用者量的應用程式。
在合作廠商端,國內外眾多雲廠商相繼接入,包括亞馬遜、微軟、三大運營商、阿里雲、百度智慧雲、騰訊雲、華為雲、360數字安全、中國電子雲、並行科技、青雲科技、UCloud、金山雲、雲軸科技等,都上線了DeepSeek大模型。手機、PC等終端廠商也在積極擁抱DeepSeek,如榮耀等手機廠商已接入,一些地方政府也開始在政務系統部署,如深圳龍崗區政務服務和資料管理局已在政務外網部署上線了Deepseek-R1全尺寸模型。
在行業軟體接入方面,DeepSeek覆蓋雲計算、醫療、教育、汽車、創意設計等多個領域。如中關村科金的“得助大模型平臺2.0”、軟通動力的“天璇MaaS平臺”、國家超算西安中心等都接入了DeepSeek系列模型,醫療領域的醫渡科技、鷹瞳科技、萬達資訊,創意設計與辦公工具領域的萬興科技、釘釘AI助理,智慧汽車領域的江淮汽車、當虹科技,安全與通訊領域的北信源、奇安信等都接入了DeepSeek。
DeepSeek也在快速進化,模型功能往多元方向演進,以DeepSeek-V2為代表的模型在程式碼生成、數學推理、金融分析等場景表現突出,支援文字、影像、程式碼等多模態輸入,可擴充套件應用至智慧客服、電商推薦、工業質檢等多個場景。
另外,DeepSeek開始主動適配國產晶片,對華為•N騰、寒武紀等國產晶片進行了最佳化,符合國產化信創要求,推動了國產晶片在定製化場景中的發展。
“你可以理解為,之前大模型是大玩家的小範圍遊戲,大玩家想做生態,但想進入這個生態,需要高代價高成本,DeepSeek的作用是把高門檻一下子打掉了。”一位中美AI產業資深技術人士向《財經》評價:“無論大公司小公司,之前要贏,是高成本的贏,現在,所有人都可能低成本贏,這是生態的本質。”

當整個行業的競爭焦點從訓練轉向推理,大模型就不僅僅是對話了,基於大模型技術的千行百業應用都將取得大發展
相比產業界的複雜心態,投資圈迎來了久違的“活力”。往年春節假期結束後,大約還需要一兩週,投資機構們才會真正投入工作,今年的情況變了,投資人今年還沒等假期過完,就衝到杭州,希望能和DeepSeek溝通交流。儘管他們絕大多數都沒能見到創始人,熱情依然不減,大型美元基金、大型政府引導基金們,把杭州的科技創新專案都看了一圈。
大模型的推理和訓練都極為重要。訓練是大模型的基礎,決定了模型的上限;推理是將模型應用於實際場景的關鍵環節,推理的速度和準確性直接決定了模型在實際應用中的表現和使用者體驗。
在實際應用中,最佳化推理過程,降低對計算資源的需求,可以顯著降低模型的運營成本,使得模型能夠在更多的裝置和場景中部署和使用。DeepSeek將全行業原來聚焦以訓練為中心的競爭拉到了以推理為中心的競爭格局。這是一個巨大變化——從資本支出、晶片、基礎設施架構到應用開放正規化,都會引發巨大變化。
當全行業的競爭走向推理,一個重要表現是應用大發展,而不僅僅是目前的對話模型。從技術邏輯簡單說,推理算力本質上是分散式的,需要端側和邊緣側配合,接下來,硬體廠商會與大模型公司緊密合作,針對推理需求開發專門的硬體產品,如推理晶片、邊緣計算裝置等。軟體層面,開發適配新型硬體的驅動程式和開發工具,提高硬體資源利用率,降低推理延遲。
在市場和商業層面,競爭焦點從訓練向推理的轉向也會帶來新的變化。

有某頭部金融機構的AI技術人士向《財經》表示,DeepSeek帶來的改變很現實。它的API定價僅為OpenAI執行成本的1/30,每百萬詞元僅需2.2美元,這種低成本使得更多的企業和機構能夠負擔得起。
另外,推理技術的發展使得大模型可以更高效地部署在各種硬體裝置上,包括一些計算能力相對較弱的邊緣裝置和終端裝置。這一下子解決了大模型在很多應用場景中的部署難點,比如智慧家居和智慧穿戴裝置。
另有企業服務軟體領域的投資人向《財經》表示,大模型應用是否能夠繁榮,爆款殺手級應用固然重要,商業模式的走通更重要。他正看定製化推理服務相關的初創專案。“結合新技術路線的定製化推理服務將讓大家前期熟悉的智慧安防、智慧客服、醫療影像診斷、金融風險評估等領域的應用準確度和智慧度大大提升,顆粒度更細。”
中國電子雲副總裁常慧鋒透露,過去兩年國內AI大模型相關的專案已經湧現,不少千萬級的大單,主要是來自金融等資訊化基礎很好的行業,但整體來說,AI大模型推理能力跟業務的垂直領域結合才剛剛開始。
這些都是機會。
DeepSeek的出現再一次喚起一級市場的“害怕錯過”心態,且這次比上一次由OpenAI帶來的影響量級更上一層。“上一次是美國公司,我們是跟隨;這一次是中國公司,機會更大了。”
AI行業尚處於發展初期,門檻和上限遠比移動網際網路產業更高。
無論中國還是美國,移動網際網路時代的繁榮不僅體現在巨頭公司的陣列,更具象體現在如雨後春筍般出現的,分佈在不同領域、不同規模的新貴公司身上。由於新的估值模型被認可,即便這些公司大多沒有盈利,甚至沒有清晰的商業模式,也不會妨礙它們成功上市。
而目前AI技術研發的巨量投入本身就是一個極高門檻,基本都是已經盈利多年的巨頭們在大包大攬。初創公司若沒有一定的硬實力,單憑講故事、畫大餅就想融資,是難上加難。
過去兩年間,中國AI領域的風投出現了一個特點:風險投資資金基本上流到少數頭部大模型公司,更多細分領域的創業公司很難拿到錢。那些頭部大模型創業公司的估值太高,資金很難進去。據第三方資料機構企名片,2024年全年,中國AI領域融資總額約495億元。其中,月之暗面、百川智慧、智譜AI和Minimax四家公司共計完成了約233億元融資額,佔全年行業融資額的近一半(48%)。
創業公司估值到了一定階段後,很難繼續在一級市場拿到新融資。除非能夠證明自己的技術有獨特性和壁壘,否則就必須拿出實際資料,包括使用者數量、使用者增速、營收增速等。但創業公司在這些方面很難與大廠競爭,大廠們已經將模型應用的觸角深入各類場景中。
長此以往,投資人的思維越發保守,更注重創業公司的營收、利潤、使用者量等資料。
一家AI頭部創業公司的投資人告訴《財經》,頭部的六家大模型創業公司中,至少有四家已經面臨融資壓力。而DeepSeek的出現又加劇了這一形勢。“對於投資人來說,投一個細分方向的目的是投中行業第一,如果這個第一已經出現,繼續投資的意義就不大了。”
前述AI行業資深觀察人士認為,遵循此前美國技術路線訓練的大模型創業公司後續會比較被動。但更多基於大模型應用的新創業公司會獲得更多機會。“如果說此前的邏輯是垂直的、重資產的,現在是扁平的、輕資產的,接下來很有可能回到移動網際網路創業時代,應用為王。”
換句話說,DeepSeek徹底反轉了敘事體系,資產成本顯得不那麼重要了,回到應用為王的路徑上。
一位投資人向《財經》預測,2025年,整個一級市場的融資頻率和交易金額會有明顯提升,這主要是受近期二級市場科技股股價普遍上漲的影響。且近期不少美元機構都表現出了投資更早期專案的意願,會降低對業務資料的要求。
“新一代AI應用確實會加速,但具體方向不好判斷,要看實際落地情況。”多位接受《財經》採訪的一級市場投資人表達了同一個觀點:必須看到類似“爆款”潛質之類的苗頭才能下結論。

從“大力出奇跡”到“四兩撥千斤”的轉變,盤活了不少算力
“暴力美學”邏輯統治了2023年-2024年的全球大模型產業。期間中美科技公司對大模型的發展共識是,新一代人工智慧產業發展需要“大力出奇跡”——只有擁有足夠的晶片、足夠的資金才能支撐大模型迭代以及商業化。DeepSeek提出的“四兩撥千斤”的技術路徑推翻了這一模式。
大模型晶片公司行雲積體電路CEO季宇告訴《財經》,作為一家晶片公司,他們關注的不僅僅是模型的效果,更注重模型的經濟性,而經濟性很大程度上取決於執行模型的硬體。DeepSeek有望把高質量的模型降到人人都用得起的一個水平,他認為,這將會給硬體,也就是國產晶片帶來機會。
DeepSeek採用了MoE(混合專家模型)架構,這種架構的優勢在於降低了對記憶體頻寬的需求,缺點是需要更大的記憶體容量。不過,據《財經》瞭解,從技術角度看,更大的記憶體容量需求相對是比較好滿足的,且市場上給全國產方案帶來探索的機會。
對非顯示卡場景而言,這反而是一個有利的特點。比如使用CPU執行的場景,目前甚至使用CPU伺服器也有可能執行大模型,這說明DeepSeek顯著降低了算力門檻。
總結來說,DeepSeek為此前難以滿足大模型執行需求的國產晶片提供了更多發展空間,尤其是在推理市場。
峰瑞資本副總裁李罡的觀點是,近年來新一代AI晶片公司興起,這些新公司和過去的晶片公司一大區別就是產品的著力點在最佳化頻寬,不再追求高算力,算力可以用異構的方式來解決。
同時,DeepSeek的熱度可能將會帶動資本市場對新一代AI晶片的熱度。“去年大家都還是在以孵化為主,一些知名機構已經投了一些晶片專案,但是還沒有曝光。今年這些熱度會很快起來。”
他認為,隨著時間推移,晶片的成本能夠降到現在十分之一甚至更低,而這種晶片的降本將會帶來應用的爆發。“目前因為晶片的成本高昂,很多AI應用沒辦法免費,未來如果再下降一個數量級,就會爆發很多免費的應用出來,就將迎來應用大爆發的階段。”
並行科技創始人陳健認為,DeepSeek確實會盤活國產算力,為國產算力的成長提供全新機遇。
國內大部分算力服務商主要出售自有算力,並行科技不僅提供自有算力,還將分佈在全國各地的智算中心連線起來,形成統一算力網路,排程給前端使用者。陳健介紹,這些智算中心晶片種類多樣,算力參差不齊,算力閒置現象較為普遍。雖然目前絕大多數國產晶片均已經適配DeepSeek,但在算力排程、應用適配層面還有大量的最佳化工作,而他們當下工作重心之一,是評估哪三種國產晶片在DeepSeek上效能表現最優,以及哪三種國產晶片價效比最高,以便為客戶使用國產算力提供參考。
如某國有大型銀行採用長江計算聯合•N騰、華為雲團隊的方案,使用G440K V2伺服器成功部署DeepSeek-V3模型的本地化推理服務,為•N騰晶片等在金融行業的推廣提供了案例。
隨著DeepSeek在雲服務、手機、汽車等多領域的廣泛應用,國產晶片將有望在更多行業實現規模化應用,AI大模型應用生態也將更加成熟與繁榮。
在算力需求端,中外大型科技公司仍然堅持大規模投資算力。
2024年,美國科技四巨頭(微軟、亞馬遜、谷歌、Meta)資本支出均達到史上最高點,2025年資本支出總額將超過3200億美元,總增速約為30%。最新財報電話會顯示,微軟計劃2025年資本支出將環比增加;亞馬遜計劃2025年投入1000億美元資本支出,增速將接近30%;谷歌計劃在2025年投入750億美元資本支出,增速將超過40%;Meta預計2025年資本支出為600億-650億美元,增速將高達60%-75%。

包括字節跳動、阿里、百度等科技公司人士的觀點是,短期內節省算力很重要,但投資算力更重要。一位阿里雲人士對《財經》表示,阿里雲在2025年的重點之一,仍是大規模投資算力。

上述中國科技公司智慧演算法負責人對《財經》分析,拉到十年的長週期看,算力需求不會減少,只會螺旋上升。因此,面向未來投資算力更重要。這就像2025年的iPhone,計算效能一定超過2007年的iPhone。他所在公司綜合考慮算力資源儲備、市場未來用量、模型成本下降等因素判斷,2027年每天推理算力的消耗量將增長100倍以上。
AI產業邏輯變化,中國科技股正迎來重估。近一週,中國科技公司股價普漲。阿里(NYSE:BABA)紐交所股價上漲16.9%,總市值2954億美元,騰訊港交所股價上漲9.4%,總市值4.4萬億港元,百度(NASDAQ:BIDU)在納斯達克股價上漲7.2%,總市值346億美元。

舊地圖找不到新世界
陳健的觀點是,一流的效能表現、大幅降低的算力成本,加開源模式是DeepSeek引爆的三個核心原因。但他表示:“技術的發展就是你追我趕的,前兩點其他大模型也很快能做到甚至可能超過DeepSeek,而開源這一模式為DeepSeek生態養成和未來發展帶來深遠的影響力。”
在DeepSeek推出V3/R1之前,谷歌的AI大模型雖然也開源,但對中文的支援一般,並且它作為國外的開源產品在國內關鍵領域落地存在一定的政策風險;國內雖然有開源大模型,效能表現沒那麼出色,生態鏈不少玩家都採取保守觀望的態度。
“DeepSeek V3/R1效能出色,又開源開得比較徹底,讓人放心跟進,在這一點上,阿里雲作為另一個也在國內推AI開源大模型的廠家就有點難比,因為它同時也有閉源大模型,導致別的玩家多少有點不放心,會認為我在你開源產品上怎麼做也比不上你阿里雲閉源的大模型,DeepSeek就不會讓人產生這種顧慮。”某雲服務商高管告訴《財經》。
軟體開源並非指將原始碼全部無條件免費提供給別人用,必須遵循一定規則,即開源協議。全世界有上百種開源協議,常用的有五六種,DeepSeek選擇的是比較寬鬆友好的MIT開源協議(The Massachusetts Institute of Technology License,麻省理工學院許可協議)。
MIT開源協議最大的特點是支援商用,很多公司在選用開源產品的時候也都首選支援MIT協議的,因為可以完全控制這些第三方的程式碼,必要的時候可以修改或者二次開發。相比之下,一些商業閉源模型可能每年需要企業支付數百萬甚至上千萬元的授權費用,免費又支援商用的DeepSeek大模型對生態合作伙伴的吸引力更強。
陳健指出了開源對DeepSeek未來發展的另一種潛在的長期影響:“在開源世界,你如果被認可,那全世界的高手都會跟你玩,會在你的程式碼基礎上繼續創新,形成良好的開發者社群氛圍,增進開源模型應用生態。”
中國電子首席科學家、中國電子雲總工程師朱國平表示,DeepSeek有可能複製Linux作業系統的成功。Linux透過開源形成了豐富的生態系統,包括各種開源軟體、工具和應用。這些開源專案相互協作、相互促進,共同推動Linux在伺服器、超級計算機、嵌入式等領域成為全球主流作業系統。
“AI大模型和作業系統一樣,都是平臺級軟體,平臺級軟體總會收斂到少數幾家,儘管當前大模型眾多,但最終只有幾家能勝出。”朱國平說。
在中國,受限於美國不斷收緊的晶片制裁政策,中國公司無法從英偉達等晶片公司購買高階晶片,也無法制造7奈米及以上的高階晶片,導致不少中國AI大模型創業創新團隊不得不預設一個所謂的“跟隨戰略”:緊跟世界前沿創新的腳步,保證中國AI大模型不落後三個至六個月,並試圖利用中國豐富的應用場景做出“從1-100”的創新。
未來,國產晶片、DeepSeek大模型、算力服務商、行業應用,這些環節能夠共同形成國產AI大模型產業鏈閉環。
2月11日,百度創始人李彥宏在阿聯酋迪拜World Governments Summit 2025峰會上針對DeepSeek回應稱,百度仍需對晶片、資料中心和雲基礎設施持續投入,以打造下一代模型。
李彥宏認為,在AI、IT乃至更多領域,大多數創新都與降低成本有關。為此,需要使用更多算力來嘗試不同的路徑。也許,在某個時刻會找到一條捷徑,比如說只需600萬美元就能訓練出一個模型,但在此之前,可能已花費了數十億美元,用於探索哪條路才是花費這600萬美元的正確途徑。
從產業創新路徑的層面來看,DeepSeek打破了幾個“刻板共識”:AI領域中國相對美國差距不小,而且差距在拉大;美國的晶片是制約中國AI產業發展的關鍵,可以卡住中國;目前全球的AI競爭的核心是訓練,推理是未來的事;大模型的關鍵突破都發生在美國,其他國家市場都是在反向工程。
這不僅是對中國AI產業創新的實踐啟示,也是對全球AI進展打破常規緩慢節奏的啟示。
如果既有的道路走不通,那麼就需要尋找新的道路。在DeepSeek出現之前,AI行業普遍認為,使用的計算卡數量越多,模型就越先進,效果也越好。然而,由於美國對中國實施晶片封鎖,中國公司難以獲取大量先進的計算卡。因此,按照這種傳統邏輯參與全球AI競爭,中國公司往往會陷入被動,只能不斷扮演跟隨者的角色,難以取得先機。
DeepSeek狂潮的出現,從根本上改變了大模型時代的技術競爭邏輯,為中國的AI發展提供了一種全新的思路和可能性。
季宇認為,“過去的四五十年中,經驗主義對中國的經濟騰飛起到了巨大的作用,但也形成了一定的思維定式,如果中國沒有已經走到世界前列的情況下,經驗主義其實是一個非常有效的方法論,但是中國處在世界前列時,無論是技術還是商業創新是需要反經驗主義的,反經驗主義不只是‘反’經驗,更需要新的把事情做成的新的方法論,反經驗主義或許可以幫助中國科技創新突破瓶頸。”




責編 | 秦李欣


