DeepSeek真正成為了一條鯰魚

防走失，電梯直達安全島報人劉亞東A

來源：鳳凰網科技

作者：梁思琦

摘要：

行業普遍認為，兩大“AI巨頭”，都被DeepSeek捲到了，開源的勝利正在改變AI世界。

DeepSeek把兩大“AI巨頭”都捲到了

自走紅之初，DeepSeek就因成本優勢不斷震驚業界，這為其開源生態發展奠定了非常好的基礎。

過去大模型走閉源路線與成本息息相關。許多大模型在預訓練階段幾乎都選擇了不計成本地投入，而DeepSeek選擇劍走偏鋒，把重點放在了上崗之後的強化學習。用反覆高強度地訓練，倒逼自身不斷地調整姿勢，理解邏輯，自我反思，直到結果令人滿意。

以一直在難產的OpenAI GPT-5為例，估算顯示，該專案一次為期半年的訓練，僅計算成本就高達約 5億美元。目前，該專案已開發超過18個月，成本花費巨大，卻仍未取得預期成果。

這給國內很多大模型公司都敲響了警鐘，意味著想訓練頂級的模型，單是GPU的採購成本就高達幾十億，部署十萬卡叢集的 “燒錢”程度更是難以想象。

相比之下，DeepSeek找到了一條低算力，高效率的路徑，其訓練成本只是OpenAI相關模型的十幾甚至幾十分之一。

DeepSeek還狠狠回擊了所謂“開源是矽谷精神”的論調，其不僅開源了所有的模型和論文，供所有人去免費下載，還公開了訓練方法，允許大家去做資料的蒸餾，去訓練自家的模型。

這意味著全球所有相關的技術人員，都能在現有的能力基礎之上，去做研發與開發，至此，新的技術，新的應用就會在這個新生態裡產生。

DeepSeek在2025年1月20日釋出R1模型後，僅7天新增使用者1億（含網頁端與應用端），成為史上最快破億的AI應用。至2月1日，其日活躍使用者（DAU）突破3000萬大關，超越豆包（1695萬），直逼ChatGPT的5323萬。

從雲服務商、電信運營商，到多數手機、汽車廠商，越來越多企業正在奮力擁抱 DeepSeek。

這條鯰魚很快也攪動了全球AI市場，兩大“AI巨頭”先後決定一改閉源態度，鬆口向公眾免費。

先是1月31日，OpenAI上線了新的推理模型o3-mini，並進一步下放了免費的許可權。OpenAI CEO Sam Altman首次承認在開源上的失誤，指出後續可能找到不同的開源策略，有望重拾模型開源。

最新訊息則來自於百度，其在2月13宣佈，從4月1日起，文心一言將全面免費。同時即日起，文心一言上線深度搜索功能；該功能也將於4月1日起免費開放使用。

要知道，去年李彥宏還是堅定的閉源擁躉。“今天不管是在中國也好、美國也好，最強的基礎模型都是閉源的。閉源是有真正商業模式的，是能夠賺到錢的，能賺到錢才能聚集算力、聚集人才”。

僅僅不到一年過去，情況就開始逆轉。

開源的底氣到底是什麼？

其實許多人仍對DeepSeek如何算得又快又好抱有好奇，其中比較重要的一點，就是它實現了晶片最底層的最佳化。DeepSeek在其釋出的技術論文中表示，DeepSeek採用了PTX（Parallel Thread Execution）程式設計，透過定製PTX最佳化，使DeepSeek的系統和模型可以更好釋放底層硬體的效能。

相比於外界盛傳的算力限制讓其尋找價效比方案，DeepSeek其實是主動擁抱的最佳化，用PTX把某些SM（GPU裡負責計算的核）做了程式設計，讓他們來負責做資料的傳輸，使得多個GPU之間的資料傳輸的速度變快，解決了大模型計算中的一大瓶頸；同時，它還用PTX優化了其他的包括計算梯度在內的運算，使得同樣的GPU發揮出了10倍的效能，這在訓練與推理過程中扮演著十分重要的角色。

除了晶片最佳化，DeepSeek在訓練方法上也下了真功夫。不同於傳統的大模型訓練方法，它選擇直接跳過監督微調階段，專注於透過規則驅動的強化學習訓練推理模型。

從DeepSeek V3 Base的預訓練模型開始，完全省略了監督微調階段，為了實現大規模的強化學習，研究團隊使用了一種名為GRPO（群體相對策略最佳化）的方法。有人用現實生活生動類比了這一數學原理的精妙之處，“通俗的說，就是一群學生在解決一個問題。老師不再單獨給每個學生打分，而是讓學生自己比較答案。答案更好的學生會受到鼓勵，而其他人則會從錯誤中吸取教訓。隨著時間的推移，整個團隊會共同進步，變得更加準確和一致”。

觀察DeepSeek這一本土化大模型的發展路徑，晶片最佳化與GRPO，可謂是兩大法寶，提供源源不斷的光照與養分，但光有養分還不夠，一個好的土壤更加重要。DeepSeek的全資母公司幻方量化，原本對AI押寶許久，同時也是國內少數破千億的量化私募，既不缺錢也沒有融資需求。跟國內絕大多數AI相比，DeepSeek在商業化上可以說完全佛系，內部甚至沒有設立過多的營銷、產品崗位。

同時，據公開資訊顯示，DeepSeek研發團隊有 139人，均是立足於本土的年輕團隊，他們更知道這片土地到底需要什麼，所以以上這些快速迭代，前沿的實驗成果才有了茁壯成長的土壤。

工程上精益求精，技術上大刀闊斧進行創新，DeepSeek的爆火絕非偶然。事實上，六年前這場佈局就已開始。它的母公司幻方量化早在2019年就花費2億打造螢火一號超算叢集， 2022年默默地屯了萬張A100顯示卡，是ChatGPT 3.5釋出之後第一波手握萬卡入場券的少數模型公司，積累下的豐富資源增強了開疆拓土的信心。

至此，他們在V3實現了震撼的價效比，R1在實現價效比的同時還跑通了影響很大的新正規化，一躍成為AI領域的新星，甚至有些觀點認為，DeepSeek可以稱為中國AI大模型的ChatGPT時刻。對於行業而言，DeepSeek的案例再次證明：在AI競賽中，垂直突破、開放協作、長期主義仍是贏得競爭的關鍵。

全球資本重估中國科技企業

DeepSeek掀起的人工智慧革命浪潮還改變了中國科技企業的估值敘事。

截至2025年2月12日，恒生科技指數ETF近1周累計上漲7.67%。2月13日，恒生指數再度高開0.46%，恒生科技指數漲0.77%。嗶哩嗶哩-W、網易-S、百度集團-SW、中芯國際等漲超2%。

據中國證券報報道，高盛日前釋出報告稱，中國人工智慧（AI）企業深度求索（DeepSeek）的出現正激發投資者加速購買中國股票的熱情。同時，高盛維持對明晟（MSCI）中國指數的超配評級，預計該指數今年將上漲14%。

此前，中國科技企業一直普遍處於被低估的狀態中。大摩的一篇報告指出，全球投資者對中國科技企業的估值體系仍停留在傳統網際網路思維，未能充分反映其在前沿科技領域的突破。以騰訊、阿里為例，二者港股市盈率分別只有19和15，遠遠低於美股科技股的市盈率。

現在，DeepSeek真正成為了一條鯰魚。

美國針對DeepSeek的報道里，有一個高頻詞彙經常出現：“Sputnik Moment”，又名斯普特尼克時刻（該術語源於1957年10月4日蘇聯成功發射的 “斯普特尼克 1號”人造衛星。這是人類歷史上第一顆人造地球衛星，它的發射成功使蘇聯在太空領域取得了領先地位，讓美國意識到自己在科技，尤其是太空技術方面的落後，給美國帶來了巨大的危機感和緊迫感）。

這件事對當時的美國衝擊很大，隨後1958年NASA成立，美國舉全國之力完成了登月，重新回到太空領域裡面領先的地位，才拔掉了自己心頭的這根刺。而這次，在美國最核心的AI領域裡，DeepSeek又扎進去了一根新的刺。