DeepSeek真正成為了一條鯰魚

 防走失,電梯直達安全島報人劉亞東A 


來源:鳳凰網科技
作者:梁思琦

摘要:

行業普遍認為,兩大“AI巨頭”,都被DeepSeek捲到了,開源的勝利正在改變AI世界。

DeepSeek把兩大“AI巨頭”都捲到了
自走紅之初,DeepSeek就因成本優勢不斷震驚業界,這為其開源生態發展奠定了非常好的基礎。
過去大模型走閉源路線與成本息息相關。許多大模型在預訓練階段幾乎都選擇了不計成本地投入,而DeepSeek選擇劍走偏鋒,把重點放在了上崗之後的強化學習。用反覆高強度地訓練,倒逼自身不斷地調整姿勢,理解邏輯,自我反思,直到結果令人滿意。
以一直在難產的OpenAI GPT-5為例,估算顯示,該專案一次為期半年的訓練,僅計算成本就高達約 5億美元。目前,該專案已開發超過18個月,成本花費巨大,卻仍未取得預期成果。
這給國內很多大模型公司都敲響了警鐘,意味著想訓練頂級的模型,單是GPU的採購成本就高達幾十億,部署十萬卡叢集的 “燒錢”程度更是難以想象。
相比之下,DeepSeek找到了一條低算力,高效率的路徑,其訓練成本只是OpenAI相關模型的十幾甚至幾十分之一。 
DeepSeek還狠狠回擊了所謂“開源是矽谷精神”的論調,其不僅開源了所有的模型和論文,供所有人去免費下載,還公開了訓練方法,允許大家去做資料的蒸餾,去訓練自家的模型。
這意味著全球所有相關的技術人員,都能在現有的能力基礎之上,去做研發與開發,至此,新的技術,新的應用就會在這個新生態裡產生。
DeepSeek在2025年1月20日釋出R1模型後,僅7天新增使用者1億(含網頁端與應用端),成為史上最快破億的AI應用。至2月1日,其日活躍使用者(DAU)突破3000萬大關,超越豆包(1695萬),直逼ChatGPT的5323萬。
從雲服務商、電信運營商,到多數手機、汽車廠商,越來越多企業正在奮力擁抱 DeepSeek。
這條鯰魚很快也攪動了全球AI市場,兩大“AI巨頭”先後決定一改閉源態度,鬆口向公眾免費。
先是1月31日,OpenAI上線了新的推理模型o3-mini,並進一步下放了免費的許可權。OpenAI CEO Sam Altman首次承認在開源上的失誤,指出後續可能找到不同的開源策略,有望重拾模型開源。
最新訊息則來自於百度,其在2月13宣佈,從4月1日起,文心一言將全面免費。同時即日起,文心一言上線深度搜索功能;該功能也將於4月1日起免費開放使用。
要知道,去年李彥宏還是堅定的閉源擁躉。“今天不管是在中國也好、美國也好,最強的基礎模型都是閉源的。閉源是有真正商業模式的,是能夠賺到錢的,能賺到錢才能聚集算力、聚集人才”。
僅僅不到一年過去,情況就開始逆轉。
開源的底氣到底是什麼?
其實許多人仍對DeepSeek如何算得又快又好抱有好奇,其中比較重要的一點,就是它實現了晶片最底層的最佳化。DeepSeek在其釋出的技術論文中表示,DeepSeek採用了PTX(Parallel Thread Execution)程式設計,透過定製PTX最佳化,使DeepSeek的系統和模型可以更好釋放底層硬體的效能。
相比於外界盛傳的算力限制讓其尋找價效比方案,DeepSeek其實是主動擁抱的最佳化,用PTX把某些SM(GPU裡負責計算的核)做了程式設計,讓他們來負責做資料的傳輸,使得多個GPU之間的資料傳輸的速度變快,解決了大模型計算中的一大瓶頸;同時,它還用PTX優化了其他的包括計算梯度在內的運算,使得同樣的GPU發揮出了10倍的效能,這在訓練與推理過程中扮演著十分重要的角色。
除了晶片最佳化,DeepSeek在訓練方法上也下了真功夫。不同於傳統的大模型訓練方法,它選擇直接跳過監督微調階段,專注於透過規則驅動的強化學習訓練推理模型。
從DeepSeek V3 Base的預訓練模型開始,完全省略了監督微調階段,為了實現大規模的強化學習,研究團隊使用了一種名為GRPO(群體相對策略最佳化)的方法。有人用現實生活生動類比了這一數學原理的精妙之處,“通俗的說,就是一群學生在解決一個問題。老師不再單獨給每個學生打分,而是讓學生自己比較答案。答案更好的學生會受到鼓勵,而其他人則會從錯誤中吸取教訓。隨著時間的推移,整個團隊會共同進步,變得更加準確和一致”。
觀察DeepSeek這一本土化大模型的發展路徑,晶片最佳化與GRPO,可謂是兩大法寶,提供源源不斷的光照與養分,但光有養分還不夠,一個好的土壤更加重要。DeepSeek的全資母公司幻方量化,原本對AI押寶許久,同時也是國內少數破千億的量化私募,既不缺錢也沒有融資需求。跟國內絕大多數AI相比,DeepSeek在商業化上可以說完全佛系,內部甚至沒有設立過多的營銷、產品崗位。
同時,據公開資訊顯示,DeepSeek研發團隊有 139人,均是立足於本土的年輕團隊,他們更知道這片土地到底需要什麼,所以以上這些快速迭代,前沿的實驗成果才有了茁壯成長的土壤。
工程上精益求精,技術上大刀闊斧進行創新,DeepSeek的爆火絕非偶然。事實上,六年前這場佈局就已開始。它的母公司幻方量化早在2019年就花費2億打造螢火一號超算叢集, 2022年默默地屯了萬張A100顯示卡,是ChatGPT 3.5釋出之後第一波手握萬卡入場券的少數模型公司,積累下的豐富資源增強了開疆拓土的信心。
至此,他們在V3實現了震撼的價效比,R1在實現價效比的同時還跑通了影響很大的新正規化,一躍成為AI領域的新星,甚至有些觀點認為,DeepSeek可以稱為中國AI大模型的ChatGPT時刻。對於行業而言,DeepSeek的案例再次證明:在AI競賽中,垂直突破、開放協作、長期主義仍是贏得競爭的關鍵。
全球資本重估中國科技企業
DeepSeek掀起的人工智慧革命浪潮還改變了中國科技企業的估值敘事。
截至2025年2月12日,恒生科技指數ETF近1周累計上漲7.67%。2月13日,恒生指數再度高開0.46%,恒生科技指數漲0.77%。嗶哩嗶哩-W、網易-S、百度集團-SW、中芯國際等漲超2%。
據中國證券報報道,高盛日前釋出報告稱,中國人工智慧(AI)企業深度求索(DeepSeek)的出現正激發投資者加速購買中國股票的熱情。同時,高盛維持對明晟(MSCI)中國指數的超配評級,預計該指數今年將上漲14%。
此前,中國科技企業一直普遍處於被低估的狀態中。大摩的一篇報告指出,全球投資者對中國科技企業的估值體系仍停留在傳統網際網路思維,未能充分反映其在前沿科技領域的突破。以騰訊、阿里為例,二者港股市盈率分別只有19和15,遠遠低於美股科技股的市盈率。
現在,DeepSeek真正成為了一條鯰魚。
美國針對DeepSeek的報道里,有一個高頻詞彙經常出現:“Sputnik Moment”,又名斯普特尼克時刻(該術語源於1957年10月4日蘇聯成功發射的 “斯普特尼克 1號”人造衛星。這是人類歷史上第一顆人造地球衛星,它的發射成功使蘇聯在太空領域取得了領先地位,讓美國意識到自己在科技,尤其是太空技術方面的落後,給美國帶來了巨大的危機感和緊迫感)。
這件事對當時的美國衝擊很大,隨後1958年NASA成立,美國舉全國之力完成了登月,重新回到太空領域裡面領先的地位,才拔掉了自己心頭的這根刺。而這次,在美國最核心的AI領域裡,DeepSeek又扎進去了一根新的刺。


相關文章