DeepSeek，改變了AI的遊戲規則

最近，中美AI領域發生了兩件大事：

在美國發布AI禁令後，特朗普隨即宣佈了一項預算高達5000億美元的AGI計劃——星際之門，以保證其在AI領域的領先地位。

而在大洋彼岸的中國，一家名為Deepseek的中國創業公司，只用了2048塊顯示卡，就訓練出了一個能與頂級模型相媲美的Deepseek-V3模型。

Deepseek最引人注目的並不只是它的技術指標，而是其所代表的效率革命，僅依靠少量的硬體配置和幾十名年輕的博士生，就打破了美國的AI資源限制，完成了跨越式的技術突破。

更重要的是，Deepseek選擇了完全開源的路線，將程式碼、模型權重和訓練日誌全部公開。沒有人會忘記開源的力量，雖然定義智慧手機的是iOS，但安卓才是那個讓手機行業真正繁榮，普惠深入世界各個角落的人。

正如Perplexity CEO Aravind Srinivas所說：歷史告訴我們，一旦開源追上甚至超越閉源軟體，所有開發者都會轉向開源。

以此為轉折點，DeepSeek不僅改變了AI原有的競爭規則，也讓美國和中國的AI路線走向了不同的兩個方向：鉅額投入與追求效率、封閉與開源。

‍

DeepSeek突破的三層意義

之所以DeepSeek能夠引起如此廣泛的討論，不僅在於其技術指標，更在於其對於AI行業的重要意義。

首先，DeepSeek重新定義了大模型的競爭壁壘。過去兩年裡，OpenAI每年要花費上百億美金，來維持自己在AI領域的優勢地位。

而現在遊戲規則變了。“DeepSeek”證明，數千萬美元的投資也能取得顯著成果。

不久前，UC伯克利博士生潘家怡和另兩位研究人員，在CountDown遊戲中復現了DeepSeek R1-Zero。實驗中，團隊驗證了透過強化學習RL，3B的基礎語言模型也能夠自我驗證和搜尋。

更誇張的是，整個實現成本僅不到30美金（約217元）。這意味著，低成本構建具備推理能力的模型已成為可能，預訓練模型的鉅額投入不再是必需。

這背後也引出了一個深層次的問題：

當一家公司能在缺乏頂級晶片的情況下，以極低成本建立突破性的 AI 模型時，我們不得不重新思考：那些投入的數千億美元資本支出，真的物有所值嗎？

這是OpenAI需要回答的問題。

其次，與OpenAI的閉源路線不同，DeepSeek選擇完全開源的路線，將程式碼、模型權重和訓練日誌全部公開。

當開源模型效能媲美市場上最強大的模型，甚至在部分領域有所超越時，會吸引越來越多的開發者參與。

原因很簡單，開源軟體成本低廉，成本越低，開發者的吸引力就越大。因為這將大大降低構建應用程式的成本。

這有點像蘋果和安卓的故事。回顧移動網際網路時代，定義智慧機0到1的是iOS，但讓手機行業真正繁榮普惠深入世界各個角落的是安卓。

在Meta 副總裁兼首席人工智慧科學家楊立昆看來，DeepSeek的成功，與其說是”中國超越美國”，倒不如說是開源模型正在超越專有模型。

第三，Deepseek的技術突破，背後是AI研發開放性的勝利，這與美國的AI封鎖形成了鮮明對比。

具體來說，在一個被GPU短缺和晶片禁運困擾的環境中，一家從未被計入中國“AI 六小龍”的量化基金公司，用少量的硬體配置和幾十名年輕的博士生，就完成了跨越式的技術突破。

作為一個後來者，Deepseek的突破雖然離不開自身的努力，但更重要的是，開放的技術交流環境，包括論文、開原始碼和各種正式或非正式的人才交流，為創新突破創造了條件。

這揭示了AI行業的另一個關鍵特性：模型研發具有很強的外部性。特別是在蒸餾與合成數據等技術存在的情況下，後來者的追趕和學習效應異常強勁。這種內卷加外卷的結果，也是模型能力變好，而成本快速下降的原因。

英偉達科學家Jim Fan也提到了開放性對於AI發展的影響：

不管你喜歡與否，AI的未來不會是被“安全委員會”控制的瓶中精靈。每個網際網路使用者都將能在他們的“烤麵包機筆記本”上執行高階模型。這是歷史潮流，我們應該順勢而為，而不是逆流而上。

當美國不斷強化AI技術封鎖的當下，Deepseek的突破又何嘗不是對於美國AI制裁的一種“反噬”。

找到中國大模型的商業化答案

之前，李開復一直在表達一個觀點：

中國做AI的優勢從來不是在不設預算上限的情況下去做突破性研究，而是在好、快、便宜和可靠性之間找出最優解。

在相當長時間裡，國內大模型一直處於很尷尬的處境，訓練階段不僅被技術封鎖，還容易被海外開源降維打擊。

如今，Deepseek的突破代表了一種新的可能性——即透過算力效率的提升，實現更繁榮的LLM應用生態。

長期來看，AI應用生態能否跑通，取決於每個國家的成本結構、商業模式、經濟模型、產品供給能力，大家各有不同，是個複雜的商業問題。

固然，中國買不到最新的晶片，單位Flops的推理成本永遠比海外高，但這也倒逼中國infra出現了各種“工程式創新”，去探索更高效的算力最佳化方式。

至少從目前看，國內推理最佳化進展比大家想象要快。一旦算力最佳化這事跑通，國內大模型在商業層面建立良性迴圈也不是沒有可能。

也就是說，中美未來AI將是兩個完全不同的故事：美國押注模型能力提升，中國追求模型效率的極限。

一旦算力最佳化這事跑通，國內大模型在商業層面建立良性迴圈也不是沒有可能。

也就是說，中美未來AI將是兩個完全不同的故事：美國押注模型能力提升，中國追求模型效率的極限。

這就很像當年網際網路所發生的故事。過去十年，中國和美國在網際網路領域講了兩個完全不同的故事：矽谷加倍投入企業軟體，而中國則將賭注押在消費者應用上。

自谷歌和Meta後，美國科技業幾乎放棄了在消費網際網路上再造流量入口的嘗試，轉而選擇全面擁抱SaaS。軟體也完美接力上一個十年中的消費移動應用，成為新十年的主流投資趨勢，也跑出了很多優秀公司。

而中國在消費網際網路展現了非凡的生命力，字節跳動把短影片生意做到了全世界，美團把本地生活做成了一個千億美元的生意，而拼多多也成長為阿里、亞馬遜一外的電商新一極。

在GPT橫空出世之後，美國SaaS公司率先受益，紛紛開始向客戶提供AI功能，透過之前建立的客戶基礎和產品場景直接產生商業回報，大大提升了在AI上創新投入的回報確定性。而中國的AI應用卻因為缺乏場景和商業模式而進展緩慢。

隨著AI應用的逐漸落地，模型效率將會成為打通中國大模型商業化迴圈的一把“鑰匙”。

>End

>>>

本文轉載自“烏鴉智慧說”，原標題《DeepSeek，改變了AI的遊戲規則》。

為分享前沿資訊及有價值的觀點，太空與網路微信公眾號轉載此文，並經過編輯。

未按照規範轉載及引用者，我們保留追究相應責任的權利

部分圖片難以找到原始出處，故文中未加以標註，如若侵犯了您的權益，請第一時間聯絡我們。

HISTORY/往期推薦

商業火箭，想說愛你不容易——（一）中途夭折的商業火箭起步之旅

商業火箭，想說愛你不容易——（二）難以複製的SpaceX

商業火箭，想說愛你不容易——（三）中國商業火箭未來之路怎麼走？

>>>

充滿激情的新時代，

充滿挑戰的新疆域，

與踔厲奮發的引領者，

卓爾不群的企業家，

一起開拓，

一起體驗，

一起感悟，

共同打造更真品質，

共同實現更高價值，

共同見證商業航天更大的跨越！

——《太空與網路》，觀察，記錄，傳播，引領。

>>>

·《衛星與網路》編輯委員會

高階顧問：王國玉、劉程、童旭東、相振華、王志義、楊烈

· 《衛星與網路》創始人：劉雨菲

·《衛星與網路》副社長：王俊峰

· 微信公眾號（ID：satnetdy）團隊

編輯：豔玲、哈玫，周泳、邱莉、黃榕、娜娜

主筆記者：李剛、魏興、張雪松、霍劍、樂瑜、稻子、趙棟

策劃部：楊豔、若㼆、李真子

視覺總監：董濘

專業攝影：馮小京、宋偉

設計部：顧錳、潘希峎、楊小明

行政部：姜河、林紫

業務部：王錦熙、瑾怡

原創文章轉載授權、轉載文章侵權、投稿等事宜，請加微信：15910858067

商務合作；展覽展廳設計、企業VI/CI及室內設計、企業文化建設及品牌推廣；企業口碑傳播及整體營銷傳播等，請加微信：13811260603

雜誌訂閱，請加微信：

wangxiaoyu9960

· 衛星與網路各分部：

成都分部負責人：沈淮

長沙分部負責人：賓鴻浦

西安分部負責人：郭朝暉

青島分部負責人：江偉

· 衛星與網路總部負責人：農燕

· 會議活動部負責人：喬顥益、許克新、董今福

· 投融資及戰略層面合作：劉雨菲

· 本平臺簽約設計公司：一畫開天（北京）文化創意設計有限公司

· 航天加（深圳）股權投資基金管理負責人：楊豔

dignews.cc

DeepSeek，改變了AI的遊戲規則

相關文章

部分國產晶片適配滿血版DeepSeek，仍「遙遙無期」

四大國產GPU力挺DeepSeek！

DeepSeek崛起，如何影響AI技術發展路徑與國際競爭格局？

端側AI爆發，AI模組破局DeepSeek在實體產業落地最後一公里

DeepSeek到底是真開源還是假開源？業內人士：已經有足夠多細節值得學習

DeepSeek硬控智慧家居！四大電視巨頭搶跑，AR眼鏡、智慧音箱都上桌了

“網紅”DeepSeek，還能火多久？

DeepSeek爆火28天，國內大模型同行都在幹什麼？

中國9.9美元AI耳機爆賣海外！DeepSeek掀起的端側AI革命將帶動智慧硬體大爆發？

創歷史！DeepSeek獲16大國產AI晶片力挺，中國智算的半壁江山都出動了