“網紅”DeepSeek，還能火多久？

作者 | 宮靖

編輯 | 張軼驍

不曾想到，這個春節，最火爆的話題，不是旅遊與消費，而是DeepSeek與人工智慧。

上至美國總統特朗普，中至全球所有AI公司，下至全球數十億關注AI進展的使用者，在最近十餘天之內都在討論、研究和熱議DeepSeek。

從1月20日DeepSeek公司（全稱杭州深度求索人工智慧基礎技術研究有限公司）釋出DeepSeek-R1算起，十餘天內，在全球範圍內快速掀起關注熱潮，成為AI發展歷史上的現象級事件之一。

至1月27日，在蘋果App Store中國、美國區免費榜上，DeepSeek均成為第一，超過了來自OpenAI的ChatGPT。

除了鋪天蓋地的溢美之詞之外，最值得關注的兩則評論，分別來自美國總統特朗普和OpenAI執行長薩姆·奧爾特曼。

特朗普認為，中國的DeepSeek公司“提出了一種更快、更便宜的人工智慧方法，我認為這是積極的”，“（這）給我們（美國）的行業敲響警鐘，我們需要專注於競爭以贏得勝利。”

薩姆·奧爾特曼於1月27日晚在社交媒體上發文，稱“DeepSeek-R1是一款令人印象深刻的模型，尤其是考慮到它能夠以這個價格提供”，“有這樣的新競爭對手確實令人振奮。”

網紅效應總會過去，一番喧鬧之後，DeepSeek至少給AI領域留下四個需要深度思考和直面的真問題：

DeepSeek能夠從“網紅”到“長紅”嗎？

當DeepSeek已經用低價策略走出一條獨特的路後，AI大模型還會繼續走昂貴之路嗎？

AI大模型到底要走開源還是閉源之路？

以及，如何看待DeepSeek之後的中美AI技術水平差距？換言之，中國真的借DeepSeek之機實現“彎道超車”了嗎？

一鯨落，萬物生，新的局面，也孕育著新的挑戰。

DeepSeek能否從“網紅”到“長紅”？

近幾天的表現反映出，DeepSeek並不是一個網紅AI產品這麼簡單，全球各界已經歸納出其爆火的幾個原因。

在開發背景方面，DeepSeek出自中國，而不是AI技術能力更為領先的美國；而且，其開發者也不是中國的網際網路大廠，或者是AI“六小虎”等知名企業，而是一家中國初創公司，有西方網友甚至稱其為“來自東方的神秘力量”。

價效比方面，DeepSeek能力強、體驗感佳，水平堪比OpenAI相關產品，但價格僅僅是後者的百分之幾。

在發展路徑方面，DeepSeek與OpenAI“反著來”，成本低，所需算力少，一定程度上打破了AI大模型研發的“高價”神話。同時，與全球AI大模型龍頭企業主要走閉源路線完全不同，DeepSeek技術路線完全開源，再次挑動了“開閉源之爭”話題。

1 月 27 日，現象級國產遊戲《黑神話：悟空》的製作人馮驥評價稱，DeepSeek“可能是個國運級別的科技成果”。

他點評DeepSeek說，“如果有一個 AI 大模型做到了以下（六條）的任何一條，都是超級了不起的突破。但DeepSeek 全部、同時做到了。”他提到的DeepSeek六大亮點，分別為強大、便宜、開源、免費、聯網和本土。

任何一款“網紅”產品的產生都有其獨特的內外部原因，同時，“網紅”的宿命有兩種，即成為“長紅”或止於網紅。

在中國AI業內人士看來，自2023年7月成立起，DeepSeek已有過兩次“高光時刻”。這次在全球火出圈，可以稱得上是DeepSeek的第三次高光時刻。

第一次在DeepSeek籌備成立期間。在2023年5月，正在組建DeepSeek公司的量化基金公司幻方就被媒體曝出可能擁有超過1萬枚英偉達GPU，是幾家頭部大廠之外持有算力資源最多的公司。在當時，中國的AI“六小虎”也還在初創或籌建階段。

業內一般認為，1萬枚英偉達A100晶片是做自訓大模型的算力門檻。從之後美國限制中國進口英偉達晶片的舉措來看，DeepSeek的創始者極有遠見和魄力。

第二次是2024年5月，中美市場上“百模大戰”最激烈的時刻，DeepSeek突然宣佈對大模型大幅降價，掀起“價格戰”，其降幅甚至達行業水平9成以上。之後中國AI全行業在兩週內迅速跟進，外界直呼“讓大模型降成白菜價”。

此次DeepSeek走紅之時，其在正式釋出的資料中自豪地介紹，DeepSeek-R1 在後訓練階段大規模使用了強化學習技術，在僅有極少標註資料的情況下，極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上，效能比肩 OpenAI o1 正式版。

〓 DeepSeek公佈的效能測試比對成果。圖|DeepSeek官方微信

可以預見，不用很久，DeepSeek將成為中國AI領域正式的“新貴”，估值有望超過“六小虎”水平。但與此同時，DeepSeek面臨的國內外競爭也將更加激烈。

從技術上看，細觀全球業內人士評價可發現，DeepSeek-R1的水平與OpenAI o1“水平相當”，而不是領先。考慮到OpenAI o1釋出已有4個月左右，之後OpenAI仍然在繼續研究和精進，所以DeepSeek的水平能否與即將釋出的新模型“水平相當”，或長期保持在較高技術水平上，還未可知。

從國外競爭形勢看，DeepSeek對美國AI行業的刺激很大，未來技術起點高於中國企業的美國AI行業必然會更加進取。

1月21日，特朗普在上任美國總統後第二天，就在白宮宣佈了一項名為“星際之門”（Stargate）的人工智慧專案，將由美國甲骨文公司、OpenAI和日本軟銀集團聯合出資5000億美元打造。

除了特朗普的“星際之門”計劃會更快速推進之外，近期包括OpenAI在內的AI巨頭已經進行了戰略微調。扎克伯格的Meta已宣佈，2025年投資高達650億美元用於與人工智慧密切相關的專案，包括新建設一個規模巨大的AI資料中心以及大幅擴充AI領域人才，增加Meta人工智慧團隊實際規模。

在國內，各網際網路大廠與AI“六小虎”、“四小龍”，甚至其他較小型的大模型公司，也必然會如美國企業般調整戰略和技術路線，進行新競爭。未來有下一個DeepSeek的出現，也不是沒有可能。

同時，國內外對AI感興趣的資本，以及各家網際網路大廠，普遍有興趣對DeepSeek或投資或合作。如此關鍵和微妙時刻，考驗著DeepSeek掌舵人的智慧。

全球AI發展形勢“一月千里”，未來對於DeepSeek來說，不再是“不進則退”的局面，而是“不快則退”。想要從“網紅”到“長紅”，並不容易。

AI大模型還會繼續走“燒錢”之路嗎？

貴、燒錢，是AI大模型效用足夠激動人心的另一面。

AI大模型最燒錢的部分是算力，需要海量效能最先進的GPU晶片，其執行還需要巨量的電力能源支援；其技術核心是演算法，需要大量頂級的人工智慧專家和技術人員參與研發。

因此可以看到，美國的AI大模型專案動輒投資數十億美元，大模型計劃動輒投資數百億美元、上千億美元。

但DeepSeek此次對上述模式進行了一次讓人震撼的改變——一家小型初創公司，僅100多名研發人員，在算力受限情形下，使用相對“極低”的訓練費用，訓練出技術水平堪比全球頂極的AI大模型，且實現了“極低”的使用者收費。

據央視網報道，DeepSeek公司R1模型訓練成本僅為560萬美元，遠遠低於OpenAI 、谷歌等美國科技巨頭在人工智慧技術上投入的“數億美元乃至數十億美元”。

伴隨著技術的精進，AI大模型研發的成本已經走上快速下行通道，DeepSeek顯然大大加速了降本程序，而且從行業反映看，確實存在進一步加速降本的可能性。

〓 DeepSeek頁面截圖

但是，如果據此認為DeepSeek終結了AI大模型研發的昂貴路線，恐怕為時尚早。

首先，現階段的DeepSeek R1其實只是AI大模型的一個具有“深度思考”功能的分支，一個分支的低成本還不能代表全部大模型能走上低成本之路。事實上，低成本之路能否走通，還需要全行業進行較長時間的驗證。

其次，包括DeepSeek在內的中外AI大模型行業，真正要實現的目標並不是AI大模型本身，而是AGI——通用人工智慧。目前業內尚不能確認AI大模型是否是實現AGI的正確解，更不能確認未來的AGI研發之路是否昂貴。

再次，從市場近期反應看，“終止昂貴之路”一說還沒得到更進一步支援。

晶片巨頭英偉達股價雖然多日下跌，但跌幅尚有限，美國科技股同樣跌幅有限。此外，市場上暫時還沒有傳出AI大模型專案或計劃大幅向下調整預算的訊息，而Meta在2025年高達數百億的AI預算甚至是在DeepSeek爆火之後才傳出。

開源，還是閉源？

無論美國還是中國，AI大模型領域的開源、閉源之爭，均持續已久。

DeepSeek是堅定的開源路線支持者。任何人均可自行下載與部署，且提供論文詳細說明了訓練步驟與竅門，甚至DeepSeek APP上提供了使用者可見的AI思考、推理過程。

DeepSeek爆火後，UC伯克利、港科大、HuggingFace等機構根據開源資訊，紛紛實現低成本復現，對外稱僅花30美元就能見證“啊哈時刻”（指可以令使用者眼前一亮的時刻）。

原本，閉源路線在中美均有隱隱佔優之勢，但DeepSeek橫空出世並爆火，增加了太多變數，勢必會在業內再次引發開源、閉源之爭。

DeepSeek在官方公眾號上稱：“以開源精神和長期主義追求普惠AGI，是 DeepSeek 一直以來的堅定信念。我們非常興奮能與社群分享在模型預訓練方面的階段性進展，也十分欣喜地看到開源模型和閉源模型的能力差距正在進一步縮小。”

同樣堅持開源路線的Meta 的首席人工智慧科學家Yann LeCun近期發文表示，DeepSeek 的成功“並不是中國的人工智慧超越了美國，而是開源模型正在超越專有模型”。

其在文中還表示，“DeepSeek受益於開放研究和開源，Meta的Llama也是如此。OpenAI 最初是一家開源人工智慧公司，其使命是創造造福全人類的技術，但最近已轉向閉源。”該評論對於閉源路線，隱有火藥味兒。

閉源自有其道理。AI基礎性研發投入巨大，閉源可以讓企業更有動力投入，並利用技術領先獲得市場地位，然後進行市場變現。而開源意味著技術共享，市場收益一般較閉源要小。

其中的典型代表便是蘋果。蘋果智慧手機的作業系統和系列軟體是閉源生態，當蘋果市佔率實現全球第一時，其“贏家通吃”效應顯著。蘋果之所以能長期拿走全球智慧手機大部分利潤，與其閉源生態密切相關。而安卓系統為開源生態，谷歌利用技術共享的方式開放給大量手機廠商，其賺錢方式為技術授權和智慧財產權收費模式。其利潤遠小於蘋果。

2024年7月5日，百度CEO李彥宏在一場圓桌訪談中對開源與閉源模型進行了討論，並談了堅持閉源路線的理由。他解釋說，同樣引數規模下，開源模型的能力不如閉源，閉源模型可以根據使用者需求提供多種變體，以平衡效果、推理速度和成本；無論是ChatGPT還是百度的文心一言，這些閉源模型的平均水平都比開源模型更強大，推理成本也更低。

對於開源模型，李彥宏也承認其價值。他表示，開源模型在一些學術研究、教學等領域有存在價值，可以用於研究大模型的工作機制，形成理論。

其實開源、閉源模式之爭的背後，是關於如何平衡技術創新、商業利益和市場競爭力的討論，是難以給出標準答案的選擇題，並沒有優劣與對錯。

DeepSeek拉近了中美AI的技術差距嗎？

DeepSeek爆火之後，大量的樂觀評論也隨之而來，認為意味著中美在AI領域的差距到了“微乎其微”的地步，甚至，還有人說中國已實現“彎道超車”。

DeepSeek還引發了資本市場的劇烈反應，有西方媒體稱其為中國大模型“爆擊華爾街”。

1月27日，美國股市開盤後，科技板塊整體下跌，其中美國晶片巨頭英偉達（NVIDIA）暴跌約17%。隨後，美國、歐洲電力供應商的股價也遭受重創（AI大模型預訓練、執行等對能源需求巨大）。

〓英偉達近期股價走勢

甚至，有經濟分析認為，DeepSeek可能影響全球經濟。例如德銀策略師George Saravelos在最新報告中認為，DeepSeek的出現可能對全球經濟產生“積極的供應衝擊”，甚至可能使美元“面臨邊際下行壓力”。

客觀、冷靜地看，DeepSeek當然是重要的區域性突破，但整體上中國AI領域尤其AI大模型領域與美國還是有著一定差距的。

首先，DeepSeek-R1代表大模型的“深度思考”能力，是通用大模型的一部分能力，因此其水平接近美國市場的頭部同類模型，且是更早（4個月前）釋出的模型，是一種區域性突破，而非整體突破。

其次，儘管DeepSeek通用大模型V3也廣受好評，但其受好評的前提是其具有極致的價效比，“效能接近”美國頭部產品，且價格更低（是對方的百分之幾）。顯然，這不代表V3真的與ChatGPT在技術上沒有差距。

再次，中國AI行業與美國行業在演算法、算力和資料上的差距依然沒有實質性改變。

演算法方面，美國是AI大模型的原創研發國，技術路線和發展方向目前均主要由美國引領。算力方面，美國目前具有絕對優勢，且隨著美國對英偉達GPU晶片的出口限制日益嚴格，中國受限會愈加嚴重，而國內自主研發雖有重大進展，但尚需追趕和突破時間。資料方面，中文資料存在數量少且“網際網路孤島”加劇之勢。

最後，從市場表現看中美差距依然較大。與美國相比，我國AI企業數量較多，但核心產業規模明顯偏小。並且，我國AI企業估值與美國AI企業估值有拉大之勢，OpenAI市場估值超過1萬億元人民幣，馬斯克主導的xAI估值已達400億美元，而我國“六小虎”估值普遍為100億至數百億人民幣，網際網路大廠則普遍沒有因為發展AI大模型得到較多的AI賦分。

儘管DeepSeek爆火不能完全代表中美AI技術水平接近，但確實進一步縮短了中美AI的技術差距。至於縮短了多少，或許還需要市場後續發展來給出答案。