“網紅”DeepSeek,還能火多久?

作者 | 宮靖
編輯 | 張軼驍
不曾想到,這個春節,最火爆的話題,不是旅遊與消費,而是DeepSeek與人工智慧。
上至美國總統特朗普,中至全球所有AI公司,下至全球數十億關注AI進展的使用者,在最近十餘天之內都在討論、研究和熱議DeepSeek。
從1月20日DeepSeek公司(全稱杭州深度求索人工智慧基礎技術研究有限公司)釋出DeepSeek-R1算起,十餘天內,在全球範圍內快速掀起關注熱潮,成為AI發展歷史上的現象級事件之一。
至1月27日,在蘋果App Store中國、美國區免費榜上,DeepSeek均成為第一, 超過了來自OpenAI的ChatGPT。
除了鋪天蓋地的溢美之詞之外,最值得關注的兩則評論,分別來自美國總統特朗普和OpenAI執行長薩姆·奧爾特曼。
特朗普認為,中國的DeepSeek公司“提出了一種更快、更便宜的人工智慧方法,我認為這是積極的”,“(這)給我們(美國)的行業敲響警鐘,我們需要專注於競爭以贏得勝利。”
薩姆·奧爾特曼於1月27日晚在社交媒體上發文,稱“DeepSeek-R1是一款令人印象深刻的模型,尤其是考慮到它能夠以這個價格提供”,“有這樣的新競爭對手確實令人振奮。”
網紅效應總會過去,一番喧鬧之後,DeepSeek至少給AI領域留下四個需要深度思考和直面的真問題:
DeepSeek能夠從“網紅”到“長紅”嗎?
當DeepSeek已經用低價策略走出一條獨特的路後,AI大模型還會繼續走昂貴之路嗎?
AI大模型到底要走開源還是閉源之路?
以及,如何看待DeepSeek之後的中美AI技術水平差距?換言之,中國真的借DeepSeek之機實現“彎道超車”了嗎?
一鯨落,萬物生,新的局面,也孕育著新的挑戰。
DeepSeek能否從“網紅”到“長紅”?
近幾天的表現反映出,DeepSeek並不是一個網紅AI產品這麼簡單,全球各界已經歸納出其爆火的幾個原因。
在開發背景方面,DeepSeek出自中國,而不是AI技術能力更為領先的美國;而且,其開發者也不是中國的網際網路大廠,或者是AI“六小虎”等知名企業,而是一家中國初創公司,有西方網友甚至稱其為“來自東方的神秘力量”。
價效比方面,DeepSeek能力強、體驗感佳,水平堪比OpenAI相關產品,但價格僅僅是後者的百分之幾。
在發展路徑方面,DeepSeek與OpenAI“反著來”,成本低,所需算力少,一定程度上打破了AI大模型研發的“高價”神話。同時,與全球AI大模型龍頭企業主要走閉源路線完全不同,DeepSeek技術路線完全開源,再次挑動了“開閉源之爭”話題。
1 月 27 日,現象級國產遊戲《黑神話:悟空》的製作人馮驥評價稱,DeepSeek“可能是個國運級別的科技成果”。
他點評DeepSeek說,“如果有一個 AI 大模型做到了以下(六條)的任何一條,都是超級了不起的突破。但DeepSeek 全部、同時做到了。”他提到的DeepSeek六大亮點,分別為強大、便宜、開源、免費、聯網和本土。
任何一款“網紅”產品的產生都有其獨特的內外部原因,同時,“網紅”的宿命有兩種,即成為“長紅”或止於網紅。
在中國AI業內人士看來,自2023年7月成立起,DeepSeek已有過兩次“高光時刻”。這次在全球火出圈,可以稱得上是DeepSeek的第三次高光時刻。
第一次在DeepSeek籌備成立期間。在2023年5月,正在組建DeepSeek公司的量化基金公司幻方就被媒體曝出可能擁有超過1萬枚英偉達GPU,是幾家頭部大廠之外持有算力資源最多的公司。在當時,中國的AI“六小虎”也還在初創或籌建階段。
業內一般認為,1萬枚英偉達A100晶片是做自訓大模型的算力門檻。從之後美國限制中國進口英偉達晶片的舉措來看,DeepSeek的創始者極有遠見和魄力。
第二次是2024年5月,中美市場上“百模大戰”最激烈的時刻,DeepSeek突然宣佈對大模型大幅降價,掀起“價格戰”,其降幅甚至達行業水平9成以上。之後中國AI全行業在兩週內迅速跟進,外界直呼“讓大模型降成白菜價”。
此次DeepSeek走紅之時,其在正式釋出的資料中自豪地介紹,DeepSeek-R1 在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上,效能比肩 OpenAI o1 正式版。

DeepSeek公佈的效能測試比對成果。  圖|DeepSeek官方微信
可以預見,不用很久,DeepSeek將成為中國AI領域正式的“新貴”,估值有望超過“六小虎”水平。但與此同時,DeepSeek面臨的國內外競爭也將更加激烈。
從技術上看,細觀全球業內人士評價可發現,DeepSeek-R1的水平與OpenAI o1“水平相當”,而不是領先。考慮到OpenAI o1釋出已有4個月左右,之後OpenAI仍然在繼續研究和精進,所以DeepSeek的水平能否與即將釋出的新模型“水平相當”,或長期保持在較高技術水平上,還未可知。
從國外競爭形勢看,DeepSeek對美國AI行業的刺激很大,未來技術起點高於中國企業的美國AI行業必然會更加進取。
1月21日,特朗普在上任美國總統後第二天,就在白宮宣佈了一項名為“星際之門”(Stargate)的人工智慧專案,將由美國甲骨文公司、OpenAI和日本軟銀集團聯合出資5000億美元打造。
除了特朗普的“星際之門”計劃會更快速推進之外,近期包括OpenAI在內的AI巨頭已經進行了戰略微調。扎克伯格的Meta已宣佈,2025年投資高達650億美元用於與人工智慧密切相關的專案,包括新建設一個規模巨大的AI資料中心以及大幅擴充AI領域人才,增加Meta人工智慧團隊實際規模。
在國內,各網際網路大廠與AI“六小虎”、“四小龍”,甚至其他較小型的大模型公司,也必然會如美國企業般調整戰略和技術路線,進行新競爭。未來有下一個DeepSeek的出現,也不是沒有可能。
同時,國內外對AI感興趣的資本,以及各家網際網路大廠,普遍有興趣對DeepSeek或投資或合作。如此關鍵和微妙時刻,考驗著DeepSeek掌舵人的智慧。
全球AI發展形勢“一月千里”,未來對於DeepSeek來說,不再是“不進則退”的局面,而是“不快則退”。想要從“網紅”到“長紅”,並不容易。
 AI大模型還會繼續走“燒錢”之路嗎?
貴、燒錢,是AI大模型效用足夠激動人心的另一面。
AI大模型最燒錢的部分是算力,需要海量效能最先進的GPU晶片,其執行還需要巨量的電力能源支援;其技術核心是演算法,需要大量頂級的人工智慧專家和技術人員參與研發。
因此可以看到,美國的AI大模型專案動輒投資數十億美元,大模型計劃動輒投資數百億美元、上千億美元。
但DeepSeek此次對上述模式進行了一次讓人震撼的改變——一家小型初創公司,僅100多名研發人員,在算力受限情形下,使用相對“極低”的訓練費用,訓練出技術水平堪比全球頂極的AI大模型,且實現了“極低”的使用者收費。
據央視網報道,DeepSeek公司R1模型訓練成本僅為560萬美元,遠遠低於OpenAI 、谷歌等美國科技巨頭在人工智慧技術上投入的“數億美元乃至數十億美元”。
伴隨著技術的精進,AI大模型研發的成本已經走上快速下行通道,DeepSeek顯然大大加速了降本程序,而且從行業反映看,確實存在進一步加速降本的可能性。
〓 DeepSeek頁面截圖
但是,如果據此認為DeepSeek終結了AI大模型研發的昂貴路線,恐怕為時尚早。
首先,現階段的DeepSeek R1其實只是AI大模型的一個具有“深度思考”功能的分支,一個分支的低成本還不能代表全部大模型能走上低成本之路。事實上,低成本之路能否走通,還需要全行業進行較長時間的驗證。
其次,包括DeepSeek在內的中外AI大模型行業,真正要實現的目標並不是AI大模型本身,而是AGI——通用人工智慧。目前業內尚不能確認AI大模型是否是實現AGI的正確解,更不能確認未來的AGI研發之路是否昂貴。
再次,從市場近期反應看,“終止昂貴之路”一說還沒得到更進一步支援。
晶片巨頭英偉達股價雖然多日下跌,但跌幅尚有限,美國科技股同樣跌幅有限。此外,市場上暫時還沒有傳出AI大模型專案或計劃大幅向下調整預算的訊息,而Meta在2025年高達數百億的AI預算甚至是在DeepSeek爆火之後才傳出。
開源,還是閉源?
無論美國還是中國,AI大模型領域的開源、閉源之爭,均持續已久。
DeepSeek是堅定的開源路線支持者。任何人均可自行下載與部署,且提供論文詳細說明了訓練步驟與竅門,甚至DeepSeek APP上提供了使用者可見的AI思考、推理過程。
DeepSeek爆火後,UC伯克利、港科大、HuggingFace等機構根據開源資訊,紛紛實現低成本復現,對外稱僅花30美元就能見證“啊哈時刻”(指可以令使用者眼前一亮的時刻)。
原本,閉源路線在中美均有隱隱佔優之勢,但DeepSeek橫空出世並爆火,增加了太多變數,勢必會在業內再次引發開源、閉源之爭。
DeepSeek在官方公眾號上稱:“以開源精神和長期主義追求普惠AGI,是 DeepSeek 一直以來的堅定信念。我們非常興奮能與社群分享在模型預訓練方面的階段性進展,也十分欣喜地看到開源模型和閉源模型的能力差距正在進一步縮小。”
同樣堅持開源路線的Meta 的首席人工智慧科學家Yann LeCun近期發文表示,DeepSeek 的成功“並不是中國的人工智慧超越了美國,而是開源模型正在超越專有模型”。
其在文中還表示,“DeepSeek受益於開放研究和開源,Meta的Llama也是如此。OpenAI 最初是一家開源人工智慧公司,其使命是創造造福全人類的技術,但最近已轉向閉源。”該評論對於閉源路線,隱有火藥味兒。
閉源自有其道理。AI基礎性研發投入巨大,閉源可以讓企業更有動力投入,並利用技術領先獲得市場地位,然後進行市場變現。而開源意味著技術共享,市場收益一般較閉源要小。
其中的典型代表便是蘋果。蘋果智慧手機的作業系統和系列軟體是閉源生態,當蘋果市佔率實現全球第一時,其“贏家通吃”效應顯著。蘋果之所以能長期拿走全球智慧手機大部分利潤,與其閉源生態密切相關。而安卓系統為開源生態,谷歌利用技術共享的方式開放給大量手機廠商,其賺錢方式為技術授權和智慧財產權收費模式。其利潤遠小於蘋果。
2024年7月5日,百度CEO李彥宏在一場圓桌訪談中對開源與閉源模型進行了討論,並談了堅持閉源路線的理由。他解釋說,同樣引數規模下,開源模型的能力不如閉源,閉源模型可以根據使用者需求提供多種變體,以平衡效果、推理速度和成本;無論是ChatGPT還是百度的文心一言,這些閉源模型的平均水平都比開源模型更強大,推理成本也更低。
對於開源模型,李彥宏也承認其價值。他表示,開源模型在一些學術研究、教學等領域有存在價值,可以用於研究大模型的工作機制,形成理論。
其實開源、閉源模式之爭的背後,是關於如何平衡技術創新、商業利益和市場競爭力的討論,是難以給出標準答案的選擇題,並沒有優劣與對錯。
DeepSeek拉近了中美AI的技術差距嗎?
DeepSeek爆火之後,大量的樂觀評論也隨之而來,認為意味著中美在AI領域的差距到了“微乎其微”的地步,甚至,還有人說中國已實現“彎道超車”。
DeepSeek還引發了資本市場的劇烈反應,有西方媒體稱其為中國大模型“爆擊華爾街”。
1月27日,美國股市開盤後,科技板塊整體下跌,其中美國晶片巨頭英偉達(NVIDIA)暴跌約17%。隨後,美國、歐洲電力供應商的股價也遭受重創(AI大模型預訓練、執行等對能源需求巨大)。
〓 英偉達近期股價走勢
甚至,有經濟分析認為,DeepSeek可能影響全球經濟。例如德銀策略師George Saravelos在最新報告中認為,DeepSeek的出現可能對全球經濟產生“積極的供應衝擊”,甚至可能使美元“面臨邊際下行壓力”。
客觀、冷靜地看,DeepSeek當然是重要的區域性突破,但整體上中國AI領域尤其AI大模型領域與美國還是有著一定差距的。
首先,DeepSeek-R1代表大模型的“深度思考”能力,是通用大模型的一部分能力,因此其水平接近美國市場的頭部同類模型,且是更早(4個月前)釋出的模型,是一種區域性突破,而非整體突破。
其次,儘管DeepSeek通用大模型V3也廣受好評,但其受好評的前提是其具有極致的價效比,“效能接近”美國頭部產品,且價格更低(是對方的百分之幾)。顯然,這不代表V3真的與ChatGPT在技術上沒有差距。
再次,中國AI行業與美國行業在演算法、算力和資料上的差距依然沒有實質性改變。
演算法方面,美國是AI大模型的原創研發國,技術路線和發展方向目前均主要由美國引領。算力方面,美國目前具有絕對優勢,且隨著美國對英偉達GPU晶片的出口限制日益嚴格,中國受限會愈加嚴重,而國內自主研發雖有重大進展,但尚需追趕和突破時間。資料方面,中文資料存在數量少且“網際網路孤島”加劇之勢。
最後,從市場表現看中美差距依然較大。與美國相比,我國AI企業數量較多,但核心產業規模明顯偏小。並且,我國AI企業估值與美國AI企業估值有拉大之勢,OpenAI市場估值超過1萬億元人民幣,馬斯克主導的xAI估值已達400億美元,而我國“六小虎”估值普遍為100億至數百億人民幣,網際網路大廠則普遍沒有因為發展AI大模型得到較多的AI賦分。
儘管DeepSeek爆火不能完全代表中美AI技術水平接近,但確實進一步縮短了中美AI的技術差距。至於縮短了多少,或許還需要市場後續發展來給出答案。

鳳凰WEEKLY財經(ID:fhzkfinance)原創

RECOMMENDED
微信又改版啦

為了讓「鳳凰WEEKLY」出現在您的時間線
星標一下 ★ 為了更好的我


相關文章