日報
專欄
熱點
國際
活動
DeepSeek的崛起標誌著AI發展從“算力競賽”轉向“效率競爭”。(首圖來自圖蟲創意)
2025年初,中國人工智慧企業深度求索(DeepSeek)釋出的開源模型DeepSeek-R1引發全球關注。其以顯著低於行業巨頭的訓練成本(如DeepSeek-V3僅557.6萬美元,效能對標GPT-4o),打破了AI領域長期對算力堆疊的路徑依賴。這一技術突破不僅引發資本市場震盪,更吸引了高盛、摩根士丹利等頂級投行的深度解析。
01 投行視角下的DeepSeek技術價值
改進模型,降低成本
摩根士丹利指出,DeepSeek透過改進模型架構和最佳化資料質量,顯著降低了訓練成本,其模型成本僅為OpenAI等競爭對手的十分之一,且效能接近頂尖閉源模型。這證明“更大並不等於更聰明”,高效工程設計和演算法最佳化可能比單純算力投入更具競爭力。
摩根大通認為這代表AI技術的階躍式進步,採用“專家混合”(MoE)系統,使模型在引數執行機制上更為高效,在較弱硬體和較低記憶體頻寬下透過重度最佳化也能產生顯著效果,降低能源需求和總體成本,為AI技術發展提供新思路。
高盛則強調,DeepSeek的低成本將降低AI應用開發門檻,可能顛覆現有競爭格局,使初創企業能夠挑戰網際網路巨頭在AI領域的壟斷地位。
開源生態的催化劑
DeepSeek選擇開源模型,允許開發者自由部署和二次開發。摩根士丹利認為,此舉將加速全球開源生態繁榮,推動更多企業探索定製化AI解決方案,同時削弱閉源模型的技術壁壘。例如,華為、阿里雲等國內外雲廠商已快速整合DeepSeek模型,提供低成本API服務。
美銀認為DeepSeek的開源特性降低了軟體公司應用AI技術的門檻,眾多軟體企業有望快速嵌入AI功能,提升競爭力,加速行業創新。像金山軟體、金蝶等企業可能率先受益。
推理層面的進步
DeepSeek帶來的最大的震撼不是開源或者低成本,而是不需要做 SFT(Supervised Fine-Tuning)了。但只是在推理層面,推理以外的任務還是需要做SFT。這也許能夠提出一個新的正規化或架構,使得訓練模型對資料的利用效率更高,或者模型表現的迭代速度更快。
02 對產業鏈的衝擊與機遇
算力市場:短期需求預期下降,長期多元化發展
摩根士丹利觀察到,DeepSeek的技術路徑降低了對先進算力的依賴,導致市場對英偉達高階GPU(如GB200晶片)的需求預期大幅下調。其報告將英偉達2025年GB200出貨量預測從3萬件下調至2萬件,引發英偉達股價短期暴跌23.8%。
但同時,國產算力廠商(如華為昇騰、海光DCU)因與DeepSeek的深度適配獲得發展視窗期。高盛指出,國產晶片廠商可透過最佳化價效比和服務響應速度,在多元化算力市場中佔據更大份額。
雲服務與AI應用:成本下降驅動商業化加速
摩根士丹利認為,DeepSeek模型顯著縮小了雲廠商前期投入與收益兌現的週期差距。例如,微軟Azure、亞馬遜AWS等全球雲平臺已快速上線DeepSeek服務,而國內雲廠商(如騰訊雲、華為雲)則透過整合國產算力進一步壓縮成本,提升利潤率。
高盛補充稱,低成本的模型呼叫(如每百萬tokens僅0.014美元)將加速AI在醫療、金融、工業等垂直領域的滲透,尤其是Agent AI(智慧體)和端側AI的落地。
資料中心:短期影響有限,長期持樂觀態度
美銀證券認為對於資料中心短期影響有限,因為2025年的預計收入增長很大程度上已經由先前的積壓訂單保證;至於長期方面,對受到更廣泛的人工智慧應用推動的資料中心需求前景持樂觀態度。同時,隨著模型推理效率提升,更多人工智慧相關訂單將從模型訓練轉向模型推理。
03 風險與挑戰
儘管DeepSeek展現巨大潛力,投行也提示以下風險:
-
技術侷限性:DeepSeek在多模態處理、長上下文視窗等方面仍落後於GPT-4o和Gemini。
-
地緣政治風險:中美技術競爭可能影響DeepSeek的全球供應鏈合作。
-
商業可持續性:開源模式可能壓縮企業利潤空間,需探索差異化服務實現盈利。
DeepSeek的崛起標誌著AI發展從“算力競賽”轉向“效率競爭”。摩根士丹利稱,這一變革將重構全球AI產業鏈,推動技術民主化和應用普及化;高盛則斷言,未來投資需聚焦“技術降本”與“生態整合”兩條主線。隨著開源模型與國產算力的協同突破,中國在全球AI競賽中的話語權或將進一步提升。
REVIEW




