DeepSeek這把火,燒旺了誰,又燒疼了誰?

DeepSeek下場,AI界一夜變天。
來源:筆記俠
宏觀趨勢:
這個春節,國內外都在瘋狂地討論DeepSeek帶來的影響,我們深入到各個科技社群討論和各種前沿文章中,為你摘選對你深入認識DeepSeek最有價值的觀點。
DeepSeek 不一定是最後的勝者,但它開啟一個新思維,對AI產業的貢獻是巨大的。2025年,我們必須意識到,AI在應用端的爆發正式開啟。
這裡插播一條廣告:
【黑馬大課年度會員重磅來襲】
創業這條道路,你要跟對圈子。如果身邊都是悲觀主義者,你是走不遠的。所以,與誰同行,十分重要。
現在,加入黑馬大課年度會員,一起做有收穫、有成長的創業者!
會員核心權益包括:1、全年8場線下大課,任選3場參加;2、每場3天課程+私董會+小飯桌;3、全年線下認識300位優秀老闆;4、資源連結,進入黑馬校友社群。
掃碼諮詢報名
(翻到底部瞭解詳情)
01
為什麼大家會覺得DeepSeek厲害?
很大程度上是這兩年國內趕得太費勁了,無論是大廠還是創業公司。 
02
DeepSeek的意義
DS的意義在於它是開源的,在取得與GPT一樣水平的能力後,開源給了所有人,讓創業者可以站在相當於GPT的肩膀上持續開發。
這不僅會大幅降低創業者的門檻與成本,也是類似奧特曼們不太願意看到的。
更可貴的是,DeepSeek顯然演算法上也更有優勢,邏輯性更好,自我學習能力也更強。
03
誰是受益者?
DS的創新,會極快降低2B、2C的 AI應用成本,極大規模化AI應用市場,提高生產力,同時隨著AI對經濟生活滲透的深化,會繼續長期推高對晶片、能源的需求。
成本加速一個數量級接著一個數量級地幹下去,相信未來整個市場會找到資料模型和算力的“拼多多”之道。2025年應該更加大機率加速應用端起飛,開啟“Agentic AI”(代理型人工智慧)元年。
過去能源對生產力的促進,要面對高技能人才世代培訓的瓶頸,現在AI起來了,瓶頸弱化了。能源+AI可以直接更快推動文明的進化。
晶片(含半導體產業)應該是最大的受益者。
梁文鋒在訪談中提到,未來對他們的卡點:高階晶片的禁運。
希望中國光刻機也突破一下,光刻機產業鏈比較長,需要的時間也長。時間是中國人的好朋友。
04
DeepSeek帶火了一個經濟學名詞:
傑文斯悖論,這個悖論指出,技術的進步可能會加速自然資源的消耗。
蒸汽機的進步可以使用更少的煤炭,卻導致煤炭需求大幅上升。從這個角度看,社會需要更多的資料中心,更多的AI晶片。
DeepSeek帶來的技術進步雖然使單個應用所需資源急劇減少,但總體需求反而增加,導致總資源需求上升。
在一個新技術產業的匯入期和增長期,傑文斯悖論的效應明顯。
20世紀90年代的手機叫大哥大,跟磚頭一樣重,一部賣2萬人民幣。人們都以為其暴利,其實那時的手機部門營收很低。
後來2G的全球通手機出現,一部只賣幾千元,城市中產人手一臺,才發現大降價帶來真正的規模利潤。
同理,當AI普及後,市場會變很大。
05
正如計算機有效能的摩爾定律,
AI圈也出現了訓練的成本曲線:
2020 年,Anthropic 的團隊發表過一篇論文,推測演算法進步導致的曲線平移約為“每年 1.68 倍”。很可能這一速度如今已經顯著加快,大概是“每年 4 倍”左右。
其結果是:在保持模型質量不變的情況下,價格大幅下降的情況已經持續出現好幾年了。
Claude 3.5 Sonnet 在最初的 GPT-4 釋出 15 個月後才面世,它在幾乎所有基準上都超過了 GPT-4,但其 API 價格卻便宜了大約 10 倍。
DeepSeek-V3 的訓練成本相比於一年前開發的美國現有模型減少了 8 倍左右。
06
不攻自破的5萬塊A100:
如果DeepSeek有5萬多塊A100,A100的價格大約在3-3.5萬美元,取中間值3.25萬美元來計算。5萬多塊A100,梁文峰要有16億美金來買。
07
市值最高的10家公司,
可能將來替換一半:
AI時代極致技術和產品火爆的速度越來越快了。
Instagram2年半獲取過億使用者;TikTok9個月獲取過億使用者;Chat GPT2個月獲取過億使用者;現在DeepSeek只上線了幾天就下載榜首全球第一,這樣的速度下去,絕對超過ChatGPT。
這樣的速度意味著,高質量的技術創新會更高效地結合商業紅利和資本紅利,這意味著五年後全球資本市場上現在的市值最高的十家公司很可能50%會被創新企業替代。
08
現實的微軟:
微軟轉頭也很快。微軟表示,已將DeepSeek的R1人工智慧模型在其Azure雲計算平臺和GitHub 開發者工具上提供。該人工智慧模型將在平臺的模型目錄中提供,並將加入微軟提供的 1,800 多個模型。
此舉正值微軟尋求減少對 ChatGPT製造商OpenAI的依賴之際。
09
所有的業績會,
DeepSeek都成了必問問題:
扎克伯格說,仍在評估其創新點,並計劃吸收其中一些技術,無論技術來自哪裡,AI領域的進步都需要相互學習,每次的技術釋出都會推動整個行業前進。
微軟 CEO 薩提亞說,Deepseek 有一些真正的創新。
用於生產晶片的光刻機巨頭ASML(阿斯麥) CEO 傅恪禮說,DS會讓帶來更多半導體(儲存晶片、邏輯晶片等)的需求。
10
DeepSeek對英偉達的威脅:
Deep Seek有算力,但不需要像OpenAI那樣儲備算力。DeepSeek 強大的地方是大幅降低了預訓練成本,所以對英偉達構成威脅。
因為推理不一定需要英偉達的晶片,所以DeepSeek 採用了AMD 的推理晶片。
英偉達為此作了回應表示,主要意思是DS 釋出的新模型是一項“卓越的人工智慧進步”,推理需要大量的英偉達 GPU 和高效能網路。
11
晶片之爭,ADM逆襲:
在英偉達的輝煌背後,老牌半導體公司AMD卻在苦苦掙扎,那就是 AMD。在 AI 晶片的浪潮中,它卻被英偉達遠遠甩在了身後。
終於,AMD 的推理晶片迎來了曙光。DeepSeek 所代表的推理大模型,為 AMD 提供了一條可能的逆襲之路,雙方迅速達成了多維度的合作,包括硬體和軟體。
DeepSeek 這次替它做了很好的廣告。
英偉達在預訓練晶片和推理晶片兩個產品系列的需求都受到挑戰。
12
“AI 的盡頭是能源” 
不再是共
Deepseek一夜之間不光讓英偉達下跌17%,還讓如核電、能源公司集體暴跌。
星座能源(Constellation Energy)單日下跌20.85%,Vistra能源暴跌28.27%,小型核電站概念股Oklo和NuScale能源分別下跌25.61%和27.53%。
13
DeepSeek幾乎完全開放:

DeepSeek的開放有多徹底?它不但開源、免費可下載和公開了訓練方法,而且允許任何人用R1做資料蒸餾,去訓練自家的模型,而且你可以商業化。

DeepSeek甚至已經用市面上的兩個開源模型,阿里的Qwen和Meta的Llama,蒸餾出來六個小模型供你隨便用。它們的跑分都相當高——
這些蒸餾出來的小模型很不簡單。其中一個有320億引數的小模型,數學和程式設計效能直接超越了o1-mini。
還有一個只有15億引數的迷你小模型,數學和程式設計效能已經超過了當今最主流的兩個非推理模型,也就是GPT-4o和Claude 3.5 Sonnet——而它小到可以執行在你的個人電腦,甚至是手機上!
14
DeepSeek 的獨特秘密與優勢:
DeepSeek 的秘密在於採用無人工干預的強化學習。如同AlphaZero自行摸索圍棋技巧,DeepSeek 的模型自行掌握推理方法。
訓練的基礎模型 DeepSeek – R1 – Zero 在訓練中自行湧現多種解題能力,如寫下解題步驟、自動檢查步驟、中斷錯誤思考並重新推導、反思回顧尋找最優解、生成詳細步驟、遇難題自動延長推理時間等。
模型還湧現出 “aha 時刻”,彷彿智慧自行升級。
因 R1 – Zero中英文混合輸出介面不友好,經人性化改進得到 R1。R1 每次輸出都提供思考過程,這是OpenAI不願完全公開的,閱讀其思考過程讓人感覺它像人一樣。
15
大模型蒸餾技術不是剽竊:
知識蒸餾是技術正規化,更是AI行業的普遍共識,連OpenAI自己也在蒸餾,並且承認Deepseek是獨立發現了推理AI訓練的核心路徑。
16
Deepseek不為人知的83小時:
25日-29日,83小時,Deepseek伺服器叢集,受到每秒超過2.3億次DDos惡意請求,攻擊總量相當於整個歐洲三天的網路流量總和。
老一輩網際網路企業360安全大腦、華為雲的泰山防控,阿里雲算力排程演算法,海康公共監控演算法,網易遊戲雷火遊戲伺服器叢集,釘釘緊急通訊池,菜鳥網路物流排程演算法,紅客聯盟等聯合進行多層次多維度流量清洗,來守護DeepSeek這個後輩。
最終抗住此次攻擊!29日DDos惡意請求已下降了97.2%!曾經的臨安古城,各自為戰的網際網路企業攜手抵禦了一幫野蠻匈奴在數字領域的突襲!
*免責宣告:本文章為作者獨立觀點,不代表i黑馬立場。

這裡認真推薦你:
加入黑馬大課年度會員,一起做有收穫、有成長的創業者!
主要權益包括:
1、全年8場線下大課,任選3場參加
2、每場3天課程+私董會+小飯桌
3、全年認識300位優秀老闆
4、資源連結,進入黑馬校友社群
現在,早期優惠價:3980元/人,任選3次黑馬大課歡迎鎖定最後的優惠名額。
活動詳情如下
↓↓↓

掃碼諮詢報名


相關文章