
在硬體生態層面,DeepSeek引起的震動還在持續。英偉達反覆強調“DeepSeek出現證明需要更多AI晶片”。對於其他大模型廠商而言,DeepSeek於2月26日推出的“錯峰優惠活動”,或許將掀新一輪降價潮。在應用層面,摩根士丹利、高盛等機構認為,低成本、高效能的模型普及會給AI行業帶來爆發性的使用量和更廣泛的商業落地。
那麼,對於AI行業的創業者而言,DeepSeek究竟意味著什麼?不久前,峰瑞資本副總裁李罡與行雲積體電路的創始人兼CEO季宇博士就DeepSeek帶來的影響、如何進行技術創新等話題展開了深入的探討。
季宇博士擁有清華物理系本科和清華計算機系體系結構方向博士學位。他曾入選“華為天才少年”計劃,在海思從事AI晶片編譯器設計與最佳化,持續攻克複雜技術難題。2023年,季宇創立行雲,圍繞大模型需求研發超大視訊記憶體規格的GPU晶片。行雲希望推動AI的技術普惠,讓市場重新回到人比機器貴的黃金時代。
我們將他們分享的部分內容編輯成文。他們聊天的話題,包括但不侷限於以下主題:
-
現在容易獲取的資料基本都被AI訓練過了,未來是否會變成AI自己生成資料來訓練自己?
-
大模型公司的護城河在哪裡?
-
DeepSeek的出現,是偶然的破局,還是產業發展的必然方向?
-
AI晶片行業有哪些重構、創新的機會?
-
如何看待梁文峰所說的“技術優勢是短暫的,真正的護城河是文化和組織”?
希望能帶來不一樣的角度和思考。我們只截取了他們聊天的部分內容,歡迎移步小宇宙APP / Apple Podcasts(蘋果播客),搜尋並訂閱「高能量」收聽這期節目的完整版內容。

互動福利
你覺得DeepSeek給你的生活、工作帶來哪些變化?歡迎在留言區和我們聊聊~截止至3月6日17:00,我們將隨機挑選3位讀者,送出由峰瑞資本團隊撰寫的新版行研手冊。

/ 01 /
未來,AI是否會自己生成資料
來訓練自己?
李罡:現在網路上比較易得的資料可能已經都被AI訓練過了。大模型可用資料越來越少,那未來會不會變成AI自己生成資料,來訓練自己?
季宇:我覺得問題的關鍵不是資料從哪裡來,比資料更重要的是語言本身。因為語言才是給智慧體提供思考能力的底層基座。
大模型在預訓練階段確實需要資料,但在推理階段,更需要是獎勵(reward)。
獎勵是一種泛化的監督訊號,告訴模型該往哪個方向調整以提高效能。比如在強化學習中,模型隨機生成大量結果,透過外部訊號輸入,明確哪些是好的,哪些是不好的,然後調整,生成更好的結果。只要有這種訊號輸入,就可以進行最佳化。
此前,左右互搏這種方法,在人工智慧程式AlphaGo訓練圍棋技能時被充分應用。左右互搏是一種在人工智慧訓練的策略,同時藉助生成器和判別器,提升輸出的結果。就好比一個人自己和自己下棋,不斷提升自己的棋藝。
但實際上,左右互搏並沒有在強化學習或大模型的概念空間中被充分定義。因此,如何讓大模型提升推理能力,還有很大的探索空間。
思考是一個自我驗證和迭代的過程。自然語言的厲害之處在於,我們可以自己悶頭思考問題,即使沒有對話,也可以在腦海裡進行邏輯演繹,找到思路或得出更深刻的結論。這是語言本身帶來的,更大的探索空間。
當然,“語言”和“獎勵”這兩者並不衝突。如果能借助語言,找到更多的獎勵訊號,也能提升模型的能力。比如,據業內人士分析,ChatGPT的一個突破點在於,將程式碼和自然語言放在同一個模型中訓練,從而提升了輸出質量。
如果當下,大模型能夠在更多的領域進行強化學習,可能會因為不同領域的資料特徵差異,激發出新的能力。
李罡:確實。畢竟,AlphaGo輸出的結果通常是“非黑即白”的,因為輸贏是客觀的。但在語言模型領域,有些輸出是可以評價的,比如數學和程式設計有確定答案。但更多的時候,很多問題是沒有標準答案的。下一個階段,大模型所需要的資料和評價方式可能會發生新的變化。
/ 02 /
AI模型公司的護城河在哪裡?
李罡:在DeepSeek開源的生態下,個人和企業使用者都能相對容易地以較低成本自行部署或複製出模型,那麼大模型公司的護城河在哪裡?
季宇:對於一家企業而言,技術本身並不能形成護城河,真正的壁壘在於商業模式或生態系統。
藉助資源形成的競爭壁壘,很容易被打破。比如,DeepSeek打破了過去許多雲廠商和網際網路巨頭構建出的,以GPU、“萬卡叢集”構建的資源壁壘。
一個很現實的問題是,儘管人們對AI期望很高,但它還沒有完全滲透到這個世界的經濟系統裡,發揮出巨大的商業價值。我們先不要給AI行業設定門檻,當AI行業發展起來之後,自然會出現相應的商業模式。
畢竟,在技術還沒有真正完善之前,所謂的門檻可能也不堪一擊。只有當技術和應用場景緊密結合,形成可持續的經濟迴圈時,一家企業才會擁有真正的護城河。
/ 03 /
DeepSeek的出現,是偶然的破局,
還是產業發展的必然方向?

▲ 歡迎掃碼收聽,豐叔和季宇一起聊了聊AI晶片領域的創新機會。
DeepSeek爆火的這段時間,美國有人甚至提出要加強對中國的晶片和顯示卡管制,要限制中國AI大模型發展。他們面對挑戰時的第一反應是固步自封。你覺得DeepSeek是偶然出現的破局者,還是說這是產業發展的一個必然方向?
季宇:在AI這樣一個龐大的體系和生態系統中,DeepSeek是一個非常重要的角色。它的“出圈”,對AI行業有很大的促進作用。
過往,OpenAI、微軟、英偉達等公司形成了一個利益共同體,希望大家都使用他們的基礎設施和模型。Scaling Law推動千卡、萬卡叢集的形成,本質上是在構建一個大型規模的計算體系。這樣的結果是,硬體裝置越來越像上世紀80年代的大型機,需要極大規模的投資才能執行最好的模型。
DeepSeek是撬動這個體系的第一步,“開了第一槍”。更重要的是,未來,AI普惠的產業結構如何與透過資源形成壟斷體系的小圈子之間進行博弈。
AI行業越往後發展,越需要有更多的創新。創新不僅僅在模型層面,還包括基礎設施(Infra)的變革,晶片的重構,以及圍繞AI普惠搭建起來的一整套體系。而晶片的重構,也是行雲積體電路一直投身其中的方向。
對於硬體行業來說,真正的破局之路在於塑造一個比CUDA生態更有吸引力、更具競爭力的新體系。
如果我們未來圍繞DeepSeek、國產晶片以及AI普惠的目標,能夠打造出類似過去的X86叢集和個人電腦的生態系統,或許可以逐漸讓這個“大型計算體系”失去其核心價值。
我們有可能借助幾千元或幾萬元的晶片,就能用得上好的大模型,甚至構建出服務能力超過以往昂貴硬體的叢集。
歷史上,PC以及網際網路領域的革新大多基於這樣的思路,即創新公司用更經濟的方式取代了傳統巨頭形成的高價策略。這種轉變不僅降低了硬體成本,還形成了更高效的計算機底座體系。
/ 04 /
創新過程本身也需要提高效率
李罡:作為一個創業者,你是怎麼看待梁文鋒說的:“技術的優勢是短暫的,真正的護城河是文化和組織”?
季宇:我非常認同這一點。梁文鋒躬身入局,是個很好的榜樣。
技術的優勢雖然重要,但很難持久。比如,OpenAI剛出來時,大家都追不上它的技術,但這只是暫時的。全世界有這麼多優秀人才,大機率可以復現並超越這種技術。
DeepSeek成功的關鍵在於,它在基礎設施、演算法和模型等方面都進行了聯合創新,而不是單點突破。
創新過程本身也需要提高效率。DeepSeek這種聯合創新,對企業組織能力的要求非常高。
組織能力不是說把一群聰明人聚在一起,就能產生價值。組織的作用是給出一個通盤合理的方向,大家齊頭並進。
提出通盤思路的前提在於,需要深入到細節,知道每一層要做些什麼,才能有效打破每一層的邊界條件。
我之前和一位在DeepSeek工作的師弟聊過,他說梁文鋒對他所做專案的每個技術細節都非常清楚。當總負責人深度參與到專案中,瞭解清楚技術細節,才能更好地組織全域性,真正讓團隊裡的人才發揮價值。
文化與組織才是真正的護城河,但實踐起來非常難。
我觀察到,一些人在投資和創業時都很相信經驗主義——相信行業專家和取得過成功的標杆人物。經驗主義這種方法在中國經濟騰飛中確實發揮了作用,它解決了如何提升效率的問題。反經驗主義並不是拋棄經驗,而是搭建新的組織方式,來高效推進創新。
國內不缺反經驗式的創新嘗試,比如非Transformer架構的模型、非GPU路線的晶片等等。但這些嘗試之所以成功率不高,部分原因在於缺乏全域性的思考和方法論。
李罡:我也非常贊同梁文鋒的觀點。從投資人的視角,我們希望初創企業能提升資金的利用效率,創造更大的價值。而效率問題本質上還是人才、團隊組織的問題——如何找到最優秀的人才,並將他們有效地組合起來。
就像MoE(Mixture of Experts,專家混合模型)架構中的每個專家一樣,一家企業需要考慮清楚:如何把團隊裡的每個專家組織起來,形成一個規模大而且能力強的公司?

▲ 《哪吒2》爆火背後的天時、地利與人和 | 峰瑞研究所
▲ 一文講透關於DeepSeek的7個核心問題 | 峰瑞報告
▲ 2025,AI重塑藥物研發的三個方向
▲ 展望2025,AI行業有哪些創新機會?| 峰瑞報告
▲ AI for Science:站在科研正規化的轉折點上 | 峰瑞報告
星標峰瑞資本微信公眾號
一手商業思考及時送達
