中國AI霸榜美國AI話題圈,創始人哪裡做得最正確?

DeepSeek目前搞得美國AI圈人心惶惶。
DeepSeek(深度求索)是由梁文鋒成立的。梁文鋒是量化投資領域的知名人物,同時也是量化私募巨頭幻方量化的創始人。他於2023年7月17日創立了杭州深度求索人工智慧基礎技術研究有限公司(DeepSeek),專注於開發先進的大語言模型(LLM)和相關技術。
梁文鋒(右)
他做得最正確的選擇恐怕就是用量化投資賺的錢在較早時候開始屯英偉達GPU。幻方量化作為中國頭部量化私募基金,早在2021年便大規模佈局AI算力,搭建了高效能計算叢集“螢火一號”和“螢火二號”,併成為國內少數幾家儲備上萬張英偉達A100 GPU的機構。
隨著美國逐步封禁出口GPU,有卡的創業者和沒卡的完全就是兩回事了,在初期就是算力為王。這樣有算力支撐且不急著賺錢的創業公司,在目前中國大模型領域恐怕也就是頭部幾個網際網路大廠能比的。
2023年,幻方創始人梁文鋒在接受採訪時明確表示,公司已擁有超過1萬張英偉達A100顯示卡,這些資源直接支援了DeepSeek的模型訓練需求。
但算力的豐厚並未讓團隊依賴粗放的訓練模式,而是採用了自主設計的MoE(混合專家)架構,在降低算力成本的同時提升模型效能。在訓練其標誌性模型DeepSeek-V3時,DeepSeek使用了2048塊英偉達H800 GPU(H100的中國特供版),並透過高速互聯技術(如NVLink和InfiniBand)構建算力叢集,相比之下,Meta訓練同等規模的Llama 3.1模型需超過16000塊H100 GPU,而DeepSeek僅用少量GPU便實現了效能對標,凸顯其硬體利用效率。
實際驗證,DeepSeek-V3在多項基準測試中接近GPT-4水平,但推理成本僅為其1/50。

但即便如此,我看到一些散戶股民們對梁並不友好。
他們認為梁透過量化收割了散戶,賺的錢不光彩。
量化投資對散戶,確實是降維打擊,但也不是他一家做量化,如果合法合規,那就沒問題。他賺了錢,至少去投資國家級別的基礎科研產品,帶動就業,也沒轉移出去揮霍。

當然,這也給梁提了一個醒,現在海外對DeepSeek評價非常高,可千萬別飄了,DeepSeek未來能否真的搞出通用人工智慧還需要時日檢驗,另外還是要面對商業版本能否賺錢的考驗。
不過從發言中看出他還是比較清醒的。梁文鋒指出,中國AI與美國的真實差距在於“原創式創新”的不足。
儘管中國在應用層快速追趕,但基礎架構層面的突破仍依賴西方技術社群。中國過去三十年更強調商業變現而非基礎研究,企業普遍選擇“短平快”的應用開發路徑。例如,多數中國公司直接複製Llama架構,而非探索新結構。
中美AI差距的本質是系統性創新能力的差距,而非單一技術指標或時間維度。他呼籲中國科技界擺脫“跟隨慣性”,透過原創研究、開源協作和生態建設縮小差距。
他認為,創新的核心驅動力是“好奇心與創造欲”,而非單純商業利益。
能夠搞出DeepSeek,一部分確實是因為他有錢,但從另外一個角度看,把目標定在通用人工智慧AGI,也許是他能夠在早期就下決心開始屯卡的原因之一吧,這讓他獲得了早期的優勢。
好奇心與創造欲,能否支撐DeepSeek跨越後續發展的數字鴻溝,我們拭目以待!
參考資料:DeepSeek
點選推薦」,錦鯉附身!
– END –
投稿及內容合作|[email protected]
廣告及商務合作|bd@chreview.cn

相關文章