↓ 進入公眾號點選右上角“…”設置星標 ↓
2024+2025雙年、2025+電子刊,組合下單更優惠
根據介面新聞報道,2月18日,DeepSeek的研究團隊釋出了一篇新的技術論文,其中最核心的內容是NSA(Native Sparse Attention),憑藉這套技術思路,大模型訓練將不僅對硬體要求更低,並且訓練效率更高。此外,在這次論文中,DeepSeek運用到了一種叫做Triton的框架。這是由OpenAI開源的一套框架,屬於GPU的中間層語言,它既可以轉譯為英偉達的GPU平行計算平臺CUDA、開源計算平臺AMD的ROCm,也可以轉譯為華為昇騰的AI晶片計算框架CANN。行業專家認為,“這意味著從推理到訓練的算力,未來都有可能國產化了。”
在早前文化縱橫推出的關於中國晶片產業的播客節目中,嘉賓就指出由於DeepSeek對算力的要求更小、成本更低,一旦這類AI大模型與中國的製造業能力結合起來,就有可能湧現出各種各樣具有AI能力的新產品,進而為本土晶片產業發展創造出巨大的增量市場。藉著這個新聞,我們再次向大家推薦一下這期播客——
在全國人民歡度蛇年春節的同時,中國企業推出的AI大模型DeepSeek在中美兩國都引起了巨大的關注和討論。在過去幾年美國政府不斷加緊對華AI晶片封鎖的背景下,中國企業卻以更低的成本、更小的算力,實現了與美國頂尖AI大模型不相上下的效能和效果。這樣的衝擊,讓美國政商精英正在評估和反思其對華技術政策是否已經失敗。對於是應當放棄既有的對華晶片封鎖政策,還是進一步擴大封鎖範圍,美國國內目前似乎尚無堅定的共識。但無論如何,在這樣一個時間節點,冷靜下來探討一下中國晶片產業發展的困難與前景,無疑是一件非常有價值的事。
實際上,往前追溯,自2018年美美國特朗普政府制裁中興、華為以來,中國半導體產業面臨的“卡脖子”問題就越來越受關注。晶片製程、光刻機、EDA軟體……這樣一些原本只有極小範圍專業人士瞭解和使用的詞語,也開始頻繁出現在各種媒體上。但是,這些討論和分析,要麼技術性過強,普通讀者難以理解;要麼充滿噱頭和情緒宣洩,難辨真假。對於中國為什麼會在半導體產業被“卡脖子”,以及中國半導體產業發展歷程的政治經濟學分析,仍比較少見。本期節目,我們邀請到了兩位研究產業政策和創新經濟學的社科學者李寅、何鵬宇,一起來聊聊這些話題。與媒體和大眾對“卡脖子”問題的極度關注不同,在他們看來,一個產業能否發展與繁榮,是一個系統性的經濟社會問題,僅僅關注技術指標是否達到了先進標準,是遠遠不夠的。而在影響半導體產業發展的諸多因素中,能否培育支撐本土半導體企業發展的市場環境,能否形成上下游不同企業之間緊密聯絡的產業生態,至關重要。因此,以DeepSeek為代表的低成本的AI大模型如能與中國的製造業能力結合起來,就有可能湧現出各種各樣具有AI能力的新產品,進而為本土晶片產業發展創造出巨大的增量市場。
本期嘉賓:
李 寅,復旦大學國際關係與公共事務學院副教授,主要研究領域為創新經濟學、產業政策、新興技術治理。
何鵬宇,北京大學政府管理學院博士後,主要研究領域為產業政策和技術創新。
* 在《文化縱橫》2025年第1期雜誌上,李寅、何鵬宇各發表了一篇文章,分別討論先進製程晶片和成熟製程晶片,感興趣的朋友可以在此購買本期雜誌:
在本期節目中,你可以聽到以下內容——
本期播客節目可在以下平臺收聽: