中美AI敘事和背後的算力邏輯

長按即可參與👆
作者:門捷列夫學徒
來源:雪球
自DS出現以後,我看網上沒有很好的一篇文章去總結目前中美ai敘事的差異以及背後的算力需求。簡單來說:
Ch­i­na Ai敘事:DS開源帶來的LLM平權以及由此延伸的各種ds蒸餾小模型端側(包括一體機)、邊緣側的ai應用落地,大有全面開花之勢。
Ch­i­na算力:H20和國產As­ic就行,甚至端側還有更簡單的方案。當然傑文森悖論還是適用的,大廠加大資料中心投入。
北美Ai敘事:繼續大力出奇跡通往AGI,各種多模態高階模型推出,萬億引數大模型繼續走起。
北美算力:高階NV卡仍然供不應求,GP­Us are me­l­t­i­ng。。。
現在的gap在於:顯然北美這條路出成果沒這麼快,而國內ai敘事(還有考慮到我們的文化和商業環境)出成果很快,畢竟國人比較務實,成本要算得過來,朱xh不是說了嘛,ai會議紀要就能一個月賺幾千萬,這種ai應用需要毛線NV Ru­b­in。
所以在這種微妙的北美空檔期,對NV的質疑就比較多了,再疊加DS和Qw­en這種百億引數LLM模型達到了和gpt4一樣的效果。。。不得不讚嘆國人Ai in­f­ra能力。
另外DS的Ai in­f­ra能力可能是一個變數
另外還有一些關鍵問題:那就是隨著DS的出現和國產晶片的崛起,我們究竟還需不需要高階NV晶片(比如GB300),是不是以後H20和國產晶片就夠用了?DS究竟改變了算力什麼又沒有改變什麼。以及像zj、ali這種只能大規模部署H20的將來和北美csp大規模部署GB300和A100的究竟有什麼差距?
先說結論:1、如果ai應用只是LLM ch­a­t­b­ot(比如De­e­p­s­e­ek)這種形式。或,2、幾乎所有的端側ai推理(自動駕駛除外)。那麼無論是H20或910c其實真的夠用了,甚至一些異構晶片比如fp­ga+ri­sc-v都能跑一些簡單的例如ai端側(包含一體機)的推理。這也是為什麼前段時間有聲音說中國的ai敘事和北美不一樣,或我們在沒有高階晶片的前提下依然實現了ai大規模應用。這也是投資人在詬病NV股價預期的一個關鍵背景。
那麼什麼情況下H20和910c不太行呢?
1、像GPT-4o這種文生圖以及大部分多模態應用。尤其是4o這種需要高併發並即時生成的應用,用H20卡不說(需要3-5秒而H100只需要1秒),且需要高視訊記憶體+大寬頻,這時候就得用GB300這種晶片來跑。
所以各位小夥伴期待的國內版文生圖可能就要等等了,哪怕推出了估計也會卡得要死。主要是還是卡不行。
其實你看tx的微信就是聊天,所以llm對於他們暫時就夠用。而zj因為是影片起家,肯定對於高階卡的需求是更大的。前面沒說的是Ai影片生成更需要500+tf­l­o­ps和48G視訊記憶體,更需要NV的高階卡。
這也是為什麼我們直到現在都沒看到國內的csp推出多模態的Ai應用
有一個變數是DS的Ai in­f­ra的能力,如果V4是多模態而又不耗卡(很難想象是否能做到),這也是對NV的致命一擊。
2、千億乃至萬億引數大模型的訓練(比如GPT5)。這個很好理解了,for AGI需要繼續加大算力投入,NV高階晶片主要是互聯厲害,非常有利於訓練百萬卡叢集的大模型。
3、Ai for Sc­i­e­n­ce。比如Ai醫療生物科技裡面我非常看好的Al­p­h­a­F­o­ld3,可以預測大分子相互作用的Ai演算法對於創新藥研發和合成生物學的選品可能是革命性的影響(順便吐槽一下晶泰這種小分子還屬於上一代ai敘事幾乎沒法用於實戰)。另外一些手術機器人或者多模態的Ai診斷因為其低延時的需求(畢竟做手術嘛,1秒都寶貴)。
4、高階Ag­e­nt應用。主打一個高併發(例如Ai遊戲可能1秒鐘內有數百萬個Ai NPC互動)、超長上下文記憶(例如Ai醫療診斷,法律判決、超複雜辦公場景解決輸出,ai可能一下子需要記住數萬個to­k­en)、多模態(比如有影片介入的ag­e­nt)。反之就是一些簡單的ag­e­nt,比如朱xh舉例的會議紀要ag­e­nt、簡單的做題ag­e­nt等等,用國產晶片足矣。
所以總結一下:當出現高併發、多模態、超低延時需求的場景的時候,NV的高階卡是很吃香的,尤其是多模態,單次互動可能就需要500 TF­l­o­ps(H20也就750 TF­L­o­ps,可能一次就用光了。。。)
可以看到1、2、3、4也就1剛剛有些苗頭,234出成果都沒那麼快。如果只是基於ch­a­t­b­ot這種llm模型那無疑是DS(還有我們特色的Ai)就完勝了:成本比你低、落地比你快、賺錢比你有路子,比如tx的元寶一接入DS就有2000萬DAU日活,這就使得無論是投資人甚至是北美csp自己都在懷疑自己的路線是否值得(太正常了,都是人嘛),所以最近北美算力鬼故事很多,而國產算力一開始就是瞄著落地去的,所以ca­p­ex反而更紮實。
但一旦上面的1234有了突破,我相信情況馬上就會反轉,這也是為什麼像國內csp大廠一直不敢大規模部署國產算力而要搶NV卡的原因(這跟三大運營商不一樣,運營商幾乎都配國產),我們假設GPT-4o文生圖是一個巨大的賺錢利器,很難想象國內不去fo­l­l­ow還停留在ch­a­t­b­ot模式,而這必然會帶來高階NV卡的供不應求而動搖國內各種端側的ds敘事。此外再次強調DS V4可能的Ai in­f­ra能力看看能否繼續撼動NV卡的邏輯,這確實是一個很大的變數。
雪球三分法是雪球基於“長期投資+資產配置”推出的基金配置理念,透過資產分散、市場分散、時機分散這三大分散進行基金長期投資,從而實現投資收益來源多元化和風險分散化。

相關文章