

作者| 孫鵬越
編輯|大 風
杭州AI一夜火了。
有網友調侃道,很有意思啊!我們小小的杭州,幹掉美國三大科技巨頭。

一家名叫幻方量化(Deepseek)的AI公司,幹出來拼多多式的偉業,讓全世界為之震撼,把AI訓練成本直接打下來99%,打破了OpenAl的霸權; 一家名叫宇樹(Unitree)的機器人公司,幹掉了美國最知名的工程與機器人設計公司波士頓動力,秒殺原本的液壓技術路線,反超波士頓動力的機器狗; 一家名叫毫微(Nano Labs)的無晶圓廠IC設計公司,剛剛推出FPU3.0 AI ASIC設計架構,同類產品已超英偉達的五倍以上。
在科技圈,一直流傳著“AI四小龍”商湯、曠視、雲從、依圖科技;“大模型六小虎”智譜、MiniMax、月之暗面、百川、零一萬物、階躍星辰。
現在,杭州也有了自己的AI三支柱。

改變AI時代的底層邏輯
眾所周知,AI大模型越智慧,支援的場景越多,就意味著它需要的晶片和算力就越多。
全世界的算力需求,讓英偉達從一家顯示卡廠商,硬生生蛻變成一家三萬億美元市值的巨無霸。
但哪怕是英偉達、AMD、英特爾等全部半導體公司加起來,也滿足不了AI市場逐年上揚的算力需求。
就在所有AI公司都苦於算力缺口之際,來自中國杭州的一家AI創企幻方量化,釋出了一個引數量高達671B的大模型:DeepSeek-V3。
更讓人驚訝的是,DeepSeek-V3僅僅只用了2048塊GPU訓練了2個月,且只花費557.6萬美元。
對比OpenAI的GPT-4o,它的訓練成本約為1億美元,至少在10000個GPU的計算叢集上訓練。
也就是說,幻方量化只用了五分之一的晶片,二十分之一的成本,就訓練出一個引數量第一梯隊的大模型。

DeepSeekMoE
這樣的成績瞬間引爆了整個AI市場。
前OpenAI聯合創始人、Tesla AI團隊負責人Andrej Karpathy在社交平臺發文讚歎道:”Llama 3 405B使用了3080萬GPU小時,而DeepSeek-V3看起來是一個更強大的模型,僅使用了280萬GPU小時(計算量約為十分之一)。“
“如果DeepSeek-V3的優良表現能夠得到廣泛驗證,這一模型將是在資源受限的情況下,在研究和工程方面讓人印象深刻的一次展示。”
據DeepSeek-V3研發團隊表示,之所以能用較低的價格完成高難度大模型訓練,主要是採用了高效推理的多頭潛在注意力(MLA)和用於經濟訓練的DeepSeekMoE。
多Token預測目標(Multi-Token Prediction,MTP)有利於提高模型效能,可以用於推理加速的推測解碼。並採用一種創新方法,將推理能力從長思維鏈模型(DeepSeek R1)中,蒸餾到標準模型上。
這種“分散式推理”的方式早有人提出,例如OpenAI聯合創始人兼前首席科學家Ilya Sutskever就曾經說過:“我們已經達到了資料峰值,AI預訓練時代無疑將終結。”
但沒想到的是,一直將中國大模型視為“廉價替代品”的美國企業,在“分散式推理”領域上,被一家中國杭州的企業先拔頭籌,用技術給他們好好上了一課。
可以說,DeepSeek-V3讓AI世界享受到了拼多多式的快樂。

從機器人到半導體設計
如果說DeepSeek-V3的出現,讓矽谷巨頭們真切意識到中國AI產業的進步速度,而宇樹(Unitree)和毫微(Nano Labs)則繼續讓他們處於“持續應激”之中。
前不久,宇樹釋出了旗下行業級機器狗B2-W(B2機器狗的進階版)的炫技影片,在影片中,B2-W機器狗演示瞭如何爬山、涉水、越障,克服崎嶇地形、顛簸路面流暢行走。

宇樹B2-W機器狗
除此之外,B2-W機器狗還能完成高難度的雜技動作:原地旋轉穩停、兩足倒立旋轉、2.8米高樓飛躍。另外,該機器人可負載40千克行走,一個成年男性的重量不在話下。
宇樹B2-W機器狗影片引發了全網熱議,就連太平洋彼岸的馬斯克,也忍不住轉發並評論稱讚。
B2-W機器狗不僅僅是一個“高價寵物”,它最適合的場景是專業領域,比如安防巡檢、勘測探索、公共救援、醫療防疫陪護等危險廠家,讓人員避免事故風險。
據新華社12月14日報道,警用機器狗加入成都市公安局高新區分局巡邏大隊,開展安全巡邏和宣防工作。
值得一提的是,機械狗原本是美國高科企業的代表,就比如波士頓動力,從2005年就開始研發出第一款“大狗機器人”。
彼時,宇樹基本上只是波士頓動力的跟班,跟著大佬的腳步一點點“照貓畫虎”,從產品形態再到商業生態位,宇樹一直走的是波士頓動力“平替版”路線。
然而僅僅只過了數年時間,宇樹就成功研發出運動性更高、平衡性更強的動輪方案,取代了波士頓動力的四足方案,一年時間裡完成了能在戶外環境裡跋山涉水的訓練。
不少波士頓動力的死忠粉紛紛破防,還覺得宇樹B2-W機器狗的影片一定是AI生成的CGI畫面。

宇樹B2-W機器狗
除了大模型和機器人,在半導體領域,也有一家杭州公司,對“巨人”英偉達發起了衝鋒。
那就是毫微(Nano Labs)。
12月26日,Nano Labs正式推出FPU3.0,採用ASIC架構,在能效上實現了五倍的提升,樹立了能源高效、高效能ASIC的新標準。能廣泛應用於AI推理、邊緣AI計算、5G資料傳輸處理和網路加速等領域。
作為AI與區塊鏈技術的老玩家,Nano Labs是國內領先的無晶圓廠IC設計公司,從2022年就陸續推出多款HTC和HPC晶片設計的全新基礎構架晶片。
目前來說,ASIC架構晶片已經成為AI世界的主流選擇。
在執行大規模特定的AI任務時,ASIC可以針對特定應用設計的專用晶片,進一步提高計算的效率、降低功耗並提高效能。
摩根士丹利在12月15日釋出研報《AI ASIC 2.0:潛在贏家》認為ASIC憑藉針對性最佳化和成本優勢,有望逐步從英偉達GPU手中爭取更多市場份額。
預計AI ASIC市場規模將從2024年的120億美元增長至2027年的300億美元,年複合增長率達到34%。
目前,ASIC晶片朋友圈逐步擴大,谷歌、Meta、微軟、亞馬遜等大廠都將推出自家AI ASIC晶片。

為什麼是杭州?
“中美貿易戰裡最大矛盾,是華盛頓市賓夕法尼亞大街1600號臨時居民與深圳市南山區粵海街道企業之間的糾紛。”
這是前幾年最火熱的段子,而“華盛頓市賓夕法尼亞大街1600號”是指美國白宮;
“深圳市南山區粵海街道企業”則是指華為、大疆、中興、騰訊等坐落在深圳南山區粵海街道的中國科技大廠們。
如今中美貿易戰熱度降低,科技鬥爭的矛盾點逐漸轉移到了當下網際網路的核心:AI。
同樣,和美國科技巨頭的對抗前線,也從深圳南山區轉移到杭州。
很多人不知道,早在AI浪潮之前,杭州就已經被稱為人工智慧的“東方矽谷”,更是國內第一座“人工智慧之城”。

杭州城市大腦
2016年10月,杭州成為全世界第一個啟動“城市大腦”基礎建設。
杭州將安裝一個人工智慧中樞:杭州城市資料大腦。讓資料幫助城市來做思考和決策,將杭州打造成一座能夠自我調節、與人類良性互動的城市。
美國著名城市理論家、社會哲學家Lewis Mumford在著作《技術與文明》中提及,人類城市發展分成三個階段:古希臘城市(初始文明),中世紀基督教城市(商業文明),近代和現代工業城市(工業文明)。
全世界第一個啟動城市大腦的杭州,將對城市文明發起第四次浪潮,一個基於網際網路、資料和人工智慧的“科技之城”。
如果你問我,為何是杭州?為何是他們?為何是今年?
那麼這就是答案。
