四大國產GPU力挺DeepSeek!

饒毅:DeepSeek是鴉片戰爭以來,中國對人類最大的科技震撼。
作者 |  雲鵬
編輯 |  漠影
芯東西2月5日報道,今年國產AI大模型DeepSeek猶如春雷炸響,以前所未有的影響力轟動全球科技圈。當前沐曦天數智芯摩爾線程海光資訊4家國產GPU企業,華為雲騰訊雲天翼雲阿里雲百度智慧雲火山引擎6家國內雲計算巨頭,無問芯穹矽基流動等AI基礎設施企業,以及PPIO派歐雲雲軸科技等獨立雲廠商,均宣佈適配及上架DeepSeek模型服務。
還有更多企業正在跟上。DeepSeek也成為本季度科技財報電話會議的必問話題,在今日剛剛舉行的財報電話會議上,AMD董事長兼CEO蘇姿豐谷歌CEO桑達爾·皮查伊都對DeepSeek大加誇讚。
昨日,天數智芯、摩爾線程、海光資訊接連宣佈完成與DeepSeek模型的國產化適配加上週日率先宣佈的沐曦,已有4家國產GPU企業公開擁抱DeepSeek。上週英偉達AMD英特爾等海外晶片巨頭更是早早完成支援。
▲近期官宣支援DeepSeek模型的晶片企業(按照時間順序排列,資訊來自各家官網、官方媒體平臺)
在今日財報電話會議上,AMD董事長兼CEO蘇姿豐稱讚DeepSeek展現了AI世界創新的速度和步伐模型和演算法創新有利於AI普及她認為有新方法可以用更少的基礎設施實現訓練和推理能力,是好事,有助於在更廣泛的應用領域部署AI計算,並誇開源模型的採用速度和步伐是相當驚人的。
谷歌CEO桑達爾·皮查伊今日也在財報會議中誇DeepSeek是一支“了不起的團隊”“做得非常非常好”。他透露說,谷歌的Gemini 2.0 Flash模型和2.0 Flash Thinking模型在效率方面與DeepSeek R1相當。隨著AI推理成本不斷下降,AI將有更多用途,皮查伊認為這是谷歌的“機會空間”。
繼兩大海外雲巨頭AWS和微軟Azure後,這兩天更多國內雲計算巨頭加入到支援行列中。阿里雲、百度智慧雲、火山引擎先後官宣對DeepSeek V3、R1模型的支援。加之此前的華為雲天翼雲騰訊雲目前國內六大雲巨頭都已正式支援DeepSeek。
▲近期官宣支援DeepSeek模型的雲服務及AI基礎設施企業(按照時間順序排列,資訊來自各家官網、官方媒體平臺)
DeepSeek捲起的全球AI風暴,正在深度捲入產業中的每一位玩家,而中國晶片圈和雲服務領域的巨頭和創企們,已然集體出動。
01.

國內GPU企業紛紛響應

美國晶片三巨頭到齊

國內外晶片廠商紛紛快速響應,宣佈對於DeepSeek模型的支援。
海外晶片三巨頭中,AMD響應最積極,早在1月25日新年前就官宣將DeepSeek-V3模型整合到了Instinct MI300X GPU上。在X平臺發文中,AMD特別感謝了DeepSeek和SGLang團隊的密切配合。
1月31日,AI計算“扛把子”英偉達也官宣其NVIDIA NIM微服務預覽版對於DeepSeek-R1模型的支援。NIM微服務基於HGX H200系統,每秒能夠處理3872個tokens。開發者們可以呼叫API進行測試和試驗,該API後續會作為英偉達AI企業軟體平臺的一部分提供。
同樣在1月31日,英特爾也宣佈DeepSeek能夠在搭載酷睿處理器的AI PC上離線使用。在酷睿Ultra 200H(Arrow Lake H)平臺上,DeepSeek-R1-1.5B模型能夠本地離線執行,做翻譯、做會議紀要、進行文件撰寫等任務。
國內晶片廠商這邊,華為的昇騰系列AI晶片自然不必多說。沐曦也聯合中國開源大模型平臺Gitee AI釋出了全套DeepSeek-R1千問蒸餾模型,2月2日首批上線的四個較小規模的模型(1.5B、7B、14B、32B),均部署在國產沐曦曦雲GPU上。
▲沐曦模型資源包釋出
DeepSeek-R1模型+沐曦曦雲GPU+Gitee AI平臺,實現了從晶片到平臺,從算力到模型,全國產研發、中國製造。官方稱之為“100%國產AI的力量”。
日,天數智芯、摩爾線程、海光資訊接連宣佈對DeepSeek模型的支援。
天數智芯宣佈與Gitee AI合作,僅用時一天,就完成了與DeepSeek-R1模型的適配工作,並已上線多個大模型服務,包括1.5B、7B、14B等版本。
▲天數智芯完成DeepSeek-R1模型適配,上線多個大模型服務
天數智芯寫道,國內GPU與DeepSeek的適配可實現深度學習框架與國內自主硬體的深度融合,能促進國內AI產業鏈自主可控發展,減少對國外硬體平臺的依賴,降低技術風險和成本,有助於國內GPU拓展市場,完善產業鏈生態。
摩爾線程已實現對DeepSeek蒸餾模型推理服務的部署,並即將開放自主設計的誇娥(KUAE)GPU智算叢集,支援DeepSeek V3、R1模型及新一代蒸餾模型的分散式部署。
▲摩爾線程官宣資訊
摩爾線程稱DeepSeek的開源模型與摩爾線程的硬體形成閉環,驗證了國產全功能GPU對複雜AI任務的支援能力,為AGI技術普惠化提供了可行路徑。
海光資訊也在昨日宣佈,海光資訊科技團隊已完成DeepSeek V3和R1模型與海光DCU的適配並上線。DCU是海光資訊推出的高效能GPGPU架構AI加速卡,已在多個領域規模化應用。使用者現可透過“光合開發者社群”中的“光源”板塊訪問並下載相關模型,即可基於DCU平臺快速部署和使用相關模型。
02.
中國六大雲巨頭
均已支援DeepSeek
2月1日大年初四,華為雲正式官宣,經過和矽基流動團隊連日攻堅,雙方聯合首發並上線了基於華為雲昇騰雲服務的DeepSeek-R1/V3推理服務。
▲矽基流動聯合華為雲上線的DeepSeek-R1/V3推理服務
華為雲提到得益於自研推理加速引擎加持,雙方支援部署的DeepSeek模型可以獲得持平全球高階GPU部署模型的效果。
同日,天翼雲宣佈上架DeepSeek-R1模型。天翼雲智算產品體系(息壤-科研助手、天翼AI雲電腦、魔樂社群、“息壤”智算平臺、GPU雲主機/裸金屬)均接入DeepSeek R1模型並上線相應服務
▲息壤一體化智算服務平臺
2月2日,騰訊雲官宣了對DeepSeek-R1模型的支援,在騰訊雲的HAI平臺上,開發者大約花3分鐘就可以接入並呼叫模型。
▲騰訊雲HAI平臺
2月3日下午16點58分,阿里雲官宣其PAI Model Gallery支援雲上一鍵部署DeepSeek-V3、DeepSeek-R1。
▲PAI Model Gallery
44分鐘後,百度智慧雲也宣佈了其千帆平臺正式上架DeepSeek-R1和DeepSeek-V3模型,公佈輸入和輸出價格,並從上線到2月18日24點模型限時免費。
▲百度智慧雲公佈模型的輸入和輸出價格
昨日下午,字節跳動旗下火山引擎宣佈將支援V3/R1等不同尺寸的DeepSeek開源模型,可以透過兩種方式使用模型:一是在火山引擎機器學習平臺veMLP中部署,二是在火山方舟中呼叫模型,將提供有競爭力的價格、全網最高限流、兩週限時5折優惠,助力企業暢享滿血版DeepSeek-R1。
▲PAI Model Gallery
同日,騰訊雲TI平臺宣佈上架DeepSeek系列模型,包括“滿血”的V3、R1原版模型和基於DeepSeek-R1蒸餾得到的系列模型,全面支援DeepSeek系列模型的一鍵部署,並限時開放了R1模型的免費線上體驗。
除了六大雲巨頭外,國內AI基礎設施企業無問芯穹更是早在1月28日除夕一大早就宣佈了其Infini-AI異構雲對DeepSeek-R1-Distill 32B模型的支援。
PPIO派歐、雲軸科技則同在2月2日官宣對於DeepSeek模型的支援。
PPIO派歐算力雲支援了DeepSeek-V3、DeepSeek-R1、蒸餾模型DeepSeek-R1-Distill-Llama-70B,模型價格與官方價格保持一致。
▲PPIO派歐算力雲
雲軸科技ZStack宣佈AI Infra平臺ZStack智塔支援企業私有化部署 DeepSeek V3/R1/Janus Pro三種模型,可基於海光、昇騰、英偉達、英特爾等國內外CPU/GPU適配。
▲雲軸科技ZStack智塔
海外市場,全球第一大雲巨頭AWS也在1月31日官宣DeepSeek-R1模型的全面上線。使用者可在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart上部署DeepSeek-R1模型;在Amazon Bedrock上自定義匯入DeepSeek-R1-Distill模型並在Amazon EC2 Trn1例項上部署DeepSeek-R1-Distill模型。
▲Amazon Bedrock
微軟Azure雲服務則是在1月30日宣佈DeepSeek-R1正式上線微軟的Azure AI Foundry以及GitHub。微軟還貼心地給出了使用教程影片。
雖然DeepSeek的模型是開源的,但全球雲服務廠商們對模型的支援仍然十分關鍵。透過支援DeepSeek模型的雲平臺,開發者可以省去買卡、裝驅動、配網路、配儲存、裝環境、裝框架、下載模型等一系列繁瑣步驟,直接在雲服務廠商的平臺上去呼叫DeepSeek模型。
客觀來說,像DeepSeek-V3這樣的MoE模型總引數量有671B,部署門檻並不低。
同時開發者還能在平臺上以更少甚至零程式碼去實現從訓練到部署再到推理的全過程,AI開發和應用的流程更簡單、更高效。
03.

結語:DeepSeek朋友圈陣容豪華

合作共贏才是未來AI發展必由之路

DeepSeek給整個AI產業帶來的影響是全方位、多層次的,除了自身模型的優秀,DeepSeek對於產業的帶動效應更值得關注,從晶片產業到上層雲服務產業,幾乎所有頭部玩家和創企都在積極湧入DeepSeek“生態圈”。
有業內人士稱,DeepSeek如此之快的爆發速度,一方面刺激著各路廠商加速適配模型,另一方面也刺激著算力產業的整合,隨著模型同質化趨勢凸顯、開源模型的加速成長,AI應用生態層的商業價值會越來越高,應用層競爭也將成為後續行業聚焦的重點。
DeepSeek無疑正在重塑全球AI產業的競爭版圖,中美之間的AI競爭格局也在改變。算力神話被打破、更多玩家有機會在AI新時代更輕鬆地拿到“入場券”,AI應用生態的發展也愈發重要。
正如DeepSeek創始人梁文鋒近日在接受《暗湧》採訪時提到的,在這波AI浪潮中,DeepSeek的出發點是走到技術前沿,去推動整個生態發展。正如英偉達的領先不只是一個公司到努力,也是整個西方技術社群和產業共同努力的結果,中國AI的發展,同樣需要這樣的生態。
梁文鋒說,DeepSeek希望形成一種生態,他們只負責基礎模型和前沿的創新,其它公司在DeepSeek的基礎上構建toB、toC的業務。
中國知名生物學家、北京大學終身講席教授饒毅近日釋出了題為“鴉片戰爭以來,中國對人類最大的科技震撼:DeepSeek”的文章,激起廣泛熱議。
毫無疑問,DeepSeek給海外諸多產業和領域都帶來了巨大震撼,中美之間的AI競爭仍然事態焦灼、充滿不確定性。中國AI或許正走在一個歷史最關鍵時刻。
正如傅聰所說:“我們不需要更多的禁令,中美作為在當今人工智慧領域最領先的兩個國家,不能不合作。只有共同合作發展,才能彌合數字和智慧鴻溝,特別是幫助全球南方在人工智慧發展程序中平等受益。”

相關文章