為了驗證
DeepSeek-V3
滿血版在國產 GPU 的適配情況,春節期間我們聯合沐曦的工程師進行了充分的測試。經過幾天緊張的測試,目前已經確認DeepSeek-V3
全精度滿血版可以成功執行在沐曦訓推一體 GPU 之上,這也充分證明了 DeepSeek 可以實現全鏈路自主技術的閉環。今天我們再次將
DeepSeek-V3
滿血版(671B)上線到平臺上(滿血版目前僅供大家體驗用途)。這也是 Gitee AI 繼全套千問蒸餾模型上線沐曦 GPU 卡之後的又一大的更新。
由於滿血版模型的執行需要多機多卡的配置,除了伺服器本身外,還需要InfiniBand(IB)
互聯裝置(如交換機、HBA網絡卡、光纖等)以實現高速網路連線。然而,目前具備此類條件的伺服器數量較為有限,因此只能部署一個最小規模的叢集,無法支援更高的併發需求。由此可能會出現體驗卡頓或超時的情況。我們將與沐曦進一步協調更多計算裝置,以便為大家提供更穩定的服務。如果用於生產環境使用,我們推薦選擇 Gitee AI 已經準備好的全套免費的DeepSeek-R1
蒸餾模型。
效能對標海外頂級閉源模型
DeepSeek-V3
多項評測成績超越了其他開源模型,並在效能上和世界頂尖的閉源模型 GPT-4o
以及 Claude-3.5-Sonnet
不分伯仲。
V3 與蒸餾模型的核心差異
此次上線的
DeepSeek-V3
與近期上線的DeepSeek-R1-Distill
(1.5B/7B/14B/32B)形成互補,企業和開發者可按需選擇:模型規模與架構

適用場景
DeepSeek-V3
-
適合複雜任務處理和高精度場景,如長文件分析、多模態推理、科研計算等
-
支援千卡級訓練,滿足超大規模叢集分散式訓練需求
DeepSeek-R1-Distill 蒸餾模型
-
適合輕量級部署和資源受限場景,如邊緣裝置推理、中小企業快速驗證 AI 應用
-
在視訊記憶體和算力要求上更為靈活,適配入門級硬體
國產沐曦曦雲 GPU 強勢助力
曦雲系列通用 GPU 產品(包括 C550、C500、C500X、C290、C280、N260 等型號)採用完全自主研發的 GPU IP,擁有完整的智慧財產權,並具備強大的多精度混合計算能力及高頻寬視訊記憶體支援。同時,沐曦產品搭載先進的時空互聯技術和全球相容的 MXMACA 軟體棧,可廣泛應用於智慧、通用計算和資料處理等場景。

沐曦曦雲 GPU 不僅具備強大的硬體支援,還在軟硬體協同最佳化方面做了大量工作,確保
DeepSeek-V3
能夠發揮出其最大效能。相比海外廠商的 GPU,沐曦曦雲 GPU 的更高相容性和更低的資源消耗,使得DeepSeek-V3
的 API 成本進一步降低。
為何100%國產AI至關重要
全球 AI 產業的競爭格局正在因開源戰略和技術創新而發生深刻變化,中國 AI 企業正成為推動行業變革的重要力量。這種轉變正促使過去三年由海外大廠主導的局面發生變化。
DeepSeek 之所以能在這個春節迅速破圈,成為國內外廣泛關注的焦點,正是因為它代表了中國在人工智慧領域的領先力量。然而,若其只能在海外硬體平臺上執行,那麼這一突破性的技術成果最終也只能侷限於海外技術的生態之中,難以完全實現自主可控。
真正意義上的技術自主與獨立,必須依託於能夠充分相容並高效執行在國產 GPU 上的能力。只有當 DeepSeek 能夠在國產 GPU 上完美執行,整個中國 AI 技術體系才真正得以實現閉環!
點選文末閱讀原文訪問 Gitee AI,體驗基於基於沐曦曦雲 GPU 的
DeepSeek-V3
,感受全鏈路自主技術閉環的 AI 應用開發!Gitee AI 的 Serverless API 提供了文字生成、視覺模型、影像處理、語音識別、語音生成、向量與重排模型、程式碼生成等 9 種類型共 53 個大模型的 API 使用。透過購買模型資源包,即可透過極低的價格即可盡享眾多主流模型。

