DeepSeek-V3滿血版在國產沐曦GPU首發體驗上線

為了驗證DeepSeek-V3滿血版在國產 GPU 的適配情況，春節期間我們聯合沐曦的工程師進行了充分的測試。經過幾天緊張的測試，目前已經確認DeepSeek-V3全精度滿血版可以成功執行在沐曦訓推一體 GPU 之上，這也充分證明了 DeepSeek 可以實現全鏈路自主技術的閉環。

今天我們再次將DeepSeek-V3滿血版（671B）上線到平臺上（滿血版目前僅供大家體驗用途）。這也是 Gitee AI 繼全套千問蒸餾模型上線沐曦 GPU 卡之後的又一大的更新。

由於滿血版模型的執行需要多機多卡的配置，除了伺服器本身外，還需要InfiniBand（IB）互聯裝置（如交換機、HBA網絡卡、光纖等）以實現高速網路連線。然而，目前具備此類條件的伺服器數量較為有限，因此只能部署一個最小規模的叢集，無法支援更高的併發需求。由此可能會出現體驗卡頓或超時的情況。我們將與沐曦進一步協調更多計算裝置，以便為大家提供更穩定的服務。

如果用於生產環境使用，我們推薦選擇 Gitee AI 已經準備好的全套免費的DeepSeek-R1蒸餾模型。

效能對標海外頂級閉源模型

DeepSeek-V3多項評測成績超越了其他開源模型，並在效能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

V3 與蒸餾模型的核心差異

此次上線的 DeepSeek-V3 與近期上線的DeepSeek-R1-Distill（1.5B/7B/14B/32B）形成互補，企業和開發者可按需選擇：

模型規模與架構

適用場景

DeepSeek-V3

適合複雜任務處理和高精度場景，如長文件分析、多模態推理、科研計算等
支援千卡級訓練，滿足超大規模叢集分散式訓練需求

DeepSeek-R1-Distill 蒸餾模型

適合輕量級部署和資源受限場景，如邊緣裝置推理、中小企業快速驗證 AI 應用
在視訊記憶體和算力要求上更為靈活，適配入門級硬體

國產沐曦曦雲 GPU 強勢助力

曦雲系列通用 GPU 產品（包括 C550、C500、C500X、C290、C280、N260 等型號）採用完全自主研發的 GPU IP，擁有完整的智慧財產權，並具備強大的多精度混合計算能力及高頻寬視訊記憶體支援。同時，沐曦產品搭載先進的時空互聯技術和全球相容的 MXMACA 軟體棧，可廣泛應用於智慧、通用計算和資料處理等場景。