DeepSeek-V3滿血版在國產沐曦GPU首發體驗上線

為了驗證DeepSeek-V3滿血版在國產 GPU 的適配情況,春節期間我們聯合沐曦的工程師進行了充分的測試。經過幾天緊張的測試,目前已經確認DeepSeek-V3全精度滿血版可以成功執行在沐曦訓推一體 GPU 之上,這也充分證明了 DeepSeek 可以實現全鏈路自主技術的閉環。
今天我們再次將DeepSeek-V3滿血版(671B)上線到平臺上(滿血版目前僅供大家體驗用途)。這也是 Gitee AI 繼全套千問蒸餾模型上線沐曦 GPU 卡之後的又一大的更新。
由於滿血版模型的執行需要多機多卡的配置,除了伺服器本身外,還需要InfiniBand(IB)互聯裝置(如交換機、HBA網絡卡、光纖等)以實現高速網路連線。然而,目前具備此類條件的伺服器數量較為有限,因此只能部署一個最小規模的叢集,無法支援更高的併發需求。由此可能會出現體驗卡頓或超時的情況。我們將與沐曦進一步協調更多計算裝置,以便為大家提供更穩定的服務。
如果用於生產環境使用,我們推薦選擇 Gitee AI 已經準備好的全套免費的DeepSeek-R1蒸餾模型

效能對標海外頂級閉源模型

DeepSeek-V3多項評測成績超越了其他開源模型,並在效能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

V3 與蒸餾模型的核心差異

此次上線的 DeepSeek-V3 與近期上線的DeepSeek-R1-Distill(1.5B/7B/14B/32B)形成互補,企業和開發者可按需選擇:

模型規模與架構

適用場景

DeepSeek-V3

  • 適合複雜任務處理高精度場景,如長文件分析、多模態推理、科研計算等
  • 支援千卡級訓練,滿足超大規模叢集分散式訓練需求

DeepSeek-R1-Distill 蒸餾模型

  • 適合輕量級部署資源受限場景,如邊緣裝置推理、中小企業快速驗證 AI 應用
  • 在視訊記憶體和算力要求上更為靈活,適配入門級硬體

國產沐曦曦雲 GPU 強勢助力

曦雲系列通用 GPU 產品(包括 C550、C500、C500X、C290、C280、N260 等型號)採用完全自主研發的 GPU IP,擁有完整的智慧財產權,並具備強大的多精度混合計算能力及高頻寬視訊記憶體支援。同時,沐曦產品搭載先進的時空互聯技術和全球相容的 MXMACA 軟體棧,可廣泛應用於智慧、通用計算和資料處理等場景。
沐曦曦雲 GPU 不僅具備強大的硬體支援,還在軟硬體協同最佳化方面做了大量工作,確保DeepSeek-V3 能夠發揮出其最大效能。相比海外廠商的 GPU,沐曦曦雲 GPU 的更高相容性和更低的資源消耗,使得DeepSeek-V3的 API 成本進一步降低。

為何100%國產AI至關重要

全球 AI 產業的競爭格局正在因開源戰略和技術創新而發生深刻變化,中國 AI 企業正成為推動行業變革的重要力量。這種轉變正促使過去三年由海外大廠主導的局面發生變化。
DeepSeek 之所以能在這個春節迅速破圈,成為國內外廣泛關注的焦點,正是因為它代表了中國在人工智慧領域的領先力量。然而,若其只能在海外硬體平臺上執行,那麼這一突破性的技術成果最終也只能侷限於海外技術的生態之中,難以完全實現自主可控。
真正意義上的技術自主與獨立,必須依託於能夠充分相容並高效執行在國產 GPU 上的能力。只有當 DeepSeek 能夠在國產 GPU 上完美執行,整個中國 AI 技術體系才真正得以實現閉環!
點選文末閱讀原文訪問 Gitee AI,體驗基於基於沐曦曦雲 GPU 的DeepSeek-V3,感受全鏈路自主技術閉環的 AI 應用開發!

Gitee AI 的 Serverless API 提供了文字生成、視覺模型、影像處理、語音識別、語音生成、向量與重排模型、程式碼生成等 9 種類型共 53 個大模型的 API 使用。透過購買模型資源包,即可透過極低的價格即可盡享眾多主流模型。


相關文章