繼V3之後,沐曦GPU再完成DeepSeek-R1全尺寸適配,已上線GiteeAI

繼 DeepSeek 全套蒸餾模型以及 V3 版本上線後,經過 Gitee AI 和沐曦團隊兩天緊鑼密鼓的適配和機器籌備,DeepSeek-R1全尺寸版本現在已上線 Gitee AI 供開發者們使用
截至目前,DeepSeek-R1DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千問蒸餾模型均實現了在國產沐曦訓推一體 GPU 上成功執行,且均已上線 Gitee AI 開放使用體驗,國內 AI 全鏈路自主技術閉環踏出了巨大且關鍵的一步。在此特別感謝沐曦團隊的技術支援以及來自上海加佳的算力支撐。

三大「殺手鐧」成就國產模型新高度

DeepSeek-R1的效能相信大家已經充分領教了,其「殺手鐧」之一就是開放了思維鏈輸出過程,使用者可以看到模型進行推理時的每一步邏輯,告別了傳統大模型的「黑盒」問題。
Gitee AI 中 DeepSeek-R1 的推理過程
DeepSeek-R1另一個「殺手鐧」則是在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上,效能比肩OpenAI-o1 正式版。
DeepSeek-R1的第三個「殺手鐧」無疑是開放的許可證和使用者協議,模型開源 License 統一使用 MIT,完全開源,不限制商用,無需申請
同時,產品協議明確可「模型蒸餾」,明確允許使用者利用模型輸出、透過模型蒸餾等方式訓練其他模型。
這三大「殺手鐧」使得DeepSeek-R1不但擁有極高的透明度和易用性,也為開發者提供了更靈活的訓練和應用方式,極大地加速了模型的落地與普及,迅速讓國產模型在世界 AI 競爭格局中登上了新的制高點

沐曦 GPU+曦源一號萬卡叢集=國產算力新標杆

當然,想要實現技術自主與獨立,僅有模型的領先還不夠,關鍵在於 AI 模型對國產 GPU 的深度適配與高效執行。
唯有 DeepSeek-R1 能夠在國產 GPU 上穩定執行,中國 AI 技術體系才能真正實現自主可控的完整閉環
本次DeepSeek-R1部署採用了沐曦訓推一體 GPU,使用完全自主研發的 GPU IP,擁有完整的智慧財產權,並具備強大的多精度混合計算能力及高頻寬視訊記憶體支援。同時,沐曦產品搭載先進的時空互聯技術和全球相容的 MXMACA 軟體棧,可廣泛應用於智慧、通用計算和資料處理等場景。
此外,由上海加佳智雲數字科技有限公司運營的曦源一號國產替代萬卡叢集正以其卓越的效能為本次部署以及各類 AI 平臺、AI 模型及 AI 應用提供強大的算力支援。
曦源一號SADA萬卡叢集-上海智算中心現場
曦源一號國產替代算力叢集是基於沐曦高效能 GPU 加速卡所構建的一個開放、標準、高效的計算架構,有效促進了計算資源、資料資源與智慧服務的全面整合。這種創新不僅提升了整體效能,也在 AI 即時推理、大規模模型訓練等眾多領域展現出巨大的潛力,從而滿足了目前急需高效、穩定計算能力的國內市場。

Gitee AI——模型 API 新選擇

2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應用為核心功能與服務,致力於讓開發者輕鬆構建和部署 AI 應用,為企業客戶提供更加智慧、高效的 AI 應用解決方案。
Gitee AI 的 Serverless API 提供了文字生成、視覺模型、影像處理、語音識別、語音生成、向量與重排模型、程式碼生成等 9 種類型共 54 個大模型的 API 使用。透過購買模型資源包,即可透過極低的價格即可盡享眾多主流模型。
點選文末閱讀原文訪問 Gitee AI,體驗基於基於沐曦曦雲 GPU 及曦源一號國產替代算力叢集的DeepSeek-R1,使用 100% 國產 AI 開發應用吧!

線上閱讀:https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf


相關文章