DeepSeek-R1釋出,效能對標OpenAIo1正式版

今天,我們正式釋出 DeepSeek-R1,並同步開源模型權重。
  • DeepSeek-R1 遵循 MIT License,允許使用者透過蒸餾技術藉助 R1 訓練其他模型。
  • DeepSeek-R1 上線API,對使用者開放思維鏈輸出,透過設定 `model='deepseek-reasoner'` 即可呼叫。
  • DeepSeek 官網與 App 即日起同步更新上線。
效能對齊OpenAI-o1正式版
DeepSeek-R1 在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上,效能比肩 OpenAI o1 正式版。
在此,我們將 DeepSeek-R1 訓練技術全部公開,以期促進技術社群的充分交流與創新協作。
論文連結
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸餾小模型超越 OpenAI o1-mini

我們在開源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個 660B 模型的同時,透過 DeepSeek-R1 的輸出,蒸餾了 6 個小模型開源給社群,其中 32B 和 70B 模型在多項能力上實現了對標 OpenAI o1-mini 的效果。
HuggingFace連結
https://huggingface.co/deepseek-ai

開放的許可證和使用者協議

為了推動和鼓勵開源社群以及行業生態的發展,在釋出並開源 R1 的同時,我們同步在協議授權層面也進行了如下調整:
  • 模型開源 License 統一使用 MIT。我們曾針對大模型開源的特點,參考當前行業的通行實踐,特別引入 DeepSeek License 為開源社群提供授權,但實踐表明非標準的開源 License 可能反而增加了開發者的理解成本。為此,此次我們的開源倉庫(包括模型權重)統一採用標準化、寬鬆的 MIT License,完全開源,不限制商用,無需申請。
  • 產品協議明確可“模型蒸餾”。為了進一步促進技術的開源和共享,我們決定支援使用者進行“模型蒸餾”。我們已更新線上產品的使用者協議,明確允許使用者利用模型輸出、透過模型蒸餾等方式訓練其他模型。

App與網頁端

登入DeepSeek官網或官方App,開啟“深度思考”模式,即可呼叫最新版 DeepSeek-R1 完成各類推理任務。

API 及定價

DeepSeek-R1 API 服務定價為每百萬輸入 tokens 1 元(快取命中)/ 4 元(快取未命中),每百萬輸出 tokens 16 元
詳細的 API 呼叫指南請參考官方文件
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model


相關文章