DeepSeek-R1釋出，效能對標OpenAIo1正式版

今天，我們正式釋出 DeepSeek-R1，並同步開源模型權重。

效能對齊OpenAI-o1正式版

DeepSeek-R1 在後訓練階段大規模使用了強化學習技術，在僅有極少標註資料的情況下，極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上，效能比肩 OpenAI o1 正式版。

在此，我們將 DeepSeek-R1 訓練技術全部公開，以期促進技術社群的充分交流與創新協作。

論文連結：

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸餾小模型超越 OpenAI o1-mini

我們在開源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個 660B 模型的同時，透過 DeepSeek-R1 的輸出，蒸餾了 6 個小模型開源給社群，其中 32B 和 70B 模型在多項能力上實現了對標 OpenAI o1-mini 的效果。

HuggingFace連結：

https://huggingface.co/deepseek-ai

為了推動和鼓勵開源社群以及行業生態的發展，在釋出並開源 R1 的同時，我們同步在協議授權層面也進行了如下調整：

模型開源 License 統一使用 MIT。我們曾針對大模型開源的特點，參考當前行業的通行實踐，特別引入 DeepSeek License 為開源社群提供授權，但實踐表明非標準的開源 License 可能反而增加了開發者的理解成本。為此，此次我們的開源倉庫（包括模型權重）統一採用標準化、寬鬆的 MIT License，完全開源，不限制商用，無需申請。
產品協議明確可“模型蒸餾”。為了進一步促進技術的開源和共享，我們決定支援使用者進行“模型蒸餾”。我們已更新線上產品的使用者協議，明確允許使用者利用模型輸出、透過模型蒸餾等方式訓練其他模型。