

如果你一直關注人工智慧領域,你會知道,在構建最強大、推理能力最強的模型的競爭中,OpenAI、Anthropic 和谷歌等大公司一直佔據主導地位。
但是這兩天遊戲規則剛剛發生了變化。
中國人工智慧公司深度求索公司 DeepSeek 釋出了一顆重磅炸彈:DeepSeek-R1,這是一個完全開源的推理模型,它不僅可以與 OpenAI 的 O1 相媲美,而且其效能令人驚歎。最棒的是?它是完全開源的,遵循 MIT 許可證。是的,你沒看錯。

什麼是 DeepSeek-R1?
DeepSeek-R1 是一種推理模型,旨在解決數學、編碼和邏輯推理等複雜任務。它是 DeepSeek 家族的一部分,該家族最近釋出了 DeepSeek-V3,這是目前最好的開源模型之一。但 R1 將事情提升到了一個全新的層級。
它是一種思維模型,這意味著它使用一種稱為測試時間推理或計算擴充套件的過程來逐步推理問題。可以把它想象成一個內部獨白,模型會與自己辯論以得出最佳答案。
更令人驚訝的是,DeepSeek-R1 不只是一個模型。該公司還發布了R1 的六個精簡版本,引數數量從 15 億到 700 億不等。這些較小的模型不僅輕量級,而且功能強大。例如,DeepSeek-R1-Distill-Qwen-1.5B模型在某些基準上的表現優於 GPT-4。
讓我們來仔細想想:一個 15 億引數的模型,小到可以在邊緣裝置上執行,正在與 OpenAI GPT-4 一較高下。
為什麼這是一件大事?
-
它是完全開源的:DeepSeek-R1 是根據 MIT 許可證釋出的,這意味著你可以用它做任何事情——下載、修改、微調,甚至用它來訓練新模型。這與 OpenAI 的服務條款形成了鮮明對比,後者禁止使用其輸出來訓練其他模型。DeepSeek 不僅僅是開源模型;他們還積極鼓勵創新。
-
它與 OpenAI 的 O1 不相上下:根據基準測試,DeepSeek-R1 在數學、編碼和推理任務中的表現與 OpenAI 的 O1 相當。在某些情況下,它甚至優於 O1。例如,經過提煉的 70 億引數模型在 AIME 2024 基準測試中得分為 55.5,擊敗了 GPT-3.5 和 Claude-3.5 等模型。
-
它的構建方式與眾不同:DeepSeek-R1 使用大規模強化學習 (RL)進行訓練,而不依賴於監督式微調 (SFT)。這是一種突破性的方法,因為它允許模型自行探索和學習推理模式,而無需人工輸入標記資料。結果如何?一個可以自我驗證、反思並生成長鏈思維來解決複雜問題的模型。
-
它速度快且易於訪問:與某些速度慢或經常宕機的專有模型不同,DeepSeek-R1 速度“快如閃電”,你可在chat.deepseek.com上免費獲取。你還可以透過他們的 API 訪問它,這不僅比 OpenAI 價格便宜,而且沒有速率限制。
上線 18 天日活 1500 萬
從上線開始到現在 18 天,DeepSeek 日活達到 1500 萬,而 ChatGPT 過 1500 萬花了 244 天,增長速度是 ChatGPT 的 13 倍。
至此,DeepSeek 成全球增速最快 AI 應用,截止當前 DeepSeek 在蘋果應用商店 157 個國家/地區的第一名。
提煉模型將改變遊戲規則
DeepSeek-R1 最令人興奮的方面之一是精簡模型。這些較小的版本使用 R1 生成的資料進行微調,事實證明它們非常強大。例如:
-
DeepSeek -R1-Distill-Qwen-7B模型在 AIME 2024 上得分為 55.5,優於 GPT-3.5 和 Claude-3.5。
-
DeepSeek-R1-Distill-Qwen-32B模型在多個基準測試中擊敗了 OpenAI 的 O1-mini。
這些精簡的模型不僅僅是學術上的好奇心——它們是可以在消費級硬體上執行的實用工具。想象一下,擁有一個與 GPT-4 一樣強大的模型,但又足夠小,可以在你的筆記型電腦甚至 Raspberry Pi 上執行。這就是 DeepSeek 正在構建的未來。
真實世界的表現:令人驚歎的例子
讓我們來談談 DeepSeek-R1 到底能做什麼。在測試中,它展示了一種不可思議的推理複雜問題的能力,即使問題很棘手或沒有解決方案
-
數學問題:當給出 IIT 入學考試(世界上最難的考試之一)中的一個具有挑戰性的積分問題時,DeepSeek-R1 在29 秒內解決了它,並透過逐步推理給出了正確答案。另一方面,GPT-4 無法解決這個問題。
-
棘手問題:當被問到一道無解的數學題時,DeepSeek-R1 並沒有就此放棄——它對問題進行了推理,得出結論認為無解,並解釋了原因。這種級別的自我意識在 AI 模型中非常罕見。
-
化學難題:在一道化學題中,題目包含一個細微錯誤(二氧化碳寫成了一氧化碳),DeepSeek-R1 識別出了錯誤,並進行了糾正,給出了正確答案。它甚至會自言自語,懷疑使用者是不是打錯了。
Deepseek已經在多家平臺上線
在美國的一些公司已經宣佈開始支援 DeepSeek。包括微軟, AWS、Groq、Liquid AI、Perplexity、Windsurf 、Cursor、Cerebras、KREA。
特別是英偉達已經上線DeepSeek,稱讚其為最先進的大型語言模型。NVIDIA NIM 已經支援 DeepSeek-R1了 (可以理解為NVIDIA部署了DeepSeek-R1賣服務)
還有其它未列入的企業,各種 AI 程式設計、雲服務、AI 搜尋紛紛接入接入 Deepseek。
多個國家開始限制DeepSeek
義大利資料保護局(GPDP)星期四(1月30日)對DeepSeek的人工智慧聊天機器人展開調查,並表示已禁止其處理義大利使用者的資料。
義大利資料保護局表示,在詢問該公司個人資料使用情況後,其收到的答覆“完全不充分”,因此決定採取行動。
愛爾蘭資料保護委員會也要求DeepSeek提交其人工智慧大模型如何使用使用者資料的報告。另外,澳大利亞國庫部長吉姆·查默斯呼籲公民謹慎使用DeepSeek的人工智慧模型。
美國官員則聲稱正在調查DeepSeek對“國家安全”的影響。
人工智慧的未來更加開放
DeepSeek-R1 不僅僅是一個模型,它更是一個宣告。它證明了你不需要數十億美元或龐大的公關機器來構建世界級的人工智慧。透過正確的方法(在本例中是強化學習),你可以建立與世界上最好的模型相媲美的模型,並讓每個人都可以使用它們。
此次釋出也為 AI 社群敲響了警鐘。雖然 OpenAI 和 Anthropic 等公司一直專注於專有模型,但 DeepSeek 仍保持著開放 AI 的原始精神。他們不只是釋出模型;他們還分享訓練秘訣,鼓勵微調,並授權開發人員在其工作的基礎上繼續發展。
結語:這是專有模型的終結嗎?
不完全是。專有模型仍然有其存在的意義,尤其是對於企業用例而言。但 DeepSeek-R1 有力地提醒我們,開源 AI 不僅活著,而且正在蓬勃發展。有了這樣的模型,AI 創新的門檻比以往任何時候都要低。
因此,如果您還沒有嘗試過,請前往https://chat.deepseek.com並試用 DeepSeek-R1。無論你是開發人員、研究人員還是 AI 愛好者,此模型都值得關注。誰知道呢?得益於 DeepSeek,AI 的下一個重大突破可能就來自各位。
人工智慧的未來是開放的,而且看起來比以往任何時候都更加光明!
作者:跨年的大雄
相關閱讀: