一手實測「豆包」深度思考模式：能超越DeepSeek嗎？

「元寶」給了「豆包」壓力？

作者｜連冉

編輯｜鄭玄

字節跳動旗下 AI 助手豆包正在小範圍測試深度思考模型，據豆包相關負責人對極客公園表示，當前測試的是自家深度思考模型的不同實驗版本。

另外有報道稱，豆包正在測試的深度思考模型是基於豆包 1.5 基座模型研發。

其實此前在 1 月中旬，在豆包大模型團隊釋出豆包 1.5Pro 時，就已宣佈了深度推理模型 Doubao-1.5-pro-AS1-Preview 的存在，並稱「在完全不使用其他模型資料的條件下，透過 RL 演算法的突破和工程最佳化，充分發揮 Test Time Scaling 的算力優勢，完成了 RL Scaling，研發了 Doubao 深度思考模式。」

極客公園實測發現，與豆包對話時後者生成的答案確實有開始顯示推理過程的思維鏈，不過並不穩定出現。目前在豆包對話頁面也尚未出現「深度思考」功能的入口。

從 2 月 22 日開始，豆包就被騰訊旗下的 AI 應用「騰訊元寶」壓了一個身位，位居中國區蘋果應用商店免費 APP 下載排行榜第三位（第一名還是 deepseek)，在騰訊、百度多個應用接入 deepseek 後，位元組豆包會如何處之就成為大家關注的焦點，如今答案正在顯現。

豆包也上「深度思考」了？

最早具備深度思考能力的模型是 OpenAI 於 2023 年 12 月推出的 o1 系統，但其採用閉源策略而且僅限付費使用者使用（每月 200 美元）。而 DeepSeek 則透過開源策略、成本降低以及互動創新，成為首個將深度思考能力大規模普及的 AI 公司——DeepSeek 於 2024 年 11 月 20 日釋出 R1-Lite-Preview，成為國內首個對標 o1 的推理模型，並在 2025 年 1 月 20 日開源了 R1 模型。

R1 模型的創新點在於：透明化思維鏈；展示完整的推理過程，包括自我質疑、假設驗證等擬人化思考路徑；低成本與開源；R1 模型的推理成本僅為 OpenAI o1 的 1/27，且程式碼完全開放。

DeepSeek 的深度思考模式是一種透過顯性化 AI 模型的推理過程來增強使用者理解的功能，思維鏈（Chain of Thought, CoT）是支撐這一模式的核心技術。

簡單來說，深度思考模式可以讓使用者直觀看到模型的思考過程，這中間涉及思維鏈的展示，也就是 COT（Chain of Thought）——思維鏈是模擬出來的，透過訓練讓模型輸出中間步驟，比如自我質疑和反思，雖然只是文字序列，但看起來像人類的思考過程。

在深度思考模式下，使用者不僅能看到 AI 的最終答案，還能觀察到模型解決問題的完整邏輯鏈條，包括自我質疑、假設驗證、錯誤修正等步驟。比如，在解決數學題時，模型會展示其從問題拆解、多方法驗證到最終結論的全過程。

結合即時聯網功能後，模型可抓取最新資訊並進行邏輯整合。25 日，Anthropic 釋出了 Claude 3.7 Sonnet 混合推理模型，阿里雲 Qwen 推理模型「QwQ-Max 預覽版」也亮相了，我讓豆包評價了一下這兩款推理模型：