DeepSeek縫合Claude，比單用R1/o1效果都好！GitHub攬星3k

2025-09-14 07:28 機器學習演算法與自然語言處理

MLNLP

社群是國內外知名的機器學習與自然語言處理社群，受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。

社群的願景是促進國內外自然語言處理，機器學習學術界、產業界和廣大愛好者之間的交流和進步，特別是初學者同學們的進步。

來源 | 量子位

作者｜夢晨西風

讓DeepSeek代替Claude思考，縫合怪玩法火了。

原因無它：比單獨使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模型的效果更好。

先來看一段VCR：

再來看一個測評結果：

在程式碼編輯基準Polyglot Benchmark上，縫合模型效果小超o1-high和R1一頭。

在這個測試中，R1扮演架構師，描述如何解決程式碼問題。

而Claude扮演程式設計師，按要求生成特定的程式碼編輯指令，以便把改動應用到原始檔中。

除此之外，實驗過程中還得出還有幾個有意思的結論：

o1與Claude Sonnet搭配效果並不如單獨使用o1。
使用R1或o1當架構師，Claude之外的其他模型當程式設計師，效果都不如單獨使用R1或o1。
但o1-preview和o1-mini當架構師，使用很多不同的模型當程式設計師都能提高組合的成績。
使用R1的推理過程token效果不如使用R1的最終輸出token。

這樣看來，R1和Claude Sonnet還真是一對絕配啊～

DeepClaude應用本身100%免費且開源，在GitHub上已攬獲3k星星（當然API要用自己的）。

網友測試後總結到：Claude擅長撰寫清晰、結構良好的文字和程式碼，因此它能將DeepSeek-R1的想法轉化為精煉的回覆。

DeepClaude作者之一對此有感而發：

AI智慧體和智慧體應用正在展示出一種“數字世界優先”的正規化轉變，智慧系統正在成為主動的合作者，而不僅僅是被動的工具。

DeepSeek和Claude的混血兒

具體來說，DeepClaude是一個LLM推理API，透過Rust編寫。

它提供了一個統一的介面，將DeepSeek R1的CoT邏輯推理能力和Claude的回覆在單一流中無縫銜接。

開發者可以透過這個API同時呼叫兩種模型的功能，還能完全掌控自己的API金鑰和資料。

打造它的團隊名為Asterisk，團隊成員具有安全研究&CTF（Capture The Flag）背景，致力於利用AI讓檢查程式碼安全這事兒變得更加高效。

團隊認為，DeepSeek R1的CoT深度推理甚至達到了LLM具有反省認知（metacognition）的程度，它能夠自我糾正、思考不常見/極端/特殊的情況，並在自然語言中進行類似蒙特卡洛樹搜尋（MCTS）的推理。

不過R1在程式碼生成、創造力和對話技巧方面有所欠缺，Claude 3.5 Sonnet在這些方面表現出色，剛好可以作補充。

何不將兩者結合起來？取兩者之長，打造出DeepClaude～

對話中，Claude回應之前，系統會顯示“<thinking>”這樣的預填充文字。

DeepClaude結合了這兩種模型，具有以下特性：

託管API完全免費，允許使用者使用自己的金鑰，並將DeepSeek和Claude的流式API整合在一起，提供計算組合使用量和價格等便利功能。

程式碼是開源的，使用者可以自由託管、修改和重新分發。團隊表示它已經在Asterisk的生產環境中大規模使用，每天處理數百萬token，至今尚未出現故障，只要不濫用就行。

One More Thing

你以為兩個模型縫合就是極限了嗎？

No no no

還有網友開發出了三縫合玩法，將DeepSeek-R1和Gemini 2.0 Flash的思考結果組合起來，在讓Claude Sonnet去回答問題。

在GPQA測試（谷歌搜不到的理化生博士級選擇題）中也取得了好成績。

Github地址：https://github.com/getasterisk/deepclaude

參考連結：

[1]https://aider.chat/2025/01/24/r1-sonnet.html

[2]https://x.com/deepclaude_/status/1886911416478642279

[3]https://x.com/omercelik/status/1883510797193937278

[4]https://x.com/mufeedvh/status/1883620781583901011

技術交流群邀請函

△長按新增小助手

掃描二維碼新增小助手微信

請備註：姓名-學校/公司-研究方向

（如：小張-哈工大-對話系統）

即可申請加入自然語言處理/Pytorch等技術交流群

關於我們

MLNLP 社群是由國內外機器學習與自然語言處理學者聯合構建的民間學術社群，目前已經發展為國內外知名的機器學習與自然語言處理社群，旨在促進機器學習，自然語言處理學術界、產業界和廣大愛好者之間的進步。

社群可以為相關從業者的深造、就業及研究等方面提供開放交流平臺。歡迎大家關注和加入我們。

相關文章

Claude3.7Sonnet釋出：別提什麼AGI，我Anthropic要賺企業客戶的錢！

Claude3.7Sonnet釋出：別提什麼AGI，我Anthropic要賺企業客戶的錢！

Claude3.7成精了！偷偷將OpenAI模型換成自己，卡帕西：迄今最好笑的一趴

Claude3.7成精了！偷偷將OpenAI模型換成自己，卡帕西：迄今最好笑的一趴

從R1到Sonnet3.7，ReasoningModel首輪競賽中有哪些關鍵訊號？

從R1到Sonnet3.7，ReasoningModel首輪競賽中有哪些關鍵訊號？

深夜重磅！全球首個混合推理模型釋出，Claude能「思考」了，實測發現這些細節

深夜重磅！全球首個混合推理模型釋出，Claude能「思考」了，實測發現這些細節

Claude玩寶可夢，卡關就「裝死」重啟，大模型：逃避可恥但有用

Claude玩寶可夢，卡關就「裝死」重啟，大模型：逃避可恥但有用

DeepSeek開源第四彈教最佳化，梁文鋒參與研發；Anthropic全面開放ClaudeAI的GitHub整合丨AIGC日報

DeepSeek開源第四彈教最佳化，梁文鋒參與研發；Anthropic全面開放ClaudeAI的GitHub整合丨AIGC日報

DeepSeek開源周才第二天，有些公司就已經坐不住了…

DeepSeek開源周才第二天，有些公司就已經坐不住了…

DeepSeek模型綜述：V1V2V3R1-Zero

DeepSeek模型綜述：V1V2V3R1-Zero

實測Claude3.7：3200行程式碼一口氣輸出，物理規律手拿把掐，弱智吧已失守

實測Claude3.7：3200行程式碼一口氣輸出，物理規律手拿把掐，弱智吧已失守

中文比R1絲滑、玩寶可夢還賊溜？全球首個混合推理模型Claude3.7Sonnet太驚豔，網友直呼“孤獨求敗”！

中文比R1絲滑、玩寶可夢還賊溜？全球首個混合推理模型Claude3.7Sonnet太驚豔，網友直呼“孤獨求敗”！

Copyright © 2025 | WordPress Theme by MH Themes