
社群是國內外知名的機器學習與自然語言處理社群,受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。
來源 | 量子位
作者|夢晨 西風
讓DeepSeek代替Claude思考,縫合怪玩法火了。
原因無它:比單獨使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模型的效果更好。
先來看一段VCR:
再來看一個測評結果:
在程式碼編輯基準Polyglot Benchmark上,縫合模型效果小超o1-high和R1一頭。

在這個測試中,R1扮演架構師,描述如何解決程式碼問題。
而Claude扮演程式設計師,按要求生成特定的程式碼編輯指令,以便把改動應用到原始檔中。
除此之外,實驗過程中還得出還有幾個有意思的結論:
-
o1與Claude Sonnet搭配效果並不如單獨使用o1。
-
使用R1或o1當架構師,Claude之外的其他模型當程式設計師,效果都不如單獨使用R1或o1。
-
但o1-preview和o1-mini當架構師,使用很多不同的模型當程式設計師都能提高組合的成績。
-
使用R1的推理過程token效果不如使用R1的最終輸出token。
這樣看來,R1和Claude Sonnet還真是一對絕配啊~

DeepClaude應用本身100%免費且開源,在GitHub上已攬獲3k星星(當然API要用自己的)。

網友測試後總結到:Claude擅長撰寫清晰、結構良好的文字和程式碼,因此它能將DeepSeek-R1的想法轉化為精煉的回覆。

DeepClaude作者之一對此有感而發:
AI智慧體和智慧體應用正在展示出一種“數字世界優先”的正規化轉變,智慧系統正在成為主動的合作者,而不僅僅是被動的工具。

DeepSeek和Claude的混血兒
具體來說,DeepClaude是一個LLM推理API,透過Rust編寫。
它提供了一個統一的介面,將DeepSeek R1的CoT邏輯推理能力和Claude的回覆在單一流中無縫銜接。
開發者可以透過這個API同時呼叫兩種模型的功能,還能完全掌控自己的API金鑰和資料。
打造它的團隊名為Asterisk,團隊成員具有安全研究&CTF(Capture The Flag)背景,致力於利用AI讓檢查程式碼安全這事兒變得更加高效。

團隊認為,DeepSeek R1的CoT深度推理甚至達到了LLM具有反省認知(metacognition)的程度,它能夠自我糾正、思考不常見/極端/特殊的情況,並在自然語言中進行類似蒙特卡洛樹搜尋(MCTS)的推理。
不過R1在程式碼生成、創造力和對話技巧方面有所欠缺,Claude 3.5 Sonnet在這些方面表現出色,剛好可以作補充。
何不將兩者結合起來?取兩者之長,打造出DeepClaude~

對話中,Claude回應之前,系統會顯示“<thinking>”這樣的預填充文字。

DeepClaude結合了這兩種模型,具有以下特性:

託管API完全免費,允許使用者使用自己的金鑰,並將DeepSeek和Claude的流式API整合在一起,提供計算組合使用量和價格等便利功能。
程式碼是開源的,使用者可以自由託管、修改和重新分發。團隊表示它已經在Asterisk的生產環境中大規模使用,每天處理數百萬token,至今尚未出現故障,只要不濫用就行。
One More Thing
你以為兩個模型縫合就是極限了嗎?
No no no
還有網友開發出了三縫合玩法,將DeepSeek-R1和Gemini 2.0 Flash的思考結果組合起來,在讓Claude Sonnet去回答問題。
在GPQA測試(谷歌搜不到的理化生博士級選擇題)中也取得了好成績。

Github地址:https://github.com/getasterisk/deepclaude
參考連結:
[1]https://aider.chat/2025/01/24/r1-sonnet.html
[2]https://x.com/deepclaude_/status/1886911416478642279
[3]https://x.com/omercelik/status/1883510797193937278
[4]https://x.com/mufeedvh/status/1883620781583901011
技術交流群邀請函

△長按新增小助手
掃描二維碼新增小助手微信
關於我們
