阿里Qwen3-Coder攜1M上下文殺來!5分鐘生成網站,開發者狂歡:Claude Code可以解除安裝了

整理 | 褚杏娟
今天,阿里正式釋出了其“迄今為止最具代理能力的程式碼模型” Qwen3-Coder。
Qwen3-Coder 有多個版本,其中 Qwen3-Coder-480B-A35B-Instruct 是一個有 480B 引數、35B 啟用引數的 MoE 模型,原生支援 256K token 的上下文並可透過 YaRN 擴充套件到 1M token,擁有卓越的程式碼和 Agent 能力。據悉,該模型支援 358 種程式語言,在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了開源模型的 SOTA 效果,可以與 Claude Sonnet4 媲美。

與此同時,阿里還推出並開源了一款用於代理式程式設計的命令列工具:Qwen Code。Qwen Code 是一個 CLI 工具,修改自 Gemini CLI,針對 Qwen3‑Coder 系列的模型增強了解析器和工具支援。據悉,Qwen Code 基於 Gemini Code 進行二次開發,但團隊進行了 prompt 和工具呼叫協議適配,以最大程度激發 Qwen3-Coder 在 Agentic Coding 任務上的表現。另外,Qwen3-Coder 還可以和社群優秀的程式設計工具結合,如 Claude Code、Cline 等。
據介紹,藉助 Qwen3-Coder,剛入行的程式設計師一天就能完成資深程式設計師一週的工作,生成一個品牌官網最快只需 5 分鐘。
目前,Qwen3-Coder 已在魔搭社群、HuggingFace 等平臺開源,全球開發者都可以免費下載使用。截至發稿前,該模型已在 Github 上獲得 5.1k stars。此外,Qwen3-Coder 很快將接入阿里的 AI 程式設計產品通義靈碼,API 也已上線阿里雲百鍊。
相關地址:
https://github.com/QwenLM/Qwen3-Coder
https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct
Qwen3-Coder 訓練過程
預訓練
據悉,這次團隊從不同角度進行 Scaling,以提升 Qwen3-Coder 的程式碼能力:
  • 資料擴充套件:總計 7.5T(程式碼佔比 70%),在保持通用與數學能力的同時,具備卓越的程式設計能力;
  • 上下文擴充套件:原生支援 256K 上下文,藉助 YaRN 可拓展至 1M,專為倉庫級和動態資料(如 Pull Request)最佳化;
  • 合成數據擴充套件:利用 Qwen2.5-Coder 對低質資料進行清洗與重寫,來顯著提升整體資料質量。
後訓練
團隊在更豐富的真實程式碼任務上進行了擴充套件 Code RL 訓練。與當前社群普遍聚焦於競賽類程式碼生成不同,團隊認為所有的程式碼任務天然適合執行驅動的大規模強化學習。透過自動擴充套件測試樣例,團隊構造了大量高質量的訓練例項,不僅顯著提升了程式碼執行成功率,還對其他任務帶來增益。

在真實世界的 Software Engneering Task,比如 SWE-Bench,模型需要在環境中不斷互動,自主規劃、選擇工具呼叫、接受反饋不斷做出新決策,這是一個典型的 Long-Horizon RL 任務。
團隊在 Qwen3-Coder 的後訓練階段執行了 Agent RL,鼓勵模型透過多輪互動的方式利用工具解決問題。據介紹,Agent RL 的主要挑戰在於 Environment Scaling,團隊實現了可驗證環境的擴充套件系統,藉助阿里雲的基礎設施,實現同時執行 20k 獨立環境。這一套基礎設施可以提供大規模的強化學習反饋和評測,最終我們在 SWE-bench Verified 上實現了開源模型 SOTA 的效果。
效果如何?
Qwen3-Coder 是社群期待已久的大模型之一。4 月底時候就有人提出,希望確保 Qwen3coder 使用最新 / 更新的高質量程式碼進行訓練,尤其是針對系統程式語言的程式碼。還有開發者表示,希望 Qwen3-coder 能在 C 和 C++ 領域有更多涉獵。“現在的 AI 模型都針對 Web 和桌面開發進行了最佳化。但我們今天使用的很多技術仍然嵌入在智慧裝置中,而且由於對傳統硬體元件的依賴,大多數公司無法切換到 Rust。”
Qwen3-Coder 釋出後開發者們表現出了很大的熱情。
SnapEdit 聯合創始人兼執行長 Oscar Le 發推稱,“Qwen 從來沒有讓我失望過。現在大家不用再每月花 200 美元購買 Claude Code 了。”

蘋果研究員 Yufan Zhuang 也稱讚Qwen 正在推動開源人工智慧研究。
Qwen3-Coder 是千問系列模型中首個採用混合專家 MoE 架構的程式碼模型。在瀏覽器呼叫(WebArena)、工具呼叫(BFCL)等 Agent 能力評測中,Qwen3-Coder 重新整理開源模型紀錄,超越 GPT4.1;在考察模型自主規劃解決程式設計任務的 SWE-Bench 評測中,Qwen3-Coder 取得了開源最佳效果,媲美 Claude4。
據介紹,Qwen3-Coder 具備出色的 Agent 能力,尤為擅長解決多步驟的長任務,它能通觀全域性自主安排工作內容,支援 Agent 呼叫各種工具深入鑽研,最終解決複雜程式設計任務。官方實測資料顯示,在執行任務時,Qwen3-Coder 能夠呼叫的工具數量比 Claude 多幾倍,效果非常出色。
Qwen3-Coder 能幫助程式設計師完成基礎的程式設計任務,比如寫程式碼、補全程式碼、修 Bug 等,程式設計工作效率大幅提升,程式碼測試、查詢生成等工作從人工編寫的數小時驟降至數分鐘。同時,Qwen3-Coder 也極大降低了普通人入門程式設計的門檻,比如一句話就能生成精妙複雜的 3D 物理模擬過程:
Qwen Chat Web Dev:
用一句名言測試你的 WPM:
旋轉超立方體中的彈跳球:
太陽系模擬:
DUET 遊戲:
“我測試了該基準測試的幾個示例。預設基準測試使用的提示只要求回答問題。這意味著推理模型憑藉其較長的 COT(參見 QwQ)具有巨大的優勢。但當我更改提示詞,要求模型逐步推理並考慮所有細微的上下文時,更新後的 Qwen3 235B 表現明顯更好。”有開發者反饋道。
還有做了測試的開發者表示“速度快得離譜”。不過,也有開發者遇到了一些問題:“我嘗試讓它進行一些基本操作,如用 MCP 工具讀取一些檔案,但即使我詳細解釋瞭如何操作,它還是失敗了。”
另外,有開發者找到了阿里雲百鍊上的價格:

附:在 Claude Code 使用 Qwen3‑Coder 的方法
官方給出了 Qwen3‑Coder 與 Claude Code 搭配使用的具體方法,具體提供了兩種接入方式。
方案 1:使用 dashscope 提供的代理  API
只需要將 Anthropic 的 base url 替換成 dashscope 上提供的 endpoint 即可。
export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxyexport ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
至此,可以直接輸入 claude 開始使用 Qwen3-Coder & Claude Code
方案 2:使用 claude-code-config 自定義路由
claude-code-router 是一個第三方的路由工具,用於為 Claude Code 靈活地切換不同的後端 API。dashscope 平臺提供了一個簡單的擴充套件包 claude-code-config,可為 claude-code-router 生成包含 dashscope 支援的預設配置。
npm install -g @musistudio/claude-code-routernpm install -g @dashscope-js/claude-code-config
生成配置檔案和外掛目錄:
ccr-dashscope
該命令會自動生成 ccr 所需的配置檔案和外掛目錄。你也可以手動調整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。最後,透過 ccr 開始使用 Claude Code:
ccr code
會議推薦
首屆 AICon 全球人工智慧開發與應用大會(深圳站)將於 8 月 22-23 日正式舉行!本次大會以 “探索 AI 應用邊界” 為主題,聚焦 Agent、多模態、AI 產品設計等熱門方向,圍繞企業如何透過大模型降低成本、提升經營效率的實際應用案例,邀請來自頭部企業、大廠以及明星創業公司的專家,帶來一線的大模型實踐經驗和前沿洞察。一起探索 AI 應用的更多可能,發掘 AI 驅動業務增長的新路徑!
今日薦文
你也「在看」嗎?👇

相關文章