阿里Qwen3-Coder攜1M上下文殺來！5分鐘生成網站，開發者狂歡：Claude Code可以解除安裝了

整理 | 褚杏娟

今天，阿里正式釋出了其“迄今為止最具代理能力的程式碼模型” Qwen3-Coder。

Qwen3-Coder 有多個版本，其中 Qwen3-Coder-480B-A35B-Instruct 是一個有 480B 引數、35B 啟用引數的 MoE 模型，原生支援 256K token 的上下文並可透過 YaRN 擴充套件到 1M token，擁有卓越的程式碼和 Agent 能力。據悉，該模型支援 358 種程式語言，在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了開源模型的 SOTA 效果，可以與 Claude Sonnet4 媲美。

與此同時，阿里還推出並開源了一款用於代理式程式設計的命令列工具：Qwen Code。Qwen Code 是一個 CLI 工具，修改自 Gemini CLI，針對 Qwen3‑Coder 系列的模型增強了解析器和工具支援。據悉，Qwen Code 基於 Gemini Code 進行二次開發，但團隊進行了 prompt 和工具呼叫協議適配，以最大程度激發 Qwen3-Coder 在 Agentic Coding 任務上的表現。另外，Qwen3-Coder 還可以和社群優秀的程式設計工具結合，如 Claude Code、Cline 等。

據介紹，藉助 Qwen3-Coder，剛入行的程式設計師一天就能完成資深程式設計師一週的工作，生成一個品牌官網最快只需 5 分鐘。

目前，Qwen3-Coder 已在魔搭社群、HuggingFace 等平臺開源，全球開發者都可以免費下載使用。截至發稿前，該模型已在 Github 上獲得 5.1k stars。此外，Qwen3-Coder 很快將接入阿里的 AI 程式設計產品通義靈碼，API 也已上線阿里雲百鍊。

相關地址：

https://github.com/QwenLM/Qwen3-Coder

https://huggingface.co/Qwen/Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder 訓練過程

預訓練

據悉，這次團隊從不同角度進行 Scaling，以提升 Qwen3-Coder 的程式碼能力：

資料擴充套件：總計 7.5T（程式碼佔比 70%），在保持通用與數學能力的同時，具備卓越的程式設計能力；
上下文擴充套件：原生支援 256K 上下文，藉助 YaRN 可拓展至 1M，專為倉庫級和動態資料（如 Pull Request）最佳化；
合成數據擴充套件：利用 Qwen2.5-Coder 對低質資料進行清洗與重寫，來顯著提升整體資料質量。

後訓練

團隊在更豐富的真實程式碼任務上進行了擴充套件 Code RL 訓練。與當前社群普遍聚焦於競賽類程式碼生成不同，團隊認為所有的程式碼任務天然適合執行驅動的大規模強化學習。透過自動擴充套件測試樣例，團隊構造了大量高質量的訓練例項，不僅顯著提升了程式碼執行成功率，還對其他任務帶來增益。

在真實世界的 Software Engneering Task，比如 SWE-Bench，模型需要在環境中不斷互動，自主規劃、選擇工具呼叫、接受反饋不斷做出新決策，這是一個典型的 Long-Horizon RL 任務。

團隊在 Qwen3-Coder 的後訓練階段執行了 Agent RL，鼓勵模型透過多輪互動的方式利用工具解決問題。據介紹，Agent RL 的主要挑戰在於 Environment Scaling，團隊實現了可驗證環境的擴充套件系統，藉助阿里雲的基礎設施，實現同時執行 20k 獨立環境。這一套基礎設施可以提供大規模的強化學習反饋和評測，最終我們在 SWE-bench Verified 上實現了開源模型 SOTA 的效果。

效果如何？

Qwen3-Coder 是社群期待已久的大模型之一。4 月底時候就有人提出，希望確保 Qwen3coder 使用最新 / 更新的高質量程式碼進行訓練，尤其是針對系統程式語言的程式碼。還有開發者表示，希望 Qwen3-coder 能在 C 和 C++ 領域有更多涉獵。“現在的 AI 模型都針對 Web 和桌面開發進行了最佳化。但我們今天使用的很多技術仍然嵌入在智慧裝置中，而且由於對傳統硬體元件的依賴，大多數公司無法切換到 Rust。”

Qwen3-Coder 釋出後開發者們表現出了很大的熱情。

SnapEdit 聯合創始人兼執行長 Oscar Le 發推稱，“Qwen 從來沒有讓我失望過。現在大家不用再每月花 200 美元購買 Claude Code 了。”

蘋果研究員 Yufan Zhuang 也稱讚Qwen 正在推動開源人工智慧研究。

Qwen3-Coder 是千問系列模型中首個採用混合專家 MoE 架構的程式碼模型。在瀏覽器呼叫（WebArena）、工具呼叫（BFCL）等 Agent 能力評測中，Qwen3-Coder 重新整理開源模型紀錄，超越 GPT4.1；在考察模型自主規劃解決程式設計任務的 SWE-Bench 評測中，Qwen3-Coder 取得了開源最佳效果，媲美 Claude4。

據介紹，Qwen3-Coder 具備出色的 Agent 能力，尤為擅長解決多步驟的長任務，它能通觀全域性自主安排工作內容，支援 Agent 呼叫各種工具深入鑽研，最終解決複雜程式設計任務。官方實測資料顯示，在執行任務時，Qwen3-Coder 能夠呼叫的工具數量比 Claude 多幾倍，效果非常出色。

Qwen3-Coder 能幫助程式設計師完成基礎的程式設計任務，比如寫程式碼、補全程式碼、修 Bug 等，程式設計工作效率大幅提升，程式碼測試、查詢生成等工作從人工編寫的數小時驟降至數分鐘。同時，Qwen3-Coder 也極大降低了普通人入門程式設計的門檻，比如一句話就能生成精妙複雜的 3D 物理模擬過程：

Qwen Chat Web Dev：

用一句名言測試你的 WPM：

旋轉超立方體中的彈跳球：

太陽系模擬：

DUET 遊戲：

“我測試了該基準測試的幾個示例。預設基準測試使用的提示只要求回答問題。這意味著推理模型憑藉其較長的 COT（參見 QwQ）具有巨大的優勢。但當我更改提示詞，要求模型逐步推理並考慮所有細微的上下文時，更新後的 Qwen3 235B 表現明顯更好。”有開發者反饋道。

還有做了測試的開發者表示“速度快得離譜”。不過，也有開發者遇到了一些問題：“我嘗試讓它進行一些基本操作，如用 MCP 工具讀取一些檔案，但即使我詳細解釋瞭如何操作，它還是失敗了。”

另外，有開發者找到了阿里雲百鍊上的價格：

附：在 Claude Code 使用 Qwen3‑Coder 的方法

官方給出了 Qwen3‑Coder 與 Claude Code 搭配使用的具體方法，具體提供了兩種接入方式。

方案 1：使用 dashscope 提供的代理 API

只需要將 Anthropic 的 base url 替換成 dashscope 上提供的 endpoint 即可。

export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxyexport ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey

至此，可以直接輸入 claude 開始使用 Qwen3-Coder & Claude Code

方案 2：使用 claude-code-config 自定義路由

claude-code-router 是一個第三方的路由工具，用於為 Claude Code 靈活地切換不同的後端 API。dashscope 平臺提供了一個簡單的擴充套件包 claude-code-config，可為 claude-code-router 生成包含 dashscope 支援的預設配置。

npm install -g @musistudio/claude-code-routernpm install -g @dashscope-js/claude-code-config

生成配置檔案和外掛目錄：

ccr-dashscope

該命令會自動生成 ccr 所需的配置檔案和外掛目錄。你也可以手動調整~/.claude-code-router/config.json 和 ~/.claude-code-router/plugins/ 中的配置。最後，透過 ccr 開始使用 Claude Code：

ccr code

會議推薦

首屆 AICon 全球人工智慧開發與應用大會（深圳站）將於 8 月 22-23 日正式舉行！本次大會以 “探索 AI 應用邊界” 為主題，聚焦 Agent、多模態、AI 產品設計等熱門方向，圍繞企業如何透過大模型降低成本、提升經營效率的實際應用案例，邀請來自頭部企業、大廠以及明星創業公司的專家，帶來一線的大模型實踐經驗和前沿洞察。一起探索 AI 應用的更多可能，發掘 AI 驅動業務增長的新路徑！