Qwen3,越過三重門

AI圈新產品的釋出,似乎已經很難讓人眼前一亮了。
但是,如果是一套產業級的佈局,和系統性的組合拳呢?
最近一段時間阿里雲的動作,在全球的AI社群,都引起了不小的震動。
接連三天,三款重量級模型的密集釋出,通義千問系列,亮出了新肌肉……
Qwen3,牆內開花牆外香
海外的AI開發者圈、AI業內人,對Qwen的評價一向不低。
都說同行相輕,但技術圈,說話還是看資料、看實力。
像海外最大的開發者社群HuggingFace的CEO Clem,就多次在X上重點談及Qwen3。

Perplexity的CEO,也很認可 Qwen3-coder 的實力:
推特創始人 Jack Dorsey 則是公開表示:qwen3-coder效能強勁,是一款讓他覺得“哇”的產品。
再比如備受技術圈關注的Hacker News網站,Qwen3釋出的熱度排名,高居第一。
我之前翻譯過幾次文章的a16z合夥人Marco,更是對Qwen3 Coder的效果表示驚訝!
那麼,Qwen3到底好在哪?
近期釋出的Qwen3家族都有哪些不一樣?
Qwen3“三重門”:跨越式升級
7月22日,阿里雲率先發布了 Qwen3-235B(Non-thinking)
這款非思考模式的旗艦模型,一經推出便在多個國際評測中展現出卓越效能。
在指令遵循、邏輯推理、文字理解、數學、科學、程式設計及工具使用等通用能力方面,Qwen3-235B表現出顯著提升。
具體來看,它在GPQA(知識問答)、AIME25(數學推理)、LiveCodeBench(程式設計能力)、Arena-Hard(人類偏好對齊)以及BFCL(Agent能力)等一系列基準測試中,其效能已經超越了國內的Kimi-K2和DeepSeek-V3等頂級開源模型。
https://qwen.readthedocs.io/en/latest/
更值得關注的是,在某些測試維度上,Qwen3-235B的效能甚至優於閉源的Claude Opus4非思考版本。
此次Qwen3-235B的更新,還特別強調了對多語言長尾知識的覆蓋能力,這意味著模型在處理非主流語言和特定領域知識時,表現更為出色。
此外,在主觀及開放性任務中,模型對使用者偏好的契合度顯著增強,能夠生成更符合使用者期望、質量更高的文字。
在上下文處理方面,Qwen3-235B將長文字能力提升到了 256K tokens,這對於處理長篇文件、程式碼庫或複雜的對話歷史具有重要意義。
僅僅一天之後,7月23日,阿里雲緊接著釋出了 Qwen3-Coder

這款模型被定位為通義千問家族中“最具程式碼代理能力”的模型。
首批上線的旗艦版本Qwen3-Coder-480B-A35B-Instruct,採用了 480B引數的MoE架構,其中啟用引數達到35B。
與Qwen3-235B相似,Qwen3-Coder也原生支援 256K上下文長度,並且可以透過Yarn等技術擴充套件至1M,為大型程式碼專案和複雜程式設計任務提供了充足的處理能力。
在核心能力上,Qwen3-Coder在Agentic Coding(代理式程式設計)、Agentic Browser-Use(代理式瀏覽器使用)和基礎程式設計任務上,取得了開源模型中的SOTA表現。
官方資料顯示,其整體程式設計智慧已能與Anthropic的 Claude Sonnet 4 相媲美。
為了進一步提升開發者體驗,阿里雲還同步開源了一款面向代理式程式設計的命令列工具 Qwen Code
這款工具基於Gemini CLI開發,並針對Qwen3-Coder增強了解析器和工具支援,旨在充分發揮模型在代理式程式設計任務中的潛力。Qwen3-Coder的釋出,無疑為開發者提供了更多選擇,也預示著AI輔助程式設計將進入一個更具智慧化和自動化水平的新階段。
而更引人注目的,是7月25日昨天剛釋出的 Qwen3-235B(Thinking)
這款模型被官方稱為Qwen3旗艦模型的“超級進化”,其效能表現已經達到可以 比肩Google Gemini 2.5 Pro 的水平。
作為目前全球最強的開源推理模型之一,Qwen3-235B(Thinking)在複雜推理任務中的能力提升,將使其在科學研究、複雜問題解決、邏輯分析等領域展現出巨大潛力。
它的推出,不僅是阿里在通用智慧領域深耕的成果,更是對開源模型能力邊界的一次重要拓展。
這三款模型,分別在通用智慧、智慧編碼和複雜推理這三大AI核心方向上實現了突破。
它們在多個國際評測中頻頻位居榜首,無疑鞏固了阿里在“全球最強開源模型”領域的地位,並凸顯了其在AI產業化程序中的技術實力。
阿里的AI策略與全棧佈局
阿里雲在AI領域的密集動作,並非偶然。
反映的是其對AI戰略的長期投入和全棧部署。
當外界還在討論單個模型的效能指標時,阿里已經開始以“日更”的節奏,展示其在AI基礎設施、模型研發、雲平臺整合以及生態建設上的協同能力。
這種策略的深層邏輯在於,阿里不僅致力於開發出高效能的模型,更著眼於構建一個完整的AI生態系統。
這與一些專注於單一模型或應用的公司形成對比。

以全球市場為例,Google透過其TPU硬體、Gemini模型和搜尋業務構建了自身的AI閉環。
而阿里則透過 阿里雲+通義千問+全鏈自研 的模式,正在形成中國AI的能力閉環。
這意味著從底層晶片、計算框架,到上層模型、應用服務,阿里都具備自研能力,從而實現對整個AI技術棧的深度掌控和最佳化。
在資本投入上,阿里也展現出了其對AI的決心。
官方資料顯示,阿里未來三年將投入 3800億元人民幣 用於雲和AI領域。
這筆鉅額投資,是中國企業在AI領域最大規模的資本下注,體現了阿里將AI視為核心增長引擎的戰略決心。
市場對於阿里的科技屬性也正在重新評估。

類似於AWS與Anthropic、Azure與OpenAI的合作模式,阿里正在構建“阿里雲+通義千問”的中國式路徑。
阿里雲作為國內領先的雲計算平臺,為通義千問系列模型提供了強大的算力支援、資料儲存和開發環境。
同時,通義千問模型的不斷升級和開源,也反過來豐富了阿里雲的AI服務能力,吸引更多開發者和企業使用者在其平臺上進行創新。
這種協同效應,使得阿里能夠提供從基礎設施到模型能力的端到端AI解決方案,從而提升其在企業級AI服務市場的競爭力。
相比國內其他廠商在AI模型釋出上呈現的“單點低頻”特點,阿里“三向齊發+高頻更新”的節奏,更反映出其在AI研發體系上的成熟度和體系化能力。
這種能力差距,使得阿里能夠更快地響應市場需求,將最新的技術成果快速推向市場,並在全球AI競爭中保持領先地位。
阿里,真正的全球玩家
長期以來,西方科技巨頭在AI基礎模型領域佔據主導地位,且多傾向於閉源發展,例如OpenAI的GPT系列。
然而,中國廠商尤其以阿里為代表,在近年來對開源的擁抱,正在逐步改變這一局面。

根據斯坦福大學2025年《AI指數》報告,中國AI與美國在效能上的差距已縮小至 0.3%,而阿里在全球AI領域的貢獻排名第三。
這些資料表明,中國在AI基礎研究和模型開發方面,正在快速追趕並縮小與頂尖水平的差距。
當美國頂流模型如GPT-4等逐步走向閉源,限制了外部開發者對其內部機制的瞭解和創新時,中國廠商卻集體加速開源程序,以Qwen為代表的模型,不僅將模型權重和程式碼開放給全球開發者,還積極構建活躍的社群生態。
在程式碼能力、推理能力、長文字上下文等關鍵指標上,Qwen3系列的表現足以與全球頂尖的閉源模型相抗衡,甚至在某些方面展現出超越的潛力。
例如,Qwen3-Coder在Agentic Coding上的表現可以與Claude Sonnet 4媲美,Qwen3-235B(Thinking)則能夠比肩Gemini 2.5 Pro。
這些事實表明,中國AI企業已從“技術受限者”的角色,逐步轉變為全球AI生態的“輸出者”和貢獻者。而阿里,無疑是這一轉變中的核心推動力量。
當AI開始走向中國創造
阿里雲的Qwen3系列模型密集釋出,無疑是本週全球AI領域最引人注目的事件之一。
這不僅僅是幾款高效能模型的問世,更是阿里在AI戰略上深耕細作、持續投入的體現。透過構建全棧式的AI能力,並堅持開源策略,阿里正在為中國乃至全球的AI發展描繪一幅新的圖景。
未來,它們有望在更廣泛的行業中落地,例如智慧客服、自動化程式設計、科學研究輔助、金融分析和醫療診斷等。
這場由阿里引領的“中國開源”浪潮,正在重塑全球AI的技術格局和商業競爭態勢。
它不僅展現了中國在AI技術上的崛起,也為全球AI的普惠和可持續發展提供了新的路徑。
中國創造,已經從小商品走向AI!

相關文章