
最近大家有沒有覺得,AI 圈子又熱鬧起來了,天天測不完的新產品,測不完,根本測不完。。。
這才幾天安生日子,我尋思著最近的 Agent 沒玩夠呢,結果這兩天一開啟手機,好傢伙,又被阿里的 Qwen3 給刷屏了。
一開始我以為又是模型的小修小補,結果看了一週才發現,是我天真了。
阿里這次不是發了一款模型,也不是兩款,而是在短短一週內,來了個「三連發」,跟下餃子似的,接連扔出了三顆重磅炸彈 。
這更新速度,敢情這是不打算讓友商睡覺了吧。
這次的更新到底有多強,我給大家聊聊看。
通義千問三連發
咱們按時間線捋一捋,你就知道這波操作有多密集、多有衝擊力了。
7 月 22 日先是通用模型「Qwen3-235B(Non-thinking)」更新上線。這相當於通義千問的常規主力部隊,但這次升級可不是換層皮那麼簡單,效能直接拉滿 。

7 月 23 日緊接著,專門為碼農兄弟們打造的「Qwen3-Coder」程式碼模型正式釋出。這可是個大傢伙,引數高達 480B,主打一個「程式碼代理能力」,我雖然不是碼農,但最近也沒少玩。

今天 7 月 25 日壓軸登場的,是 Qwen3 系列的完全體,旗艦模型「Qwen3-235B-A22B-Thinking-2507」超級進化版上線 。如果說前面兩個是 pro 版,那這個就是 Pro Max 版。
一週之內,通用智慧、智慧編碼、複雜推理三個維度全覆蓋了。這種爆發式的更新節奏,說實話,實屬罕見。堪稱是「阿里通義周」 。
它已經不是簡單的「我有一個新模型很厲害」,而是擺明了說:「我不僅有一個,我還有一套完整的、覆蓋各個領域的頂級模型矩陣,而且我能以‘天’為單位進行迭代。」
這架勢,直接就把 AI 的競爭門檻又往上抬了一大截。
光說不練假把式,到底有多強?
當然,釋出得再熱鬧,關鍵還得看療效。畢竟咱們普通玩家,最關心的還是這玩意兒到底好不好用,夠不夠強。
我翻了翻官方網站和一些社群的反饋,發現阿里這次好像壓根沒把眼光放在國內的牌桌上。
1、Qwen3-235B(非思考版):通用能力的六邊形戰士
首先是週一釋出的這個通用模型,你可以理解為啥都能幹一點的全能選手。
我在各大評測榜單上瞅了瞅,好傢伙,它在 GPQA(知識問答)、AIME25(數學)、LiveCodeBench(程式設計)等好幾個國際硬核測評裡,都把國內的強勁對手甩在了後面,甚至還超越了閉源模型裡的強手 Claude Opus 4 的非思考版本 。

這是什麼概念呢,意味著在常規的指令遵循、邏輯推理、文字理解這些基礎活兒上,Qwen3 已經達到了一個非常恐怖的水平。而且,這次更新還特別提到了,長文字能力提升到了 256K ,並且在多語言的長尾知識覆蓋上進步顯著。
這相當於為整個 Qwen3 家族打下了一個極為堅實的地基——快、準、且知識面廣。
我在一些社群裡看到不少「自來水」的反饋,都說實際體驗下來,感覺模型對使用者意圖的理解更準了,回答也更有用,不再是那種正確的廢話 。
2、Qwen3-Coder:最懂程式設計師的「程式碼代理」
週二釋出的這個 Coder 模型,引數量直接幹到了 480B ,雖然是 MoE 架構,啟用 35B 引數 ,但這體量在開原始碼模型裡絕對是巨無霸了。它最牛的地方在於所謂的「代理能力」(Agentic Coding) 。

啥意思呢?就是它不光能幫你寫程式碼,還能像個真正的代理人一樣,幫你使用瀏覽器、呼叫工具,完成更復雜的程式設計任務。官方的說法是,它的整體能力已經可以和閉源的 Claude Sonnet 4 掰手腕了 。
這表明阿里的野心,是要在 AI 最具產業化潛力的程式設計領域,定義下一個代際的標準 。

為了讓這大傢伙的能力充分發揮,阿里還配套開源了一個命令列工具 Qwen Code ,可以說是相當貼心了。
3、Qwen3-235B(思考版):直面全球頂流的「推理之王」
如果說非思考模式是「快」,那麼思考模式就是「深」。
今天正式推出的 Qwen3-235B-A22B 思考模型升級版本:Qwen3-235B-A22B-Thinking-2507。
這次升級就是要把 Qwen3 直接打造成一個能跟 Gemini-2.5 Pro 和 O4-mini 硬碰硬的六邊形戰士。
它不光是在程式設計(LiveCodeBench)和數學(AIME25)這種考驗邏輯推理的老強項上實現了效能再突破,就連知識問答(SuperGPQA)、寫作文(WritingBench)、多語言能力(MultilF)這些通用能力也全都補了上來,創下了全球開源模型的最佳效能表現。
更頂的是,新模型直接支援 256K 上下文長度,你丟給它一篇超長的報告當背景資料,它也能輕鬆讀完不懵圈。

它的目標非常明確,就是全球最強的開源推理模型。
這是什麼概念?這意味著中國的開源 AI,在最考驗模型「智商」的複雜推理能力上,已經有底氣去挑戰美國最頂級的閉源 AI 了 。
這意味著,在需要複雜邏輯、深度思考和精妙推理的「AI 認知皇冠」上,開源模型第一次擁有了與全球最頂級閉源模型平起平坐的資格。

Qwen3 在全球受熱捧
這一下就把格局打開了。過去我們總覺得,開源的肯定比不上閉源的,國產的肯定要弱於美國的。但 Qwen3 的出現,似乎正在告訴我們:時代變了,大人。
「日更」背後,是阿里的「全家桶」戰略
通用、編碼、推理,三位一體。阿里在一週內構建起了一個完整的模型矩陣。
當對手還在慶祝攻下一個山頭時,阿里已經展示了它擁有隨意塑造整個戰場的地圖繪製能力。
可是,why baby,why?為什麼阿里能做到如此高頻且高質量的更新?
其實,如果你足夠關注 Qwen 的話,這「日更」般的節奏,其實只是阿里 AI 全棧佈局戰略執行力的一個外在表現 。
國內很多廠商還停留在「單點低頻釋出」的階段,今天發個模型,過幾個月再更新一下。
而阿里玩的,是一套從底層到上層的組合拳,可以說阿里的佈局貫穿了晶片、模型、雲平臺、應用,再到社群生態的全鏈路 。
這讓我想起了 Google,它靠的是 TPU 晶片 + Gemini 模型 + Search 搜尋,形成了一個強大的閉環。而阿里現在走的,是「阿里雲 + 通義千問 + 全鏈自研」的路徑,正在打造一個屬於中國 AI 的能力閉環。

一個模型強,可能是偶然;但一個體系裡的模型矩陣能做到週週更新、日日進化,這背後一定是深厚的技術積累和體系化的能力在做支撐。而且,阿里對 AI 的投入也是實打實的真金白銀。
官方已經宣佈未來三年要投入 3800 億元用於雲+AI,這手筆,堪稱是中國最大規模的 AI 資本下注了。
敲黑板,重點來了。
如今的阿里,不再僅僅是一個電商巨頭,而是一個與 Google、微軟在同一維度上思考和佈局的硬核科技公司。
結語
說實話,完整跟完阿里這一週的釋出,我心裡還是挺感慨的。
長期以來,世界 AI 領域都存在一個預設的鄙視鏈:美國的閉源模型,代表著絕對的行業標杆;而開源模型,無論多努力,似乎總是扮演著追趕者和平替的角色
Qwen3 的出現,可以說數次打破了我們對「國產模型上限」的偏見。
當一款來自中國的開源模型,在複雜推理能力上可以比肩 Gemini 2.5 Pro 時,這就不是一次簡單的效能追平,而是一次對整個 AI 格局的「掀桌子」行為 。
「中國的開源 AI 都打得過美國的閉源 AI 了」,這句話在過去聽起來像是一種民族情緒的宣洩,但今天,它值得被重新冷靜評估。
更有趣的趨勢正在發生:當 Anthropic、OpenAI 等美國頂流模型,或明或暗地走向閉源,收緊訪問許可權時;以阿里為代表的中國廠商,卻在集體擁抱開源,以前所未有的速度向世界分享自己的核心能力。
現在看來,我現在對全球最強開源模型這個稱號有了更深的理解。它不僅僅是一個榜單上的排名,而且還說明——
在大模型賽道上,中國的大模型不僅有能力跟跑,更有能力定義新的遊戲規則 。
當開源的力量足以撼動閉源的霸權,當「為愛發電」的社群開始擁有媲美「巨頭實驗室」的武器,一個屬於 AI 的「大航海時代」或許才真正來臨。
接下來,就看牌桌上的其他玩家,將如何應對這場由東方掀起的滔天巨浪了。
