這周，AI圈的頭條只屬於這一家公司

最近大家有沒有覺得，AI 圈子又熱鬧起來了，天天測不完的新產品，測不完，根本測不完。。。

這才幾天安生日子，我尋思著最近的 Agent 沒玩夠呢，結果這兩天一開啟手機，好傢伙，又被阿里的 Qwen3 給刷屏了。

一開始我以為又是模型的小修小補，結果看了一週才發現，是我天真了。

阿里這次不是發了一款模型，也不是兩款，而是在短短一週內，來了個「三連發」，跟下餃子似的，接連扔出了三顆重磅炸彈。

這更新速度，敢情這是不打算讓友商睡覺了吧。

這次的更新到底有多強，我給大家聊聊看。

通義千問三連發

咱們按時間線捋一捋，你就知道這波操作有多密集、多有衝擊力了。

7 月 22 日先是通用模型「Qwen3-235B（Non-thinking）」更新上線。這相當於通義千問的常規主力部隊，但這次升級可不是換層皮那麼簡單，效能直接拉滿。

7 月 23 日緊接著，專門為碼農兄弟們打造的「Qwen3-Coder」程式碼模型正式釋出。這可是個大傢伙，引數高達 480B，主打一個「程式碼代理能力」，我雖然不是碼農，但最近也沒少玩。

今天 7 月 25 日壓軸登場的，是 Qwen3 系列的完全體，旗艦模型「Qwen3-235B-A22B-Thinking-2507」超級進化版上線。如果說前面兩個是 pro 版，那這個就是 Pro Max 版。

一週之內，通用智慧、智慧編碼、複雜推理三個維度全覆蓋了。這種爆發式的更新節奏，說實話，實屬罕見。堪稱是「阿里通義周」。

它已經不是簡單的「我有一個新模型很厲害」，而是擺明了說：「我不僅有一個，我還有一套完整的、覆蓋各個領域的頂級模型矩陣，而且我能以‘天’為單位進行迭代。」

這架勢，直接就把 AI 的競爭門檻又往上抬了一大截。

光說不練假把式，到底有多強？

當然，釋出得再熱鬧，關鍵還得看療效。畢竟咱們普通玩家，最關心的還是這玩意兒到底好不好用，夠不夠強。

我翻了翻官方網站和一些社群的反饋，發現阿里這次好像壓根沒把眼光放在國內的牌桌上。

1、Qwen3-235B（非思考版）：通用能力的六邊形戰士

首先是週一釋出的這個通用模型，你可以理解為啥都能幹一點的全能選手。

我在各大評測榜單上瞅了瞅，好傢伙，它在 GPQA（知識問答）、AIME25（數學）、LiveCodeBench（程式設計）等好幾個國際硬核測評裡，都把國內的強勁對手甩在了後面，甚至還超越了閉源模型裡的強手 Claude Opus 4 的非思考版本。

這是什麼概念呢，意味著在常規的指令遵循、邏輯推理、文字理解這些基礎活兒上，Qwen3 已經達到了一個非常恐怖的水平。而且，這次更新還特別提到了，長文字能力提升到了 256K ，並且在多語言的長尾知識覆蓋上進步顯著。

這相當於為整個 Qwen3 家族打下了一個極為堅實的地基——快、準、且知識面廣。

我在一些社群裡看到不少「自來水」的反饋，都說實際體驗下來，感覺模型對使用者意圖的理解更準了，回答也更有用，不再是那種正確的廢話。

2、Qwen3-Coder：最懂程式設計師的「程式碼代理」

週二釋出的這個 Coder 模型，引數量直接幹到了 480B ，雖然是 MoE 架構，啟用 35B 引數，但這體量在開原始碼模型裡絕對是巨無霸了。它最牛的地方在於所謂的「代理能力」（Agentic Coding）。

啥意思呢？就是它不光能幫你寫程式碼，還能像個真正的代理人一樣，幫你使用瀏覽器、呼叫工具，完成更復雜的程式設計任務。官方的說法是，它的整體能力已經可以和閉源的 Claude Sonnet 4 掰手腕了。

這表明阿里的野心，是要在 AI 最具產業化潛力的程式設計領域，定義下一個代際的標準。

為了讓這大傢伙的能力充分發揮，阿里還配套開源了一個命令列工具 Qwen Code ，可以說是相當貼心了。

3、Qwen3-235B（思考版）：直面全球頂流的「推理之王」

如果說非思考模式是「快」，那麼思考模式就是「深」。

今天正式推出的 Qwen3-235B-A22B 思考模型升級版本：Qwen3-235B-A22B-Thinking-2507。

這次升級就是要把 Qwen3 直接打造成一個能跟 Gemini-2.5 Pro 和 O4-mini 硬碰硬的六邊形戰士。

它不光是在程式設計（LiveCodeBench）和數學（AIME25）這種考驗邏輯推理的老強項上實現了效能再突破，就連知識問答（SuperGPQA）、寫作文（WritingBench）、多語言能力（MultilF）這些通用能力也全都補了上來，創下了全球開源模型的最佳效能表現。

更頂的是，新模型直接支援 256K 上下文長度，你丟給它一篇超長的報告當背景資料，它也能輕鬆讀完不懵圈。

它的目標非常明確，就是全球最強的開源推理模型。

這是什麼概念？這意味著中國的開源 AI，在最考驗模型「智商」的複雜推理能力上，已經有底氣去挑戰美國最頂級的閉源 AI 了。

這意味著，在需要複雜邏輯、深度思考和精妙推理的「AI 認知皇冠」上，開源模型第一次擁有了與全球最頂級閉源模型平起平坐的資格。

Qwen3 在全球受熱捧

這一下就把格局打開了。過去我們總覺得，開源的肯定比不上閉源的，國產的肯定要弱於美國的。但 Qwen3 的出現，似乎正在告訴我們：時代變了，大人。

「日更」背後，是阿里的「全家桶」戰略

通用、編碼、推理，三位一體。阿里在一週內構建起了一個完整的模型矩陣。

當對手還在慶祝攻下一個山頭時，阿里已經展示了它擁有隨意塑造整個戰場的地圖繪製能力。

可是，why baby，why？為什麼阿里能做到如此高頻且高質量的更新？

其實，如果你足夠關注 Qwen 的話，這「日更」般的節奏，其實只是阿里 AI 全棧佈局戰略執行力的一個外在表現。

國內很多廠商還停留在「單點低頻釋出」的階段，今天發個模型，過幾個月再更新一下。

而阿里玩的，是一套從底層到上層的組合拳，可以說阿里的佈局貫穿了晶片、模型、雲平臺、應用，再到社群生態的全鏈路。

這讓我想起了 Google，它靠的是 TPU 晶片 + Gemini 模型 + Search 搜尋，形成了一個強大的閉環。而阿里現在走的，是「阿里雲 + 通義千問 + 全鏈自研」的路徑，正在打造一個屬於中國 AI 的能力閉環。

一個模型強，可能是偶然；但一個體系裡的模型矩陣能做到週週更新、日日進化，這背後一定是深厚的技術積累和體系化的能力在做支撐。而且，阿里對 AI 的投入也是實打實的真金白銀。

官方已經宣佈未來三年要投入 3800 億元用於雲+AI，這手筆，堪稱是中國最大規模的 AI 資本下注了。

敲黑板，重點來了。

如今的阿里，不再僅僅是一個電商巨頭，而是一個與 Google、微軟在同一維度上思考和佈局的硬核科技公司。

結語

說實話，完整跟完阿里這一週的釋出，我心裡還是挺感慨的。

長期以來，世界 AI 領域都存在一個預設的鄙視鏈：美國的閉源模型，代表著絕對的行業標杆；而開源模型，無論多努力，似乎總是扮演著追趕者和平替的角色

Qwen3 的出現，可以說數次打破了我們對「國產模型上限」的偏見。

當一款來自中國的開源模型，在複雜推理能力上可以比肩 Gemini 2.5 Pro 時，這就不是一次簡單的效能追平，而是一次對整個 AI 格局的「掀桌子」行為。

「中國的開源 AI 都打得過美國的閉源 AI 了」，這句話在過去聽起來像是一種民族情緒的宣洩，但今天，它值得被重新冷靜評估。

更有趣的趨勢正在發生：當 Anthropic、OpenAI 等美國頂流模型，或明或暗地走向閉源，收緊訪問許可權時；以阿里為代表的中國廠商，卻在集體擁抱開源，以前所未有的速度向世界分享自己的核心能力。

現在看來，我現在對全球最強開源模型這個稱號有了更深的理解。它不僅僅是一個榜單上的排名，而且還說明——

在大模型賽道上，中國的大模型不僅有能力跟跑，更有能力定義新的遊戲規則。

當開源的力量足以撼動閉源的霸權，當「為愛發電」的社群開始擁有媲美「巨頭實驗室」的武器，一個屬於 AI 的「大航海時代」或許才真正來臨。

接下來，就看牌桌上的其他玩家，將如何應對這場由東方掀起的滔天巨浪了。

dignews.cc

這周，AI圈的頭條只屬於這一家公司

相關文章

不斷有人在問，這個中國模型到底有什麼魔力？

Qwen3釋出！超DeepSeekR1登頂開源榜，還帶來了跟R1不同配方

通義千問Qwen3系列AI模型正式釋出繼續採用開源模式引領AI開源社群發展

通義千問Qwen2.5-Coder全系列來咯！強大、多樣、實用！

深夜突襲，阿里Qwen3登頂全球開源王座！暴擊DeepSeek-R1，2小時狂攬17k星

阿里釋出Qwen3-Coder：4800億引數，實現開原始碼模型新SOTA

英偉達和阿里千問要搞個大事情？

阿里通義Qwen3上線，開源大軍再添一名猛將

為什麼李飛飛團隊經常cue通義千問？

阿里Qwen3深夜開源！8款模型、整合MCP，效能超DeepSeek-R1，2小時狂攬16.9k星