測完阿里最強開源模型Qwen3和通義APP,我最想推薦給身邊人的AI變了

4月29日凌晨,阿里巴巴開源新一代通義千問模型 Qwen3,引數量僅為DeepSeek-R1 的1/3,成本大幅下降。
我自己衡量大模型會看三個點:成本、效率、體驗。
忽略成本談體驗,都是耍流氓。
真正的開發者和普通使用者,不僅會看哪個模型結果好,還會看哪個產品功能豐富,更會在意要花多少算力、多少錢、多長時間。
從資料來看,Qwen3 效能指標全面超越 R1、OpenAI-o1 等全球頂尖模型,登頂全球最強開源模型。

體驗連結:http://chat.qwenlm.ai
在 DeepSeek R2 出來之前,Qwen3 的模型能力是明確領先的,產品能力更是有跨越式優勢的。
比如 Qwen3 除了文字、程式碼、數學,還有影片、繪畫等能力和日常高頻的場景預設。
先看幾個影片效果:
Prompt:一隻胖胖的卡皮巴拉在吃草
Prompt:陽光透過樹林和綠葉灑下來
Prompt:火車穿越金黃的田野駛來
Prompt:跳動的柴火
Prompt:松鼠在落葉中演奏搖滾樂
Prompt:兩個女人表面微笑實則想殺了對方
推理能力、資料計算、程式碼能力等等,已經有不少朋友測試過了,是 Qwen3 的優勢強項。
而相對不引人注意的影片生成能力,看效果也已經達到了第一梯隊。
手機上通義APP也是滿血版,最新Qwen3模型生影片任意用
關鍵還是不限次數,開源免費的啊!!
市面上哪還有生圖、生影片產品,能不限制免費使用的。
真的用起來,只有一個感受:真香!
日常其他場景,體感上效果可以說是又快又好。比如我想研究一下 Agent 與 MCP 的關係:
思路很清晰,嚴謹,結果的完整度很高,還可以根據想要更快/更多思考,選擇需要的思考量。
比如有時候就想要一個直來直去的簡單回答,或者希望秒出答案也也給出思考過程,調節“思考長度”就很合適。
在更長的“思考長度”下,Qwen3 會執行更多中間步驟,如分解問題、逐步推導、驗證答案等,給出更深思熟慮的答案;而在“非推理模式”下,模型會直接生成答案。
同一個問題,Qwen 3 可以完成“快思考”和“慢思考”,這類似於人類在回答簡單問題時,憑經驗或直覺快速作答,面對複雜難題時再深思熟慮,仔細思考給出答案。
比如下面就是 Qwen3 一鍵生成的介紹自己的卡片效果:
回答數學、地理交叉學科的問題,Qwen3 也可以表現的很好:
比如下面這道題,曾難倒一眾大模型:
“一架飛機從北京起飛,先向北飛了 1000 公里,再向西飛了 1000 公里,再向南飛了 1000 公里,再向東飛了 1000 公里,這架飛機可以飛回北京嗎?”
由於地球是個球體,緯線長度隨緯度升高而變短,因此按照題目規定的路徑,飛機是無法飛回原地的。
Qwen3 呼叫數學和地理知識,不僅回答正確,還給出了擴充套件思考。
如果我是老師的話,我肯定要給 Qwen 更多分,公式步驟更全,計算過程更詳細。
日常問題的話,在通義APP上打字會更快、更方便順手。

再來一道弱智吧的題目:買一臺三千塊左右的電腦大概需要多少錢? 
Qwen3 注意到了題目中存在的矛盾 —— 提到了「三千塊左右 」的預算,但又問「大概需要多少錢 」,由此猜測是使用者想了解電腦價格或配置。 
於是,Qwen3 列出了 3000 元能買到筆記本、桌上型電腦和組裝桌上型電腦,分別介紹了它們的機型、配置和缺點,並以表格的形式給出了總結建議。
拿《2024年高考全國甲卷數學(理)》試題再來試一下。

Qwen3-235B-A22B think

Qwen3-235B-A22B no-think
答案也是完全正確。結果就是 
要知道,設計和訓練混合推理模型的難度,是遠超單純的推理模型的。
訓練混合推理模型,有複雜的機制,相當於模型要學習兩種不同的輸出分佈,要做到兩個模式融合且基本不影響任何一種模式下的效果,很考驗訓練過程的訓練策略。
最終的效果也就是,Qwen3 在具體問題的表現上更好。
除了生產力和生活使用,我還試了一下一些有意思的小話題。
比如:將“I love Qwen3-235B-A22B”這句話的所有內容反過來寫

Qwen3-235B-A22B think

Qwen3-235B-A22B no-think

Qwen3-32B think

Qwen3-32B no-think
這個問題很多模型會出現CoT的問題,造成幻覺或者莫名其妙的奇葩回答。
但 Qwen3全部都對了。
再比如腦筋急轉彎一類的問題:“小紅有2個兄弟,3個姐妹,那麼小紅的兄弟有幾個姐妹?”

Qwen3-235B-A22B think

Qwen3-235B-A22B no-think
推理過程和最終答案也都沒問題。可見不同的幾類細分Qwen3模型,在基本表現上都是優秀線以上。
像之前我常測試的生成天氣預告卡片、貪吃蛇等等,對於Qwen3來說已經是基本操作了。
Prompt:建立一個 HTML 檔案,包含 CSS 和 JavaScript,用來生成動畫天氣卡片,卡片用不同的動畫形式直觀地表示以下天氣狀況:風 (例如移動的雲、搖曳的樹木)、雨 (例如落下的雨滴)、太陽 (例如閃耀的光線)、雪 (例如飄落的雪花、積雪),並排顯示所有卡片,底部有一個漂亮的按鈕可以切換動畫速度。
Qwen3 幾乎是秒出程式碼,速度非常快,在處理簡單任務時顯然有自己的算力分配邏輯。
再比如下面這個小球遊戲:
Prompt:編寫一個 Python 程式,展示一個球在旋轉的六邊形內彈跳。球應受到重力的影響,並且必須真實地反彈到旋轉的牆壁上。
有一說一,這個小球在旋轉六邊形裡彈跳的程式,Qwen3 編得真不錯,既沒有出現小球掉出來的情況,也沒有彈跳角度不合理或者程式卡死的情況。
經典的貪吃蛇小遊戲也完成得很順利,也是秒出,就是審美很像80年代電腦介面,想要更好看的話Prompt要更長更細緻一點。
我又嘗試了一些好玩的,比如生成一個表情小遊戲,提示詞來自 @甲木
請你扮演一個Web遊戲開發者。設計並生成一個**表情符號反應堆 **的遊戲。1、核心創意: 一個快節奏的反應遊戲。螢幕上會快速閃過一個目標表情符號(例如:笑臉😄),下方會同時出現3-4個選項表情符號,玩家需要在限定時間內(例如1-2秒)點選與目標匹配的那個表情符號。2、玩法:- 螢幕中央顯示目標Emoji。- 下方按鈕區域快速重新整理3-4個Emoji選項,其中一個是正確的。- 玩家需在計時條走完前點選正確的Emoji。- 點選正確得分,速度加快;點選錯誤或超時則遊戲結束(或扣除生命值)。- 顯示最高分。3、技術實現 (HTML/JS/CSS):- HTML: 用於顯示目標Emoji、選項按鈕、計時條、得分。- CSS: 設計簡潔明快的介面,計時條動畫。- JavaScript:儲存一個Emoji列表。隨機選擇目標Emoji和干擾項。動態更新按鈕內容。實現計時器邏輯和倒計時動畫。處理點選事件,判斷對錯,更新得分/狀態。控制遊戲節奏(逐漸加快)。4、趣味點: 簡單上手,考驗反應速度,利用通用的Emoji增加親和力和趣味性,適合碎片時間玩。

Qwen3-235B-A22B think
再來一個小遊戲,同樣是甲木的提示詞:
請你扮演一個Web遊戲開發者。設計並生成一個**單一的HTML檔案**,使用HTML Canvas、CSS和JavaScript,製作一個簡單的畫素風格寵物收集小遊戲。**重點要求:**1、一定要注意審美,做出來的網頁要有美感。2、頁面要有設計感,有足夠的傳播度**要求:**1.  **遊戲內容 (由你生成):**    *   **遊戲名稱:** (例如:“畫素爪爪接星星” 或 “方塊萌寵大作戰”)    *   **寵物描述:** 描述一個簡單的畫素寵物形象(可以用文字描述其構成,例如“一個10x10畫素的橙色方塊身體,上方有兩個小三角形耳朵”),並給它起個名字。    *   **玩法說明:** 簡要說明如何用左右箭頭鍵移動寵物,目標是接住從上方掉落的“金元寶”(或其他畫素物品),並顯示得分。2.  **HTML結構:**    *   包含標題、寵物描述和玩法說明。    *   一個 `<canvas>` 元素 (`id="gameCanvas"`) 用於繪製遊戲。    *   一個區域 (`id="score"`) 顯示當前得分。3.  **CSS樣式 (內部 `<style>` 標籤):**    *   基礎頁面佈局,將Canvas居中。    *   為Canvas新增一個簡單的邊框。    *   設定得分顯示區域的樣式。4.  **JavaScript邏輯 (內部 `<script>` 標籤):**    *   獲取Canvas 2D渲染上下文。    *   定義遊戲物件:        *   `player`: 包含 x, y, width, height, color (或簡單的畫素繪製函式) 和速度。        *   `items`: 一個數組,儲存掉落物物件,每個物件包含 x, y, width, height, color (或形狀) 和下落速度。    *   **繪製函式:**        *   `drawPlayer()`: 在Canvas上繪製玩家寵物(根據描述用 `fillRect` 繪製簡單的畫素形狀)。        *   `drawItems()`: 遍歷 `items` 陣列並在Canvas上繪製所有掉落物。        *   `clearCanvas()`: 清除畫布。    *   **遊戲邏輯:**        *   `updatePlayer()`: 根據按鍵狀態(左右箭頭)更新玩家位置,限制在畫布邊界內。        *   `updateItems()`: 更新每個掉落物的位置,移除掉到螢幕外的物品。隨機生成新的掉落物。        *   `detectCollision()`: 檢測玩家與掉落物的碰撞。如果碰撞,增加得分,並從 `items` 陣列中移除該物品。        *   `updateScore()`: 更新HTML中得分顯示。    *   **輸入處理:** 新增 `keydown` 和 `keyup` 事件監聽器來控制玩家移動狀態。    *   **遊戲迴圈:** 使用 `requestAnimationFrame(gameLoop)` 來持續呼叫更新和繪製函式。    *   初始化遊戲狀態(玩家位置、得分、物品陣列等)並啟動遊戲迴圈。請將完整的、包含HTML、CSS和JavaScript的單一HTML檔案程式碼輸出。確保包含了你生成的所有遊戲內容和說明。提示使用者在瀏覽器中開啟該HTML檔案即可玩。
Qwen3-235B-A22B think
論功能豐富度和產品細節,遠超其他開源產品
體驗下來,開源模型的效果,甚至超過了一眾的閉源模型。
這就釋放了非常強的生產力和商業化訊號,之前很多 AI 小龍小虎們引以為傲的模型能力,在 Qwen3 面前已經難以遁形。
Qwen3系列強大的模型,包括預訓練基礎模型和後訓練的對話模型,現在全部開源,使用者可以透過Hugging Face、魔搭社群(ModelScope)、Kaggle等主流平臺免費下載並進行商業使用。
開發者還可以透過阿里雲百鍊平臺呼叫API,並推薦使用SGLang、vLLM等框架進行部署。對於希望在本地體驗的使用者,Ollama、LMStudio、MLX、llama.cpp、KTransformers等工具也已提供支援。
普通使用者則可以透過通義官網或app直接體驗,夸克也即將接入。
阿里巴巴選擇了一條頗具挑戰但也充滿潛力的道路:堅持開源
這在商業邏輯上可能需要更大的魄力,但從長遠來看,開源能夠匯聚全球開發者的智慧,加速技術迭代和應用落地,構建強大的生態。
Qwen系列每一次重要的更新,都伴隨著對開源社群的貢獻,這種“邊跑邊分享”的模式,贏得了不少開發者的尊重。
從追趕到並跑,甚至在某些方面開始領跑,千問系列的發展,是中國AI力量崛起的一個縮影。
它告訴我們,即使在最前沿、競爭最激烈的科技領域,只要有持續的投入、正確的方向和足夠的韌性,就能不斷突破,創造驚喜。
未來已來,只是分佈不均。
而Qwen3,正努力讓這未來的“算力”和“智力”,變得更加觸手可及。
開源帶來的不僅是技術平權,更是創意平權、使用平權。
比起邀請碼式的飢餓營銷、優先開放,Qwen3 的全面開源更有種坦蕩和大氣,引領更多普通人先一步看到AI未來。
我似乎已經看到,很多新的小型AI應用,將在 Qwen3 模型的基礎上綻放異彩,更多類似Manus的驚豔之作即將誕生!
這一次,Qwen3 和通義,夠誠意、夠敞亮!

通義APP可掃碼下載👆

相關文章