

作者 | 陳駿達
編輯 | 漠影
智東西2月25日報道,今天,阿里通義千問團隊推出QwQ-Max-Preview深度思考模型,並支援聯網搜尋,展現出超強的通用能力,不僅現場銳評了最新的《哪吒2》電影,還能寫程式碼、做數學題,並可以勝任創意寫作、遊戲開發等開放性任務。這款模型會在不久後開源,目前已在通義千問的新官網上線,僅需點選聊天框左下角的“深度思考(QwQ)”按鈕即可體驗。
QwQ-Max-Preview的部落格文章有滿屏醒目的顏文字,並附上跳轉到體驗頁面和Discord的連結,還特別標註出這篇部落格是正是由新模型親自操刀的,模型撰寫部落格時的思考過程也被一併呈現在文內。

體驗連結:https://chat.qwen.ai/
Discord連結:https://discord.com/invite/yPEP2vHTu4
在DeepSeek推出DeepSeek-R1深度思考模型後,阿里和騰訊都爭相推出了類R1的深度推理模型。QwQ-Max-Preview基於Qwen2.5-Max構建,在數學、程式設計以及通用任務中展現了更強的能力,同時在與Agent相關的工作流中也有不錯的表現。作為即將釋出的QwQ-Max的預覽版,這個版本還在持續最佳化中。
通義千問團隊計劃在不久的將來以Apache 2.0許可協議開源釋出QwQ-Max以及Qwen2.5-Max。此外,通義千問計劃面向全球使用者推出Qwen Chat App,並開源更適合端側的小尺寸推理模型。
部落格內,通義千問團隊放出了多個實測案例。
通義千問的深度思考模型能與聯網功能結合,根據即時網際網路資訊進行推理,先來看看通義千問是怎麼評價《哪吒2》的。在開啟深度思考和聯網搜尋功能後,千問快速查詢網際網路資訊,並在思考過程中與答案裡都清晰地引用信源。

下方是QwQ對《哪吒2》的評價,截圖後由Qwen2.5-VL-72B-Instruct翻譯:

下一個案例主要展現了模型的程式碼能力。提示詞為“建立一個p5.js指令碼,用於在旋轉的球體內建立100個彈跳的黃色小球。小球被限制在球體內,並且正確處理了碰撞檢測。球體緩慢旋轉以產生動態效果。”

長時間思考後,QwQ-Max-Preview輸出了71行程式碼,並附上了對程式碼主要功能的描述和使用指南,可以說是十分全面了。複製程式碼並執行後,可以看到動畫的效果基本符合提示詞要求。

不過,當智東西將同款提示詞甩給體驗連結中的QwQ-Max-Preview,它給出的程式碼執行後可以說是“車禍現場”,黃色小球漫天飛舞,完全忽視了“小球被限制在球體內”這一要求。這一現象或許是由於預覽版本尚不穩定。

接下來的測試任務是遊戲開發。QwQ-Max-Preview收到的需求是:“在同一個HTML檔案中建立一個遊戲。發揮你的想象力,將俄羅斯方塊和2048遊戲結合成一個遊戲。”

模型開發出的新遊戲確實將兩款遊戲的玩法結合了起來,原版2048遊戲是透過滑動方塊進行相同數字的消除,而新遊戲中數字將會從上方掉落,需要玩家進行操作並消除。

這款模型還能勝任更為複雜的遊戲開發任務,例如下方提示詞這種帶調整的:
建立一個棋盤遊戲網頁,顯示一個六邊形網格,就像在《卡坦島》遊戲中一樣。每個六邊形網格都標有從1到N的數字,其中N是六邊形格子的總數。使其具有通用性,以便可以使用滑塊更改“環”的數量。例如,在《卡坦島》中,半徑為3個六邊形。請使用單個HTML頁面。
案例中模型對提示詞的理解還是比較到位的,拖動滑塊確實可以修改環的數量。

不過,在我們用同樣提示詞進行的實測中,完成效果依舊不太理想,從六邊形的形狀到格子的排列,都與原提示詞的要求有些偏差,還出現了超出顯示範圍的問題。或許在未來正式版釋出後,這些問題能得到解決。

通義千問思考模型本次還融入了Agent能力,支援工具選擇,不過目前的體驗版本尚不支援。在部落格文章中提供的案例裡,可以看到這些工具包括影像生成、物流追蹤、二維碼生成、港股行情等。

示例中,測試人員選擇了二維碼生成器和影像生成兩款工具,要求模型生成一個穿著白色連衣裙的女孩,然後展示一個指向taobao.com的二維碼圖片。
生成結果是這樣的,可以看到模型選擇了二次元的畫風,畫面內容符合要求,二維碼實測也可以跳轉至淘寶官網。

據通義千問團隊介紹,本次他們既會開源滿血版思考模型,也將推出輕量級的變體,還會將其融入應用,此舉是為了讓不同層次使用者都能體驗到這款模型的能力。他們也邀請全球開發者社群對這些模型進行實驗、最佳化和擴充套件,探索從教育工具到agent等多樣化應用場景。
QwQ-Max-Preview的釋出及將要到來的開源,意味著阿里也正式加入了這波推理模型的開源潮。阿里的Qwen系列模型作為當今全球影響力最大的開源模型家族之一,衍生模型數量已經超過9萬個,還霸榜了Hugging Face開源榜單的全球前10名。在正式版的QwQ-Max開源釋出後,或許還會給全球開發者帶來更多的驚喜。
(本文系網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)

DeepSeek的爆火,意味著行業已經來到分水嶺時刻。其背後的AI算力基建,正是來自工廠。聯想集團釋出2024/2025財年Q3財報主題科普影片第三集《AI工廠:數字孿生如何改造物理世界?》,回溯AI工廠百年進化通史,解構背後的數字孿生技術如何驅動工廠AI化。當下,聯想集團與DeepSeek的滿血合作,帶來低成本高效率革命,讓千行百業看似遙遠的AI化觸手可及。每個人與物理世界的關係都正在被重塑,速來一探究竟。

