阿里開源新一代通義千問模型Qwen3

2025-08-21 09:48 第一財經

4月29日凌晨，阿里巴巴開源新一代通義千問模型Qwen3（簡稱千問3），引數量為DeepSeek-R1的1/3，成本大幅下降。千問3是“混合推理模型”，“快思考”與“慢思考”整合進同一個模型，對簡單需求可低算力“秒回”答案，對複雜問題可多步驟“深度思考”，節省算力消耗。

千問3總引數量235B，啟用僅需22B。阿里稱僅需4張H20即可部署千問3滿血版，視訊記憶體佔用僅為效能相近模型的三分之一。

千問3模型版本包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。API可按需設定“思考預算”（即預期最大深度思考的tokens數量），進行不同程度的思考，滿足AI應用和不同場景對效能和成本的多樣需求。比如，4B模型面向手機端，8B可在電腦和汽車端側部署應用等。