史無前例!DeepSeek最強殺手正式釋出

轉自:快科技
自DeepSeek火爆全球之後,國產開源大模型的開發熱潮一浪高過一浪。如今,DeepSeek誕生以來最強的對手,它來了!

阿里巴巴放出一枚重磅炸彈——通義千問最新開源模型QwQ-32B正式釋出,比DeepSeek更小的尺寸,效能比肩全球最強開源推理模型。
據瞭解,透過大規模強化學習,千問QwQ-32B在數學、程式碼及通用能力上實現質的飛躍,整體效能比肩DeepSeek-R1。
而且在保持強勁效能的同時,千問QwQ-32B還大幅降低了部署使用成本,在消費級顯示卡上也能實現本地部署。
目前,阿里已採用寬鬆的Apache2.0協議,將千問QwQ-32B模型向全球開源,所有人都可免費下載及商用。

開啟chat.qwen.ai,左上角選擇QwQ-32B-Preview

同時,使用者也將可透過通義APP免費體驗最新的千問QwQ-32B模型目前,QwQ-32B-Preview已經在(chat.qwen.ai)官網上線。
據通義千問Qwen團隊介紹,近期的研究表明,強化學習可以顯著提高模型的推理能力。例如,DeepSeek-R1透過整合冷啟動資料和多階段訓練,實現了最先進的效能,使其能夠進行深度思考和複雜推理。
而QwQ-32B就是大規模強化學習(RL)對大語言模型的智慧的提升作用的最好研究例證。

規模上,QwQ-32B是一款僅有320億引數的模型,其效能卻可與具備6710 億引數(其中370億被啟用)的DeepSeek-R1媲美。
另外,Qwen團隊還在推理模型中集成了與Agent相關的能力,使其能夠在使用工具的同時進行批判性思考,並根據環境反饋調整推理過程。
測試結果顯示,在測試數學能力的AIME24評測集上,以及評估程式碼能力的 LiveCodeBench中,千問QwQ-32B表現與DeepSeek-R1相當,遠勝於o1-mini及相同尺寸的R1 蒸餾模型
在由Meta首席科學家楊立昆領銜的“最難LLMs評測榜” LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確呼叫函式或工具方面的BFCL測試中,千問QwQ-32B的得分均超越了DeepSeek-R1。
此外,Qwen團隊還透過展示了一段簡短的示例程式碼,說明如何透過API使用 QwQ-32B。
Qwen團隊表示,我們希望我們的一點努力能夠證明強大的基礎模型疊加大規模強化學習也許是一條通往通用人工智慧的可行之路。
受此訊息影響,阿里巴巴港股大漲6.7%,截稿前報138.6港元,總市值2.63萬億港元。

END
官方站點:www.linuxprobe.com
 Linux命令大全:www.linuxcool.com

劉遄老師QQ:5604215
Linux技術交流群:2636170
(新群,火熱加群中……)
想要學習Linux系統的讀者可以點選"閱讀原文"按鈕來了解書籍《Linux就該這麼學》,同時也非常適合專業的運維人員閱讀,成為輔助您工作的高價值工具書!


相關文章