MLNLP社群是國內外知名的機器學習與自然語言處理社群，受眾覆蓋國內外NLP碩博生、高校老師以及企業研究人員。

社群的願景是促進國內外自然語言處理，機器學習學術界、產業界和廣大愛好者之間的交流和進步，特別是初學者同學們的進步。

來源 | Datawhale

作者 | 張龍斐

昨天凌晨，阿里開源了全新的推理模型：QwQ-32B。

據官方釋出訊息，該模型效能比肩滿血版 DeepSeek-R1（671B）！

可以看到在官方放出的評測圖中， QwQ-32B 與滿血版 DeepSeek R1（671B）在五項基準測試的得分不相上下，更是遠超同尺寸 R1 蒸餾模型。

看到了這些訊息後，我就開始上手深度測試。

QwQ-32B開源連結：

魔搭開源連結：https://modelscope.cn/models/Qwen/QwQ-32B

huggingface開源連結：https://huggingface.co/Qwen/QwQ-32B

線上體驗地址：

https://chat.qwen.ai/?models=Qwen2.5-Plus

本地部署：保姆級實戰教程

我在 AutoDL 上租用一張 4090，本地部署了一個 QwQ-32B-AWQ 量化版本。

寫了個保姆級部署教程，因篇幅原因，大家可以按需檢視～

教程地址：https://datawhaler.feishu.cn/docx/Wz2NdqSx1oEZsuxB9zHcEQ20nNe

根據命令列列印的資訊可以看到模型在一張 4090 GPU 上完美執行。我給他測試了最近很火的問題：

9.11 和 9.9 哪個更大？

推理一共花了 21.39 秒，結果如下所示：

實測下來，QwQ-32B-AWQ 量化版本視訊記憶體佔用不到 18GB ，一張 4090 綽綽有餘。而 32B 的 QwQ，也是完美適配消費級硬體。

效能實測

在 QwQ-32B 的效能方面，我分了程式碼能力、數學能力和邏輯能力三個維度進行測評。

首先是程式碼能力，我讓它“編寫一個 python 指令碼，顯示一個球在旋轉的六邊形內部彈跳。球應該受到重力和摩擦的影響，並且必須真實地彈跳 off 轉動的牆壁。”

可以看到，整個球體的彈跳和撞擊特別真實，就連小球帶動大框的效果都做出來了，很好的還原了真實的物理場景。

而 Grok-3 在這個問題上直接就炸了，小球直接自由落體。

然後我試了試它的數學能力。最近正好考研成績出了，我就拿了兩道數一的考研題進行了測試：

題目一：回答完全正確。

題目二：回答完全正確。

數學和程式碼作為 QwQ-32B 的主攻方向，確實是效果極佳。

最後的邏輯推理能力實測來自 unlock-deepseek 專案群。

有一道很有意思的題目：

下面我會給你一道數學單選題，請選出正確答案。題目資訊如下：

下面說法正確的是（）．

A：跳遠測距離，根據的是兩點之間線段最短．

B：跳高杆不會掉落，是因為兩點確定一條直線．

C：多條跑道找捷徑，根據的是垂線段最短．

D：同一路口白色斑馬線互相平行，是因為過直線外一點有且只有一條直線與已知直線平行．

這道題有多難呢，大家可以試試看，模型的思考過程真的特別精彩，上演了足足 7 分多鐘的左右腦互搏。。

但是 QwQ 還是回答出了正確答案。

結合數學、程式碼、邏輯推理三個維度的實測，QwQ 的實力還是挺強悍的，一點也不輸幾個主流的超大杯引數的推理模型。

Agent 相關能力：Function Call

QwQ-32B 中還集成了與 Agent（智慧體）相關的能力，支援函式呼叫。於是我也測試使用了一下，搭建了一個股票資料分析 Agent：

import osfrom openai import OpenAIimport efinance as efimport json# 設定模型的 API 地址openai_api_base = "http://localhost:8000/v1"api_key = "dummy_key"# 本地部署不需要真實 key# 例項化 OpenAI 客戶端client = OpenAI( api_key=api_key, base_url=openai_api_base,)# 定義可用的函式defquery_stock_code(stock_name):"""查詢股票程式碼"""try: stock_data = ef.stock.get_realtime_quotes(stock_name)return stock_data.to_dict('records')except Exception as e:return {"error": str(e)}defget_stock_history(stock_code, start_date=None, end_date=None):"""獲取股票歷史資料"""try: history_data = ef.stock.get_quote_history(stock_code, start_date, end_date)return history_data.to_dict('records')except Exception as e:return {"error": str(e)}defget_stock_financial(stock_code):"""獲取股票財務資料"""try: financial_data = ef.stock.get_financial_report(stock_code)return financial_data.to_dict('records')except Exception as e:return {"error": str(e)}# 定義函式對映function_map = {"query_stock_code": query_stock_code,"get_stock_history": get_stock_history,"get_stock_financial": get_stock_financial}# 定義函式描述，用於告訴模型可用的函式functions = [ {"name": "query_stock_code","description": "查詢股票的即時行情資料","parameters": {"type": "object","properties": {"stock_name": {"type": "string","description": "股票名稱或程式碼" } },"required": ["stock_name"] } }, {"name": "get_stock_history","description": "獲取股票的歷史行情資料","parameters": {"type": "object","properties": {"stock_code": {"type": "string","description": "股票程式碼" },"start_date": {"type": "string","description": "開始日期，格式為YYYY-MM-DD" },"end_date": {"type": "string","description": "結束日期，格式為YYYY-MM-DD" } },"required": ["stock_code"] } }, {"name": "get_stock_financial","description": "獲取股票的財務報表資料","parameters": {"type": "object","properties": {"stock_code": {"type": "string","description": "股票程式碼" } },"required": ["stock_code"] } }]definteractive_stock_query():"""互動式股票查詢功能"""print("歡迎使用股票查詢助手！您可以詢問任何有關股票的問題。輸入'退出'結束對話。")# 儲存對話歷史 conversation_history = []whileTrue: user_input = input("\n請輸入您的問題: ")if user_input.lower() in ['退出', 'exit', 'quit']:print("感謝使用，再見！")break# 新增使用者輸入到對話歷史 conversation_history.append({"role": "user", "content": user_input})try:# 呼叫模型，允許函式呼叫 response = client.chat.completions.create( model="QwQ-32B", messages=conversation_history, functions=functions, function_call="auto" ) assistant_message = response.choices[0].message# 新增助手回覆到對話歷史 conversation_history.append(assistant_message)# 檢查是否有函式呼叫if assistant_message.function_call: function_call = assistant_message.function_call function_name = function_call.name# 解析函式引數try: function_args = json.loads(function_call.arguments)except json.JSONDecodeError:print("函式引數解析錯誤")continueprint(f"正在呼叫函式: {function_name}")# 執行函式if function_name in function_map: function_to_call = function_map[function_name] function_response = function_to_call(**function_args)# 將函式執行結果新增到對話歷史 conversation_history.append({"role": "function","name": function_name,"content": json.dumps(function_response, ensure_ascii=False) })# 再次呼叫模型，讓它解釋函式執行結果 second_response = client.chat.completions.create( model="QwQ-32B", messages=conversation_history )# 輸出模型解釋print("\n助手:", second_response.choices[0].message.content)# 新增到對話歷史 conversation_history.append(second_response.choices[0].message)else:print(f"未知函式: {function_name}")else:# 直接輸出模型回覆print("\n助手:", assistant_message.content)except Exception as e:print(f"發生錯誤: {str(e)}")if __name__ == "__main__": interactive_stock_query()

成果展示：