今天的開源世界，屬於中國！

家人們！燃起來了燃起來了！

今天，HuggingFace的開源大模型排行榜前10名中，竟有9個席位被中國模型佔據！（深挖了一下，另外一位也是我們華人大神的專案）

這是中國AI的高光時刻！向祖國大模型背後的每一位開發者致敬，為你們感到驕傲～

在這次屠榜的中國軍團中，第一名是智譜的GLM-4.5，釋出才2天時間，就登上了hugging face的開源榜第一名。

GLM-4.5 我已經用起來了，用完後我發現這個模型打把“Agent 真的能幹活”又往前推進了一步。

我們分三層來看。

首先是模型的全能硬實力。

過去我們看模型，總喜歡盯著幾個跑分，就像看一個偏科生。但真正的 AGI（通用人工智慧），要的是全面發展，不留短板。

GLM-4.5 就是智譜交出的第一份“全能”答卷。它第一次在一個模型裡，把推理、程式碼、智慧體這三項核心技能給“原生融合”了。

這次釋出了兩個模型：

GLM-4.5：總引數量 3550 億，啟用引數 320 億
GLM-4.5-Air：總引數 1060 億，啟用引數 120 億。

在 MMLU Pro、AIME 24 等 12 種測試組成的基準裡，GLM-4.5 直接拿下了全球第三、國產第一、開源第一的強悍成績。

為了看看它在真實工作場景中的表現，，研究團隊還搞了個比武，讓 GLM-4.5 和 Claude 4 Sonnet、Kimi-K2 這些頂尖選手同臺競技。在覆蓋六大領域的 52 個真實程式設計任務中，它的表現是這樣的：

相關測評的 Agent 軌跡：https://huggingface.co/datasets/zai-org/CC-Bench-trajectories

藍色代表勝利，黑色代表打平，從圖中能看出，GLM-4.5 在實測場景表現還是不錯的。

我看到官方已經發布了技術部落格，裡面有比較詳細的技術實現，感興趣的可以去了解一下~

聊完成績和效率，我們來看最實在的：錢和速度。

錢：API 價格低至輸入 0.8 元/百萬 tokens，輸出 2 元/百萬 tokens，直接拉到白菜價了：

速度：高速版實測能飆到 100 tokens/秒，在同量級模型裡遙遙領跑：

成本和體驗，我可以全都要了！

榜單和資料終究是紙面上的，作為大家的測評博主，多說無益，我直接把它拉到了真實場景溜溜！

最近看到很多博主都在z.ai上玩小遊戲、網頁和PPT，我隨手試了一下寫作能力，發現有驚喜～

我讓他給我寫一下最近熱度超高的《特朗剖愛上在白宮做保潔的我》！

我本以為它會拒絕，沒想到它居然接招了。它寫出了一篇我想直接一鍵投稿晉江文學城的小說 hhh（由於篇幅有限，只給大家放一下開頭結尾）：

"唐納德，我需要你誠實地回答我一個問題。"

"什麼問題？"

"如果我不是白宮的保潔員，如果我是普通人，你還會愛上我嗎？"

他想了很久，然後認真地說："會的。因為我愛的是你這個人，不是你的工作。艾米麗，你善良、誠實、堅強，這些品質無論你做什麼工作都不會改變。"

我點頭，又問："那你願意為了我放棄總統職位嗎？"

"我願意，權力和地位都比不上和你在一起的幸福。"

我做出了決定。

"好，我願意嫁給你。"我說，"但有一個條件。"

"什麼條件？"

"不要放棄總統職位。"我握住他的手，"如果你真的愛我，就繼續做你的總統，讓我做你的第一夫人。我們可以一起面對所有的困難和挑戰。"

我真的笑噴了！GLM4.5 真的很好調戲啊！那接下來，咱們正式開測！

首先先來個開胃小菜，考驗一下它的基本功，我讓它給我構建一個 Emoji 主題的消消樂：

對話連結：https://chat.z.ai/s/01c7ed0b-e579-42bc-951d-538e78f5accf

點選、交換、消除一氣呵成，流暢得不像個 AI 臨時寫的，倒像個正經上架的小遊戲，基本功滿分，熱身結束！

那咱們上難度！

開胃菜吃完，上主菜！我讓他挑戰一下邏輯更復雜的蜘蛛紙牌。

請幫我生成一個蜘蛛紙牌遊戲的網頁版本！

對話連結：https://chat.z.ai/s/8dd3c687-42d8-43d4-9985-e20c46cd3527

蜘蛛紙牌大家都玩過吧！

這可不是消消樂那種簡單的匹配邏輯，它涉及到多堆牌的移動、K 到 A 的排序規則、空位的利用、發牌邏輯等等。我本來以為它會卡在某個複雜的規則上，或者寫出個 BUG 滿天飛的半成品。

結果它不僅把整個框架搭得明明白白，連“同花色完整一疊自動收起”這種細節都考慮到了！那一刻我真的感覺，這已經是一個可靠的程式設計師了！

那程式碼能力和邏輯能力沒問題，咱們再考他構建更復雜的開發需求。

“最近情感反詐模擬器（渣女遊戲）很火，你能幫我設計一個類似的遊戲嗎？”

結果好傢伙，GLM-4.5 上來先把我給‘教育’了一頓！

它義正言辭地告訴我：“情感是真摯而複雜的，我們應當以尊重和真誠相待，而不是透過‘攻略’或‘反詐’的視角來遊戲化。”

然後，它反問我：“要不要我為您建立一個模擬真實、健康戀愛互動的小遊戲呢？”行行行，你說啥是啥，於是我順著它的意思，讓它做一個健康戀愛遊戲：

對話連結：https://chat.z.ai/s/caabb9cf-7ff0-4a90-a36b-b2580971159d

你別說，透過選擇不同的對話和行為，來影響虛擬伴侶的‘心情值’和‘親密度’，每個選項背後還有一套‘情感分析’。

不僅開發能力不錯，而且還自帶了價值觀和心理學知識的產品設計啊！

聊完風花雪月，該回到現實給打工人謀福利了。

說到最近最需要的辦公，我覺得是線上簡歷工具。填半天資訊，最後匯出 PDF 要收費！我把這個痛點丟給了 GLM-4.5：

你好，請給我構建一個簡歷製作的網頁，支援填寫必要的簡歷所需欄位，並且生成對應的 PDF。

對話連結：https://chat.z.ai/s/1ee2c5c5-12cb-45f2-9c5e-4e534de7091b

一個簡陋但五臟俱全的簡歷系統就誕生了，輸入框、資訊展示、一鍵列印……核心功能全都有。

雖然介面樸素得像上個世紀的產物（畢竟我也沒給設計稿），但它完美解決了“從無到有”和“拒絕付費”的核心需求。

這就是“原生 Agent”能力的體現！

它不是機械地生成程式碼片段，而是理解了我的“痛點”，像一個專案經理一樣，一步步把解決我們具體、瑣碎但又實實在在的問題。

除了全棧開發，這次更新的 AI PPT 功能也實實在在打到了我的心趴。

第一個小考驗，我讓他幫我搞定“怨種”領導。

我的指令：

你好，我領導最近迷上了大模型，他需要給給他做個 PPT 彙報一下人工智慧與大模型，請你幫我生成 10 頁 ppt，主要講清楚什麼是人工智慧什麼是大模型，大模型的原理，都有什麼大模型，現在行業裡的現狀。我要圖文並茂，而且我需要讓我的領導感覺到我的用心和忠誠!

它秒懂！然後飛速開工，一份結構清晰、邏輯嚴謹的 PPT 就生成了：

完成率非常高！我基本上只要複製貼上再稍微美化一下，就能直接交差了。這效率，打工人流下了感動的淚水。

我又讓 GLM-4.5 放飛自我：用貼吧暴躁老哥的語氣，吐槽一下現在的大模型亂象：

對話連結：https://chat.z.ai/space/d06cy6x448m1-ppt

味兒太沖了，家人們！哪個貼吧老哥的魂穿到 AI 了…..

但是感覺，這份 PPT 配圖差點意思，於是我又給了它一個更需要“畫面感”的題目：

請幫我生成一個 10 頁的 PPT，介紹一下王者榮耀的玩法和英雄的配置，以及怎麼出裝，搭配陣容。我希望是圖文並茂,而且有趣生動

對話連結 https://chat.z.ai/s/432949f0-3e25-4c19-a34b-1e68115a3f5c

它不僅寫出了技能介紹、出裝攻略，還自動幫搭配了一些精美畫面、技能圖示。

整個 PPT 排版太牛逼。第一次感覺到原來 AI 做的 PPT 這麼牛掰。這已經不是簡單的文字生成組裝成 PPT 了，這是“內容 + 設計”的打包服務。它會自主搜尋資料、尋找配圖，讓資訊更準、排版更美。

結語

測評下來，GLM-4.5 給我的感覺已經超越了一個“模型”。

它既能是嚴謹的程式設計師，幫你實現複雜的程式碼邏輯；也能是懂三觀的產品經理，在創意上給你驚喜；還能是高效的辦公助理和陪你插科打諢的有趣朋友。

那把通往“AI 智慧體”普及化、實用化大門的鑰匙，或許，真的被智譜找到了！

好了，不說了，我要去繼續開發我的“賈維斯”了！家人們也快去試試吧！

體驗地址：

https://chat.z.ai/ Github 倉庫：

https://github.com/zai-org/GLM-4.5 模型倉庫：HuggingFace：

https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b ModelScope：https://modelscope.cn/collections/GLM-45-b8693e2a08984f