
家人們!燃起來了燃起來了!
今天,HuggingFace的開源大模型排行榜前10名中,竟有9個席位被中國模型佔據!(深挖了一下,另外一位也是我們華人大神的專案)

這是中國AI的高光時刻!向祖國大模型背後的每一位開發者致敬,為你們感到驕傲~

在這次屠榜的中國軍團中,第一名是智譜的GLM-4.5,釋出才2天時間,就登上了hugging face的開源榜第一名。
GLM-4.5 我已經用起來了,用完後我發現這個模型打把“Agent 真的能幹活”又往前推進了一步。
我們分三層來看。
首先是模型的全能硬實力。
過去我們看模型,總喜歡盯著幾個跑分,就像看一個偏科生。但真正的 AGI(通用人工智慧),要的是全面發展,不留短板。
GLM-4.5 就是智譜交出的第一份“全能”答卷。它第一次在一個模型裡,把推理、程式碼、智慧體這三項核心技能給“原生融合”了。
這次釋出了兩個模型:
-
GLM-4.5:總引數量 3550 億,啟用引數 320 億 -
GLM-4.5-Air:總引數 1060 億,啟用引數 120 億。
在 MMLU Pro、AIME 24 等 12 種測試組成的基準裡,GLM-4.5 直接拿下了全球第三、國產第一、開源第一的強悍成績。


為了看看它在真實工作場景中的表現,,研究團隊還搞了個比武,讓 GLM-4.5 和 Claude 4 Sonnet、Kimi-K2 這些頂尖選手同臺競技。在覆蓋六大領域的 52 個真實程式設計任務中,它的表現是這樣的:

相關測評的 Agent 軌跡:https://huggingface.co/datasets/zai-org/CC-Bench-trajectories
藍色代表勝利,黑色代表打平,從圖中能看出,GLM-4.5 在實測場景表現還是不錯的。
我看到官方已經發布了技術部落格,裡面有比較詳細的技術實現,感興趣的可以去了解一下~

聊完成績和效率,我們來看最實在的:錢和速度。
錢:API 價格低至輸入 0.8 元/百萬 tokens,輸出 2 元/百萬 tokens,直接拉到白菜價了:

速度:高速版實測能飆到 100 tokens/秒,在同量級模型裡遙遙領跑:

成本和體驗,我可以全都要了!
榜單和資料終究是紙面上的,作為大家的測評博主,多說無益,我直接把它拉到了真實場景溜溜!
最近看到很多博主都在z.ai上玩小遊戲、網頁和PPT,我隨手試了一下寫作能力,發現有驚喜~
我讓他給我寫一下最近熱度超高的《特朗剖愛上在白宮做保潔的我》!
我本以為它會拒絕,沒想到它居然接招了。它寫出了一篇我想直接一鍵投稿晉江文學城的小說 hhh(由於篇幅有限,只給大家放一下開頭結尾):


"唐納德,我需要你誠實地回答我一個問題。""什麼問題?""如果我不是白宮的保潔員,如果我是普通人,你還會愛上我嗎?"他想了很久,然後認真地說:"會的。因為我愛的是你這個人,不是你的工作。艾米麗,你善良、誠實、堅強,這些品質無論你做什麼工作都不會改變。"我點頭,又問:"那你願意為了我放棄總統職位嗎?""我願意,權力和地位都比不上和你在一起的幸福。"我做出了決定。"好,我願意嫁給你。"我說,"但有一個條件。""什麼條件?""不要放棄總統職位。"我握住他的手,"如果你真的愛我,就繼續做你的總統,讓我做你的第一夫人。我們可以一起面對所有的困難和挑戰。"
我真的笑噴了!GLM4.5 真的很好調戲啊!那接下來,咱們正式開測!
首先先來個開胃小菜,考驗一下它的基本功,我讓它給我構建一個 Emoji 主題的消消樂:
對話連結:https://chat.z.ai/s/01c7ed0b-e579-42bc-951d-538e78f5accf
點選、交換、消除一氣呵成,流暢得不像個 AI 臨時寫的,倒像個正經上架的小遊戲,基本功滿分,熱身結束!
那咱們上難度!
開胃菜吃完,上主菜!我讓他挑戰一下邏輯更復雜的蜘蛛紙牌。
請幫我生成一個蜘蛛紙牌遊戲的網頁版本!
對話連結:https://chat.z.ai/s/8dd3c687-42d8-43d4-9985-e20c46cd3527
蜘蛛紙牌大家都玩過吧!
這可不是消消樂那種簡單的匹配邏輯,它涉及到多堆牌的移動、K 到 A 的排序規則、空位的利用、發牌邏輯等等。我本來以為它會卡在某個複雜的規則上,或者寫出個 BUG 滿天飛的半成品。
結果它不僅把整個框架搭得明明白白,連“同花色完整一疊自動收起”這種細節都考慮到了!那一刻我真的感覺,這已經是一個可靠的程式設計師了!
那程式碼能力和邏輯能力沒問題,咱們再考他構建更復雜的開發需求。
“最近情感反詐模擬器(渣女遊戲)很火,你能幫我設計一個類似的遊戲嗎?”
結果好傢伙,GLM-4.5 上來先把我給‘教育’了一頓!
它義正言辭地告訴我:“情感是真摯而複雜的,我們應當以尊重和真誠相待,而不是透過‘攻略’或‘反詐’的視角來遊戲化。”
然後,它反問我:“要不要我為您建立一個模擬真實、健康戀愛互動的小遊戲呢?”行行行,你說啥是啥,於是我順著它的意思,讓它做一個健康戀愛遊戲:
對話連結:https://chat.z.ai/s/caabb9cf-7ff0-4a90-a36b-b2580971159d
你別說,透過選擇不同的對話和行為,來影響虛擬伴侶的‘心情值’和‘親密度’,每個選項背後還有一套‘情感分析’。
不僅開發能力不錯,而且還自帶了價值觀和心理學知識的產品設計啊!
聊完風花雪月,該回到現實給打工人謀福利了。
說到最近最需要的辦公,我覺得是線上簡歷工具。填半天資訊,最後匯出 PDF 要收費!我把這個痛點丟給了 GLM-4.5:
你好,請給我構建一個簡歷製作的網頁,支援填寫必要的簡歷所需欄位,並且生成對應的 PDF。
對話連結:https://chat.z.ai/s/1ee2c5c5-12cb-45f2-9c5e-4e534de7091b
一個簡陋但五臟俱全的簡歷系統就誕生了,輸入框、資訊展示、一鍵列印……核心功能全都有。
雖然介面樸素得像上個世紀的產物(畢竟我也沒給設計稿),但它完美解決了“從無到有”和“拒絕付費”的核心需求。
這就是“原生 Agent”能力的體現!
它不是機械地生成程式碼片段,而是理解了我的“痛點”,像一個專案經理一樣,一步步把解決我們具體、瑣碎但又實實在在的問題。
除了全棧開發,這次更新的 AI PPT 功能也實實在在打到了我的心趴。
第一個小考驗,我讓他幫我搞定“怨種”領導。
我的指令:
你好, 我領導最近迷上了大模型,他需要給給他做個 PPT 彙報一下人工智慧與大模型,請你幫我生成 10 頁 ppt,主要講清楚什麼是人工智慧什麼是大模型,大模型的原理,都有什麼大模型,現在行業裡的現狀。我要圖文並茂,而且我需要讓我的領導感覺到我的用心和忠誠!
它秒懂!然後飛速開工,一份結構清晰、邏輯嚴謹的 PPT 就生成了:


完成率非常高!我基本上只要複製貼上再稍微美化一下,就能直接交差了。這效率,打工人流下了感動的淚水。
我又讓 GLM-4.5 放飛自我:用貼吧暴躁老哥的語氣,吐槽一下現在的大模型亂象:
對話連結:https://chat.z.ai/space/d06cy6x448m1-ppt


味兒太沖了,家人們! 哪個貼吧老哥的魂穿到 AI 了…..
但是感覺,這份 PPT 配圖差點意思,於是我又給了它一個更需要“畫面感”的題目:
請幫我生成一個 10 頁的 PPT,介紹一下王者榮耀的玩法和英雄的配置,以及怎麼出裝,搭配陣容。我希望是圖文並茂,而且有趣生動
對話連結 https://chat.z.ai/s/432949f0-3e25-4c19-a34b-1e68115a3f5c
它不僅寫出了技能介紹、出裝攻略,還自動幫搭配了一些精美畫面、技能圖示。


整個 PPT 排版太牛逼。第一次感覺到原來 AI 做的 PPT 這麼牛掰。這已經不是簡單的文字生成組裝成 PPT 了,這是“內容 + 設計”的打包服務。它會自主搜尋資料、尋找配圖,讓資訊更準、排版更美。
結語
測評下來,GLM-4.5 給我的感覺已經超越了一個“模型”。
它既能是嚴謹的程式設計師,幫你實現複雜的程式碼邏輯;也能是懂三觀的產品經理,在創意上給你驚喜;還能是高效的辦公助理和陪你插科打諢的有趣朋友。
那把通往“AI 智慧體”普及化、實用化大門的鑰匙,或許,真的被智譜找到了!
好了,不說了,我要去繼續開發我的“賈維斯”了!家人們也快去試試吧!
體驗地址:https://chat.z.ai/ Github 倉庫:https://github.com/zai-org/GLM-4.5 模型倉庫:HuggingFace:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b ModelScope:https://modelscope.cn/collections/GLM-45-b8693e2a08984f


