
整理 | 褚杏娟
“大模型的Scaling Law並未失效,AI技術的增長進入了一個全新的階段。也就是說大模型技術的創新依舊是突飛猛進的進行時,甚至還有速度越來越快的跡象。”智譜AI CEO 張鵬在6月5日的Open Day 上說道。
飛速變化的不只是技術,還有價格。繼5月宣佈入門級產品GLM-3 Turbo模型呼叫價格從5元/百萬Tokens降至1元/百萬Tokens後,智譜AI 再次宣佈模型全面降價。
“我們切切實實透過模型核心技術的迭代和效率的提升,透過技術的創新來實現了應用成本的持續降低以及客戶價值的持續升級,並不是簡單的價格戰。”張鵬說道。
根據介紹,智譜 AI 的 MaaS 開放平臺的日均呼叫量已經超過了 400 億的 tokens,API 每日消費量在過去 6 個月增長了 50 倍以上。這次,智譜 AI 宣佈推出 MaaS 2.0 的同時,還採取了一系列降價措施。
首先,GLM-4-flash 版本的價格降到了 GLM-3 Turbo 的 1/10,“現在僅僅需要 1 毛錢我們可以擁有 100 萬 token,100 萬 token 夠寫兩本四大名著,像《紅樓夢》寫兩遍也只需要 1 毛錢。”智譜 AI COO 張帆說道。
那如何讓智譜 AI 最受歡迎的 GLM-4 也更加便宜呢?智譜 AI 為此釋出了 GLM-4 Air 版本,效能非常接近原來的 GLM-4,但是價格進一步降低,達到 1 元 /100 萬 token。“我們只用了 1% 的價格,效能可以比肩原來的 GLM-4。”
對於企業在使用大模型時對於速度的需求,智譜 AI 在之前基礎上推出了極速版,可以在效果不變的情況下將推理速度增加 162%,相當於 71 個 token/ 秒,就意味著每秒鐘可以展示出 100 多個漢字。
GLM-4 進一步的升級,全新推出了 GLM-4-520 版本,相對 GLM-4,該版本綜合能力提升 11.9%,指令遵從能力提升 18.6%。“看起來這個數字不是很大,但真正做過模型應用的同學一定能夠感覺到,這一點點的提升相當於進一步提升了我們模型的天花板,能夠極大擴充套件應用範圍,降低應用成本。”
此外,智譜 AI 對其他模型也進行了全面降價:GLM-3-Turbo 降價 80%,GLM-4V 降價 50%,Cogview-3 降幅接近 60%、一毛錢一張圖片。

針對企業使用者,智譜 AI 還支援根據使用規模快速為調整價格和併發,並推出從 V0、V1、V2、V3 四個版本,每個版本享受不同的優惠。


為支援企業私有部署,智譜 AI 升級了平臺:⽆需程式碼,三步完成微調,⽀持 GLM-4 全系列模型:
第一步,準備訓練資料,按照模版收集並準備資料,然後將其匯入資料集中以訓練資料;第二步,建立微調任務,使用平臺微調工具,訓練專屬行業大模型;第三部,部署微調模型,LoRA 微調模型可以直接呼叫,全參微調模型需將訓練好的模型部署到私有云伺服器。
張帆介紹,LoRA 微呼叫更低的成本達到一個相對較好的結果,而全參微調相當於探索模型微調的極限。在此之上,智譜 AI 透過技術能力將訓練成本最低降低 87%,訓練速度提升 30%,資料利用效率提升 40%。而 Lora 微調是價效比之王,對於 GLM-4,每千 token 只需要 4 毛錢,而 GLM-4-Air 只需要 3 分錢。即使全參微調,GLM-4 需要 6 毛錢,GLM-4-Air 需要 5 分錢。

圍繞著這方面,智譜 AI 釋出了第四代 GLM 系列開源模型:GLM-4-9B。
GLM-4-9B 的出現是源於團隊在預訓練時引入了大語言模型進入資料篩選流程,最終獲得了 10T 高質量多語言資料,資料量是 ChatGLM3-6B 模型的 3 倍以上。同時採用 FP8 技術進行高效的預訓練,相較於第三代模型,訓練效率提高了 3.5 倍。在有限視訊記憶體的情況下,團隊發現 6B 模型效能有限,因此在考慮到大多數使用者的視訊記憶體大小後,將模型規模提升至 9B,並將預訓練計算量增加了 5 倍。

根據介紹,GLM-4-9B 模型具備了更強大的推理效能、更長的上下文處理能力、多語言、多模態和 All Tools 等突出能力。
GLM-4-9B 中英文綜合性能相比 ChatGLM3-6B 提升 40%,尤其是在中文對齊能力 AlignBench,指令遵從 IFeval,工程程式碼 Natural Code Bench 方面顯著提升。對比訓練量更多的 Llama 3 8B 模型,英文方面有小幅領先,中文學科方面更是有著高達 50% 的提升。
GLM-4-9B 的上下文從 128K 擴充套件到了 1M tokens,這意味著模型能同時處理 200 萬字的輸入,大概相當於 2 本紅樓夢或者 125 篇論文的長度。同時,該模型支援 26 種語言。為了提升效能,團隊將 tokenizer 的詞表大小從 65k 擴充到了 150k,這一改進使得編碼效率提高了 30%。
另外,團隊在 GLM-4-9B 開源倉庫中提供了一個完整的 All Tools Demo,使用者可以在本地擁有一個輕量級的清言平替。

在強化文字能力的同時,智譜 AI 首次推出了基於 GLM 基座的開源多模態模型 GLM-4V-9B。這一模型採用了與 CogVLM2 相似的架構設計,能夠處理高達 1120 x 1120 解析度的輸入,並透過降取樣技術有效減少了 token 的開銷。
為了減小部署與計算開銷,GLM-4V-9B 沒有引入額外的視覺專家模組,採用了直接混合文字和圖片資料的方式進行訓練,在保持文字效能的同時提升多模態能力。
在效能方面,GLM-4V-9B 模型展現了顯著的優勢。儘管其引數量僅為 13B,但超越了許多引數量更大的開源模型。在眾多工中,GLM-4V-9B 的效能與 GPT-4V 不相上下。

除了正式的釋出,智譜 AI 團隊還邀請了劉慈欣和老羅來幫忙“整活兒”。
劉慈欣在線上分享他對 AGI 與科幻創作的思考。他表示,關於人類的想象力是否會被人工智慧所限制,還是被它所激發和促進,這個問題涉及到各個維度和複雜的互動作用。
人工智慧可能在以下兩方面限制人類的想象力:依賴性和惰性 。AI 的快速響應和準確性可能會讓人類變得更有惰性,不再願意投入時間的精力去深入探索和創新。
人工智慧也可能激發促進人的想象力。首先,AI 可以處理分析大量資料,對人類進行前所未有的資訊和知識,這些資訊作為靈感來源可以激發人類的想象力和創造能力。同時 AI 的運算能力和分析能力可以突破人類思維的侷限性,提出全新的觀點和問題。
綜合來看,人工智慧對人類想象力的影響是雙面的,關鍵在於人類如何正確地使用和管理 AI 技術。
“在 AI 時代,決定人生起點的不再只有依靠記憶性獲得的知識,還有我們的想象力,以及我們對於今天技術革命的認知度,我們需要更加註重想象力和創新力的培養。”劉慈欣說道,“我想在未來,當人工智慧擁有超過人類的智力時,想象力也許是我們對於 AI 所擁有的唯一優勢。”
而羅永浩 AI 智慧體——AI 老羅,正式入駐智譜清言 App 智慧體中心,工號 001,向全社會開放。

有趣的是,昨晚羅永浩直播的時候還被人懷疑不是真人是 AI,老羅聽到後霸氣回應“是什麼就是什麼,AI 就要標明是 AI”來否認。

本屆 ArchSummit 會議上,重點聚焦 AI 大模型技術在各行業的落地實踐, 順豐集團、眾安銀行、天弘基金、鴻海科技集團、寧德核電、廣發證券、微眾銀行介紹大模型技術的應用效果 。會議上還設定了大模型應用、架構升級、智算平臺、AI 程式設計、成本最佳化等專題和話題內容。如您感興趣,可點選「閱讀原文」檢視更多詳情。購買票數越多,享受的優惠也就越豐厚,可以聯絡票務經理 17310043226 , 鎖定最新優惠。

你也「在看」嗎?👇