
👆如果您希望可以時常見面,歡迎標星🌟收藏哦~
來源:內容編譯自theregister,謝謝。
IBM 的最新大型機以平臺傳統的關鍵任務工作負載的安全性和可靠性屬性為基礎,添加了 AI 來支援大型語言模型 (LLM)、助手和代理。

z17 系列引入了改進的 Telum II 處理器和 Spyre AI 加速器卡,這兩者都是在去年帕洛阿爾託舉行的Hot Chips 會議上討論過的,據稱其 AI 效能比 z16 提高了 7.5 倍。
IBM 聲稱,雖然 Telum II 提供了改進的 AI 推理來針對交易執行欺詐檢測檢查(就像z16 中引入的那樣),但 Spyre 卡提供了一種擴充套件 AI 處理的方法,以支援生成 AI 和 LLM,並使用多種模型來提高準確性並減少誤報。
IBM 院士兼 IBM Z 架構師 Elpida Tzortzatos 在談到藍色巨人為這款最新大型計算機開發的硬體增強功能時表示:“如果將資料視為新的燃料,那麼基礎設施就是推動企業 AI 之旅走向成功的引擎。”
該公司表示,他們花了很多時間與客戶討論他們希望在大型機中看到什麼,這為 z17 的開發提供了參考。客戶顯然告訴他們要更新他們的應用程式並使大型機更加人工智慧驅動。

但這並不是像其他一些公司那樣,將生成式人工智慧簡單地投入到其中。藍色巨人聲稱已經仔細考慮過這個問題。
Tzortzatos 表示:“GenAI 對我們的客戶來說非常重要,但也不是唯一的 AI 工具。儘管最近有很多關於 GenAI 的討論,但預測性 AI 仍將在企業中發揮關鍵作用。”
“我們將繼續非常非常好地服務於這些用例,但 GenAI 為新的用例打開了大門,例如擁有助手並能夠總結文件,能夠為開發人員提供支援,讓副駕駛能夠自動完成程式碼等等。”
這些助手包括該公司的watsonx Code Assistant for Z 和 watsonx Assistant for Z 等。
Tzortzatos 聲稱,該公司看到的一個新趨勢是將預測人工智慧的優勢與大型語言和程式碼模型的優勢結合起來,以提取新特徵或新見解,並從這些人工智慧模型中獲得更好、更準確的結果。
她舉了一個保險的例子,保險公司從 DB2 資料庫中提取與索賠相關的結構化資訊,然後從非結構化文字中提取關鍵見解(例如索賠原因或索賠緊急程度),並將其輸入預測 AI 模型以獲得更好、更準確的結果。
根據 Hot Chips 的詳細介紹,z17 中的 Telum II 處理器與上一代一樣是八核晶片,但執行速度更高,為 5.5 GHz。Telum II 的快取大小也增加了 40%,並增加了另一項新功能——片上 IO 加速器或資料處理單元 (DPU),旨在解除安裝 Spyre AI Accelerator 卡在處理較新的 AI 模型時需要處理的大量資料。
Tzortzatos 解釋說:“當談到大型語言模型和 GenAI 時,我們看到模型複雜性和模型尺寸增加了超過一百倍,這對 AI 計算提出了更高的要求。”
這些 Spyre AI 加速器卡可插入 PCIe 插槽,每個卡最多有 32 個核心,據說與 Telum II 晶片本身的 AI 加速器架構類似。IBM 表示,z17 可以在單個系統中擁有最多 48 張卡。
藍色巨人還在準備 z/OS 3.2,這是其為 IBM Z 系統開發的下一個主要作業系統版本,計劃於今年第三季度釋出。這將為整個系統提供對硬體加速 AI 功能的支援,並使用運營 AI 實現系統管理功能。
IBM 表示,新平臺將增加對現代資料訪問方法、NoSQL 資料庫和混合雲資料處理的支援,以使 AI 能夠利用更廣泛的企業資料來應用預測性業務洞察。
IBM 推出新款大型機正值這種高價位產品的艱難時期,特朗普政府的國際貿易政策動搖了商業信心。傳統上,隨著舊系統客戶升級,新大型機的推出將為藍色巨人帶來收入激增,但今年的銷售可能會很困難。
然而,Gartner 基礎設施和運營集團執行副總裁 Mike Chuba 表示,公司已經充分了解客戶的需求。
Chuba 向The Register表示:“如果你回顧一下最近幾代大型機的釋出會,並繼續回顧這一代,你會發現,IBM 在涉及大型大型機客戶的研發過程中投入了更多時間。”
“IBM 的研發工作現在專注於新硬體如何直接解決客戶面臨的挑戰。他們在 z16 上引入的專用加速器和這一代的渦輪增壓版 2 直接解決了交易時欺詐檢測等挑戰,從而專注於人工智慧。”
IBM 的的新晶片
去年,IBM 為其著名的大型機系統推出了一款更強大的處理器,承諾增強用於推理的片上 AI 加速,並整合資料處理單元 (DPU) 以增強 IO 處理能力。
IBM還為其提供了一個單獨的 AI 加速器,旨在支援更大規模的推理。
據藍色巨人稱, Telum II 處理器在帕洛阿爾託舉行的Hot Chips 2024大會上釋出,預計將為大型機帶來顯著的效能提升。該公司還預覽了 Spyre AI Accelerator,並表示預計這兩款晶片將於 2025 年上半年與下一代 IBM Z 系統一起推出。
如果 IBM 的說法可信的話,那麼全球大約 70% 的交易都是透過其大型機進行的,而 IBM 表示,它在 Hot Chips 上展示的開發成果將使其能夠將生成性 AI 引入這些關鍵任務工作負載。
Telum II 和其前代產品一樣,是一款八核晶片,但在新晶片中,這些晶片的時鐘速度更高,為 5.5GHz。有十個 36 MB 二級快取;每個核心一個,DPU 一個,第十個作為整體晶片快取。IBM 表示,隨著虛擬 L3 和虛擬 L4 分別增長到 360 MB 和 2.88 GB,這意味著快取大小增加了 40%。
首款 Telum 處理器於 2022 年推出時為 z16 帶來了內建 AI 推理功能。它能夠在處理金融交易時對其進行即時欺詐檢測檢查。
藍色巨人表示,它已顯著增強 Telum II 處理器上的 AI 加速器功能,達到每秒 24 萬億次運算 (TOPS)。但正如The Register之前所解釋的那樣,TOPS 可能是一個誤導性指標。雖然增加了對 INT8 作為資料型別的支援,但 Telum II 本身的設計旨在使模型執行時能夠與最苛刻的企業工作負載並行執行。
新增片上 DPU是為了幫助滿足不斷增長的工作負載需求,特別是著眼於未來的 AI 工作負載和即將推出的 Z 系統 Spyre 加速器。
據 Armonk 公司介紹,每個 DPU 包括四個處理叢集,每個叢集有八個可程式設計微控制器和一個管理這些處理叢集的 IO 加速器,以及兩個 IO 抽屜域的 IO 子系統。DPU 還具有單獨的 L1 快取和請求管理器來跟蹤未完成的請求。
DPU 位於主處理器結構和 PCIe 結構之間。將其直接連線到結構的目的是大大減少資料傳輸的開銷,同時提高吞吐量和功率效率。
IBM 表示,作為最高配置,未來的 Z 系統可能擁有多達 32 個 Telum II 處理器和 12 個 IO 籠,每個籠子最多有 16 個 PCIe 插槽,使系統總共支援多達 192 個 PCIe 卡,大大擴充套件了 IO 容量。
Spyre 加速器將包含 32 個核心,其架構與整合在 Telum II 晶片中的 AI 加速器類似。IBM Z 可以配置多個 Spyre 加速器,透過 PCIe 安裝,以便根據需要擴充套件 AI 加速。例如,八張卡的叢集將為單個 IBM Z 系統新增 256 個加速器核心。
Telum II 和 Spyre Accelerator 均旨在支援 IBM 所稱的整合 AI,即使用多個 AI 模型來提高與單個模型相比的預測效能和準確性。
藍色巨人 IBM Z 和 LinuxONE 產品管理副總裁 Tina Tarquinio 在評論中表示:“Telum II 處理器和 Spyre 加速器旨在提供高效能、安全且更節能的企業計算解決方案。”
她補充道:“經過多年的開發,這些創新將被引入我們的下一代 IBM Z 平臺,以便客戶可以大規模利用 LLM 和生成式 AI。”
藍色巨人希望超越推理,在其大型機上進行微調,甚至可能訓練模型。該公司表示,這將使銀行和其他希望將資料安全儲存在自己場所的企業等客戶能夠完全在組織內部訓練和部署模型。
Telum II 和 Spyre Accelerator 都將由三星採用 5 nm 工藝節點為 IBM 生產。
參考連結
https://www.theregister.com/2025/04/08/ibm_z17_update/
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4089期內容,歡迎關注。
推薦閱讀



『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦

