英特爾推出一系列新晶片,回擊AMD和Arm

👆如果您希望可以時常見面,歡迎標星🌟收藏哦~
來源:內容編譯自zdnet,謝謝。
英特爾週一釋出了其 Xeon 6 伺服器處理器的新版本,旨在在其資料中心產品線中普及人工智慧處理,以抵禦來自 AMD 和 ARM Holdings 兩方面的入侵。
這兩款新處理器被稱為 Xeon 6 6500 和 6700,擴充套件了這家晶片巨頭於 2024 年 9 月首次釋出的產品陣容。代號為“Granite Rapids”的 Xeon 6 晶片具有所謂的效能核心,即數十個獨立的計算元素,旨在提供該公司晶片陣容中最強大的計算活動。
英特爾於 9 月份釋出的首款 6900 Xeon 6 晶片,每塊晶片提供 128 個性能核心,而 6500 和 6700 晶片則提供較少的核心數,從 16 到 86,價格更低,功耗更低。(另一系列晶片“E”系列旨在專注於 Xeon 6 的能效。)
在週一釋出之前的媒體吹風會上,英特爾首席架構師 Ronak Singhal 強調了 6500 和 6700 與 AMD 最新的基於 x86 的 CPU 9005(代號為“Turin”)相比的能力。
Singhal 表示,與 AMD 的 9005 相比,Xeon 晶片使用更少的核心執行更高的計算,從而降低了總體運營成本 (TCO)。他展示了一張幻燈片,其中提到“使用三分之一的核心,AI 效能提高了 50%。”
辛加爾表示:“即使核心數量較低,我們也能夠在各種工作負載下提供更高的效能。”工作負載範圍從執行資料庫等“一般計算”到執行科學模型等“高效能計算”,再到廣義的人工智慧,包括人工智慧模型的推理和訓練。
辛加爾強調,該公司在 Granite Rapids 晶片中大量採用了特殊的 AI 友好型操作,即高階矩陣擴充套件 (AMX)。這些晶片指令允許核心執行線性代數的矩陣乘法,這構成了 AI 處理的大部分內容,同時還執行傳統的計算機指令。
辛加爾表示,AMX 指令讓 Xeon 在雲計算巨頭中獲得了更多的應用。
“例如,去你最喜歡的雲服務提供商那裡,看看他們如何與最終客戶一起使用 AMX,”Singhal 說。“你會看到他們談論他們的最終客戶如何租用 Xeon 例項來利用 AMX,以及他們如何在一些機密計算場景中做到這一點。”
500 和 6700 的釋出基本符合預期,這是英特爾在保持其產品至少能與競爭對手相媲美方面邁出的又一步,因為近年來英特爾在晶片領域的領先地位已經急劇下降。
由於 AMD 和 ARM 在資料中心的銷售額不斷增加,英特爾的財務業績卻大幅下滑。
去年9月份季度,AMD資料中心季度營收為35億美元,首次超過英特爾的33億美元。
因此,根據行業研究公司TechInsights的資料,英特爾在x86伺服器晶片市場的份額(該市場由英特爾和AMD壟斷了數十年)已從2020年第一季度的96%下降到目前的65%,而AMD的份額則從4%飆升至35%。
ARM 不生產晶片,而是將設計作為智慧財產權出售給晶片製造商,其收入基礎要小得多,但其設計在資料中心的使用中取得了顯著增長。谷歌等雲計算巨頭都依賴 ARM 的設計來製造定製晶片,例如谷歌的 TPU 和亞馬遜的 Graviton 處理器,而不是英特爾的 x86 技術。
分析師稱,在過去 12 個月中,ARM 預計 36 億美元的收入中約有 10% 來自網路和資料中心應用。ARM 表示,預計今年收入增長 26%,這在很大程度上要歸功於資料中心銷售額的增長。
ARM 在資料中心處理器總銷售額中所佔份額的確切數字尚不清楚,但隨著谷歌和其他公司部署更多非 x86 晶片,ARM 獲得的任何專利費都只會給 ARM 帶來好處,而對英特爾(以及 AMD,程度較小)來說則是損失。
英特爾表示,Xeon 部件(尤其是新款 6500 和 6700)可以更廣泛地用於廣泛的企業應用程式,從而與採用 AMD 或 ARM 晶片相比,可以降低公司的 TCO。
辛加爾表示:“這實際上側重於廣大企業及其所有不同的用例,特別關注人工智慧和安全,以及我們如何為客戶提供能夠改善其基礎設施投資的產品。”
辛加爾表示,這個想法是“允許企業將舊的基礎設施整合到新的基礎設施中,以便更好地處理新的工作負載,並能減少其耗電量”。
然而,TechInsights 稱,英特爾——其執行長帕特·基辛格 (Pat Gelsinger) 已於去年年底離職——仍然面臨著提供最前沿技術進步的壓力。
在新聞釋出會上,辛加爾強調,該公司的 Granite Rapids 繼任者、代號為 Clearwater Forest Xeon 晶片將“按計劃”於明年上半年投產。辛加爾表示,“我們今天已經在實驗室中對其進行了測試”,並進行了客戶測試。
然而,據 TechInsights 稱,這與 Clearwater Forest 預計於今年晚些時候首次亮相相比有所延遲。
此外,據 TechInsights 稱,英特爾專用的 AI 晶片 Gaudi 3 去年未能達到英特爾自己的內部銷售目標。這意味著“英特爾實際上已經退出了 AI 加速器競賽,只剩下 AMD 和 NVIDIA 兩家主要參與者。”
後續晶片 Falcon Shores 已被擱置,英特爾正在考慮推出新產品 Jaguar Shores,預計在 2027 年某個時候推出。
英特爾推出一系列晶片
眾所周知,晶片製造商英特爾最近在多個方面都遇到了困難,但重要的是要記住,資料中心銷售的每三塊處理器中,幾乎有兩塊是 Intel Inside。這是一項不錯的業務,可以帶來適度的利潤,英特爾可以(而且經常)在 X86 伺服器 CPU 方面與競爭對手 AMD 競爭,還可以提供超大規模和雲構建者在臺灣半導體制造公司製造的各種自主研發的 Arm 伺服器 CPU 所不具備的優勢。
英特爾於 2024 年 6 月推出了“Sierra Forrest”Xeon 6 處理器,該處理器基於其基於 Atom 風格核心的 E 核“高效核心”設計。這是 Xeon 6 代中的首批產品,代表著傳統 Xeon 核心(現稱為 P 核(效能核心的縮寫))合併到一組插槽上,這些插槽具有相同的外部饋送和速度,並基於插槽內相同的 I/O 晶片來提供這些饋送和速度。首款基於 P 核計算晶片的“Granite Rapids”Xeon 6 處理器於 2024 年 9 月釋出,這款高階晶片主要針對超大規模企業和雲構建者,他們希望將盡可能多的核心塞進一個插槽,為其龐大的伺服器群製造儘可能少的伺服器。
E 核和 P 核伺服器處理器之間的差異發生在具有計算核心的晶片內部,這是晶片的合理劃分,即使你可能會爭論在本質上仍然是 Atom 和 Xeon 核心之間維持計算分叉的一些優點。
市場會決定它想要什麼。這就是市場的作用。
今天,Xeon 6 系列的其他產品也已釋出,英特爾研究員、Xeon 系列長期首席架構師、現任產品經理的 Ronak Singhal 在釋出前向我們介紹了剩餘的 Xeon 6 處理器。Granite Rapids SP 變體的命名方式為 Xeon 6500P 和 6700P,它們實際上是 Xeon 6 系列的核心,面向企業客戶,這些客戶仍然比整體市場更偏愛 Xeon 晶片,而整體市場中的超大規模計算和雲構建者在 X86 架構處理器方面更偏愛 AMD Epyc 伺服器 CPU。
“這實際上側重於廣泛的企業及其所有不同的用例,特別關注人工智慧和安全,以及我們如何為客戶提供一些可以改善其基礎設施投資的東西,使他們能夠將舊基礎設施整合到這種新的基礎設施中,這種新基礎設施具有更好的能力來處理新的工作負載,並可以減少他們的功耗,”Singhal 在提到 Xeon 6500P 和 6700P 處理器時解釋道。“或者,當他們希望透過其基礎設施推出新功能或新服務時,他們為什麼要選擇 Xeon?”
在我們深入研究 Xeon 6300P、Xeon 6500P 和 Xeon 6700P 之前,我們先做一些簡單的介紹。
首先,基於“Crestmont”E 核心的 Granite Rapids Xeon 6900E 不會大規模釋出。英特爾早在 2023 年 9 月就透露,它正在開發一款最多有 288 個核心的 Sierra Forrest 晶片,而 Singhal 證實 Xeon 6900E 目前正在加速生產。
“288 核現已投入生產,”Singhal 說道。“我們實際上已經為一家大型雲客戶部署了該晶片,當他們準備好談論他們正在做什麼時,我認為這將非常有趣。我們確實在與每位客戶密切合作開發 288 核晶片,以根據他們的需求定製我們在那裡構建的產品。所以你不會看到我們從廣泛的部署場景中談論它。它首先是為那些定製的雲場景而構建的。”
英特爾還按照承諾推出了 Xeon 6 P 核平臺的片上系統版本,面向電信公司和其他服務提供商,用於網路和邊緣用例。我們現在不會花太多時間在這上面,因為我們專注於資料中心。
最後,提醒一下,幾周前英特爾已下調現有 Granite Rapids Xeon 6900P 晶片(最多 128 個核心)的價格。以下是 Xeon 6900P 的最新價格和價效比表,在檢視當今 Granite Rapids 系列的其他產品時,這些表非常有用:
下面,讓我們深入瞭解 Granite Rapids 隊其他陣容的詳細資訊。
中間地帶
與許多代 Xeon 伺服器處理器一樣,英特爾不會只蝕刻一塊大晶片,然後根據該設計的核心和 I/O 產量充實產品線。該公司設計了多種不同尺寸的晶片,因為小晶片的產量通常要好得多。即使英特爾已經進入了晶片時代,每個晶片都有自己的產量曲線(通常越小越好),但更少的晶片可以提高封裝製造的產量。在 Granite Rapids 晶片和插槽設計中,您可以看到這種相互作用,以最大限度地提高產量以及 Xeon 6 產品線的深度和廣度,而不會犧牲盈利能力。
四種不同的 Xeon 6 晶片封裝在名稱上很熟悉:超多核心數 (UCC)、極限核心數 (XCC)、高核心數 (HCC) 和低核心數 (LCC)。無論使用哪種型別的核心晶片組合,所有 Granite Rapids 核心組合均採用英特爾 3 工藝蝕刻而成(大致類似於臺積電的 3 奈米工藝),並具有一個、兩個或三個計算組合,其中有三種設計。一個小核心組合有 16 個核心,中間一個有 48 個核心,有趣的是,在 Granite Rapids 插槽中使用的具有多個核心組合的第三個核心組合有 44 個核心,為互連留出了空間,以將核心組合及其快取相互連線起來,從而建立虛擬單片晶片。
所有 Granite Rapids 晶片都有一對 I/O 小晶片,其中有 DDR5 記憶體控制器、PCI-Express 控制器和各種加速器,這些加速器包含在之前的 Xeon 4 和 Xeon 5 CPU 中,並且會不時更新新的雜湊或加密演算法或以其他方式進行壓縮。這些加速器概述在 Xeon 6 系列的以下顯著特性表的底部:
今天釋出的 Xeon 6500P 和 6700P 處理器及其平臺可擴充套件至 86 個核心,並且支援 AVX512 向量單元和 AMX 張量單元加速,前者對於 HPC 和 AI 都很重要,而後者可能成為 AI 工作負載和未來 HPC 例程的真正區別因素。
我們感到有些困惑,四路或八路機器中使用的 Xeon 6700P 處理器透過片上 NUMA 叢集技術(所謂的無縫 NUMA)連線,每個處理器上只有四個 UltraPath Interconnect (UPI) 鏈路。誠然,這些 UPI 鏈路的執行速度為 24 GT/秒,速度非常快。但是 Xeon 6900P 只能擴充套件到單個 NUMA 映像中的兩個處理器,因此與具有四個或八個處理器的 NUMA 叢集相比不需要大量互連,它有六個 UPI 鏈路,執行速度為 24 GT/秒。Sierra Forest Xeon 6700E 和 6900E 變體也是如此,它們也有更多的 UPI 鏈路,但只能擴充套件到最多兩個插槽。
我們原本以為,製造大型 NUMA 機器來執行後端關係資料庫或記憶體資料庫及其應用程式的 OEM 會希望使用 Xeon 6900P 將插槽更緊密地耦合在一起。連結越多越好,因為它可以減少 NUMA 記憶體中的跳數。六個 UPI 連結允許任何一個處理器直接連結到六個處理器,第二個跳數只需要到達八 CPU 機器中的第七個 CPU。您可以像英特爾那樣使用四個連結進行八路連線,方法是覆蓋兩個四路並使用第四個 UPI 連結交叉連線這兩個四路,如上圖所示。但是,使用六個連結,您也可以在單個 NUMA 映像中使用 16 個插槽製作無縫機器。這將有助於英特爾的 OEM 客戶更好地與 IBM Power Systems 鐵礦石競爭。
我們無法理解為什麼有人希望將八個八核可擴充套件 SKU 連線在一起形成一個節點,但這樣的機器可以擁有 32 TB 的主記憶體、4.8 TB/秒的總記憶體頻寬和 64 個核心,以 4 GHz 基本頻率和 4.3 GHz Turbo Boost 速度執行。這是一個記憶體容量和記憶體頻寬 CPU 叢集,與具有 128 或 288 個核心的單個插槽相反。也許有人需要的是記憶體肌肉伺服器?
也許那些購買 Granite Rapids 6900P、6700E 和 6900E 處理器的超大規模企業和雲構建者正在利用這兩條額外的 UPI 鏈路做一些有趣的事情。它們不是偶然出現的……我們知道的就這麼多。
除了可擴充套件至四或八個插槽的 Granite Rapids 晶片版本外,還有一些版本經過調整,僅在單插槽資料中心級用例中執行,這與針對電信公司和服務提供商的 Xeon 6 SoC 不同且更強大。
Granite Rapids 6500P 和 6700P 晶片的單插槽變體很有趣,它們證明了 AMD 在向超大規模計算和雲構建商推銷單插槽裝置作為 HPC 和 AI 頭節點以及更通用的伺服器托架方面取得了成功。(AMD 沒有四插槽或更高的 NUMA 配置,並且一直保持在兩個插槽的上限。但如果 AMD 想要分一杯羹 SAP HANA 和其他大型資料庫的羹,這種情況可能會改變。)
Xeon 65X1P 和 67X1P – X是變數,末尾的1表示單插槽 – 用於單插槽伺服器的 Granite Rapids 晶片從 16 核到 80 核不等,雖然核心數量並不多,但足以完成某些型別的計算工作 – 以軟體定義儲存的控制器為例 – 並具有大量的 I/O。
“我認為,我們今天看到很多人對這個平臺非常感興趣。”Singhal 表示,他指的是該平臺的單插槽設計。“事實上,我們已經看到一些案例,我們利用這個平臺從競爭對手手中奪回了設計,隨著我們在市場上逐漸擴大規模,我預計會看到更多這樣的情況。”
英特爾還必須滿足 SMB 和邊緣計算的需求,在這些情況下,具有強大 P 核的真正 Xeon 處理器非常重要,而 Xeon 6300P 晶片可以做到這一點。這些晶片可能會進入資料中心,但它會成為特洛伊木馬,比如交換機或其他裝置。Xeon 6300P 系列中一個計算單元的成本相當低——大約是效能 SKU 和英特爾所謂的 1 插槽 SKU 的一半,大約是四路和八路機器中使用的 Xeon 6500P 和 6700P 晶片版本價格的四分之一到一半。
Xeon 6300P 的主記憶體限制為 128 GB,並且僅以 4.8 GT/秒的速度執行,因此根本不適合繁重的記憶體工作負載。
編譯器觸及核心的地方
我們將進行更徹底的效能分析,但目前,以下是 Granite Rapids 系列中的 64 核 (Xeon 6 6767P) 和 86 核 (Xeon 6 6787P) 與之前的“Emerald Rapids”系列中的 64 核 Xeon 5 8592+ 的相對效能。
就同類核心數量而言,Granite Rapids 晶片在各種工作負載(對計算、記憶體頻寬和 I/O 的壓力不同)中效能提升了 14% 至 41%。86 核頂級 Granite Rapids 6700P 系列中增加了 22 個核心,與 64 核 Emerald Rapids 晶片相比,效能提升了 30% 至 54%。
在我們看來,對於相同的 64 個核心,平均效能提升約 25%,而對於增加到 86 個核心,平均效能提升約 40%。但當然,效能總是取決於細節,雖然資料中心執行大量工作負載,但它們不會平均這些工作負載。每個工作負載的發揮取決於系統配置的優劣。如果沒有足夠的記憶體或 I/O,即使是世界上最好的 CPU 也毫無意義。
在 100% CPU 利用率下推動絕對效能通常不是 CPU 設計師的目標,即使是那些自己製造 Arm 伺服器晶片的人也是如此。他們試圖在典型工作負載下獲得性能、散熱和價格的適當平衡。對於許多超大規模和雲構建者來說,40% 的峰值 CPU 是典型負載,因此英特爾優化了 Granite Rapids P 核設計,使其比 Emerald Rapids 前代產品更高效。就像這樣:
因此,這為您提供了此公告的總體情況。事不宜遲,以下是今天宣佈的其他 Granite Rapids 晶片的 SKU 表:
參考連結
https://www.zdnet.com/article/intel-touts-new-xeon-chips-ai-power-in-bid-to-fend-off-amd-arm-advances/
https://www.nextplatform.com/2025/02/24/intel-rounds-out-granite-rapids-xeon-6-with-a-slew-of-chips/
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4047期內容,歡迎關注。
推薦閱讀
『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦


相關文章