


作者 | ZeR0
編輯 | 漠影
芯東西5月20日報道,臺北國際電腦展COMPUTEX 2025今日盛大開幕,晶片產業領袖雲集,陳立武首次以英特爾CEO身份赴臺,並與中國臺灣供應鏈夥伴餐敘。英特爾更是一舉發布多款GPU和AI產品,包括英特爾銳炫Pro B50/B60 GPU、Gaudi 3 AI加速器、輕量級開源軟體框架Intel AI Assistant Builder,展露其在AI及專業視覺領域的最新佈局。

英特爾銳炫Pro B60/B50 GPU基於Xe 2架構,具備AI特性,為要求嚴苛的AI推理工作負載和工作站應用而設計,進一步豐富了英特爾專業級GPU產品線。
其中,銳炫Pro B60配備24GB視訊記憶體,AI峰值算力為197TOPS,適用於推理工作站;銳炫Pro B50配備16GB視訊記憶體,AI峰值算力為170TOPS,適用於圖形工作站。

兩款GPU均搭載英特爾XMX AI核心和先進的光線追蹤單元,並支援多GPU擴充套件,透過將高視訊記憶體容量與關鍵軟體相容性相結合,為創作者和AI開發者提供了可擴充套件的、經濟高效的解決方案。
銳炫Pro B50直接面向零售市場,建議零售價為299美元(約合人民幣2159元),價效比優勢突出。銳炫Pro B60將主要透過B2B模式進行專案採購,正在與多家系統整合商和OEM廠商進行合作。

華擎、藍戟、Lanner、銘瑄、傲世、Senao和撼與科技等AIB合作伙伴將於今年6月開始提供英特爾銳炫Pro B60 GPU樣品。英特爾銳炫Pro B50 GPU將於今年7月開始在英特爾授權經銷商處上市。

有合作伙伴將提供銳炫Pro B60的單卡雙GPU方案,板載視訊記憶體容量達48GB。
英特爾Gaudi 3 AI加速器提供PCIe和機架級系統部署選擇,為企業和雲AI推理提供可擴充套件的開放解決方案。英特爾Gaudi 3 PCIe卡支援在現有伺服器資料中心環境中進行可擴充套件的AI推理,將於今年下半年上市。
在CES 2025首次亮相後,英特爾AI Assistant Builder軟體框架現已在GitHub上提供公開測試版。該框架專為在基於英特爾AI PC上本地構建和執行自定義AI agents而設計,可幫助企業或個人快速構建並部署AI agents。
01.
銳炫Pro B50:AI效能提升至3倍,
價效比較RTX A1000翻番
英特爾銳炫Pro B50 GPU實現了同類價位段最高配置:擁有16個Xe核心,配備16GB視訊記憶體、128 XMX引擎,視訊記憶體頻寬為224GB/s,AI峰值算力(Int8)為170TOPS,單卡功耗僅70W。PCIe Gen 5速度的提升也會帶來10%-20%的效能提升。

與同類產品對比,銳炫Pro B50的視訊記憶體容量、驅動程式最佳化、PCIe Gen 5提升均表現更優。同類產品通常配備6GB或8GB視訊記憶體。

與上一代產品及競品相比,銳炫Pro B50在圖形和AI推理效能上有1.1倍~3.5倍的提升。

在通用效能方面,銳炫Pro B50相比上一代產品提升50%~130%。其價效比不僅相較銳炫Pro A50、英偉達RTX A1000翻倍提升,比起銳炫Pro A60也略勝一籌。

該系列GPU在Windows上相容消費級和專業級驅動程式,在Linux上支援容器化的軟體棧。其軟體棧可以簡化AI部署,並支援逐步升級和功能最佳化。
新發布的兩款GPU針對AEC(建築、工程、施工)和推理工作站進行了最佳化,並透過大量ISV認證和最佳化的軟體提供穩定、可靠的效能。

英特爾副總裁兼客戶端顯示卡總經理Vivian Lien稱,全新英特爾銳炫Pro GPU為一直在尋求針對性解決方案的中小型企業,提供了易於獲取且可擴充套件的解決方案。
02.
銳炫Pro B60:AI峰值算力197TOPS,
跑DeepSeek-R1倍殺RTX 5060Ti
銳炫Pro B60擁有20個Xe核心,配備24GB視訊記憶體、160 XMX引擎,視訊記憶體頻寬為456GB/s,AI峰值算力(Int8)為197TOPS,根據不同系統設計,單卡功耗區間為120~200W。

從效能來看,銳炫Pro B60執行DeepSeek-R1、Phi 4、QwQ、Qwen 2.5、Llama 3等模型時,相比英偉達RTX 2000 Ada 16GB、RTX 5060Ti 16GB的吞吐量更高。

更大引數規模的模型,需要更大的視訊記憶體。7B模型若採用FP16進行推理,至少需要16GB視訊記憶體。70B模型採用INT4量化,需要超過30GB的視訊記憶體,若採用FP16,視訊記憶體需求更是將超過100GB。

透過多卡互連,銳炫Pro B60能夠以更大的視訊記憶體容量,來支撐大模型執行,並在上下文和併發擴充套件方面展現優勢。一張銳炫Pro B60跑不了32B引數量的DeepSeek-R1蒸餾模型,但2張GPU就能支援20k tokens上下文,4張GPU可將上下文視窗擴充套件到100k以上,足以直接輸入一本不太厚的書或論文。

企業級應用場景對併發性提出了更高的要求。在設定8k上下文視窗的情況下,單張銳炫Pro B60無法支撐DeepSeek-R1 32B FP8精度模型的執行。使用兩張顯示卡時,系統可支援5-6個併發使用者。而當採用四張顯示卡、利用全部96GB視訊記憶體時,系統可支援超過50個併發使用者,足以滿足中小企業的大部分需求。
英特爾自己也用銳炫Pro B60來解決問題。在開發酷睿Ultra第二代Lunar Lake產品時,英特爾在VPC解碼過程中發現了一個Bug,表現出現破圖現象。這類問題通常非常複雜,可能跨越多個軟體層,且程式碼量巨大。一位經驗豐富的工程師通常需要花費數天時間,從數萬行log中發現問題,debug找到根源,並提供程式碼修復方案,然後重新進行測試。
而英特爾在配備4張銳炫Pro B60和至強W處理器的伺服器上部署執行多AI agent協同方案,僅花費數小時便完成了從問題定位到程式碼修復的全過程,並最終完成了所有問題的修復和重新測試。

03.
8張銳炫Pro B60互連,
可跑1500億引數大模型
推理工作站具有廣闊的發展前景,主要體現在:1)安全部署,資料無需上傳至雲端,可在本地處理;2)提供一站式解決方案,將所有軟體置於容器中,幫助客戶解決問題,易於設定;3)易於擴充套件,可靈活配置不同數量的顯示卡;4)成本效益具有顯著優勢。
英特爾釋出了一款可配置的工作站級英特爾至強平臺(代號Project Battlematrix),旨在減少AI開發人員的摩擦點。

藉助高達192GB的影片隨機存取儲存器(VRAM),它最多可支援8張英特爾銳炫Pro B60 24GB GPU,執行高達1500億個引數的中等規模且精度高的AI模型。

為了最佳化AI推理效能,英特爾在底層軟體上引入GPUDirect Peer-to-Peer技術,可在GPU之間直接複製資料,不需要CPU參與。此外,其張量並行演算法則可以把一張顯示卡放不下的大模型平均切分到4張或者是8張卡上進行推理,然後把結果合併輸出給使用者。
英特爾採用容器化方案來幫助客戶解決軟體部署的複雜性問題,在容器內部對大語言模型進行了大量的最佳化,包括Linux軟體棧的支援、驗證以及分階段的軟體釋出。
其Project Battlematrix Linux軟體棧如下圖所示,Linux作業系統位於容器之外,往上是使用者層驅動,Level 0是英特爾的底層驅動,再向上是英特爾OneAPI和XPU Manager,上層是英特爾對生態系統的支援。目前該軟體棧採用vLLM Serving,未來也將支援SGLang等其他開源軟體。英特爾對各層軟體進行了完整的驗證和最佳化,並透過容器形式一鍵交付給客戶,以方便部署。

英特爾還展示了軟體功能路線圖,預計第三季度釋出經過完整驗證和產品化的容器,第四季度推出SR-IOV、VDI虛擬桌面的軟體效能最佳化以及完整的管理功能。

04.
英特爾Gaudi 3:PCIe卡AI峰值算力
達1678TFLOPS,機架級配備8.2TB HBM
英特爾進一步推進其AI戰略,推出英特爾Gaudi 3 AI加速器的全新部署方案。

英特爾Gaudi 3 PCIe卡配備128GB HBM2e,FP8精度下AI峰值算力達到1678TFLOPS,支援在現有伺服器資料中心環境中進行可擴充套件的AI推理。

以AI大模型Llama為例,得益於可擴充套件配置,可靈活執行從輕量級Llama 3.1 8B到規模較大的Llama 4 Scout或Maverick等各種規模的AI模型。
英特爾Gaudi 3機架級系統參考設計帶來了極大的靈活性和可擴充套件性,每個機架最多可容納64個加速器,並擁有高達8.2TB的高頻寬記憶體(HBM)。
其機架級架構針對大型AI模型進行深度最佳化,可提供即時推理效能。
開放式模組化設計打破了供應商的限制,而有線背板和盲插2D全機架佈線讓安裝和維護變得更加簡單。透過液冷,這些系統可提供強大的效能,並有助於TCO的控制。
這些配置支援雲服務提供商(CSP)的定製化需求和開放計算專案(OCP)設計規範。英特爾承諾構建開放、靈活和安全AI基礎設施。
05.
結語:英特爾邁向全面轉型,
力補AI產品實力,強調“執行力”與“說真話”
此次新品釋出正值英特爾與臺灣科技生態系統合作40週年。英特爾進一步擴大專業級GPU陣容,提供大視訊記憶體、高性價比以及為AI推理和專業工作站量身定製的配置,並展示了其AI加速器產品及AI Assistant Builder的可用性。這些新產品有望為英特爾開闢新的局面。
在英特爾臺灣40週年晚宴活動上,陳立武發表致辭,談到英特爾將全面轉型,重回工程導向,不僅做CPU,還要構建完整的AI計算系統,包括晶片、軟體、儲存、互連及工作負載整合,並強化與中國臺灣科技供應鏈及客戶的交流合作。
陳立武再度表露改造英特爾的決心和策略,以及對“新英特爾”的期許。英特爾在PC市場有超過68%的市佔率,在伺服器市場有55%的市佔率。據陳立武透露,一些客戶反饋為了提高系統性能,正在評估推動開發定製晶片。
陳立武強調了兩個目標:打造好產品,令客戶滿意。為此,他讓英特爾工程團隊直接向他彙報,確保做出正確的晶片產品,並積極招募人才。他告訴團隊:“如果你不先告訴我壞訊息,而是讓我從客戶口中得知,那你就麻煩大了。我要的是誠實、真實的文化。”
此次來臺行程中,陳立武拜訪了許多OEM客戶,聽到很多反饋。“你會看到一個全新的英特爾。”他相信英特爾未來將以更謙卑、更開放的態度,主動傾聽客戶聲音,不僅要推出好產品,更要讓生產穩定、準時、品質穩定。
“我相信只要持續執行、執行、執行,就能讓英特爾恢復元氣。”陳立武說,他不是搞營銷的,不會吹噓表現,英特爾將用成果說話。

