英特爾大視訊記憶體GPU放猛料：價效比拉滿，本地跑DeepSeek-R1，效能秒RTX5060Ti

陳立武表露對“新英特爾”的期許。

作者 | ZeR0

編輯 | 漠影

芯東西5月20日報道，臺北國際電腦展COMPUTEX 2025今日盛大開幕，晶片產業領袖雲集，陳立武首次以英特爾CEO身份赴臺，並與中國臺灣供應鏈夥伴餐敘。英特爾更是一舉發布多款GPU和AI產品，包括英特爾銳炫Pro B50/B60 GPU、Gaudi 3 AI加速器、輕量級開源軟體框架Intel AI Assistant Builder，展露其在AI及專業視覺領域的最新佈局。

英特爾銳炫Pro B60/B50 GPU基於X^e2架構，具備AI特性，為要求嚴苛的AI推理工作負載和工作站應用而設計，進一步豐富了英特爾專業級GPU產品線。

其中，銳炫Pro B60配備24GB視訊記憶體，AI峰值算力為197TOPS，適用於推理工作站；銳炫Pro B50配備16GB視訊記憶體，AI峰值算力為170TOPS，適用於圖形工作站。

兩款GPU均搭載英特爾XMX AI核心和先進的光線追蹤單元，並支援多GPU擴充套件，透過將高視訊記憶體容量與關鍵軟體相容性相結合，為創作者和AI開發者提供了可擴充套件的、經濟高效的解決方案。

銳炫Pro B50直接面向零售市場，建議零售價為299美元（約合人民幣2159元），價效比優勢突出。銳炫Pro B60將主要透過B2B模式進行專案採購，正在與多家系統整合商和OEM廠商進行合作。

華擎、藍戟、Lanner、銘瑄、傲世、Senao和撼與科技等AIB合作伙伴將於今年6月開始提供英特爾銳炫Pro B60 GPU樣品。英特爾銳炫Pro B50 GPU將於今年7月開始在英特爾授權經銷商處上市。

有合作伙伴將提供銳炫Pro B60的單卡雙GPU方案，板載視訊記憶體容量達48GB。

英特爾Gaudi 3 AI加速器提供PCIe和機架級系統部署選擇，為企業和雲AI推理提供可擴充套件的開放解決方案。英特爾Gaudi 3 PCIe卡支援在現有伺服器資料中心環境中進行可擴充套件的AI推理，將於今年下半年上市。

在CES 2025首次亮相後，英特爾AI Assistant Builder軟體框架現已在GitHub上提供公開測試版。該框架專為在基於英特爾AI PC上本地構建和執行自定義AI agents而設計，可幫助企業或個人快速構建並部署AI agents。

01.

銳炫Pro B50：AI效能提升至3倍，

價效比較RTX A1000翻番

英特爾銳炫Pro B50 GPU實現了同類價位段最高配置：擁有16個X^e核心，配備16GB視訊記憶體、128 XMX引擎，視訊記憶體頻寬為224GB/s，AI峰值算力（Int8）為170TOPS，單卡功耗僅70W。PCIe Gen 5速度的提升也會帶來10%-20%的效能提升。

與同類產品對比，銳炫Pro B50的視訊記憶體容量、驅動程式最佳化、PCIe Gen 5提升均表現更優。同類產品通常配備6GB或8GB視訊記憶體。

與上一代產品及競品相比，銳炫Pro B50在圖形和AI推理效能上有1.1倍~3.5倍的提升。

在通用效能方面，銳炫Pro B50相比上一代產品提升50%~130%。其價效比不僅相較銳炫Pro A50、英偉達RTX A1000翻倍提升，比起銳炫Pro A60也略勝一籌。

該系列GPU在Windows上相容消費級和專業級驅動程式，在Linux上支援容器化的軟體棧。其軟體棧可以簡化AI部署，並支援逐步升級和功能最佳化。

新發布的兩款GPU針對AEC（建築、工程、施工）和推理工作站進行了最佳化，並透過大量ISV認證和最佳化的軟體提供穩定、可靠的效能。

英特爾副總裁兼客戶端顯示卡總經理Vivian Lien稱，全新英特爾銳炫Pro GPU為一直在尋求針對性解決方案的中小型企業，提供了易於獲取且可擴充套件的解決方案。

02.

銳炫Pro B60：AI峰值算力197TOPS，

跑DeepSeek-R1倍殺RTX 5060Ti

銳炫Pro B60擁有20個X^e核心，配備24GB視訊記憶體、160 XMX引擎，視訊記憶體頻寬為456GB/s，AI峰值算力（Int8）為197TOPS，根據不同系統設計，單卡功耗區間為120~200W。

從效能來看，銳炫Pro B60執行DeepSeek-R1、Phi 4、QwQ、Qwen 2.5、Llama 3等模型時，相比英偉達RTX 2000 Ada 16GB、RTX 5060Ti 16GB的吞吐量更高。

更大引數規模的模型，需要更大的視訊記憶體。7B模型若採用FP16進行推理，至少需要16GB視訊記憶體。70B模型採用INT4量化，需要超過30GB的視訊記憶體，若採用FP16，視訊記憶體需求更是將超過100GB。

透過多卡互連，銳炫Pro B60能夠以更大的視訊記憶體容量，來支撐大模型執行，並在上下文和併發擴充套件方面展現優勢。一張銳炫Pro B60跑不了32B引數量的DeepSeek-R1蒸餾模型，但2張GPU就能支援20k tokens上下文，4張GPU可將上下文視窗擴充套件到100k以上，足以直接輸入一本不太厚的書或論文。

企業級應用場景對併發性提出了更高的要求。在設定8k上下文視窗的情況下，單張銳炫Pro B60無法支撐DeepSeek-R1 32B FP8精度模型的執行。使用兩張顯示卡時，系統可支援5-6個併發使用者。而當採用四張顯示卡、利用全部96GB視訊記憶體時，系統可支援超過50個併發使用者，足以滿足中小企業的大部分需求。

英特爾自己也用銳炫Pro B60來解決問題。在開發酷睿Ultra第二代Lunar Lake產品時，英特爾在VPC解碼過程中發現了一個Bug，表現出現破圖現象。這類問題通常非常複雜，可能跨越多個軟體層，且程式碼量巨大。一位經驗豐富的工程師通常需要花費數天時間，從數萬行log中發現問題，debug找到根源，並提供程式碼修復方案，然後重新進行測試。

而英特爾在配備4張銳炫Pro B60和至強W處理器的伺服器上部署執行多AI agent協同方案，僅花費數小時便完成了從問題定位到程式碼修復的全過程，並最終完成了所有問題的修復和重新測試。

03.

8張銳炫Pro B60互連，

可跑1500億引數大模型

推理工作站具有廣闊的發展前景，主要體現在：1）安全部署，資料無需上傳至雲端，可在本地處理；2）提供一站式解決方案，將所有軟體置於容器中，幫助客戶解決問題，易於設定；3）易於擴充套件，可靈活配置不同數量的顯示卡；4）成本效益具有顯著優勢。

英特爾釋出了一款可配置的工作站級英特爾至強平臺（代號Project Battlematrix），旨在減少AI開發人員的摩擦點。

藉助高達192GB的影片隨機存取儲存器（VRAM），它最多可支援8張英特爾銳炫Pro B60 24GB GPU，執行高達1500億個引數的中等規模且精度高的AI模型。

為了最佳化AI推理效能，英特爾在底層軟體上引入GPUDirect Peer-to-Peer技術，可在GPU之間直接複製資料，不需要CPU參與。此外，其張量並行演算法則可以把一張顯示卡放不下的大模型平均切分到4張或者是8張卡上進行推理，然後把結果合併輸出給使用者。

英特爾採用容器化方案來幫助客戶解決軟體部署的複雜性問題，在容器內部對大語言模型進行了大量的最佳化，包括Linux軟體棧的支援、驗證以及分階段的軟體釋出。

其Project Battlematrix Linux軟體棧如下圖所示，Linux作業系統位於容器之外，往上是使用者層驅動，Level 0是英特爾的底層驅動，再向上是英特爾OneAPI和XPU Manager，上層是英特爾對生態系統的支援。目前該軟體棧採用vLLM Serving，未來也將支援SGLang等其他開源軟體。英特爾對各層軟體進行了完整的驗證和最佳化，並透過容器形式一鍵交付給客戶，以方便部署。

英特爾還展示了軟體功能路線圖，預計第三季度釋出經過完整驗證和產品化的容器，第四季度推出SR-IOV、VDI虛擬桌面的軟體效能最佳化以及完整的管理功能。

04.

英特爾Gaudi 3：PCIe卡AI峰值算力

達1678TFLOPS，機架級配備8.2TB HBM

英特爾進一步推進其AI戰略，推出英特爾Gaudi 3 AI加速器的全新部署方案。

英特爾Gaudi 3 PCIe卡配備128GB HBM2e，FP8精度下AI峰值算力達到1678TFLOPS，支援在現有伺服器資料中心環境中進行可擴充套件的AI推理。

以AI大模型Llama為例，得益於可擴充套件配置，可靈活執行從輕量級Llama 3.1 8B到規模較大的Llama 4 Scout或Maverick等各種規模的AI模型。

英特爾Gaudi 3機架級系統參考設計帶來了極大的靈活性和可擴充套件性，每個機架最多可容納64個加速器，並擁有高達8.2TB的高頻寬記憶體（HBM）。

其機架級架構針對大型AI模型進行深度最佳化，可提供即時推理效能。

開放式模組化設計打破了供應商的限制，而有線背板和盲插2D全機架佈線讓安裝和維護變得更加簡單。透過液冷，這些系統可提供強大的效能，並有助於TCO的控制。

這些配置支援雲服務提供商（CSP）的定製化需求和開放計算專案（OCP）設計規範。英特爾承諾構建開放、靈活和安全AI基礎設施。

05.

結語：英特爾邁向全面轉型，

力補AI產品實力，強調“執行力”與“說真話”

此次新品釋出正值英特爾與臺灣科技生態系統合作40週年。英特爾進一步擴大專業級GPU陣容，提供大視訊記憶體、高性價比以及為AI推理和專業工作站量身定製的配置，並展示了其AI加速器產品及AI Assistant Builder的可用性。這些新產品有望為英特爾開闢新的局面。

在英特爾臺灣40週年晚宴活動上，陳立武發表致辭，談到英特爾將全面轉型，重回工程導向，不僅做CPU，還要構建完整的AI計算系統，包括晶片、軟體、儲存、互連及工作負載整合，並強化與中國臺灣科技供應鏈及客戶的交流合作。

陳立武再度表露改造英特爾的決心和策略，以及對“新英特爾”的期許。英特爾在PC市場有超過68%的市佔率，在伺服器市場有55%的市佔率。據陳立武透露，一些客戶反饋為了提高系統性能，正在評估推動開發定製晶片。

陳立武強調了兩個目標：打造好產品，令客戶滿意。為此，他讓英特爾工程團隊直接向他彙報，確保做出正確的晶片產品，並積極招募人才。他告訴團隊：“如果你不先告訴我壞訊息，而是讓我從客戶口中得知，那你就麻煩大了。我要的是誠實、真實的文化。”

此次來臺行程中，陳立武拜訪了許多OEM客戶，聽到很多反饋。“你會看到一個全新的英特爾。”他相信英特爾未來將以更謙卑、更開放的態度，主動傾聽客戶聲音，不僅要推出好產品，更要讓生產穩定、準時、品質穩定。

“我相信只要持續執行、執行、執行，就能讓英特爾恢復元氣。”陳立武說，他不是搞營銷的，不會吹噓表現，英特爾將用成果說話。

dignews.cc

英特爾大視訊記憶體GPU放猛料：價效比拉滿，本地跑DeepSeek-R1，效能秒RTX5060Ti

相關文章

華碩天選6Pro銳龍版即將上市，RTX5070遊戲本到手價6999元

聯想推出小新Pro/GT銳龍AI元啟版，3月3日開放預約

大模型一體機塞進這款遊戲卡，價格砍掉一個數量級

微星泰坦、雷影、絕影系列2025筆記本開啟預約，最高RTX5090+4KMiniLED屏

聊一款不再“以下克上”的輕薄本處理器

榨乾3000元顯示卡，跑通千億級大模型的秘方來了

機械革命無界15XPro輕薄本預熱：AMD銳龍AI9H365處理器，PCMark10續航15小時以上

所有筆記本重量排名表·20250407

【投票：同志們希望什麼價位段顯示卡？】所有筆記本重量排名表·20250320

所有筆記本重量排名表【雙十一資料篇】·20250129