下載提醒:伺服器基礎知識全解終極版(第二版),儲存系統基礎知識全解(終極版),SSD快閃記憶體技術基礎知識全解(含PPT和PDF)近期完成更新(已領請忽略),請購買過“架構師技術全店資料打包彙總(全)(46份)”的讀者,請在微店留言獲免費取更新。
本次主要更新內容:
-
1、CPU更新(Intel/AMD架構演進,國產CPU架構)
-
2、GPU更新(英偉達GPU架構,從Fermi到Hopper,Rubin Ultra)
-
3、記憶體技術、操作系統、儲存技術等更新
-
4、已知問題修正
-
5、更新內容40+頁PPT
相關閱讀:
100個網路技術基礎知識(收藏版)
100個企業儲存基礎知識(收藏版)
100個GPU核心知識概述(收藏版)


-
1、CPU更新(Intel/AMD架構演進,國產CPU架構)
-
2、GPU更新(英偉達GPU架構,從Fermi到Hopper,Rubin Ultra)
-
3、記憶體技術、操作系統、儲存技術等更新
-
4、已知問題修正
-
5、更新內容40+頁PPT
一、DPU基礎概念
1.定義:DPU即資料處理單元(Data Processing Unit) ,是一種專用資料處理器,旨在將CPU處理效率低下或GPU難以勝任的資料密集型任務進行解除安裝處理,釋放CPU算力 。
2.誕生背景:隨著資料量爆炸式增長以及資料中心業務複雜性提升,傳統CPU和GPU架構難以滿足高效資料處理需求,DPU應運而生 。
3.發展歷程:概念雖在2020年由NVIDIA正式提出,但智慧網絡卡等DPU原型產品早有應用,以色列Mellanox公司在智慧網絡卡設計上貢獻突出,英偉達收購Mellanox後加速DPU技術落地 。
4.與CPU、GPU區別:CPU是通用計算核心,擅長複雜邏輯控制和通用計算;GPU專注平行計算,用於圖形處理和大規模平行計算任務;DPU則聚焦網路、儲存和安全等資料中心基礎設施任務處理 。
5.地位:被視為資料中心繼CPU和GPU之後的第三顆主力晶片 。
6.架構組成:一般由I/O子系統、計算子系統和加速器組成 。
7.I/O子系統作用:負責資料的輸入輸出,實現與外部裝置的資料互動。
8.計算子系統構成:由CPU和記憶體組成,為DPU提供計算能力和資料儲存能力。
9.加速器作用:加速主機在處理人工智慧、雲計算、虛擬化、儲存以及網路安全等複雜資料中心任務的能力。
10.物理形態:和獨立顯示卡相似,是標準PCIe金手指介面的獨立板卡 。
11.介面:常見PCIe介面,如BlueField-3 DPU卡的PCIe口為最新的5.0協議,可向下相容;左側擋板常配有RJ-45帶外管理介面和一到多個高速率網路介面。
12.供電:伺服器主機板PCIe槽位需支援最高75W供電能力;若單張DPU卡額定功耗超75W,會在右上方配6針額外供電介面 。
13.資料中心角色:承擔網路傳輸、資料安全和基礎設施管理任務,最佳化資料中心計算和傳輸效率。
14.硬體加速原理:透過硬體電路和專用演算法,對特定資料處理任務進行快速處理。
15.軟體支援:需要配套的驅動程式和管理軟體,實現對DPU的配置、監控和管理。
二、DPU核心技術
16.算力解除安裝技術:將網路、儲存和虛擬化工作負載從CPU解除安裝到DPU,提高資料中心效能和效率 。
17.算力釋放技術:避免CPU過度參與資料處理,使資料直接傳遞給應用、GPU或儲存裝置,減少效能瓶頸 。
18.算力擴充套件技術:消除網路瓶頸,降低分散式應用任務週期內的通訊耗時佔比,提升大規模叢集整體計算能力。
19.RDMA(遠端直接記憶體訪問)技術:可加速記憶體之間的資料交換,實現零複製、核心旁路和基於事務的訊息處理,減少CPU在網路任務上的開銷 。
20.SR – IOV(單根I/O虛擬化)技術:允許多個虛擬機器共享物理網絡卡資源,提升網路I/O效能 。
21.NVMe – oF(基於光纖的非易失性記憶體主機控制器介面規範)技術:實現儲存裝置的高速訪問,DPU支援該技術可加速儲存效能 。
22.網路功能虛擬化(NFV)技術:透過軟體實現網路功能,DPU可加速NFV的處理 。
23.軟體定義網路(SDN)技術:實現網路的靈活控制和管理,DPU與SDN結合可最佳化網路效能 。
24.儲存虛擬化技術:將物理儲存資源虛擬化為邏輯儲存單元,DPU協助管理和最佳化儲存虛擬化 。
25.安全啟動技術:確保系統啟動過程的安全性,防止惡意軟體入侵。
26.防火牆解除安裝技術:將防火牆功能從CPU解除安裝到DPU,提高防火牆處理效能。
27.資料傳輸加密技術:對資料在傳輸過程中進行加密,保證資料安全,DPU可加速加密解密操作 。
28.零信任架構技術:DPU為每個伺服器提供獨立安全服務,與伺服器應用域隔離實現零信任架構,防止攻擊擴散 。
29.硬體加速引擎:DPU中整合的專門用於加速特定任務的硬體模組 。
30.可程式設計邏輯:允許使用者根據需求對DPU的功能進行程式設計定製 。
31.片上網路(NoC)技術:用於DPU內部各個元件之間的資料通訊,提高通訊效率 。
32.記憶體管理技術:最佳化DPU記憶體使用,提高資料處理速度 。
33.快取技術:設定快取以減少資料訪問延遲,提高DPU效能 。
34.多核心技術:採用多個核心並行處理資料,提升DPU計算能力 。
35.異構計算技術:結合不同型別的計算單元,如CPU核心與專用加速器,發揮各自優勢 。
36.分散式計算技術:支援分散式計算架構,使DPU能夠協同工作處理大規模任務 。
37.負載均衡技術:將任務均勻分配到DPU的各個核心或多個DPU之間,提高資源利用率 。
38.熱插拔技術:允許在系統執行時插拔DPU裝置,方便維護和升級 。
39.時鐘管理技術:最佳化DPU的時鐘頻率,平衡效能和功耗 。
40.錯誤檢測與糾正技術:確保資料在處理和傳輸過程中的準確性。
三、DPU核心引數
41.網路頻寬:如BlueField – 3 DPU支援1400Gbit/s、2100Gbit/s的乙太網和無限頻寬,決定資料傳輸速度 。
42.記憶體容量:BlueField – 3 DPU提供高達48GB記憶體容量,影響DPU可處理的資料量 。
43.記憶體頻寬:BlueField – 3 DPU支援高達5600Mhz的記憶體頻寬,關係記憶體資料讀寫速度 。
44.CPU核心數:BlueField – 3 DPU的CPU部分使用ARM架構,提供高達16核心,核心數影響計算能力 。
45.CPU頻率:BlueField – 3 DPU的A78架構核心組頻率高達2.3Ghz,頻率越高計算速度越快 。
46.PCIe協議版本:如BlueField – 3 DPU卡的PCIe口為5.0協議,高版本提供更高資料傳輸速率 。
47.固態硬碟容量:BlueField – 3 DPU整合40GB pSLC EMMC + 128GB的固態硬碟,用於儲存資料 。
48.加速器效能指標:不同加速器有各自效能指標,如用於AI加速的效能引數 。
49.儲存I/O效能:衡量DPU對儲存裝置讀寫操作的速度和效率 。
50.網路I/O效能:體現DPU在網路資料收發和處理方面的能力 。
51.資料加密速度:DPU加速資料加密時的加密資料量/時間 。
52.資料解密速度:DPU加速資料解密時的解密資料量/時間 。
53.虛擬化效能:如支援的虛擬機器數量、虛擬機器效能損耗等指標。
54.防火牆吞吐量:DPU作為防火牆時單位時間內可處理的最大網路流量 。
55.負載均衡能力:可處理的最大併發連線數、每秒新建連線數等。
56.功耗:DPU執行時消耗的功率,影響資料中心散熱和運營成本 。
57.散熱要求:DPU正常工作所需的散熱條件 。
58.可靠性指標:如平均故障間隔時間(MTBF)等 。
59.可擴充套件性:能否方便增加DPU數量或升級硬體以提升效能 。
60.相容性:與伺服器硬體、作業系統、其他軟體的相容程度。
四、DPU應用場景
61.AI應用:拓展AI晶片應用領域,滿足光學神經網路、光學計算等多樣化AI場景需求 。
62.雲網絡:包括網路功能解除安裝、儲存介面硬體加速、儲存應用解除安裝以及Service Mesh解除安裝等 。
63.儲存應用:統一管理和運維儲存資源,提供硬體級QoS服務,支援多種場景下儲存統一管理 。
64.安全應用:涵蓋安全啟動、防火牆解除安裝和資料傳輸加密等,保障資料安全。
65.高效能計算:加速大規模科學計算、工程模擬等任務。
66.邊緣計算:在邊緣節點處理資料,減少資料傳輸延遲。
67.5G網路:處理5G網路中的資料轉發、流量管理等任務 。
68.大資料分析:快速處理和分析海量資料。
69.物聯網:管理和處理物聯網裝置產生的大量資料。
70.金融行業:用於金融交易資料處理、風險評估等。
71.醫療行業:處理醫療影像、電子病歷等資料。
72.科研領域:協助科研機構處理實驗資料、模擬計算等。
73.影片流媒體:最佳化影片資料的傳輸和處理。
74.遊戲行業:支援遊戲伺服器的高效執行。
75.電商行業:處理電商平臺的交易資料、使用者資料等。
五、DPU關鍵友商
76.NVIDIA:DPU領域領先者,BlueField系列產品是市場代表性DPU 。BlueField – 2搭載8顆64 bit的ARMA72 CPU核心、2VLIM加速器和ConnectX6Dx智慧網絡卡 ;BlueField – 3專為AI和加速計算設計,支援400G乙太網和NDR InfiniBand 。
77.AMD Pensando:核心是完全可程式設計P4資料處理單元(DPU) ,採用與超大規模服務系統相同底層技術,已在多個雲平臺和企業中部署 。
78.Intel:採用CPU配合FPGA和加速引擎的方式發展DPU相關技術 。
79.Marvell:使用最新的處理器核心配合硬體加速引擎。
80.AWS:自研Nitro DPU系統,將網路、儲存、安全和監控等功能轉移到專用硬體和軟體上 。
81.阿里雲:積極佈局DPU領域,在雲上伺服器場景有相關技術和產品 。
82.Fungible:其F1晶片支援16個雙模PCIe控制器和8x100G網路介面,有獨特的TrueFabric技術 。
83.博通(Broadcom):在網路晶片領域實力強勁,可能在DPU相關技術和產品上有所佈局 。
84.賽靈思(Xilinx,已被AMD收購):原有的FPGA技術可為DPU發展提供技術支援 。
85.瑞薩電子(Renesas):在半導體領域有廣泛業務,可能涉足DPU市場 。
86.美滿電子科技(Marvell Technology):不斷研發處理器核心與硬體加速引擎用於DPU 。
87.英偉達與AMD競爭優勢對比:英偉達先發優勢明顯,產品效能和生態完善;AMD Pensando在軟體堆疊和安全方面有獨特最佳化 。
88.Intel與其他友商技術差異:採用CPU配合FPGA和加速引擎的獨特技術路線。
89.雲廠商自研DPU的意義:提高雲服務效能、降低成本、增強安全性和自主性。
90.新進入DPU市場廠商的挑戰:技術研發難度大、市場競爭激烈、生態建設困難。
91.友商產品效能對比維度:網路頻寬、計算能力、儲存效能、安全功能、功耗等。
92.友商產品價格對比:不同廠商不同型號DPU價格因效能和定位而異 。
93.友商產品生態建設情況:包括軟體支援、合作伙伴數量和質量等。
94.NVIDIA的市場份額:在DPU市場佔據較高份額,產品應用廣泛 。
95.AMD Pensando的市場策略:與雲廠商和企業合作,透過軟體最佳化提升競爭力。
96.Intel的DPU發展戰略:結合自身CPU和FPGA技術優勢,推動DPU技術發展。
97.雲廠商自研DPU對市場格局的影響:改變市場競爭格局,增加市場多樣性和創新性。
98.友商之間的技術合作與競爭關係:既有競爭,也在部分技術和標準上存在合作。
99.未來DPU友商發展趨勢:技術不斷創新、產品效能提升、應用場景拓展。
100.新興DPU廠商的發展機會:在細分市場、特定應用場景或新技術應用方面找到突破點。
相關閱讀:
-
海思昇騰920晶片解析:達芬奇架構進化與AI算力躍遷 -
申威晶片技術分析報告 -
昇騰910 AI晶片技術全面概述 -
乾貨收藏:GPU引數詳解與主流產品對比分析 -
寒武紀AI晶片分析報告 -
智算中心網路常見組網拓撲分析 -
中國智算中心:佈局、分佈與發展態勢 -
SSD快閃記憶體技術基礎知識全解(終極版) -
昇騰310晶片引數及技術概述 -
InfiniBand,撼動不了乙太網? -
InfiniBand高效能網路設計概述 -
面向E級計算的4款高效能處理器概述 -
基於鯤鵬處理器的高效能計算實踐 -
高效能計算關鍵元件核心知識 -
一文全解高效能製造模擬技術 -
高效能計算:RoCE技術分析及應用 -
高效能計算:談談被忽視的國之重器 -
高效能計算:RoCE v2 vs. InfiniBand網路該怎麼選? -
高效能網路全面向RDMA進軍



免責申明:本號聚焦相關技術分享,內容觀點不代表本號立場,可追溯內容均註明來源,釋出文章若存在版權等問題,請留言聯絡刪除,謝謝。
推薦閱讀
更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包(全)”相關電子書(46本技術資料打包彙總詳情可透過“閱讀原文”獲取)。
溫馨提示:
掃描二維碼關注公眾號,點選閱讀原文連結獲取“架構師技術全店資料打包彙總(全)”電子書資料詳情。

