公眾號記得加星標⭐️,第一時間看推送不會錯過。

來源:內容編譯自IEEE。
在過去的美好時光裡,網路只是連線少量本地計算機。但時代變了。在人工智慧主導的世界裡,關鍵在於協調數萬臺伺服器的活動,以訓練大型語言模型,並且不造成任何通訊延遲。現在,有一個經過最佳化的架構可以實現這一點。Cornelis Networks表示,其 CN500 網路結構可最大限度地提高人工智慧效能,支援部署多達 50 萬臺計算機或處理器(比現在高出一個數量級),並且不會增加延遲。
繼乙太網和InfiniBand之後,這項新技術為網路領域帶來了第三款重要產品。它旨在使人工智慧和高效能計算機(HPC,即超級計算機)能夠以更高的效率實現更快、更可預測的完成時間。Cornelis 聲稱,在 HPC 方面,其技術優於2022 年推出的InfiniBand NDR版本,每秒傳遞的訊息數量是後者的兩倍,延遲降低了 35%。在人工智慧應用方面,與基於乙太網的協議相比,其通訊速度提高了六倍。
乙太網長期以來一直是區域網(LAN)的代名詞。軟體補丁使其通訊協議經受住了時間的考驗。InfiniBand 的發明是一項改進,但它的設計目標仍然是相同的:連線少量本地裝置。“這些技術發明之初,與平行計算毫無關聯,”賓夕法尼亞州 Cornelis 公司聯合創始人、總裁兼營運長Philip Murphy表示。
當資料中心開始興起時,工程師們需要一種新的網路解決方案。由於不同的系統使用不同的軟體,它們無法共享資源——因此,擴充套件乙太網和 InfiniBand 等網路以適應最繁忙的運營時段顯得頗具挑戰性。“這引發了整個雲計算的演變,”墨菲說道。在不同的計算機甚至不同的組織之間共享基於雲的 CPU 成為了當時流行的解決方案。
然而,儘管資料中心先驅們試圖最大限度地增加單臺伺服器上執行的應用程式數量,墨菲和他的同事們卻看到了相反方法的價值:最大限度地增加單個應用程式上執行的處理器數量。“這需要一個完全不同的網路解決方案,”他說道,而這正是 Cornelis 現在提供的。該公司的Omni-Path架構由英特爾開發,用於超級計算應用,例如模擬氣候模型或藥物設計的分子相互作用,它提供了最大的吞吐量,並且零資料包丟失。
無擁堵資料高速公路
協調處理器來訓練人工智慧模型需要以極高的頻寬交換大量訊息(資料包)。每毫秒的訊息速率很重要,延遲(即接收方需要多長時間才能做出響應)也很重要。
在整個網路中共享如此多的資料包所帶來的一個主要挑戰是流量擁堵。墨菲解釋說,你需要一種可靠地繞過擁堵點並避免其他問題的方法。例如,如果資料包透過不同的路由到達同一目的地,它們可能會出現亂序。
Cornelis 的動態自適應路由演算法透過繞過短暫擁塞事件來緩解擁塞,而其擁塞控制架構則將流量路由到“熱門”目的地。“如果某個體育場舉辦了一場我們都想去的活動,你肯定不希望經過體育場的流量也卡在那裡,”Murphy 說。中央調速技術實現了這種擁塞控制架構。交換機會檢測流量的形成位置,然後指示傳送方減速,直到擁塞消散。“想象一下,當車輛駛入高速公路入口匝道時,如何緩解交通擁堵,”Murphy 解釋道。
另一個挑戰是避免延遲。在傳統的乙太網架構中,傳送資料包需要端點有足夠的記憶體。“如果我傳送給你,而你的記憶體不足,你必須回來告訴我,”墨菲說。這是一個漫長的迴圈,需要大量的不可擴充套件的緩衝區。相反,科內利斯使用了一種名為“基於信用的流量控制”的演算法,可以提前分配記憶體。“你什麼都不用告訴我,我就能知道還能傳送多少,”墨菲說。
最後,系統避免了 GPU 或鏈路故障導致的宕機。在傳統架構中,如果伺服器宕機,應用程式也會宕機。修復這個問題需要從最近的檢查點重新啟動——這本身就需要大量的計算能力來建立。“想象一下,如果每次點選文件上的‘儲存’,你都必須等待 20 分鐘,”Murphy 說。相反,由於 Cornelis Networks 的伺服器分佈在多臺計算機上,因此即使頻寬略低,應用程式也能保持執行,直到故障鏈路被替換——無需檢查點。
高效的人工智慧
從物理上講,CN5000產品是一款基於定製晶片構建的網絡卡。這些網絡卡可以插入每臺伺服器,“就像你在家裡的電腦上插乙太網卡一樣,”Murphy 解釋道。機架頂部交換機透過線纜連線到每臺伺服器和其他交換機,而導向器級交換機則配備 48 或 576 個埠,用於連線機架交換機。“每臺伺服器都插有網絡卡,因此你可以構建數千個端點叢集,”Murphy 說。
該公司的主要市場是那些希望升級到新叢集以實現 AI 或更快 HPC 模擬的組織。Cornelis 會透過與其合作的三家伺服器和網路交換機原始裝置製造商之一來實現這一目標。OEM 會從 Cornelis 購買物理卡,並將其插入伺服器,然後再完成訂單。
直到最近,訓練一個神經網路模型還是一次性的事情。但現在,訓練一個擁有數萬億引數的人工智慧模型意味著需要反覆進行微調或更新。Cornelis 希望能夠利用這一點。“如果你不採用人工智慧,你就會倒閉。如果你使用人工智慧效率低下,你仍然會倒閉,”Murphy 說。“我們的客戶希望以儘可能最高效的方式採用人工智慧。”
Nvidia 在資料中心乙太網銷售額上超越思科和競爭對手 Arista
乙太網業務並非單一的,而是多種多樣的。如今,隨著用於後端AI叢集網路的乙太網交換機的演進,出現了一種新的業務,有可能主導收入和利潤。這四大乙太網細分市場——園區、邊緣、資料中心前端和資料中心後端——並非步調一致,儘管它們之間的協議相容,但基本上各行其是。
例如,不管你信不信,根據 IDC 的研究,1Gb/秒交換機市場在今年第一季度實際上實現了增長,而該市場仍然佔據資料中心以外乙太網產品銷售收入的一半以上。
第一代乙太網交換機遵循在網際網路泡沫鼎盛時期最終確定的光纖和銅線協議傳輸標準,於2000年問世,而1 Gb/秒乙太網則花了幾年時間才在資料中心和運營商網路中成為主流,並最終進入園區網路。因此,如果我們對IDC近期乙太網市場公開宣告中的解讀和估計準確無誤,那麼在800 Gb/秒乙太網交換機的銷售在大約25年後開始在資料中心獲得實質性增長的情況下,1 Gb/秒交換機在2025年第一季度仍能帶來約25億美元的銷售額,這或許會令人感到驚訝。

另一方面,IDC 在其乙太網交換和路由市場資料中首次公佈了 800 Gb/秒產品的銷售額。具體來說,如果 IDC 過去的表現可以作為其當前表現的參考,我們懷疑它是否會再次這樣做。該公司表示,800 Gb/秒裝置在第一季度帶來了 3.501 億美元的收入,佔同期全球 117 億美元乙太網交換機總銷售額的 5.1%。
200 Gb/秒和400 Gb/秒裝置的銷售額增長了2.9倍,這些裝置完全在資料中心銷售,有時也用於路由裝置和交換工作。根據IDC過去的宣告以及我們據此構建的模型,我們認為200 Gb/秒和400 Gb/秒裝置合計創造了約45億美元的銷售額,本季度埠數量可能超過1800萬個。IDC對100 Gb/秒乙太網的銷售額隻字未提。100 Gb/秒乙太網即使在銷售十五年後仍用於高階園區市場以及企業和服務提供商網路。10 Gb/秒裝置的銷售額則在2023年開始批量出貨。我們的最佳預測是,100 Gb/秒乙太網在第一季度創造了約30億美元的收入,而10 Gb/秒交換機的銷售額可能達到5億美元以上。校園和邊緣的 2.5 Gb/秒、5 Gb/秒、25 Gb/秒和 50 Gb/秒裝置的銷售佔據了剩餘的大部分。
路由器市場發展緩慢,路由工作量隨著時間的推移基本保持穩定,即使部分路由工作被轉移到也能承擔路由任務的現代交換機上——這在超大規模企業、雲構建商和能夠自行設計硬體和路由軟體堆疊的電信運營商中很常見。其他服務提供商的規模不足以承擔這樣的任務,這就是為什麼思科和華為技術公司仍然擁有路由硬體業務的原因。

IDC 還在其剛剛釋出的 2025 年第一季度報告中開始單獨跟蹤 Nvidia。
當然,Nvidia 已迅速崛起,在資料中心領域挑戰思科系統和 Arista Networks,這主要是因為其 InfiniBand 超級計算互連在後端 AI 網路方面的應用正在減弱,而其 Spectrum-X 乙太網(具有與 BlueField DPU 配合使用的現代擁塞控制和自適應路由功能)正越來越多地被其 AI 系統客戶所採用。對於執行機密工作負載的能力級機器,HPC 中心對 Spectrum-X 的熱情程度還有待觀察。但對於那些執行能力級 HPC 系統且擁有數千名使用者執行各種相對較小的作業的人來說,我們認為 Spectrum-X 所需的溢價可能是值得的,因為 Spectrum-X 具有接近 InfiniBand 的網路效能以及與共享雲實用程式相當的網路微分段和安全性。
我們對 Nvidia 乙太網交換機的銷量有自己的估計,但在下面的圖表中,我們透過計算上圖中 Nvidia 的畫素來確定 IDC 認為的銷量。

如你所見,Nvidia 絕對是乙太網交換領域的有力競爭者,而且其崛起速度遠超 Arista Networks。Arista Networks 於 2009 年憑藉 10 Gb/秒的裝置起步,並在 100 Gb/秒時代真正嶄露頭角。(Arista 最近才擴充套件到園區交換領域,如今在這個領域與思科競爭比十五年前在資料中心領域與思科競爭更加艱難。)
本季度,思科的乙太網交換機收入增長了4.7%,達到36.4億美元,佔乙太網市場份額略低於三分之一。相比之下,英偉達的乙太網交換機收入同比增長了8.6倍,環比增長了1.84倍。如果我們進行三角計算,就會發現英偉達在第一季度的乙太網交換機銷售額為14.6億美元,在117億美元的乙太網交換機市場份額中佔據了12.5%的份額。而Arista Networks長期以來一直佔據著乙太網交換機市場份額的榜首,其收入增長了27.1%,達到16.3億美元,佔市場份額的13.9%。
惠普企業(HPE)的乙太網交換機銷售額略高於410億美元,下降了5%,這主要得益於其Aruba無線網路業務。華為的銷售額為7.04億美元,同比增長15.4%,不到2024年第四季度銷售額的一半。傳統上,第一季度對華為來說是一個非常疲軟的季度。根據IDC的資料以及我們構建模型時已知的資訊,全球原始設計製造商(ODM)——主要銷售資料中心產品——共計貢獻了14.1億美元的銷售額,同比增長67.5%,環比增長18.6%。
至於我們,關心的是當談到切換時,世界各地的資料中心內發生的情況。

據IDC資料顯示,資料中心乙太網交換機銷售額增長54.6%,達到69.2億美元,佔總銷售額的59.1%。在2020年第一季度至2022年第四季度(GenAI熱潮開始之時),資料中心乙太網交換機銷售額佔整個市場的平均份額為43.5%,因此,資料中心乙太網支出出現了大幅增長,這完全歸功於用於訓練和推理的AI叢集。
非資料中心市場部分(即園區和邊緣計算)的銷售額達到47.8億美元,同比增長9.5%。正如我們上文所述,其中略多於一半的銷售額來自園區領域銷售的1 Gb/秒裝置。
在上圖中,紅線標示了IDC停止公佈全球資料中心和非資料中心出貨量埠數量的點。我們已經盡力估算了這些數字,但必須承認,我們的估算是基於一個較為簡單的框架。
讓我們更深入地研究一下資料中心。以下是過去五個季度的資料,這次英偉達從“其他”類別中被剔除,而 H3C 和瞻博網路則重新被歸入“其他”類別,這意味著我們再也看不到它們了,因為 IDC 只公開討論排名前五的廠商以及 ODM 廠商。請看下圖:

如果剔除校園和邊緣計算,那麼 Nvidia 將緊隨 Arista Networks 之後,後者自 2023 年第四季度以來一直是資料中心乙太網交換機的最大銷售商。
2025年第一季度,Arista Networks 資料中心乙太網交換機銷售額達14.8億美元,同比增長26.4%,佔據資料中心業務21.3%的份額。Nvidia 緊隨其後,銷售額達14.6億美元,市場份額達21.1%,其迅猛增長的勢頭在本文開篇有所提及。思科在資料中心領域位居第三,乙太網裝置銷售額達12.5億美元,在我們的模型中同比增長17.7%。正如我們之前提到的,ODM(原始設計製造商)銷售額增長了67.5%,達到14.1億美元,但同樣,該領域仍有十幾家公司在生產規模可觀的網路裝置。
以下是資料中心乙太網銷售的更長趨勢線,供您參考:

所以問題是:您認為 Arista Networks 能在資料中心領域超越 Nvidia 嗎?
如果 Nvidia 試圖將其 Spectrum-X 網路的銷售額與其當前的 Grace-Blackwell 和未來的 Vera-Rubin 機架式系統的銷售額直接掛鉤,它可能會發現自己陷入了反壟斷的困境。捆綁銷售是絕對不允許的,尤其是在一家公司擁有 85% 或更高的市場份額,並且相關市場(在本例中為人工智慧系統)定義嚴格的情況下。HPE 已經對美國和歐洲的超級計算實驗室進行了一定程度的施壓,迫使它們在其百億億次級和百億億次級機器中採用“Rosetta” Slingshot 互連技術,但購買這些機器的政府知道,為了市場的長期利益,HPE 需要資金來投資於適合高效能計算 (HPC) 的乙太網變體。利潤豐厚的 Nvidia 很難說服任何反壟斷機構相信它沒有捆綁銷售,即使它實際上沒有捆綁銷售。
因此,即使 Nvidia 可能並非如此,也必須表現出開放的態度。正因如此,Nvidia 才與思科合作開發 Spectrum-X 互連產品,並同意將其 NX-OS 網路作業系統移植到 Spectrum-4 及更高版本的 ASIC 上。Arista 是否會與 Nvidia 在交換機 ASIC 上建立類似的合作關係,這值得關注——考慮到 Arista 和思科過去的法律糾紛和普遍的敵意,雙方合作前恐怕難有進展。
只需再進行一兩筆大型 AI 訓練和推理交易,Nvidia 就能遠遠超越 Arista。我們認為,今年實現這一目標的可能性非常高。即便如此,Arista 及其 ASIC 合作伙伴博通也並未就此止步。
參考連結
https://spectrum.ieee.org/ai-network-architecture
https://www.nextplatform.com/2025/06/23/nvidia-passes-cisco-and-rivals-arista-in-datacenter-ethernet-sales/
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。
END
今天是《半導體行業觀察》為您分享的第4074期內容,歡迎關注。
推薦閱讀

加星標⭐️第一時間看推送,小號防走丟

求點贊

求分享

求推薦
