拆解Marvell800G光模組

👆如果您希望可以時常見面,歡迎標星🌟收藏哦~
來源:內容編譯自servethehome,謝謝。
今天,我們有一個非常有趣的東西:看看 Marvell COLORZ 800。這是一款長距離 800G ZR+ 光學模組,採用標準 OSFP 可插拔外形尺寸,但可以在 800Gbps 的速度下達到 500 公里或 1000 公里以上。它甚至可以調整為允許在高達 2500 公里的距離上進行 400Gbps 通訊。我們在 Marvell 實驗室幕後瞭解了這種相干光學技術的工作原理,並想向您展示他們如何實現這一點。
Marvell COLORZ 800 可在 1000 公里的距離內實現 800Gbps 的速度
如今,資料中心的規則基本上是:儘可能使用銅線,當距離太遠時,就使用光纖。如果您看一下NVIDIA GB200 NVL72之類的產品,就會發現其最大的創新是能夠使用後端的銅線將 72 個 GPU 和交換機互連。
電纜長度約為 3 米後,由於訊號完整性,高速線和銅線根本無法混合。
雖然銅線通常可以到達機架內和相鄰機架,但光學模組可用於跨越更長的距離。然而,有一個問題。光學模組使用不同的技術以不同的速度跨越不同的距離。
執行速度為 10Gbps 或 100Gbps 的短距離光模組的製造成本比執行速度為 400Gbps 或 800Gbps 的長距離光模組低很多,這在很大程度上是因為技術的複雜性在不斷提高。
另一個方面是光學模組的外形尺寸。
CFP 樣式的外形尺寸模組在電信應用中更常見。在資料中心,我們傾向於看到用於低端應用的小型 SFP 模組和用於高速應用的大型 QSFP 模組和 OSFP 模組。即使是常見的 AI 基礎設施 NIC(如NVIDIA ConnectX-7 400GbE介面卡)也使用 OSFP。今天我們討論的是 Marvell COLORZ III 800G ZR+ OSFP 模組。OSFP 提供了更大的模組標準,具有電源、冷卻功能,更重要的是,提供了處理所有元件所需的空間。它看起來像這樣:
簡單來說,一方面,模組從裝置獲取電訊號。
在另一端,我們有光纖電纜插入的光傳送和接收端。
雖然這聽起來很簡單,但金屬外殼內部卻發生了神奇的事情。電訊號變成光訊號,而光訊號又轉換回電訊號。我們將在相當高的層次上討論內部發生的事情,以便許多人能夠跟上。
接下來,讓我們向您展示 OSFP 外殼內部的情況以及其工作原理。
Marvell 光學實驗室內部配備 COLORZ 800 ZR+ 光學模組
事實證明,光學模組內的元件放置非常重要。一個元件的放置位置哪怕相差一毫米,都會對其執行產生很大影響。通常,對於這些高階模組,公司都不喜歡我們拆開它們。相反,我們看到了 Marvell 的實驗室演示,它就像是那個小型金屬 OSFP 外殼中的東西的放大版。
當然,像這樣佈局的大電路板不適合放入聯網裝置中,所以這個很酷的另一個部分不僅僅是能夠製作 400Gbps 2500km 或 800Gbps 1000km 通訊模組,還能夠將其封裝成標準可插拔外形模組。
看一下這個平臺,你首先會注意到的是短 DAC。這是 800Gbps 電訊號端。
這是從另一側看到的開發板的檢視。
您可以將其想象為您在此處看到的模組的電氣方面:
第一站是經過 Marvell Orion DSP。這是電氣端和光學端之間的元件,用於清理訊號。
為了讓您瞭解一下,這裡是 Marvell Orion DSP 及其所處的 COLORZ III 800G ZR+ 模組。該 OSFP 模組位於老一代 COLORZ II (400G) 和 COLORZ I (100G) 可插拔模組之上。
這些 DSP 非常出色,因為它們需要在空間和功率非常受限的環境中完成大量工作。雖然普通的 10Gbps 或 25Gbps NIC 晶片是採用明顯更老的工藝技術製造的,但這些 DSP 是採用 5nm 工藝製造的,以便在 OSFP 模組佔用空間的功率和空間限制下進行處理。
從 DSP 開始,傳送訊號到達 CDM 或相干驅動器模組,它是下方兩個金色/黃銅色盒子中較小的一個,其中連線了單根光纖。
作為示例,我們不會深入介紹 PIC 的工作原理,但在那個小盒子裡,我們擁有使用雷射光源、調製器和其他元件將電訊號轉換為光訊號所需的元件。在盒子的一端,我們輸入電訊號,在另一端,我們將光輸出到光纖束上。這就是此演示板上的傳輸端。
此時,您可能會猜到左側稍大一點的盒子是接收端,稱為 ICR,即整合相干接收器。如果您經常使用單模LC電纜和光學器件,您會立即注意到:接收端有兩根光纖電纜。這就是這項技術比僅進行直接檢測(“有光還是沒有光”型別的分析)的低成本和低速光學器件稍微複雜一些的地方。
電路板上不僅有一條接收端光纖,還有一個本地振盪器,可將第二個訊號饋入 ICR。可將其視為參考訊號。ICR 內部是一個 90 度混合器,這是一種無源元件,有助於保持相位和幅度資訊等。ICR 還裝有光電探測器,用於接收光訊號,然後在另一端產生電輸出。電訊號通常很弱,因此我們有一個 TIA 或跨阻放大器,用於從光電探測器獲取微弱電流並新增可測量的電壓。可將其視為電氣側的放大器。
通常,這些元件也需要冷卻,因此參考板看起來更像這樣:
即使是參考雷射源也需要散熱器。當我說我們設法進入實驗室時,你也可以看出,這確實是一個實驗室環境。
然後,來自 ICR 的電訊號可以被輸入到電氣側的 Orion DSP 中。
這樣我們就完成了電氣方面和光學方面的全面迴圈。
這裡不必低估,但這個開發平臺的每一側最終都在 OSFP 外形尺寸內進行封裝和冷卻。
除了硬體之外,我想快速瞭解一下我們為什麼需要參考雷射訊號以及直接檢測和相干檢測之間的區別。
直接檢測與相干檢測
作為文章的一部分,我的一個想法是探討低端低成本光學器件中常用的直接檢測與相干檢測之間的區別。
那些需要深入研究數學和物理的人可能已經知道了。許多訊號檢測都圍繞著相當簡單的訊號是否存在。我們可以在一個非常簡單的 10Gbps 模組中將其視為“有光還是沒有光?”這有許多相當簡單的 2D 表示,以及一些更復雜的編碼方案,我們經常在實驗室中看到如下所示的眼圖(來自我們2019 年英特爾矽光子學部分,該公司出售了這項業務。)
相干檢測要複雜得多,因為你可以用光做很多更奇特的技術。相反,我們可以看到訊號的“星座”。這兩張圖都顯示了 X 和 Y 偏振,所以我們有 16 個星座。
這就是為什麼擁有本地振盪器參考很重要。對於更復雜的編碼,我們需要該參考提供的附加資訊。
如果您對直接檢測與相干檢測感興趣,那麼有很多論文對此進行了詳細介紹。對於 STH 觀眾來說,我認為最重要的一點是,儘管 800G ZR+ OSFP 模組看起來就像一個稍大一點的 100G SR4 QSFP28 模組,但內部情況卻大不相同。
因此,這裡最大的問題是:“為什麼這一切都很重要?”一個簡單的原因是,有時僅出於成本和彈性目的,跨地域部署資料中心是有利的。能夠直接從交換機連線到 1000 公里或更遠的另一個數據中心,使組織能夠在成本更低且穩定的託管站點上容納更多基礎設施。此外,如果您只有兩個地理位置相距遙遠的校園,那麼以 400Gbps 到 800Gbps 的頻寬跨越這兩個校園可能會改變遊戲規則。
但實際上,當今可插拔光學器件的最大驅動因素之一是 AI 資料中心的建設。該建設受到電力限制,因此我們看到資料中心運營商專注於獲取電力。計劃在現有發電廠旁邊建立大型資料中心,為資料中心提供新的電源等等。最大限度地減少傳輸損耗有助於最大限度地提高可用於計算的功率。挑戰在於叢集需要如此多的電力,以至於答案可能不再是單個站點。
我們經常聽到的想法是,將多個數據中心設在電力旁邊,而不是將計算集中到一個園區。有趣的是,這也是 2010 年代中後期許多加密貨幣礦工正在研究的。不同之處在於,礦場不需要高頻寬和低延遲的相互訪問。人工智慧叢集需要。
這個想法是,在可用電源附近的多個站點上構建大規模叢集可以節省電力傳輸損耗和成本,但也可能更簡單。人們不必許可和建造大型電源,而是可以點燃暗光纖或鋪設額外光纖以在幾個較小的電源處橋接叢集。
因此,簡單的答案是,這些模組允許組織使用通用的可插拔光學模組(而不是專用的 DCI 盒)以相對便宜且輕鬆的方式點燃跨越長距離的快速鏈路。也許更令人興奮的是能夠實現 AI 資源的大規模地理分佈的想法。
我們經常看到可插拔模組,它們看起來像金屬外殼。從這個角度看,很難說出為什麼一個比另一個更復雜。
希望透過觀察高階模組內部的情況,可以瞭解這些可插拔光學器件內部的複雜程度。我們研究了一個簡單的低成本 100G SR4 光學模組,它與 800G ZR+ 光學模組有很大不同。原因是,儘管它們看起來相似,但 COLORZ III 模組在 10,000 倍的距離上傳輸 8 倍的資料速率。也許這就是為什麼我第一次看到它時認為這是一個很酷的演示。
100G QSFP28 DAC 內部結構快速拆解
有些人從上文中可能已經看到我們還拆開了 100G QSFP28 DAC和 100G SR4 QSFP28 光模組。我們認為有必要向大家展示模組內部的情況,因此本文將展示 DAC 外殼內部的情況。
我們要開啟的電纜標有英特爾 DAC。這是相當典型的 QSFP28 DAC,其一端有電聯結器,另一端有電纜。
拆開外殼很容易。有些外殼,比如這個,使用簡單的螺絲將它們固定在一起。有些外殼使用更難拆開的連線方法。我們建議,如果您自己拆開外殼,請嘗試使用易於擰緊螺絲的外殼。另外,請注意 QSFP28 固定機制通常有一個彈簧。眾所周知,開啟這些外殼時,彈簧會從工作臺上彈起。
在外殼內部,我們可以看到 PCB 非常簡單。事實上,你實際上可以看到 QSFP28 聯結器和電纜內部電線之間的許多走線。
該模組具有帶遮蔽的粗線,長度與 DAC 相同。每根線都有一個編號,這可能有助於製造。然後將連線和線的起始處包裹在某種樹脂或環氧樹脂中,以確保它們不會從 PCB 上的焊點上脫落。然後我們得到一些銅帶和帶有彎曲支撐的柔性電纜出口。兩側看起來非常相似。
僅供參考,這是低成本 QSFP28 100G SR4 DAC 內部的組裝,僅是 PIC 側。光纖的對準必須更精確,光子到電路比 DAC 內部複雜得多。
大多數人永遠不需要檢視 DAC 內部。它們設計為即插即用,無需任何維護。同時,我們認為我們應該將一端的外殼取下,以便人們可以看到它們的工作原理。我們至少應該指出,這些是無源電纜。有 AEC 或有源電纜,其電纜聯結器中有有源重定時晶片,可幫助提高訊號質量,高速訊號透過銅線傳輸得更遠。這些 AEC 有點複雜,耗電量更大,成本也更高。不過,當我們談論 DAC 設計相對簡單時,希望這些照片能幫助您有所瞭解。
參考連結
https://www.servethehome.com/going-800gbps-at-up-to-1000km-with-the-marvell-colorz-iii-800g-zr-osfp/3/
https://www.servethehome.com/inside-a-100g-qsfp28-dac-a-quick-teardown/
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4045期內容,歡迎關注。
推薦閱讀
『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦


相關文章