
👆如果您希望可以時常見面,歡迎標星🌟收藏哦~
來源:內容編譯自IEEE,謝謝。
如果將過多的銅線捆紮在一起,最終會耗盡空間——前提是它們不會先熔合在一起。人工智慧資料中心在GPU和記憶體之間傳輸資料的電子互連方面也面臨著類似的限制。為了滿足人工智慧的海量資料需求,業界正在轉向更大尺寸、更多處理器的晶片,這意味著在機架內實現更密集、更長距離的連線。初創公司正在展示 GPU 如何擺脫銅互連,用光纖鏈路取而代之。
光纖鏈路對資料中心來說並不陌生。它們使用可插拔收發器在機架之間傳輸資料,將電訊號轉換為光訊號。為了提高能源效率,“將光學元件整合到晶片封裝中一直是一個夢想,”加州大學聖巴巴拉分校電氣工程教授克林特·肖( Clint Schow)表示。這就是共封裝光學器件(CPO),科技巨頭們正在全力支援它。英偉達 (Nvidia) 最近宣佈量產一款網路交換機,該交換機使用嵌入在與交換機同一基板上的光子調製器。“這震驚了整個行業,”加州桑尼維爾初創公司Avicena的執行長巴迪亞·佩澤什基 (Bardia Pezeshki) 表示。
哥倫比亞大學電氣工程教授、Xscape Photonics聯合創始人Keren Bergman解釋說, Nvidia 的宣告令人興奮,因為它將光子技術引入了機架內部。但Nvidia目前只計劃將光子技術引入網路交換機。Avicena和其他初創公司正在挑戰“光學技術在成本、可靠性和功率效率方面不足以取代機架內銅纜”這一觀點。他們將光學互連直接連線到 GPU 和記憶體封裝上。Bergman 表示,即使是這些最終長達一米的鏈路,也需要比銅纜所能提供的更大的頻寬。同樣的基礎技術“可以直接連線到 GPU”,使光學器件更靠近資料來源,並允許它們從晶片封裝本身傳輸頻寬。
初創公司創新光互連
多家初創公司一直在致力於替換 GPU 旁邊的銅互連線路。其中幾家公司已經著手研發使用名為微環諧振器的波導晶片,將資料通道編碼到來自外部雷射器的光波上,並在接收埠過濾合適的波長。這與英偉達在其 CPO 交換機上採用的基本光子技術相同——哥倫比亞大學的伯格曼表示,這“意義重大”。但不僅僅是一個 r諧振器,很多初創公司都在使用。
上個月,Ayar Labs宣佈推出 GPU 之間的光學互連,其中採用了標準開源UCIe電氣介面。“這是業界首創,”首席技術官兼聯合創始人 Vladimir Stojanovic 表示。UCIe 構成 GPU 和TeraPhys 光學晶片之間的封裝電氣鏈路。晶片將數字訊號的副本傳輸到單模光纖中,將通訊距離延長至 2 公里。“一個 GPU 與另一個 GPU 通訊時甚至不知道它正在離開封裝,”Stojanovic 說道。Ayar Labs 的SuperNova 光源將 16 種波長饋送到每根光纖上。諧振器對 8 個輸入和 8 個輸出光纖埠中的每一個執行波分複用,在 GPU 之間形成 256 個數據通道,總計 8 Tbps。使用 UCIe 協議可實現完全模組化設計。“任何晶片製造商都可以將其安裝上去並擁有一個光學轉換器,”Schow 解釋道。
總部位於加州山景城的初創公司LightMatter宣佈了類似的 GPU 間光學鏈路產品:Passage L200。它使用Alphawave Semi 的晶片來實現 UCIe 介面——但不是將它們並排構建,而是使用標準的晶圓上晶片技術將它們堆疊在光學電路的頂部。Lightmatter 副總裁 Steve Klinger 表示:“採用 3D 意味著你不必嘗試將電訊號路由到晶片邊緣之外。”該公司展示了Passage M1000的完全整合版本,這是一種由 8 個這樣的構建塊組成的光學中介層。每個部分都位於 GPU 或記憶體塊下方——透過極短的 UCIe 連線直接安裝在頂部。光纖將光訊號從中介層路由出去。
Schow解釋說:“L200採用模組化方式整合光學元件,而M1000則更具進取精神。” 後者利用電子器件區域性解決頻寬問題,並透過光學器件解決封裝間問題。但Stojanovic觀察到,“他們尚未進行演示。”
伯格曼的公司Xscape Photonics位於加州聖克拉拉,該公司更進一步,無需外部光源,將頻率梳雷射器直接整合到晶片上。“我們可以將雷射器和鏈路整合到一起,”伯格曼說道。去年 10 月,該公司獲得了 4400 萬美元的融資,用於擴大ChromX 平臺的產量。ChromX 平臺是一個多色平臺,可以最大限度地解決高頻寬資料從晶片中傳輸出去所固有的“逃逸頻寬”問題。
此前,曦智科技也推出了全球首款專為以下領域設計的片上光網路 (oNOC) 處理器 Hummingbird,其採用先進的垂直堆疊封裝技術,將光子晶片和電子晶片整合到一個封裝中,作為資料中心和其他高效能應用的通訊網路。
Hummingbird 是利用 Lightelligence 的 oNOC 平臺的產品系列中的第一個產品,該平臺透過矽光子學實現創新的互連拓撲,從而顯著提高了計算效能。其波導以光速傳播訊號,並利用到 64 核特定領域 AI 處理器晶片上每個核心的全對全資料廣播網路,使 Hummingbird 在延遲和功耗降低方面比傳統數字互連解決方案具有顯著優勢。
如果將過多的銅線捆紮在一起,最終會耗盡空間——前提是它們不會先熔合在一起。人工智慧資料中心在GPU和記憶體之間傳輸資料的電子互連方面也面臨著類似的限制。為了滿足人工智慧的海量資料需求,業界正在轉向更大尺寸、更多處理器的晶片,這意味著在機架內實現更密集、更長距離的連線。初創公司正在展示 GPU 如何擺脫銅互連,用光纖鏈路取而代之。
光纖鏈路對資料中心來說並不陌生。它們使用可插拔收發器在機架之間傳輸資料,將電訊號轉換為光訊號。為了提高能源效率,“將光學元件整合到晶片封裝中一直是一個夢想,”加州大學聖巴巴拉分校電氣工程教授克林特·肖( Clint Schow)表示。這就是共封裝光學器件(CPO),科技巨頭們正在全力支援它。英偉達 (Nvidia) 最近宣佈量產一款網路交換機,該交換機使用嵌入在與交換機同一基板上的光子調製器。“這震驚了整個行業,”加州桑尼維爾初創公司Avicena的執行長巴迪亞·佩澤什基 (Bardia Pezeshki) 表示。
哥倫比亞大學電氣工程教授、Xscape Photonics聯合創始人Keren Bergman解釋說, Nvidia 的宣告令人興奮,因為它將光子技術引入了機架內部。但Nvidia目前只計劃將光子技術引入網路交換機。Avicena和其他初創公司正在挑戰“光學技術在成本、可靠性和功率效率方面不足以取代機架內銅纜”這一觀點。他們將光學互連直接連線到 GPU 和記憶體封裝上。Bergman 表示,即使是這些最終長達一米的鏈路,也需要比銅纜所能提供的更大的頻寬。同樣的基礎技術“可以直接連線到 GPU”,使光學器件更靠近資料來源,並允許它們從晶片封裝本身傳輸頻寬。
初創公司創新光互連
多家初創公司一直在致力於替換 GPU 旁邊的銅互連線路。其中幾家公司已經著手研發使用名為微環諧振器的波導晶片,將資料通道編碼到來自外部雷射器的光波上,並在接收埠過濾合適的波長。這與英偉達在其 CPO 交換機上採用的基本光子技術相同——哥倫比亞大學的伯格曼表示,這“意義重大”。但不僅僅是一個 r諧振器,很多初創公司都在使用。
上個月,Ayar Labs宣佈推出 GPU 之間的光學互連,其中採用了標準開源UCIe電氣介面。“這是業界首創,”首席技術官兼聯合創始人 Vladimir Stojanovic 表示。UCIe 構成 GPU 和TeraPhys 光學晶片之間的封裝電氣鏈路。晶片將數字訊號的副本傳輸到單模光纖中,將通訊距離延長至 2 公里。“一個 GPU 與另一個 GPU 通訊時甚至不知道它正在離開封裝,”Stojanovic 說道。Ayar Labs 的SuperNova 光源將 16 種波長饋送到每根光纖上。諧振器對 8 個輸入和 8 個輸出光纖埠中的每一個執行波分複用,在 GPU 之間形成 256 個數據通道,總計 8 Tbps。使用 UCIe 協議可實現完全模組化設計。“任何晶片製造商都可以將其安裝上去並擁有一個光學轉換器,”Schow 解釋道。
總部位於加州山景城的初創公司LightMatter宣佈了類似的 GPU 間光學鏈路產品:Passage L200。它使用Alphawave Semi 的晶片來實現 UCIe 介面——但不是將它們並排構建,而是使用標準的晶圓上晶片技術將它們堆疊在光學電路的頂部。Lightmatter 副總裁 Steve Klinger 表示:“採用 3D 意味著你不必嘗試將電訊號路由到晶片邊緣之外。”該公司展示了Passage M1000的完全整合版本,這是一種由 8 個這樣的構建塊組成的光學中介層。每個部分都位於 GPU 或記憶體塊下方——透過極短的 UCIe 連線直接安裝在頂部。光纖將光訊號從中介層路由出去。
Schow解釋說:“L200採用模組化方式整合光學元件,而M1000則更具進取精神。” 後者利用電子器件區域性解決頻寬問題,並透過光學器件解決封裝間問題。但Stojanovic觀察到,“他們尚未進行演示。”
伯格曼的公司Xscape Photonics位於加州聖克拉拉,該公司更進一步,無需外部光源,將頻率梳雷射器直接整合到晶片上。“我們可以將雷射器和鏈路整合到一起,”伯格曼說道。去年 10 月,該公司獲得了 4400 萬美元的融資,用於擴大ChromX 平臺的產量。ChromX 平臺是一個多色平臺,可以最大限度地解決高頻寬資料從晶片中傳輸出去所固有的“逃逸頻寬”問題。
資料傳輸革命
Juniper Networks和Fungible的聯合創始人(現就職於微軟)的Pradeep Sindhu對此持懷疑態度。在叢集中,如果需要在大量 GPU 之間建立靈活的點對點連結,那麼每個可切換資料通道的粒度就很重要。點對之間的一條粗管道是不夠的。相反,您需要許多更小的管道,而每根光纖的頻寬太多會降低靈活性。例如,連線 512 個 GPU(每個 GPU 透過 200 Gbps 通道連結到 64 個交換機)的宏偉目標需要超過 30,000 個連線。Sindhu 說:“如果將 16 個波長塞進一根光纖,如何將這麼多 GPU 連線到這麼多交換機?” 答案之一是使用數量更少、功能更強大的電子解析粗管道的交換機,但這會將冗餘換成單點故障。此外,多波長雷射器還引發了成本、能源效率和可靠性方面的擔憂。
另一種方法則避開了這兩個問題。Avicena 使用數百個透過成像光纖連線的藍色 MicroLED來傳輸資料。Pezeshki 解釋說:“如果你用攝像頭看電視,你就擁有了一種無需雷射器的光學連線。” Avicena 的光學晶片集成了一個小型 MicroLED 顯示屏和一個微型攝像頭,其幀速率令人難以置信,該技術已在基於 10 Gbps/通道幀速率的模組化 LightBundle 平臺中釋出。每個包含 300 個MicroLED的顯示屏累計傳輸速率為 3 Tbps,但粒度更高。Pezeshki 表示,消除雷射器可以降低可靠性風險、成本和複雜性,並將能耗提升五倍。Sindhu 表示:“我樂觀地認為 MicroLED 將成為未來的領先技術。”
光通訊市場研究公司LightCounting的執行長Vladimir Koslov對這些初創公司的演示表示讚賞。“有些公司會成功,”他說道。但通往市場的道路“不是短跑,而是一場馬拉松”。此外,銅纜仍然有效。他認為,在未來幾年內,CPO將僅限於交換機,因為這是行業的目標。“我認為,直到下一個十年初,我們才能在GPU上看到它(CPO),”他說道。
Sindhu 表示,以廉價、低功耗且可靠的方式連線足夠多的 GPU 是“這個時代最重要的封裝難題”。無論誰解決了這個問題,人們都會回顧。“勝者為王,”他說道。
參考連結
https://spectrum.ieee.org/optics-gpu
END
👇半導體精品公眾號推薦👇
▲點選上方名片即可關注
專注半導體領域更多原創內容
▲點選上方名片即可關注
關注全球半導體產業動向與趨勢
*免責宣告:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支援,如果有任何異議,歡迎聯絡半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4016期內容,歡迎關注。
推薦閱讀



『半導體第一垂直媒體』
即時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小夥伴哦

