
把數百甚至上千顆GPU用光連起來,會發生什麼?
你會得到一個頻寬更高、延遲更低、能耗也更小的“光速”超節點。它不僅能將這些GPU的算力高效聚合,突破傳統電互連的物理瓶頸,而且與英偉達的封閉體系不同,它能讓各家國產GPU繞開協議的不同而彼此相連一起工作。
今天,這個充滿野心的想法在第一次變成現實。
在2025年世界人工智慧大會(WAIC)上,曦智科技釋出了其光躍LightSphere X分散式全光互連晶片及超節點解決方案。這是國內首個光互連光交換的GPU超節點方案,更重要的是,它是一個真實落地開始提供算力的方案——它即將落地上海儀電的國產算力叢集。

這是AI算力的重要一步,也是曦智的重要時刻。
1
AI
曦智一直在“等待”AI。
2017年,沈亦晨在麻省理工學院(MIT)讀物理學博士,他在《自然-光子學》上發表了一篇論文。這篇開創性的論文,從物理層面證明了利用光子進行矩陣運算的可行性,為直接在光域中執行AI計算奠定了理論基礎。它提供了一條超越傳統電子晶片限制的全新路徑。而矽光和神經網路,在那時是兩個都處在極早期的技術,但也是兩個註定會徹底改變人類利用科技能力的天花板的技術,也是從一開始就是為解決更宏大、更復雜的問題而存在的技術。

博士畢業後,沈亦晨就創辦了曦智科技。這家公司的技術路線從第一天起就帶著某種信仰色彩——堅信光子最終會是突破計算能力和正規化邊界的鑰匙。而要實現這個“信仰”,光的技術首先需要持續進步。
曦智在成立最初的多年,某種程度上像一個實驗室般運營著,它沿著“計算”和“互連”兩條路徑,一步步積累著自己的“武器庫”。從光子矩陣計算(oMAC),利用光本身完成AI核心的矩陣運算;到片上光網路(oNOC),用光連線晶片內部的各個計算核心;再到片間光網路(oNET),用光連線不同的晶片以構建更大規模的系統,曦智成為全球僅有的幾個在矽光技術上持續突破的公司。
而另一方面,曦智也一直在等待一個足夠大的問題出現,一個傳統電子晶片方案無法解決,但對於人類技術進步又必須解決的問題出現。
沈亦晨和曦智也一直在尋找矽光技術的“殺手級應用”。他們曾在諸如伊辛演算法等特定演算法上,做到了比英偉達更快的處理速度。但這些依然是點上的突破,缺少規模化的震撼。
直到大模型帶來的AI能力以及對算力的需求的徹底爆發。
最終,這個曦智一直在等待的時刻,與沈亦晨最初的論文形成了奇妙的互文。當年論文裡提到的神經網路,在十餘年的演進後,成為了今天最重要的技術。大模型的爆發,讓所有資源向其傾斜,算力逐漸成為追逐通用人工智慧(AGI)的關鍵瓶頸。
當成千上萬顆GPU需要像一個大腦般協同工作時,連線它們的“神經”——傳統的電纜——開始不堪重負。電纜在長距離傳輸高頻寬訊號時,會產生巨大的延遲和功耗,這限制了叢集的規模和效率。要構建更大規模的叢集,電互連的物理限制就成了繞不過去的坎。
——舊的方法即將失效,其中很重要的癥結在於晶片間的互連能力。而光成了破局的答案,它成為了AI的命門。
1
光
AI也一直在“等待”光,曦智研究了許久的光。
今年的世界人工智慧大會上,曦智釋出的超節點方案,是其多年技術積累的集大成之作。“這是第一個落地的基於矽光的大規模方案。”沈亦晨說。
曦智此次釋出了兩個核心方案:一是“光互連電交換”,這是一個相對穩妥、更接近現有技術路徑的方案;而另一個,也是此次釋出的核心亮點,是更具革命性的“光互連光交換”方案。後者完全擺脫了對傳統電交換晶片的依賴,是真正意義上的“全光”路徑,它不僅更具創新性,也從根本上解決了當前開放算力生態中最棘手的協議壁壘和硬體瓶頸問題。
這套方案的核心,是曦智全球首創的“分散式光交換”(dOCS)晶片。傳統的交換方案,無論是電交換還是光交換,都依賴一箇中央交換機,像一個大型交通樞紐。而曦智的方案,則是在每一個GPU的“門口”都設定了一個微型、智慧的光路切換站。這讓資料流的排程變得極其靈活,且不受連線數量的限制。
更關鍵的是,這種交換方式發生在物理層,與上層的資料傳輸協議無關。曦智CTO孟懷宇解釋說,這解決了國內GPU生態的一個核心痛點:十幾家GPU公司,就像“十個國家說十種不同的語言”,各家有各家的互連協議,卻缺少統一的高效能交換晶片。曦智的光交換方案,好比建立了一套不關心火車司機(協議)、只由中央控制檯排程鐵軌(光路)的鐵路系統,“潤物細無聲”地將它們連線起來。

這正是AI算力在等待的解決方案。它不僅解決了中國算力特有的挑戰,也指向了整個行業突破瓶頸的確定方向。
在全球超節點方案的版圖上,此前一直由兩家巨頭定義著遊戲規則。英偉達憑藉其私有的NVLink協議和專用的電交換晶片,構建了一個性能強大但生態封閉的帝國,成本高昂且高度依賴定製化硬體。而谷歌則為其TPU定製了集中式光交換機,同樣是“自產自銷”的模式,技術門檻和成本都極高,令外界難以企及。
曦智的方案希望提供一條不同的更開放的方式。它不依賴先進的半導體工藝,也無需專用的交換機,從而能夠相容不同廠商的GPU。
此次的光躍LightSphere X分散式OCS全光互連晶片及超節點解決方案是國內首個光互連光交換GPU超節點解決方案。此次的參與方為壁仞科技、中興通訊和上海儀電國產超節點算力叢集,它接下來會變為一個開放且可複製的算力方案,更多的晶片廠商和AI上下游公司會參與進來。

“對於全新的技術,總得有人第一個站出來,不問‘還有誰用過?用的怎麼樣’這樣的問題,而選擇相信和使用這個新技術方案。”沈亦晨在最近和矽星人的對話中提到。光躍就是這樣一個重要的突破。曦智與合作伙伴一起真正實現了千卡級的真實部署,成功地邁出了這最艱難的一步。
“算力沒有足夠一說,再多的算力都會被演算法吃掉。”沈亦晨說。而這種對算力永無止境的需求,正是光技術價值的最終體現。更強大的互連能力,將催生出更強大的“集體計算能力”,從而“催生出可能更聰明的更先進的人工智慧”。
AI想要兌現它所承諾的未來,其實也一直在等待一個能讓算力無限擴充套件的方案,一直在等待光。
“以前的方案是輪子的話,我們相當於創造了翅膀,你可以飛到以前到不了的地方。”沈亦晨說。
1
“英偉達時刻”
“今天是矽光技術的最好的時代。”沈亦晨對矽星人說。在死磕技術多年後,今天也是曦智最好的機會。
曦智也為矽光技術進入現實世界做著更多層面的準備。兩年前,公司的組織調整開始向產品和商業化落地傾斜。沈亦晨透露,他們引入了多位有商業化背景的高管,並將80%的工程資源投入到由市場和客戶需求驅動的明確專案中。
一個積累了許久的“技術信仰”等來了它的“殺手級應用”,而且是會改變整個技術格局和AI發展正規化的應用。這一切,都自然而然讓人想到英偉達。
曦智互連產品線副總裁朱劍認為英偉達的很多成功,源於其創始人和CEO黃仁勳對“平行計算”這一核心技術的長期信仰。但即便是英偉達,也曾在移動計算時代慘敗。在他看來,成功的關鍵在於“在恰當的時間出現在恰當的地方”。
而今天曦智的故事很是相似。當摩爾定律走向物理極限,整個行業都在尋求新的底層技術突破時,曦智多年來在矽光技術上的積累,恰好可以滿足AI基礎設施對更高頻寬、更低功耗互連的根本性要求。
“我們前五年可能就是在等這些契機,現在契機來了,我們要做到的就是在這一波浪潮裡儘快往前遊,”沈亦晨說。“儘快把我們的客戶,我們供應鏈,我們的生態鏈聚合起來,形成聚合效應,推動這個充滿潛力的矽光技術進入更多真實世界裡去。”
當“光”成為了今天AI算力命門,曦智的“英偉達時刻”看起來的確近了。
1
對話沈亦晨:這是矽光最好的時代
在光躍釋出前夕,我們也和曦智創始人兼CEO沈亦晨以及核心團隊進行了一場對話。以下為對話重點實錄,經不改變原意的整理。
矽星人:這次釋出是曦智的一個重要里程碑,可以先請您用自己的語言來跟我們介紹一下“光躍Lightsphere”分散式光交換全光互連晶片方案。
沈亦晨:曦智的初衷是用矽光技術提升計算能力。過去一兩年,隨著AI的爆發,如何讓海量GPU高效協同工作成為關鍵問題,這需要創新的GPU互連能力。我們這次釋出了兩個方案:光互連電交換和光互連光交換。前者是比較穩妥的方案,而後者是我們全球首創的,更適合當前市場需求的創新方案。
它對應兩個問題,為何要用光互連,以及為何用光交換。
先說為何用光互連。目前傳統方案是“8卡一機”,節點規模小,協同效率低。為了訓練更大模型,如果把這個比喻成一個個班集體,那麼小的班集體當需要組織起來完成任務的時候就效率很低。所以我們需要把“班集體”的規模擴大。英偉達的NVL72系統就是將72張先進的GB200 GPU置於一個機櫃內,形成了強大的算力單元。要實現同等級別的算力,國內需要將數百乃至上千個GPU以高頻寬、低延遲連線在一起。
而傳統的銅纜線連線距離一旦超過1米,效能便會急劇下降,無法滿足需求。因此,我們必須用光。我們為此定製了低延遲的LPO光互連晶片,能直接與國產GPU互連。
另外,為何用光交換。核心因為這是與協議無關的分散式交換。
當超節點規模變大,GPU間的“交通管制”就成了挑戰。英偉達有NVSwitch這樣的電交換晶片作為“紅綠燈”,但國內絕大多數GPU公司沒有類似的高效能電交換晶片。更棘手的是,國內各家GPU公司的互連協議各不相同,如同“說不同的語言”,難以用一個統一的電交換晶片去管理。
我們的光交換方案則不依賴協議。它像一個由中央控制的鐵路軌道系統,直接在光的物理層面進行路徑切換,繞開了協議的複雜性。同時,電交換方案能連線的GPU數量有上限,而我們的分散式光交換晶片隨GPU數量一同擴充套件,理論上可以構建任意規模的超節點。
矽星人:這個技術方案誕生的關鍵節點有哪些,另外,如果按照“班集體”來比喻,想要改變班級結構,需要班內成員們同意,也就是這些GPU公司們,這個合作過程是怎樣實現的。
沈亦晨:我們的光互連晶片能力在2022年、2023年就已具備,最初是為自己的光計算產品開發的。之後轉折點出現在2023年底,GPT的誕生催生了巨大的市場需求——如何突破單個GPU的算力限制,在叢集層面訓練出更好的模型。這個契機讓我們將內部的互連技術向外輸出,服務更廣泛的客戶。
至於合作,首先是需求驅動。當英偉達等頭部玩家都開始擁抱“超節點”時,其他GPU公司這是一個不得不做的選擇。其次,我們的方案本身具備優勢。用光纖替代銅纜,本質上並不需要修改GPU間的互連協議,只是更換了物理媒介,像是“汽車換成了火車”。我們與系統廠商一起,幫助GPU客戶定義了這種新的光互連方案。
矽星人:這個複雜的長鏈路合作裡,曦智扮演著什麼樣的角色?
沈亦晨:首先,我們提供底層的核心晶片能力,包括矽光晶片和配套的國產電晶片,確保了供應鏈的安全。
其次,僅有晶片是不夠的,因為這是一個全新的系統方案。因此,我們深度參與了整個系統方案的設計,從晶片到模組,再到伺服器層面。例如,我們會和GPU公司合作,在他們的板卡上為光互連預留物理空間,並參與伺服器的整體系統設計。我們與頭部的伺服器廠商、GPU公司共同完成了方案的升級和落地。
我們的光交換方案對協議不敏感,能“潤物細無聲”地融入現有碎片化的協議生態,這在當前“互連為中心”的趨勢下,讓我們處於一個非常有利的生態位。

矽星人:所以從大的方向上來看,其實光的方案是所有人的共識,那麼在一個閉環體系,像是英偉達的體系裡去做光互連,和在一個曦智現在想要建設的開放體系裡面去做相比,哪個挑戰更大,還是說從技術挑戰角度,要求其實是一樣的。
沈亦晨:這是個好問題。
其實兩者各有優劣。閉環體系的優點在於內部協調高效,所有部件都由一家公司定義。而開放體系的優勢在於,它能像乙太網生態一樣,吸引眾多玩家參與,透過充分競爭來最佳化每一環節的成本和魯棒性。
從技術路線上看,封閉體系在推進光電共封裝(CPO)這類需要緊密協同的技術上可能更容易。但從長遠來看,開放體系更加健康,對技術創新也更有利。在當前國內環境下,開放的算力體系能催生更多元的想法和路徑。我們的方案就是在一個追求不同路徑的開放環境中誕生的,這對於初創公司至關重要。
矽星人:這個過程裡,你們已經有些建立標準和打造協議的意味了。
沈亦晨:我們認為當前國內的關鍵不是創造更多的新協議,而是讓更多的GPU廠商能統一到一個公認的開放協議上。目前,各家GPU、客戶、運營商都在推自己的協議,短期內很難看到快速收斂的趨勢。
在這種背景下,曦智最大的優勢在於我們的技術方案發生在物理層,與上層協議無關。我們堅信,當你能提供足夠大的頻寬時,上層跑的是什麼協議其重要性就會大大降低。
因此,我們的策略不是去定義協議,而是提供一個能相容所有協議的物理層解決方案,為算力公司提供強大的武器。
矽星人:黃仁勳今年GTC上反覆強調“Scale Up Before Scale Out”,而曦智的方案跨越了機櫃。你們如何理解這個理念?
沈亦晨:我們做的恰恰是Scale-Up網路,也就是超節點內部的互連網路,而不是Scale-Out網路(節點間的乙太網)。我們和黃仁勳的理念是一致的:超節點會越來越大,Scale-Up網路也需要隨之壯大。
黃仁勳語境裡的Scale-Up,在過去可能受限於物理機櫃。而我們的創新之處在於,透過引入光,打破了機櫃的物理邊界。這使得Scale-Up變成了一個邏輯上的概念,你可以將多個機櫃內的GPU組成一個邏輯上的、統一的超節點。所以,我們是用一種更創新的光互連方案,去實現一個規模更大、跨越物理機櫃的Scale-Up。
矽星人:客戶“算賬”的方法也因此變化了。
沈亦晨:對。和英偉達的計算方法不太一樣。評估成本不能只看單個部件,而要算總賬,尤其是研發成本和機會成本。
對於英偉達以外的公司,要從零開始自研一套類NVSwitch的電互連超節點方案,研發成本是極其高昂的,這也是為什麼市場上鮮有成熟替代方案的原因。
我們的方案巧妙地規避了這一點。一是複用成熟生態: 我們方案基於成熟的伺服器生態,複用了大量現有元件,大大降低了客戶的早期研發投入和試錯成本。二最佳化系統架構: 我們的光交換方案省掉了昂貴的獨立交換機,直接優化了系統BOM成本。三,供應鏈控制:我們採用了部分國產供應鏈,能對光學產品的成本進行有效控制。
綜合來看,透過降低研發門檻、最佳化系統架構和控制供應鏈,我們的方案在整體上提供了一個高性價比的選擇。

矽星人:今天AI算力需求的爆發,相當於是曦智一直在等待的“殺手級應用”時刻來了。
沈亦晨:可以這麼理解。大家也可以看到過去的兩年裡面,整個矽光在國際上面的熱度和重視度顯著地好於再往前的十年,今天甚至可能是歷史上最好的時候。
包括臺積電、英偉達、博通其實都真金白銀投入了。臺積電已經真的有成百上千個人在這個產線上,英偉達在他的GTC上也直接說了他未來的光互連,博通已經開始批次推出這些產品。
所以這些其實都說明現在隨著算力的叢集和需求越來越大,矽光是一個必然的解決方案。而我們原來其實起步比較早,但別人很多東西可能要從頭開始做。
矽星人:這是曦智重要的轉折點,公司面對的局面的變化,對於你帶來哪些挑戰。您從MIT畢業創業到今天,一開始有些像一個Lab一樣,而今天顯然商業化的味道更濃了。
沈亦晨:我們的商業化轉型其實從兩年前就已經開始了。公司在組織架構、人才引進和內部績效上,都全面轉向以產品和商業落地為核心。近幾年,我們的業務收入每年都實現翻倍增長,今年晶片出貨量也達到了幾萬顆的體量。
所以,我們並非今天才開始商業化,而是早已為此做好了準備。最大的挑戰始終在於市場教育。任何創新技術都會面臨客戶的疑問:“還有誰在用?效果怎麼樣?”。幸運的是,我們已經有了近萬卡規模的落地案例,成功解決了“從0到1”的問題。有了這些成功實踐,我們相信後續的推廣會越來越順利。
矽星人:今天曦智的故事讓人很容易聯想到英偉達,英偉達從一個顯示卡公司到基礎設施公司再到AI公司,總在改變自己的定位,曦智今天如何定義自己?英偉達的成長曆程給你們哪些啟發。
沈亦晨:公司的定義會隨著階段而演進。我們最早是一家基於矽光技術,聚焦計算創新的公司。隨著AI基礎設施的演變,我們現在的核心目標是“用光電融合的技術,賦能整體算力的飛躍。
英偉達的歷程給我們的啟發是深刻的。首先,要堅持核心信仰。黃仁勳對平行計算的堅持,與我們創始團隊對矽光技術能突破摩爾定律極限的信仰是類似的。其次,要具備在不同時代都能存活和學習的能力。英偉達並非一帆風順,它在移動計算時代也曾慘敗。這告訴我們,即使是偉大的公司也無法左右時代的浪潮,但必須在恰當的時間出現在恰當的地方,並具備滿足時代要求的能力。
我們認為,摩爾定律放緩後,行業需要物理底層的替代方案。而曦智所具備的光電融合技術,恰好能滿足這個時代的要求。
矽星人:在光互連技術之外,曦智的光計算等其他技術將如何發展?不同技術線之間如何協同?
沈亦晨:公司主要有兩條產品線:互連產品線(如Lightsphere)和計算產品線(如天樞)。
它們底層共享著曦智的核心技術平臺,包括矽光IP、電晶片IP、先進封裝技術等。我們的工程研發團隊是統一的“中臺”,不按產品線劃分,以保證底層技術的通用性和前瞻性。資源分配上,約80%的資源由市場需求驅動,投入明確的產品開發;剩下20%由CTO主導,進行面向未來的前沿技術探索。
兩條產品線也是相輔相成的。計算產品線是互連產品線“最激進的客戶”,它對效能的極致追求,會不斷推動互連技術(如片上光網路、CPO)的創新。同時,互連產品線又是一個開放的平臺,可以服務所有外部的GPU和算力客戶。

矽星人:如果我們最後想象一下在5年乃至更遠的未來,曦智的技術將如何改變算力世界?最終的圖景是怎樣的?
沈亦晨:我們有幾個核心預判。
五年內,智算中心裡矽光晶片的數量和麵積,將可能與電晶片並駕齊驅,甚至超過。我們預測矽光晶片佔比至少會達到30%以上。另外,成本會隨著規模化而成倍下降,形成“成本降低—應用更廣”的正向迴圈。
而且,光計算將在3年內透過一些支柱應用(如高頻交易、大模型推理)實現規模化商用出貨。
最終的圖景是,透過光的能力,重塑計算和連線。
在互連層面,更強大的互連能力就像是為AI世界提供了更高效的通訊工具,讓構建更大規模、更復雜的專案成為可能,從而催生更強大、更聰明的通用人工智慧。
在計算層面,如果說傳統電晶片是“輪子”,英偉達的GPU是“高鐵”,那麼我們的光計算就是一種全新的工具——“翅膀”。
翅膀不僅能讓一些對速度和延遲極度敏感的場景“飛得更快”,更重要的是,它能到達“高鐵”去不了的地方。有些計算任務,受物理定律限制,用電就是做不到的,而光計算可以。這就是光計算的獨特價值,它將為算力世界開闢全新的可能性。
