90後北大校友晶片創業,獲千萬級融資,能跑大模型推理

寒序科技希望成為第一個在磁性計算領域完成商業閉環的公司。
作者 |  程茜
編輯 |  Panken
芯東西5月23日報道,今日,北大系磁性計算晶片創企寒序科技宣佈完成千萬級融資,由彼岸時代、源合資本投資。
成立於2023年8月的寒序科技,孵化於國內磁學研究重要高地北京大學應用磁學中心,至今已經完成三輪融資。其20餘人的團隊中,大多為90後且擁有多學科交叉背景
這家創企的聯合創始人是朱欣嶽。他告訴芯東西,寒序科技希望成為第一個在磁性計算領域完成商業閉環的公司
目前,寒序科技針對AI需求,探索磁性存算一體技術,研製適用於大模型推理的超高頻寬磁性邏輯計算晶片,推出SpinPU-E系列晶片;針對高效能計算需求,探索量子啟發的經典計算,研製高位元數全連線磁性機率計算晶片,推出SpinPU-M系列晶片
在產品層面,他透露,寒序科技針對大模型推理的E系列晶片已經於今年2月進行第一次流片的投片,並將於明年推出面向端側和雲側的磁性計算晶片產品
朱欣嶽提到的磁性計算,可分為磁機率計算和磁邏輯計算。寒序科技是目前國內唯一在磁性計算這兩個領域均有佈局的公司。
如今,寒序科技依託於磁性隧道結(MTJ)和隨機磁性隧道結(sMTJ)等新型磁電子學器件,結合存算一體與Chiplet技術,為AI推理算力和專用算力兩個領域,設計並推出了高效能、低成本、開發友好的SpinPU磁性計算晶片。
▲寒序科技SpinPU-M01機率計算加速卡(圖源:寒序科技)
磁機率計算晶片與其他AI晶片的主要區別是,不採用傳統邏輯運算或不同儲存計算方式,而是利用磁性材料的特性,透過對磁狀態的操控和讀取來進行機率計算。在存算一體架構的磁機率計算晶片中,磁性隨機儲存器可直接在儲存單元內進行部分計算操作,其優勢在於能耗低、平行計算能力強、對複雜機率模型處理效率高,短板則為技術成熟度相對較低、與現有技術生態融合存在挑戰等。
兼具非易失性、高速讀寫、超低功耗、整合度高優勢的磁計算晶片,已成為全球半導體巨頭英特爾、三星、臺積電、SK海力士等押注的下一代潛力晶片技術。
朱欣嶽告訴芯東西,寒序科技已經透過底層工藝、晶片設計、軟體演算法進行聯合最佳化,能夠基於國內工藝打造磁計算晶片,這正是寒序科技的核心優勢之一。

在高效能大算力晶片需求激增的背景下,這家成立不到兩年的創企將如何從日趨激烈的晶片混戰中突圍?近日,寒序科技聯合創始人兼CEO朱欣嶽與芯東西進行了一場深入對談,將創業歷程中的思考、選擇以及對技術發展與商業落地趨勢的研判悉數道來。

▲寒序科技聯合創始人兼CEO朱欣嶽
01.
北大、清華曾拋來橄欖枝
90後組團創業

寒序科技團隊年輕、多學科交叉背景的特徵在朱欣嶽身上體現的淋漓盡致。

北京大學物理學院碩士畢業的朱欣嶽,本科就讀於南京郵電大學,擁有電子科學與技術、計算機科學與技術的雙重專業背景,曾在加州大學伯克利分校進行跨模態人工智慧領域的暑期科研。本科時,他曾帶領團隊斬獲各大創新創業比賽的全國獎項,開展AI音樂和量子精密測量兩個方向的科研工作。

本科即將畢業之際,北京大學凝聚態物理所碩士以及中央音樂學院和清華大學計算機系聯合培養博士均向他拋來了橄欖枝。由於電子工程與計算機科學的交叉背景和高中物理競賽的經歷,他希望做更加接近世界本質的物理研究,並面向AI的計算需求研發物理本徵的計算裝置。
最後他選擇了凝聚態物理學科中的磁學與自旋電子學,到國內磁學重鎮北京大學應用磁學中心攻讀碩士學位,師從楊金波教授、羅昭初研究員。他基於磁學與機器學習的深層關聯,提出磁性計算、物理本徵計算的新方案,研究方向涉及新型自旋電子學工藝與器件,以及神經形態計算、類腦計算、機率計算、近存計算等新型計算方案

在2021年10月尚未入學北大之際,他就已經與導師羅昭初圍繞磁學相關的產業化方向展開了討論與探索。他認為,“磁性計算”是他們這樣一支立足北大磁學高地,又深耕AI演算法和積體電路設計的團隊最具有優勢的方向。他希望做第一個完成磁性計算晶片商業閉環的公司

他深入理解磁學的實驗物理、器件和工藝後,找到了能有效落地的磁性晶片技術方案。
目前國內磁儲存、磁感測等領域的市場競爭已經愈發激烈,有北航等高校的多年攻關和全國重點實驗室支撐,還有希磁、燦瑞等大型企業具有規模和技術優勢,致使初創企業很難快速佔領有利生態位。
基於嵌入式新型磁器件的計算晶片設計道路則更符合他想快速商業落地的目標。他認為這條賽道目前已經被臺積電、三星、SK海力士等半導體大廠押注並驗證,同時能基於國內磁性工業基礎快速在2~3年內快速實現量產
▲磁電子學自旋電子學(圖源:寒序科技)

這一創業想法在2022年底ChatGPT釋出之際被加速,他們開始尋找新型磁性計算晶片在雲端算力上的機會點。

2023年5月,朱欣嶽開始正式籌備磁性計算的創業方案,這也是北大磁學在資訊科技領域唯一的產業化專案。三個月後,寒序科技在北京正式成立,寒序科技還與澳門大學模擬與混合訊號超大規模積體電路國家重點實驗室進行積體電路設計合作。

多學科交叉背景,是朱欣嶽尋找人才的準則之一。目前寒序科技共有20餘人,大多為90後,他們的學科涉及底層物理、材料、器件工藝,以及晶片設計、晶片製造、AI演算法等多個領域。
這個團隊中,朱欣嶽統管技術、產品、運營,他的導師羅昭初負責前瞻性技術判斷、戰略佈局。團隊的優勢包括,不僅能超預期完成工程技術研發、產品規劃,且相比於學術出身的創業團隊對於產業、行業有著更為前沿、超預期的認知。

寒序科技聯合創始人兼首席科學家,北京大學物理學院助理教授、研究員、博士生導師羅昭初是國內磁學領域的知名學者。他在清華大學材料學院獲得學士和博士學位,並分別在材料學頂級期刊Advanced Materials、Advanced Functional Materials釋出兩篇論文。

02.
低能耗、速度快、體積小是天然優勢
兩大產品系列明年推出

寒序科技已經形成兩大產品系列,分別是針對AI需求的超高頻寬磁性邏輯計算晶片SpinPU-E系列晶片;針對特定需求的高位元數全連線磁性機率計算晶片SpinPU-M系列晶片

▲寒序科技的產品矩陣(圖源:寒序科技)

這家創企的M系列晶片對標的是北美量子計算創企D-Wave。D-Wave專注用超導量子位元實現量子計算機。

在量子計算標準問題Max-Cut求解測試中,SpinPU-M01與D-Wave最新一代產品相比,速度均在秒級以下,求解規模更優。且寒序科技的SpinPU-M01晶片大規模流片量產後,單片造價數千元人民幣,效能可對標D-Wave最新產品
▲寒序科技與D-Wave產品效能對比(圖源:寒序科技)

創業初期,朱欣嶽基於學術和產業認知的判斷是:雲端推理需求、端側模型部署需求會激增。2024年初,寒序科技就已針對Llama、Qwen、DeepSeek等開源模型進行了更底層的垂直適配

磁性計算晶片具備的低能耗、速度快、體積小的底層優勢,與這兩大領域相契合。

質量、電荷和自旋,是標識電子特性最為重要的三個物理量,傳統晶片以電子的電荷作為資訊載體,資訊透過電流傳導。然而,電子的另一個自由度——自旋則幾乎被忽略了。

電子電荷在電路中流動會因電阻產生熱量,導致能量損耗。隨著晶片整合度提高,熱損耗問題愈發嚴重。而電子自旋主要透過改變自旋狀態來傳遞和處理資訊,不依賴電子的大量定向移動,理論上能耗更低,且其翻轉速度極快,理論上可以在亞納秒甚至皮秒級的時間尺度內完成,這使得基於電子自旋的資訊處理有望實現更高的頻率和更快的運算速度

▲電子自旋原理(圖源:寒序科技)

從最底層物理材料、晶片設計到上層軟體演算法進行聯合最佳化,磁計算晶片可以實現更低功耗和更快運算速度。相比於同樣擁有功耗、速率優勢的光晶片,磁計算晶片還能做到更小的體積和更高的矽基相容性。

同時,微納磁器件直接沉積到矽基電晶體之上,在後道工藝的上層金屬做磁性隧道結,單元級互聯實現超高密度,從計算架構上做到超高訪存頻寬,相比於HBM有更大頻寬優勢。而高頻寬就意味著更快的推理速度,寒序科技計劃將首詞元延遲(TTFT,Time to First Token)和詞元生成速度TPS,Tokens Per Second)做到極致,比英偉達快5倍~10倍,做“最快”的推理晶片

從產業角度看,存算分離架構中資料需在儲存端與計算端之間頻繁傳輸,難以跨越傳統馮·諾依曼架構帶來的“儲存牆”和“功耗牆”。寒序科技基於存算一體架構的磁性晶片則利用微納磁性器件與獨有的磁性晶片設計手段,推出超高頻寬、更快推理速度的SpinPU-E系列磁邏輯計算晶片。

在基於先進儲存的高效能推理晶片架構上,寒序科技對標的是時下兩家知名AI晶片創企Groq和Cerebras。他們採用的路線均為SRAM存算一體,但因其器件體積較大、整合密度低、晶片容量小,導致用於雲計算推理時成本較高。
SRAM儲存單元由六個電晶體組成,單位面積晶片上儲存的容量或者能承載的模型權重較為有限,且SRAM的效能提升很大程度上要依賴於工藝節點下降,國內的工藝現狀意味著這條路面臨諸多瓶頸。
03.
主攻AI藥物研發
參與智算中心建設、大模型適配

在商業化落地層面,寒序科技的M系列機率計算晶片瞄準了AI製藥、航天、水利電力領域,選擇標準是:哪個賽道能快速驗證產品效能,就在哪個賽道做標杆客戶E系列的邏輯計算晶片則直接面向智算中心、大模型企業與網際網路大廠的推理需求,展開產品適配與市場拓展。

憑藉與學術界緊密的技術聯結優勢,以及具備與行業頭部企業協同開展工業級測試的能力,AI製藥領域成為寒序科技的第一個效能驗證場景

SpinPU-E系列磁邏輯計算晶片為Transformer架構定製設計,可相容國內28nm矽基工藝,採用存算一體的磁計算正規化,提高頻寬並降低成本。應用方面適用於主流AI模型的端側部署,直接面向AI大模型及邊緣推理市場,應用場景包括智慧硬體、具身智慧、自動駕駛、AI PC等。

SpinPU-M-01實現了1024位元數、1023連線度、16位寬精度,朱欣嶽透露,下一代晶片他們保守會做到4096位元數、4095連線度、16~32位寬精度。

▲寒序科技SpinPU-M-01效能(圖源:寒序科技)

對於未來的產品迭代規劃,其會在可控成本下進行工程實現,追求計算速度的極限,同時讓M系列做到軟體側儘量開源、硬體側儘量穩定,目前其第一代產品仍在最佳化過程中。

在晶片研發之外,寒序科技還會參與智算中心建設、異構計算適配、前沿大模型適配等。朱欣嶽提到,這是因為他們提供的加速卡和伺服器的標準、具體產品形態和交易結構會隨著市場變化而變化,因此寒序科技會將後期產品化以及演算法適配的工作前置,注重產業生態站位以及與下游客戶的繫結,以便動態調整終端產品形態和交付方式。

04.
結語:跳出主流矽基晶片
磁性晶片在推理、邊緣側找到落地場景
當下,大模型的發展對如何讓算力更好用、易用提出更高要求,寒序科技在傳統矽基晶片之外,選擇了一條以CMOS相容的新型磁性晶片路徑,並依託其低能耗、速度快、體積小的天然優勢,在AI推理、邊緣端模型部署中找到了有效落地場景。
成立不到兩年,有著多學科交叉背景的寒序科技團隊,將北京大學這一國內磁學研究高地在學術研究上的進展,與國內工藝基礎相協同,在產品層面已經初見成效。寒序科技SpinPU-M系列晶片正在與客戶進行聯合除錯,其面向雲側和邊緣側的晶片都將於明年推出。
未來,這種依託於磁性器件特性的磁機率計算和磁邏輯計算晶片未來如何在實際應用中有效落地併發揮價值,還需拭目以待。


相關文章