公開課預告:智算叢集網路互連技術創新應用與展望|雲脈芯聯產品總監孫偉主講

10月起,智猩猩晶片與算力教研組全新策劃推出「智猩猩智算叢集公開課」,聚焦叢集構建、網際網路絡、算力排程、儲存等關鍵技術。
目前,「智猩猩智算叢集公開課」前兩期已順利完結。騰訊專有云首席架構師方天戟、矩向科技CEO黃朝波分別以《智算叢集技術概述》、《智算中心融合算力排程》為主題,進行了直播講解。
11月8日19:30「智猩猩智算叢集公開課」第3期將開講,由雲脈芯聯產品總監孫偉主講,主題為《智算叢集網路互連技術創新應用與展望》。
模型引數規模的不斷提升,導致在單個晶片上完成大模型的訓練和推理變得不太現實,需要將多個晶片或多臺伺服器互連起來組成智算叢集,才能完成大模型的訓練和推理工作。智算叢集規模也正在從千卡、萬卡向10萬卡演進。
而智算叢集中晶片與晶片、機櫃與機櫃之間的互連,並不是簡單的“手拉手”,因為面對百億、千億乃至萬億級別的大模型,智算叢集要處理海量的資料,因此需要超高頻寬、超低延遲的網路互連技術,來確保叢集內資料的高效傳輸。
同時,叢集規模越大,網路結構也會越複雜,如何根據不同的計算任務和資料傳輸需求,動態地調整網路頻寬和路由策略,最佳化資料傳輸路徑,確保資料在最短的時間內到達目的地,也是智算叢集網路架構設計時需要考慮的關鍵因素。高效能網路互連技術已成為打造智算叢集的關鍵所在。
此次公開課,孫偉老師首先會分享智算叢集業務對網路互連技術的需求和挑戰,並介紹業內常見的智算叢集網路最佳化方案。之後,孫偉老師將著重講解雲脈芯聯在智算叢集網路互連技術領域的創新和應用,以及網路互連技術的未來發展趨勢。
第3期資訊
 主 題 
《智算叢集網路互連技術創新應用與展望》
 提 綱 
1、智算叢集業務對網路互連技術的需求與挑戰
2、業內常見智算叢集網路最佳化方案
3、雲脈芯聯在智算叢集網路互連技術領域的創新與應用
4、智算叢集網路互連技術發展展望
 主 講 人 
孫偉,雲脈芯聯產品總監,擁有近20年網路產品研發和產品市場經驗,在基礎網路、雲網絡和高效能網路等領域具有深刻的見解和洞察能力,當前主要從事AI智算中心網路和雲計算資料中心DPU領域的產品相關工作。
 直 播 時 間 
11月8日19:30-20:30
報名方式
有公開課直播觀看需求的朋友,可以新增小助手“瑞秋”進行報名。已新增過“瑞秋”的老朋友,可以給“瑞秋”私信,傳送“智算叢集03”進行報名。對於透過報名的朋友,之後將邀請入群進行觀看和交流。

相關文章