
智算叢集已成為大模型基建軍備競賽的標配。
在大模型訓練場景下,隨著模型引數規模從千億向萬億邁進,算力需求激增。同時,隨著大模型在不同領域的應用落地,推理算力需求也迎來爆發式增長。據中信建設證券資料顯示,2024年至2027年全球大模型推理的峰值算力需求量的年複合增長率為113%,遠高於訓練的78%。
為了應對不斷增長的算力需求,全球各地智算叢集建設正在如火如荼地進行之中,且規模也從早期的千卡、萬卡快速增長到十萬卡,甚至向百萬卡級別發展。但是,叢集規模的線性擴充套件並不直接等同於算力的線性提升。智算叢集要發揮出極致有效的算力,需要從卡間和節點間的網際網路絡、軟硬體適配、海量資料處理策略、運維保障等多個方面進行協同最佳化。
12月13日19:30,智猩猩智算叢集公開課第6期將開講,由阿里雲智慧集團智算叢集產品專家陳禕主講,主題為《大模型時代的智算GPU叢集》。
本次公開課,陳禕老師將從產業一線的角度,分享AI技術演進下的GPU叢集需求變化,並從Scale Up、Scale Out兩個層面,闡述叢集算力的擴充套件路徑。之後,陳禕老師還將重點講解大規模GPU叢集的效能最佳化方法,以及穩定性挑戰和最佳化實現,並對AI基礎設施2025年的發展趨勢進行展望。

第6期資訊
主 題

《大模型時代的智算GPU叢集》
提 綱
1、AI技術演進催生GPU叢集的需求
2、叢集算力擴充套件:Scale Up vs. Scale Out
3、大規模GPU叢集效能最佳化
4、叢集的穩定性挑戰與最佳化實現
5、AI基礎設施的2025展望
主 講 人
陳禕,阿里雲智慧集團智算叢集產品專家,負責阿里雲AI智算場景的異構計算叢集產品規劃及設計
直 播 時 間
12月13日19:30-20:30
報名方式
有公開課直播觀看需求的朋友,可以新增小助手“瑞秋”進行報名。已新增過“瑞秋”的老朋友,可以給“瑞秋”私信,傳送“智算叢集06”進行報名。對於透過報名的朋友,之後將邀請入群進行觀看和交流。
